KR20240025645A - 아데노-연관된 바이러스 패키징 시스템 - Google Patents

아데노-연관된 바이러스 패키징 시스템 Download PDF

Info

Publication number
KR20240025645A
KR20240025645A KR1020247002671A KR20247002671A KR20240025645A KR 20240025645 A KR20240025645 A KR 20240025645A KR 1020247002671 A KR1020247002671 A KR 1020247002671A KR 20247002671 A KR20247002671 A KR 20247002671A KR 20240025645 A KR20240025645 A KR 20240025645A
Authority
KR
South Korea
Prior art keywords
amino acid
nucleic acid
promoter
vector
gly
Prior art date
Application number
KR1020247002671A
Other languages
English (en)
Inventor
리스하우트 로라 판
마리사 스탠빅
Original Assignee
옥스포드 바이오메디카 솔루션즈 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 옥스포드 바이오메디카 솔루션즈 엘엘씨 filed Critical 옥스포드 바이오메디카 솔루션즈 엘엘씨
Publication of KR20240025645A publication Critical patent/KR20240025645A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0601Invertebrate cells or tissues, e.g. insect cells; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/16Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
    • C12Y114/16001Phenylalanine 4-monooxygenase (1.14.16.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/06Sulfuric ester hydrolases (3.1.6)
    • C12Y301/06013Iduronate-2-sulfatase (3.1.6.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/40Systems of functionally co-operating vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본원은 재조합 아데노-연관된 바이러스(rAAV)의 생산을 위한 이중 벡터 형질주입 시스템을 제공한다. 이중 벡터 형질주입 시스템은 일반적으로 다음을 포함한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열, 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.

Description

아데노-연관된 바이러스 패키징 시스템
관련 출원
본 출원은 2021 년 6 월 25 일자로 출원된 미국 가특허 출원 일련 번호 63/202,817, 2021 년 10 월 7 일자로 출원된 63/262,218, 및 2022 년 1 월 11 일자로 출원된 63/266,646에 대한 우선권을 주장하며, 이의 전체 개시내용은 참조로 본원에 원용된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출되었고 그 전체가 본원에 참조로 원용되는 서열 목록을 함유한다 (2022 년 6 월 21 일에 생성된 상기 ASCII 사본은 "HMW-043_SL.txt"로 명명되고 336,866 바이트 크기임).
아데노-연관된 바이러스 (AAV)는 유전자 요법의 목적을 위해 외래 DNA를 세포 내로 전달하기 위한 벡터로서 매력적이게 만드는 독특한 특징을 보유하고 있다. AAV의 상업적 제조는 일반적으로 포유동물 세포 또는 곤충 세포 시스템을 사용한다. 상업적인 포유동물 세포-기반 AAV 생산 시스템은 전형적으로 다음의 3 개의 플라스미드의 세포 내로의 형질주입(transfection)을 수반한다: AAV Rep 및 AAV 캡시드 단백질을 코딩하는 서열을 함유하는 제1 플라스미드; AAV 벡터 게놈을 함유하는 제2 플라스미드; 및 하나 이상의 헬퍼 바이러스 유전자 (보통 아데노바이러스 또는 헤르페스바이러스 유전자)를 함유하는 제3 플라스미드. 효과적이긴 하지만, 이러한 3 개의 플라스미드 AAV 제조 시스템은 최적화하기 복잡하며, 상업적 AAV 치료제와 연관된 상품의 높은 비용에 기여한다.
따라서, 효율적인 AAV 생산을 초래하지만 감소된 복잡성 및 비용을 갖는 개선된 AAV 제조 시스템에 대한 필요성이 당업계에 존재한다.
본 개시내용은 재조합 아데노-연관된 바이러스 (rAAV)의 생산을 위한 이중 벡터 형질주입 시스템을 제공한다. 본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 다음을 포함한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 이러한 이중 벡터 형질주입 시스템에서, 숙주 생산 세포와 함께 제1 핵산 벡터 및 제2 핵산 벡터는 AAV 생산에 필요한 모든 구성요소를 제공한다. 본원에 개시된 이중 벡터 형질주입 시스템은 기존의 삼중 벡터 형질주입 시스템과 비교하여 증가된 rAAV 생산성을 초래하는 것으로 밝혀졌다. 또한, 본원에 기재된 이중 벡터 형질주입 시스템에서 구성요소의 특이적 구성은 선행 기술의 이중 벡터 형질주입 시스템에 비해 우수한 rAAV 생산성을 초래하는 것으로 밝혀졌다.
따라서, 일 양태에서, 본 개시내용은 AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터를 제공하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않고, 트랜스진은 페닐알라닌 수산화효소 (PAH), 아릴설파타제 A (ARSA), 이두로네이트 2-설파타제 (I2S) 및 항-보체 구성요소 5 (C5) 항체로 이루어진 군으로부터 선택되지 않는다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않고, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 포함하지 않으며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않고, (i) 트랜스진은 페닐알라닌 수산화효소 (PAH), 아릴설파타제 A (ARSA), 이두로네이트 2-설파타제 (I2S) 및 항-보체 구성요소 5 (C5) 항체로 이루어진 군으로부터 선택되지 않고, (ii) AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 포함하지 않으며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 핵산 벡터는 DNA 플라스미드 또는 DNA 최소 벡터이다.
다른 양태에서, 본 개시내용은 다음을 포함하는, 재조합 AAV (rAAV) 패키징 시스템을 제공한다: (i) 다음을 포함하는, 제1 핵산 벡터: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열, 및 (ii) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
특정 실시양태에서, 제1 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 트랜스진은 페닐알라닌 수산화효소 (PAH), 아릴설파타제 A (ARSA), 이두로네이트 2-설파타제 (I2S) 및 항-보체 구성요소 5 (C5) 항체로 이루어진 군으로부터 선택되지 않는다. 특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 포함하지 않으며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 트랜스진은 페닐알라닌 수산화효소 (PAH), 아릴설파타제 A (ARSA), 이두로네이트 2-설파타제 (I2S) 및 항-보체 구성요소 5 (C5) 항체로 이루어진 군으로부터 선택되지 않고, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 포함하지 않으며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, 제1 핵산 벡터는 DNA 플라스미드 또는 DNA 최소 벡터이다. 특정 실시양태에서, 제2 핵산 벡터는 DNA 플라스미드 또는 DNA 최소 벡터이다.
특정 실시양태에서, 트랜스진은 폴리펩티드를 코딩한다. 특정 실시양태에서, 트랜스진은 miRNA, shRNA, siRNA, 안티센스 RNA, gRNA, 안타고미르, miRNA 스폰지, RNA 압타자임, RNA 압타머, lncRNA, 리보자임 또는 mRNA를 코딩한다. 특정 실시양태에서, 트랜스진은 페닐알라닌 수산화효소 (PAH), 글루코스-6-포스파타제 (G6Pase), 이두로네이트-2-설파타제 (I2S), 아릴설파타제 A (ARSA) 및 프라탁신 (FXN)으로 이루어진 군으로부터 선택되는 단백질을 코딩한다. 특정 실시양태에서, 트랜스진은 글루코스-6-포스파타제 (G6Pase) 또는 프라탁신 (FXN)을 코딩한다.
특정 실시양태에서, rAAV 게놈은 트랜스진에 작동가능하게 연결된 전사 조절 요소를 추가로 포함한다. 특정 실시양태에서, 전사 조절 요소는 프로모터 요소 및/또는 인트론 요소를 포함한다.
특정 실시양태에서, rAAV 게놈은 폴리아데닐화 서열을 추가로 포함한다. 특정 실시양태에서, 폴리아데닐화 서열은 트랜스진에 대해 3'이다.
특정 실시양태에서, rAAV 게놈은 서열번호 71, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, rAAV 게놈은 트랜스진의 5'의 5' 역전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 트랜스진의 3'의 3' 역전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 추가로 포함한다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 39, 41 또는 42에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일하고/하거나, 3' ITR 뉴클레오티드 서열은 서열번호 40, 43 또는 44에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다.
특정 실시양태에서, rAAV 게놈은 서열번호 75, 78, 80, 82 또는 84에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, AAV Rep 단백질은 야생형 Rep 단백질 또는 이의 변이체이다. 특정 실시양태에서, AAV Rep 단백질은 AAV2 Rep 단백질 또는 이의 변이체이다.
특정 실시양태에서, 제1 뉴클레오티드 서열은 AAV Rep 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함한다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. 특정 실시양태에서, 프로모터는 P5 프로모터, P19 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택된다.
특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh10, AAVRh32.33, AAVrh74, AAV-DJ, AAV-LK03, NP59, VOY101, VOY201, VOY701, VOY801, VOY1101, AAVPHP.N, AAVPHP.A, AAVPHP.B, PHP.B2, PHP.B3, G2A3, G2B4, G2B5 및 PHP.S로 이루어진 군으로부터 선택된다. 특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74로 이루어진 군으로부터 선택된다. 특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV8 및 AAVrh74로 이루어진 군으로부터 선택된다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함한다.
특정 실시양태에서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열을 포함한다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함한다.
특정 실시양태에서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산은 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열을 포함한다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함한다.
특정 실시양태에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산은 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질의 아미노산은 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산은 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산은 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산은 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 Y이거나; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산은 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이거나; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 또는 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열을 포함한다.
특정 실시양태에서, 제3 뉴클레오티드 서열은 AAV 캡시드 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함한다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. 특정 실시양태에서, 프로모터는 P40 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택된다.
특정 실시양태에서, 제1 핵산 벡터는 서열번호 73 또는 77에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 제2 뉴클레오티드 서열은 서열번호 71, 75, 78, 80, 82, 84, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함한다.
특정 실시양태에서, 제1 뉴클레오티드 서열은 서열번호 50, 51, 52, 53, 54, 55, 56, 57, 58 또는 59에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하고; 제2 뉴클레오티드 서열은 서열번호 71, 75, 78, 80, 82, 84, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하고; 제3 뉴클레오티드 서열은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736, 138-736 및/또는 1-736의 아미노산 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 코딩한다.
특정 실시양태에서, 제1 핵산 벡터는 5'으로부터 3'으로, 제1 뉴클레오티드 서열; 제2 뉴클레오티드 서열; 및 제3 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 헬퍼 바이러스 유전자는 아데노바이러스, 헤르페스 바이러스, 폭스바이러스, 사이토메갈로바이러스 및 배큘로바이러스로 이루어진 군으로부터 선택되는 헬퍼 바이러스로부터 유래된다. 특정 실시양태에서, 헬퍼 바이러스 유전자는 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 아데노바이러스로부터 유래된 RNA 유전자이다. 특정 실시양태에서, 헬퍼 바이러스 유전자는 UL5/8/52, ICP0, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 헤르페스 바이러스로부터 유래된 유전자이다.
특정 실시양태에서, 제2 핵산 벡터는 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함한다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. 특정 실시양태에서, 프로모터는 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택된다.
특정 실시양태에서, 제2 핵산 벡터는 서열번호 60, 61 또는 62에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 제2 핵산 벡터는 서열번호 63에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
다른 양태에서, 본 개시내용은 본원에 기재된 핵산 벡터 또는 본원에 기재된 패키징 시스템을 포함하는 숙주 세포를 제공한다. 본 개시내용은 또한 이러한 숙주 세포의 집단을 제공한다. 특정 실시양태에서, 숙주 세포의 집단은 세포 배양물로 제공된다. 특정 실시양태에서, 세포 배양물은 2 리터 이상, 50 리터 이상, 또는 2000 리터 이상의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 5000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 4000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 3000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 2500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 2000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 1500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 1000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 250 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 100 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 50 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 25 리터의 부피를 갖는다.
특정 실시양태에서, 숙주 세포는 포유동물 세포이다. 특정 실시양태에서, 포유동물 세포는 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 포유동물 세포는 HEK293 세포이다.
다른 양태에서, 본 개시내용은 rAAV가 생산되는 조건 하에서 포유동물 세포 내로 본원에 기재된 패키징 시스템을 도입하는 단계를 포함하는, rAAV의 재조합 제조 방법을 제공한다.
특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.2, 1:0.4, 1:0.6, 1:0.8, 1:1, 1:2, 1:3 또는 1:4로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:2이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.2 내지 1:1이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.6이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.8이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:1이다.
특정 실시양태에서, 방법은 패키징 시스템의 0.1 내지 4 μg의 DNA/1E6 세포를 도입하는 단계를 포함한다. 특정 실시양태에서, 방법은 패키징 시스템의 0.5 내지 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함한다. 특정 실시양태에서, 방법은 패키징 시스템의 0.6, 0.7, 0.8, 0.9 또는 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함한다. 특정 실시양태에서, 방법은 패키징 시스템의 0.75 μg의 DNA/1E6 세포를 도입하는 단계를 포함한다.
특정 실시양태에서, 제1 핵산 벡터 대 제2 벡터 핵산의 비율은 1:2, 1:3 또는 1:4이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율은 1:2이다.
특정 실시양태에서, 방법은 (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래한다.
특정 실시양태에서, 방법은 (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 온전한 벡터 게놈의 증가된 백분율을 초래한다.
특정 실시양태에서, 포유동물 세포는 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 포유동물 세포는 HEK293 세포이다.
도 1a-1c는 삼중 벡터 형질주입 시스템 (1) 및 이중 벡터 형질주입 시스템 (2)을 사용하여 소-규모 rAAV 생산으로부터 수득된 바이러스 게놈 (VG) 생산성 (도 1a), 캡시드 생산성 (도 1b), 및 온전한 벡터 게놈의 백분율 (도 1c)을 도시하는 그래프이다.
도 2a-2c는 삼중 벡터 형질주입 시스템 (1 및 3) 및 이중 벡터 형질주입 시스템 (2 및 4)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 2a), 캡시드 생산성 (도 2b), 및 온전한 벡터 게놈의 백분율 (도 2c)을 도시하는 그래프이다. rAAV 생산성은 다음의 2 개의 상이한 rAAV 유전자 편집 벡터에 대해 결정되었다: 인간-특이적 유전자 편집 벡터 (1 및 2) 및 마우스-특이적 벡터 (3 및 4). 다양한 조건은 표 3에 제시되어 있다.
도 3a-3c는 rAAV 이중 벡터 형질주입 시스템 설계-1 (도 3a), 설계-2 (도 3b) 및 설계-3 (도 3c)을 도시하는 개략도이다.
도 4a-4c는 이중 벡터 형질주입 시스템 설계-1 (1-3), 이중 벡터 형질주입 시스템 설계-2 (4-6), 및 삼중 벡터 형질주입 시스템 (7)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 4a), 캡시드 생산성 (도 4b), 및 온전한 벡터 게놈의 백분율 (도 4c)을 도시하는 그래프이다. 테스트된 이중 벡터 형질주입 시스템 설계는 도 3a 및 3b에 묘사된 바와 같다. 테스트된 각각의 이중 벡터 형질주입 시스템 설계에 대해, 다음의 3 개의 상이한 트랜스진 벡터 대 헬퍼 벡터 비율을 이용하여 형질주입을 수행하였다: 1:0.5 (1 및 4), 1:1 (2 및 5), 및 1:3 (3 및 6). 다양한 형질주입 조건은 표 4에 제시되어 있다.
도 5a-5c는 이중 벡터 형질주입 시스템 설계-1 (1), 이중 벡터 형질주입 시스템 설계-2 (2), 이중 벡터 형질주입 시스템 설계-3 (3) 및 삼중 벡터 형질주입 시스템 (4)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 5a), 캡시드 생산성 (도 5b), 및 온전한 벡터 게놈의 백분율 (도 5c; "전체 %")을 도시하는 그래프이다. 테스트된 이중 벡터 형질주입 시스템 설계는 도 3a-3c에 묘사된 바와 같다. 다양한 형질주입 조건은 표 5에 제시되어 있다.
도 6a-6c는 다양한 트랜스진 벡터 대 헬퍼 벡터 비율인 1:2 ("이중 1:2"), 1:3 ("이중 1:3") 및 1:4 ("이중 1:4")에서의 이중 벡터 형질주입 시스템 설계-1, 및 삼중 벡터 형질주입 시스템 (삼중)을 사용하여 2 L-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 6a), 캡시드 생산성 (도 6b), 및 온전한 벡터 게놈의 백분율 (도 6c)을 도시하는 그래프이다. 6 개의 상이한 rAAV 벡터 게놈 (1-6)을 테스트하였다. 조건 1-5는 AAVHSC15 캡시드를 사용하였고, 조건 6은 AAVHSC17 캡시드를 사용하였다. 다양한 형질주입 조건은 표 6에 제시되어 있다.
도 7a-7c는 AAV2 캡시드를 활용하는, 이중 벡터 형질주입 시스템 설계-1 (2 TFX) 및 삼중 벡터 형질주입 시스템 (3 TFX)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 7a), 캡시드 생산성 (도 7b), 및 온전한 벡터 게놈의 백분율 (도 7c)을 도시하는 그래프이다. 다양한 형질주입 조건은 표 6에 제시되어 있다.
도 8은 설계-1 이중 플라스미드 시스템을 사용하여 rAAV 생산으로부터 수득된 온전한 벡터 게놈의 수를 도시하는 그래프이며, 각각의 경우에 상응하는 삼중 플라스미드 시스템 대조군으로부터 수득된 온전한 벡터 게놈의 수에 대한 백분율 증가로 표현된다. 4 개의 상이한 rAAV 벡터 게놈 (1-4)을 테스트하였다. 조건 1-3은 AAVHSC15 캡시드를 사용하였고, 조건 4는 AAVHSC17 캡시드를 사용하였다. 다양한 형질주입 조건이 표 7에 제시되어 있다.
도 9는 이중 벡터 형질주입 시스템 설계-1 및 설계-2로부터의 캡시드 생성의 수준과 함께 각각 각각의 설계의 Rep/Cap 서열을 함유하는 벡터로부터의 캡시드 생성의 수준을 도시하는 그래프이다. 다양한 형질주입 조건이 표 8에 제시되어 있다.
도 10a-10c는 이중 벡터 형질주입 시스템 설계-1 (2 TFX) 및 삼중 벡터 형질주입 시스템 (3 TFX)을 사용하여 50 L 생물반응기 rAAV 생산으로부터 수득된 VG 생산성 (도 10a), 캡시드 생산성 (도 10b), 및 온전한 벡터 게놈의 백분율 (도 10c)을 도시하는 그래프이다. 형질주입 조건은 표 6, 조건 4, 설계-1에 대한 벡터 비율 1:2 및 연관된 삼중 형질주입 대조군에 제시되어 있다. 도 10d-10f는 2 TFX 및 3 TFX 시스템을 사용하여 수득된 정제된 AAV 벡터에서의 순도 퍼센트 (도 10d), 응집 퍼센트 (도 10e) 및 잔여 숙주 세포 단백질의 수준 (도 10f)을 도시하는 그래프이다. 도 10g-10j는 2 TFX 및 3 TFX 시스템을 사용하여 수득된 정제된 AAV 벡터에 패키징된 잔류 숙주 세포 DNA (도 10g), Rep/Cap (도 10h), E1a (도 10i) 및 헬퍼 서열 (도 10j)의 양을 도시하는 그래프이다. 도 10f 및 10i에서, 수평 점선은 샘플이 정량 한계 미만 (BLoQ)인 것으로 결정된 검정에 대한 검출 한계를 나타낸다. ns는 유의하지 않음을 의미하고; *는 p<0.05에서 통계적으로 유의함을 의미하며; ***는 p<0.001에서 통계적으로 유의함을 의미한다.
도 11a-11b는 1E12 VG/kg (도 11a) 및 1E14 VG/kg (도 11b)의 용량에서, 설계 1 (2 TFX) 및 연관된 삼중 형질주입 대조군 (3 TFX)에 대해 1:4의 벡터 비율로 표 6의 조건 5로부터 수득된 AAV 벡터가 투여된 Pahenu2 마우스의 혈청에서 측정된 페닐알라닌 (Phe)의 수준을 도시하는 그래프이다. 비히클-단독 투여는 대조군 (비히클)으로서 수행되었다. 도 11c-11e는 투약-후 6 주째에 치료된 마우스에서 간에서의 벡터 게놈 (도 11c), 트랜스진 발현 (도 11d) 및 표적-내(on-target) 통합 (도 11e)의 정량을 도시하는 그래프이다. ns는 유의하지 않음을 의미한다.
도 12a-12c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 벡터 V3 및 V12 사이에 표시된 바와 같은 다양한 비율을 테스트한, 이중 벡터 형질주입 시스템 설계-1을 사용하여 소규모 rAAV 생산으로부터 수득된 VG 생산성 (도 12a), 캡시드 생산성 (도 12b), 및 온전한 벡터 게놈의 백분율 (도 12c)을 도시하는 그래프이다. 사용된 PEI:DNA 비율은 2:1이었다.
도 13a-13c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 벡터 V3 및 V8 사이에 표시된 바와 같은 다양한 비율을 테스트한, 이중 벡터 형질주입 시스템 설계-1을 사용하여 소규모 rAAV 생산으로부터 수득된 VG 생산성 (도 13a), 캡시드 생산성 (도 13b), 및 온전한 벡터 게놈의 백분율 (도 13c)을 도시하는 그래프이다. 사용된 PEI:DNA 비율은 2:1이었다.
도 14a-14c는 이중 벡터 형질주입 시스템 설계-1 및 AAV 캡시드 혈청형 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74에 걸친 연관된 삼중 형질주입 대조군을 사용하여 2 L-규모의 rAAV 생산으로부터 수득된 VG 생산성 (도 14a), 캡시드 생산성 (도 14b) 및 온전한 벡터 게놈의 백분율 (도 14c)을 도시하는 그래프이다.
도 15는 이중 벡터 형질주입 시스템 설계-1을 사용하여 50 L 및 2000 L 생물반응기 rAAV 생산으로부터 수득된 VG 생산성을 도시하는 그래프이다.
본 개시내용은 재조합 아데노-연관된 바이러스 (rAAV)의 생산을 위한 이중 벡터 형질주입 시스템을 제공한다. 본 개시내용은 본원에 기재된 이중 벡터 형질주입 접근법을 사용한 rAAV 생산이 기존의 삼중 벡터 형질주입 접근법에 비해 우수한 AAV 생산성을 초래한다는 발견에 기반한다. 본원에 기재된 이중 벡터 형질주입 시스템의 구성요소의 특이적 구성은 또한 선행 기술의 이중 벡터 형질주입 접근법에 비해 우수한 AAV 생산성을 초래한다.
I. 정의
본원에 사용된 바와 같이, 용어 "재조합 아데노-연관된 바이러스" 또는 "rAAV"는 기능적 rep 및 cap 유전자가 결여된 게놈을 포함하는 AAV를 지칭한다.
본원에 사용된 바와 같이, 용어 "cap 유전자"는 AAV 캡시드 단백질을 코딩하는 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "rep 유전자"는 AAV 복제에 필요한 AAV Rep 단백질 (예컨대, Rep78, Rep68, Rep52 및 Rep40)을 코딩하는 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "Rep-Cap 요소"는 AAV 복제에 필요한 AAV Rep 단백질 (예컨대, Rep78, Rep68, Rep52 및 Rep40)뿐만 아니라 AAV 캡시드 단백질 (예컨대, VP1, VP2 및 VP3)을 코딩하는 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "헬퍼 바이러스 유전자"는 AAV 복제를 매개하는 바이러스 유전자 (예컨대, 아데노바이러스 유전자 또는 헤르페스바이러스 유전자)를 코딩하는 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "rAAV 게놈"은 rAAV의 게놈 서열을 포함하는 핵산 분자를 지칭한다. 당업자는 rAAV 게놈이 트랜스진을 포함하는 경우, rAAV 게놈이 트랜스진의 전사의 방향에 대해 센스 또는 안티센스 배향일 수 있음을 이해할 것이다.
본원에 사용된 바와 같이, 용어 "편집 게놈"은 상동 재조합을 통해 편집 요소 (예컨대, 하나 이상의 뉴클레오티드 또는 뉴클레오티드간 결합)를 표적 유전자좌에 통합하여 표적 유전자 내 유전적 결함을 교정할 수 있는 재조합 AAV 게놈을 지칭한다. 당업자는 5' 상동성 아암, 편집 요소 및 3' 상동성 아암을 포함하는 편집 게놈의 일부가 표적 유전자좌에 대해 센스 또는 안티센스 배향일 수 있음을 이해할 것이다.
본원에 사용된 바와 같이, 용어 "편집 요소"는 표적 유전자좌에서 통합될 때 표적 유전자좌를 변형시키는 편집 게놈의 일부를 지칭한다. 편집 요소는 표적 유전자좌에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 매개할 수 있다. 본원에 사용된 바와 같이, 용어 "표적 유전자좌"는 편집 요소에 의해 변형되는 염색체의 영역 또는 뉴클레오티드간 결합 (예컨대, 표적 유전자의 영역 또는 뉴클레오티드간 결합)을 지칭한다.
본원에 사용된 바와 같이, 용어 "상동성 아암"은 표적 유전자좌에 측접하는 게놈과 실질적으로 동일한 편집 요소의 5' 또는 3'에 위치하는 편집 게놈의 일부를 지칭한다.
본원에 사용된 바와 같이, 2 개의 뉴클레오티드 서열 사이 또는 2 개의 아미노산 서열 사이의 "동일성 백분율"은 정렬된 서열의 쌍 사이의 매칭의 수에 100을 곱하고, 내부 갭(gap)을 포함하는 정렬된 영역의 길이로 나누어 계산된다. 동일성 스코어링은 완벽한 매칭만 카운팅하며, 아미노산 간의 유사성의 정도는 고려하지 않는다. 내부 갭만 길이에 포함되고 서열 단부에서의 갭은 포함되지 않는다는 점에 유의한다.
본원에 사용된 바와 같이, 용어 "코딩 서열"은 출발 코돈에서 시작하여 정지 코돈에서 끝나는, 폴리펩티드를 코딩하는 상보성 DNA (cDNA)의 일부를 지칭한다. 유전자는 대체 스플라이싱, 대체 번역 개시, 및 집단 내의 변이로 인해 하나 이상의 코딩 서열을 가질 수 있다. 코딩 서열은 야생형 또는 비-자연 발생 변이체 (예컨대, 코돈 최적화된 변이체)일 수 있다.
본원에 사용된 바와 같이, 용어 "전사 조절 요소" 또는 "TRE"는 RNA 분자를 형성하기 위해 RNA 중합효소에 의해 작동가능하게 연결된 뉴클레오티드 서열의 전사를 조절 (예컨대, 제어, 증가 또는 감소)시키는 시스-작용 뉴클레오티드 서열, 예를 들어, DNA 서열을 지칭한다. 전사를 조절하기 위해 TRE는 하나 이상의 트랜스-작용 분자, 예컨대, 전사 인자에 따라 좌우된다. 따라서, 하나의 TRE는 상이한 트랜스-작용 분자와 접촉할 때, 예를 들어, 상이한 유형의 세포에 있을 때, 상이한 방식으로 전사를 조절할 수 있다. TRE는 하나 이상의 프로모터 요소 및/또는 인핸서 요소를 포함할 수 있다. 당업자는 유전자 내의 프로모터 및 인핸서 요소가 위치가 가까울 수 있고, 용어 "프로모터"는 프로모터 요소 및 인핸서 요소를 포함하는 서열을 지칭할 수 있음을 이해할 것이다. 따라서, 용어 "프로모터"는 서열 내 인핸서 요소를 배제하지 않는다. 프로모터 및 인핸서 요소는 동일한 유전자 또는 종으로부터 유래될 필요가 없으며, 각각의 프로모터 또는 인핸서 요소의 서열은 게놈 내의 상응하는 내인성 서열과 동일하거나 실질적으로 동일할 수 있다.
본원에 사용된 바와 같이, 용어 "작동가능하게 연결된"은 TRE 및 전사될 코딩 서열 사이의 연접을 기재하기 위해 사용된다. 전형적으로, 유전자 발현은 하나 이상의 프로모터 및/또는 인핸서 요소를 포함하는 TRE의 제어 하에서 배치된다. 코딩 서열의 전사가 TRE에 의해 제어되거나 영향을 받는 경우 코딩 서열은 TRE에 "작동가능하게 연결된다". TRE의 프로모터 및 인핸서 요소는 원하는 전사 활성이 수득되는 한, 코딩 서열로부터 임의의 배향 및/또는 거리에 있을 수 있다. 특정 실시양태에서, TRE는 코딩 서열로부터 상류에 있다.
본원에 사용된 바와 같이, 용어 "폴리아데닐화 서열"은 RNA로 전사될 때 폴리아데닐화 신호 서열을 구성하는 DNA 서열을 지칭한다. 폴리아데닐화 서열은 천연 또는 외인성일 수 있다. 외인성 폴리아데닐화 서열은 포유동물 또는 바이러스 폴리아데닐화 서열 (예컨대, SV40 폴리아데닐화 서열)일 수 있다.
본원에 사용된 바와 같이, "외인성 폴리아데닐화 서열"은 트랜스진의 내인성 폴리아데닐화 서열과 동일하지 않거나 실질적으로 동일하지 않은 폴리아데닐화 서열을 지칭한다. 특정 실시양태에서, 외인성 폴리아데닐화 서열은 트랜스진과 상이하지만 동일한 종 (예컨대, 인간) 내에 있는 유전자의 폴리아데닐화 서열이다. 특정 실시양태에서, 외인성 폴리아데닐화 서열은 상이한 유기체 (예컨대, 바이러스)의 폴리아데닐화 서열이다.
II. 제1 핵산 벡터
rAAV의 생산을 위한 기존의 삼중 벡터 형질주입 시스템은 전형적으로 다음을 포함한다: AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 서열을 함유하는 제1 벡터; rAAV 게놈을 포함하는 제2 벡터; 및 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터. AAV Rep 단백질, AAV 캡시드 단백질 및 하나 이상의 헬퍼 바이러스 유전자를 코딩하는 유전자가 ("Rep-Cap-헬퍼 벡터")와 동일한 벡터에 클로닝될 수 있다는 것이 이전에 나타나있다. 이러한 경우에, rAAV 게놈을 포함하는 제2 벡터 (즉, Rep, Cap 및 헬퍼 유전자를 rAAV 게놈에 트랜스로 제공함)와 함께 Rep-Cap-헬퍼 벡터의 이중 형질주입을 사용하여, rAAV를 생성할 수 있다. 예컨대, 이의 개시내용이 그 전체가 본원에 참조로 원용되는 Grimm et al. (1998) Hum. Gene Ther. 9(18): 2745-2760 참고.
이전의 이중 벡터 형질주입 시스템과 대조적으로, 본 개시내용의 이중 벡터 형질주입 시스템은 rAAV 게놈과 함께 시스로 Rep 및 Cap 유전자를 제공한다. 따라서, 본 개시내용은 재조합 아데노-연관된 바이러스 (rAAV)의 생산을 위한 이중 벡터 형질주입 시스템을 제공하며, 여기서 본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 다음을 포함한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
특정 실시양태에서, 제1 핵산 벡터는 5'으로부터 3'으로 다음을 포함한다: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열, 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열. 본 개시내용의 특정 양태는 제1 핵산 벡터가 헬퍼 바이러스 유전자 (예컨대, AAV 생산 헬퍼 인자를 코딩하는 유전자)를 포함하지 않는다는 것을 제공한다.
본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 AAV (예컨대, rAAV)를 생산하기 위해 적합한 숙주 세포 내로의 제1 핵산 벡터 및 제2 핵산 벡터의 형질주입을 수반한다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터는 함께 AAV (예컨대, rAAV) 생산에 필요한 모든 구성요소를 제공한다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터, 그리고 추가로, 숙주 세포는 함께 AAV (예컨대, rAAV) 생산에 필요한 모든 구성요소를 제공한다.
본원에 개시된 이중 벡터 형질주입 시스템은 기존의 삼중 벡터 형질주입 시스템 및 이전에 기재된 이중 벡터 형질주입 시스템 둘 모두와 비교하여 증가된 rAAV 생산성을 초래하는 것으로 밝혀졌다. 임의의 이론에도 얽매이지 않고, 출원인은 본원에 기재된 이중 벡터 형질주입 시스템에서 rAAV 게놈과 함께 시스로의 Rep 및 Cap 유전자의 제공이 부분적으로 더 적은 빈 AAV 캡시드가 생산되기 때문에 우수한 rAAV 생산성을 초래한다고 믿는다.
rAAV 게놈
본원에 개시된 이중 벡터 시스템에서, 제1 핵산 벡터는 일반적으로 rAAV 게놈을 포함하는 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, rAAV 게놈은 트랜스진을 포함한다.
특정 실시양태에서, 트랜스진은 RNA 분자를 코딩하는 하나 이상의 서열을 포함한다. 적합한 RNA 분자는 제한 없이, miRNA, shRNA, siRNA, 안티센스 RNA, gRNA, 안타고미르, miRNA 스폰지, RNA 압타자임, RNA 압타머, mRNA, lncRNA, 리보자임, 및 당업계에 알려진 합성 RNA를 포함한다.
특정 실시양태에서, 트랜스진은 하나 이상의 폴리펩티드 또는 이의 단편을 코딩한다. 이러한 트랜스진은 폴리펩티드의 완전한 코딩 서열, 또는 폴리펩티드의 코딩 서열의 단편만을 포함할 수 있다. 특정 실시양태에서, 트랜스진은 대상체에서 질환 또는 장애를 치료하는 데 유용한 폴리펩티드를 코딩한다. 적합한 폴리펩티드는 제한 없이, β-글로빈, 헤모글로빈, 조직 플라스미노겐 활성화제 및 응고 인자; 콜로니 자극 인자 (CSF); 인터류킨, 예컨대, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9 등; 성장 인자, 예컨대, 각질형성세포 성장 인자 (KGF), 줄기 세포 인자 (SCF), 섬유아세포 성장 인자 (FGF, 예컨대, 염기성 FGF 및 산성 FGF), 간세포 성장 인자 (HGF), 인슐린-유사 성장 인자 (IGF), 뼈 형태발생 단백질 (BMP), 표피 성장 인자 (EGF), 성장 분화 인자-9 (GDF-9), 간종양 유래된 성장 인자 (HDGF), 미오스타틴 (GDF-8), 신경 성장 인자 (NGF), 뉴로트로핀, 혈소판-유래된 성장 인자 (PDGF), 트롬보포이에틴 (TPO), 형질전환 성장 인자 알파 (TGF-a) 및 형질전환 성장 인자 베타 (TGF-β) 등; 가용성 수용체, 예컨대, 가용성 TNF-a 수용체, 가용성 인터류킨 수용체 (예컨대, 가용성 IL-1 수용체 및 가용성 유형 II IL-1 수용체), 가용성 γ/ΔT 세포 수용체, 및 가용성 수용체의 리간드-결합 단편 등; 효소, 예컨대, a-글루코시다제, 이미글루세라제, β-글루코세레브로시다제 및 알글루세라제; 효소 활성화제, 예컨대, 조직 플라스미노겐 활성화제; 케모카인, 예컨대, IP-10, 인터페론-감마에 의해 유도된 모노카인 (Mig), Groα/IL-8, RANTES, MIP-1a, MIP-1β, MCP-1 및 PF-4 등; 혈관신생제, 예컨대, 혈관 내피 성장 인자 (VEGF, 예컨대, VEGF121, VEGF165, VEGF-C, VEGF-2), 신경교종-유래된 성장 인자, 안지오제닌 및 안지오제닌-2; 등; 항-혈관신생제, 예컨대, 가용성 VEGF 수용체; 단백질 백신; 신경자극성(neuroactive) 펩티드, 예컨대, 신경 성장 인자 (NGF), 브라디키닌, 콜레시스토키닌, 가스트린, 세크레틴, 옥시토신, 성선자극호르몬-방출 호르몬, 베타-엔돌핀, 엔케팔린, 물질 P, 소마토스타틴, 프로락틴, 갈라닌, 성장 호르몬-방출 호르몬, 봄베신, 디노르핀, 와파린, 뉴로텐신, 모틸린, 티로트로핀, 신경펩티드 Y, 황체형성 호르몬, 칼시토닌, 인슐린, 글루카곤, 바소프레신, 안지오텐신 II, 티로트로핀-방출 호르몬, 혈관작용 장 펩티드 및 수면 펩티드 등; 혈전용해제; 심방 나트륨이뇨 펩티드; 릴랙신; 신경교섬유성 산성 단백질; 난포 자극 호르몬 (FSH); 인간 알파-1 항트립신; 백혈병 억제 인자 (LIF); 조직 인자; 대식세포 활성화 인자; 종양 괴사 인자 (TNF); 호중구 화학주성 인자 (NCF); 메탈로프로테이나제의 조직 억제제; 혈관작용 장 펩티드; 안지오제닌; 안지오트로핀; 피브린; 히루딘; IL-1 수용체 길항제; 섬모 신경영양 인자 (CNTF); 뇌-유래된 신경영양 인자 (BDNF); 뉴로트로핀 3 및 4/5 (NT-3 및 -4/5); 신경교세포 유래된 신경영양 인자 (GDNF); 방향족 아미노산 탈탄산효소 (AADC); 인자 VIII, 인자 IX, 인자 X; 디스트로핀 또는 미니-디스트로핀; 리소좀 산 리파제; 페닐알라닌 수산화효소 (PAH); 글리코겐 저장 질환-관련된 효소, 예컨대, 글루코스-6-포스파타제, 산 말타제, 글리코겐 탈분지 효소, 근육 글리코겐 포스포릴라제, 간 글리코겐 포스포릴라제, 근육 포스포프럭토키나제, 포스포릴라제 키나제, 글루코스 수송체, 알돌라제 A, β-에놀라제, 글리코겐 합성효소; 리소좀 효소, 예컨대, 이두로네이트-2-설파타제 (I2S) 및 아릴설파타제 A; 및 미토콘드리아 단백질, 예컨대, 프라탁신을 포함한다.
특정 실시양태에서, 트랜스진은 하나 이상의 리소좀 저장 질환에 결함이 있을 수 있는 단백질을 코딩한다. 적합한 단백질은 제한 없이, α-시알리다제, 카텝신 A, α-만노시다제, β-만노시다제, 글리코실아스파라기나제, α-푸코시다제, α-N-아세틸글루코사미니다제, β-갈락토시다제, β-헥소사미니다제 α-서브유닛, β-헥소사미니다제 β-서브유닛, GM2 활성화제 단백질, 글루코세레브로시다제, 사포신 C, 아릴설파타제 A, 사포신 B, 포르밀-글리신 생성 효소, β-갈락토실세라미다제, α-갈락토시다제 A, 이두로네이트 설파타제, α-이두로니다제, 헤파란 N-설파타제, 아세틸-CoA 트랜스퍼라제, N-아세틸 글루코사미니다제, β-글루쿠로니다제, N-아세틸 글루코사민 6-설파타제, N-아세틸갈락토사민 4-설파타제, 갈락토스 6-설파타제, 히알루로니다제, α-글루코시다제, 산성 스핑고미엘리나제, 산성 세라미다제, 산성 리파제, 카텝신 K, 트리펩티딜 펩티다제, 팔미토일-단백질 티오에스테라제, 시스티노신, 시알린, UDP-N-아세틸글루코사민, 포스포트랜스퍼라제 γ-서브유닛, 뮤코리핀-1, LAMP-2, NPC1, CLN3, CLN 6, CLN 8, LYST, MYOV, RAB27A, 멜라노필린 및 AP3 β-서브유닛을 포함한다.
특정 실시양태에서, 트랜스진은 항체 또는 이의 단편 (예컨대, Fab, scFv 또는 전장 항체)을 코딩한다. 적합한 항체는 제한 없이, 뮤로모납-cd3, 에팔리주맙, 토시투모맙, 다클리주맙, 네바쿠맙, 카투막소맙, 에드레콜로맙, 압식시맙, 리툭시맙, 바실릭시맙, 팔리비주맙, 인플릭시맙, 트라스투주맙, 아달리무맙, 이브리투모맙 티욱세탄, 오말리주맙, 세툭시맙, 베바시주맙, 나탈리주맙, 파니투무맙, 라니비주맙, 에쿨리주맙, 세르톨리주맙, 우스테키누맙, 카나키누맙, 골리무맙, 오파투무맙, 토실리주맙, 데노수맙, 벨리무맙, 이필리무맙, 브렌툭시맙 베도틴, 페르투주맙, 락시바쿠맙, 오비누투주맙, 알렘투주맙, 실툭시맙, 라무시루맙, 베돌리주맙, 블리나투모맙, 니볼루맙, 펨브롤리주맙, 이다루시주맙, 네시투무맙, 디누툭시맙, 세쿠키누맙, 메폴리주맙, 알리로쿠맙, 에볼로쿠맙, 다라투무맙, 엘로투주맙, 익세키주맙, 레슬리주맙, 올라라투맙, 베즐로톡수맙, 아테졸리주맙, 오빌톡삭시맙, 이노투주맙 오조가미신, 브로달루맙, 구셀쿠맙, 두필루맙, 사릴루맙, 아벨루맙, 오크렐리주맙, 에미시주맙, 벤랄리주맙, 젬투주맙 오조가미신, 두르발루맙, 부로수맙, 에레누맙, 갈카네주맙, 라나델루맙, 모가물리주맙, 틸드라키주맙, 세미플리맙, 프레마네주맙, 라불리주맙, 에마팔루맙, 이발리주맙, 목세투모맙, 카플라시주맙, 로모소주맙, 리산키주맙, 폴라투주맙, 엡티네주맙, 레론리맙, 사시투주맙, 브로루시주맙, 이사툭시맙 및 테프로투무맙을 포함한다.
특정 실시양태에서, 트랜스진은 뉴클레아제를 코딩한다. 적합한 뉴클레아제는 제한 없이, 아연 핑거 뉴클레아제 (ZFN) (예컨대, 이들 각각이 그 전체가 본원에 참조로 원용되는, Porteus, and Baltimore (2003) Science 300: 763; Miller et al. (2007) Nat. Biotechnol. 25:778-785; Sander et al. (2011) Nature Methods 8:67-69; 및 Wood et al. (2011) Science 333:307 참고), 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN) (예컨대, 이들 각각이 그 전체가 본원에 참조로 원용되는, Wood et al. (2011) Science 333:307; Boch et al. (2009) Science 326:1509-1512; Moscou and Bogdanove (2009) Science 326:1501; Christian et al. (2010) Genetics 186:757-761; Miller et al. (2011) Nat. Biotechnol. 29:143-148; Zhang et al. (2011) Nat. Biotechnol. 29:149-153; 및 Reyon et al. (2012) Nat. Biotechnol. 30(5): 460-465 참고), 귀소 엔도뉴클레아제, 메가뉴클레아제 (예컨대, 그 전체가 본원에 참조로 원용되는 미국 특허 공개공보 번호 US 2014/0121115 참고), 및 RNA-가이드된 뉴클레아제 (예컨대, 이들 각각이 그 전체가 본원에 참조로 원용되는, Makarova et al. (2018) The CRISPR Journal 1(5): 325-336; 및 Adli (2018) Nat. Communications 9:1911 참고)를 포함한다.
특정 실시양태에서, 트랜스진은 RNA-가이드된 뉴클레아제를 코딩한다. 적합한 RNA-가이드된 뉴클레아제는 제한 없이, 클래스 I 및 클래스 II 클러스터링 규칙적으로 간격을 둔 짧은 회문식 반복부 (CRISPR)-연관된 뉴클레아제를 포함한다. 클래스 I은 유형 I, III 및 IV로 나뉘며, 제한 없이, 유형 I (Cas3), 유형 I-A (Cas8a, Cas5), 유형 I-B (Cas8b), 유형 I-C (Cas8c), 유형 I-D (Cas10d), 유형 I-E (Csel, Cse2), 유형 I-F (Csyl, Csy2, Csy3), 유형 I-U (GSU0054), 유형 III (Cas10), 유형 III-A (Csm2), 유형 III-B (Cmr5), 유형 III-C (Csx10 또는 Csx11), 유형 III-D (Csx10) 및 유형 IV (Csf1)를 포함한다. 클래스 II는 유형 II, V 및 VI로 나뉘며, 제한 없이, 유형 II (Cas9), 유형 II-A (Csn2), 유형 II-B (Cas4), 유형 V (Cpf1, C2c1, C2c3), 및 유형 VI (Cas13a, Cas13b, Cas13c)를 포함한다. RNA-가이드된 뉴클레아제는 또한 자연-발생 클래스 II CRISPR 뉴클레아제, 예컨대, Cas9 (유형 II) 또는 Cas12a/Cpf1 (유형 V)뿐만 아니라 이로부터 유래 또는 수득된 기타 뉴클레아제를 포함한다. 본 발명에 사용될 수 있는 예시적인 Cas9 뉴클레아제는 S. 피오게네스(S. pyogenes) Cas9 (SpCas9), S. 아우레우스(S. aureus) Cas9 (SaCas9), N. 메닌기티디스(N. meningitidis) Cas9 (NmCas9), C. 제주니(C. jejuni) Cas9 (CjCas9) 및 지오바실러스(Geobacillus) Cas9 (GeoCas9)를 포함하나, 이에 제한되지 않는다.
특정 실시양태에서, 트랜스진은 발현 시 검출가능한 신호를 생산하는 하나 이상의 리포터 서열을 코딩한다. 이러한 리포터 서열은 제한 없이, β-락타마제, β-갈락토시다제 (LacZ), 알칼리성 포스파타제, 티미딘 키나제, 녹색 형광 단백질 (GFP), 적색 형광 단백질 (RFP), 클로람페니콜 아세틸트랜스퍼라제 (CAT), 루시퍼라제, 예를 들어, CD2, CD4, CD8, 인플루엔자 헤마글루티닌 단백질 및 그에 대해 지시된 고친화도 항체가 존재하거나 기존의 수단에 의해 생산될 수 있는 당업계에 잘 알려진 기타 단백질을 포함하는 막 결합된 단백질, 및 특히 헤마글루티닌 또는 Myc로부터의 항원 태그 도메인에 적절하게 융합된 막 결합된 단백질을 포함하는 융합 단백질을 포함한다.
특정 실시양태에서, rAAV 게놈은 트랜스진에 의해 코딩되는 RNA 또는 폴리펩티드의 발현을 제어하기 위해 트랜스진에 작동가능하게 연결된 전사 조절 요소 (TRE)를 포함한다. 특정 실시양태에서, TRE는 구성적 프로모터를 포함한다. 특정 실시양태에서, TRE는 임의의 포유동물 세포 (예컨대, 임의의 인간 세포)에서 활성일 수 있다. 특정 실시양태에서, TRE는 광범위한 인간 세포에서 활성이다. 이러한 TRE는 본원에 기재된 것들 중 임의의 것 및 당업자에게 알려진 것들 중 임의의 것을 포함하는, 구성적 프로모터 및/또는 인핸서 요소를 포함할 수 있다. 특정 실시양태에서, TRE는 유도성 프로모터를 포함한다. 특정 실시양태에서, TRE는 조직-특이적 TRE일 수 있으며, 즉, 이는 특이적 조직(들) 및/또는 기관(들)에서 활성이다. 조직-특이적 TRE는 하나 이상의 조직-특이적 프로모터 및/또는 인핸서 요소, 및 임의로 하나 이상의 구성적 프로모터 및/또는 인핸서 요소를 포함한다. 당업자는 조직-특이적 프로모터 및/또는 인핸서 요소가 당업계에 잘 알려진 방법에 의해 조직에서 특이적으로 발현되는 유전자로부터 단리될 수 있음을 이해할 것이다.
적합한 프로모터는 예컨대, 사이토메갈로바이러스 프로모터 (CMV)(Stinski et al. (1985) Journal of Virology 55(2): 431-441), CMV 초기 인핸서/닭 β-액틴 (CBA) 프로모터/토끼 β-글로빈 인트론 (CAG) (Miyazaki et al. (1989) Gene 79(2): 269-277), CBSB (Jacobson et al. (2006) Molecular Therapy 13(6): 1074-1084), 인간 신장 인자 1α 프로모터 (EF1α)(Kim et al. (1990) Gene 91 (2): 217-223), 인간 포스포글리세레이트 키나제 프로모터 (PGK)(Singer-Sam et al. (1984) Gene 32(3): 409-417), 미토콘드리아 중질-가닥 프로모터 (Lodeiro et al. (2012) PNAS 109(17): 6513-6518), 유비퀴틴 프로모터 (Wulff et al. (1990) FEBS Letters 261: 101-105)를 포함한다. 특정 실시양태에서, TRE는 사이토메갈로바이러스 (CMV) 프로모터/인핸서 (예컨대, 서열번호 18 또는 19와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), SV40 프로모터, 닭 베타 액틴 (CBA) 프로모터 (예컨대, 서열번호 20 또는 21과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), smCBA 프로모터 (예컨대, 서열번호 22와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 신장 인자 1 알파 (EF1α) 프로모터 (예컨대, 서열번호 23과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 전사 인자 결합 부위를 포함하는 마우스의 미세(minute) 바이러스 (MVM) 인트론 (예컨대, 서열번호 24 또는 25와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 포스포글리세레이트 키나제 (PGK1) 프로모터, 인간 유비퀴틴 C (Ubc) 프로모터, 인간 베타 액틴 프로모터, 인간 뉴런-특이적 에놀라제 (ENO2) 프로모터, 인간 베타-글루쿠로니다제 (GUSB) 프로모터, 토끼 베타-글로빈 요소 (예컨대, 서열번호 26 또는 27과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 칼모듈린 1 (CALM1) 프로모터 (예컨대, 서열번호 28과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 ApoE/C-I 간 제어 영역 (HCR1) (예컨대, 서열번호 29와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 α1-항트립신 (hAAT) 프로모터 (예컨대, 서열번호 30, 31 또는 32와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 연장된 HCR1 (예컨대, 서열번호 33과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), hAAT 프로모터의 HS-CRM8 요소 (예컨대, 서열번호 34와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 트랜스티레틴 (TTR) 프로모터 (예컨대, 서열번호 35와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 및/또는 인간 메틸-CpG 결합 단백질 2 (MeCP2) 프로모터를 포함한다. 본원에 기재된 TRE 중 임의의 것은 효율적인 전사를 구동하기 위해 임의의 순서로 조합될 수 있다. 예를 들어, rAAV 게놈은 CMV 인핸서, CBA 프로모터, 및 총체적으로 CAG 프로모터 (예컨대, 서열번호 36과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함)라고 불리는 토끼 베타-글로빈 유전자의 엑손 3으로부터의 스플라이스 수용자를 포함하는 TRE를 포함할 수 있다. 예를 들어, rAAV 게놈은 CMV 인핸서 및 CBA 프로모터의 하이브리드, 이어서, 총체적으로 CASI 프로모터 영역 (예컨대, 서열번호 37과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함)이라고 불리는 스플라이스 공여자 및 스플라이스 수용자를 포함하는 TRE를 포함할 수 있다. 예를 들어, rAAV 게놈은 HCR1 및 hAAT 프로모터 (예컨대, 서열번호 38과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함하는, LP1 프로모터로서 또한 지칭됨)를 포함하는 TRE를 포함할 수 있다.
특정 실시양태에서, TRE는 뇌-특이적 (예컨대, 뉴런-특이적, 교세포-특이적, 성상교세포-특이적, 희돌기아교세포-특이적, 미세아교세포-특이적 및/또는 중추신경계-특이적)이다. 예시적인 뇌-특이적 TRE는 제한 없이, 인간 신경교섬유성 산성 단백질 (GFAP) 프로모터, 인간 시냅신 1 (SYN1) 프로모터, 인간 시냅신 2 (SYN2) 프로모터, 인간 메탈로티오네인 3 (MT3) 프로모터 및/또는 인간 단백지질 단백질 1 (PLP1) 프로모터로부터의 하나 이상의 요소를 포함할 수 있다. 보다 많은 뇌-특이적 프로모터 요소는 그 전체가 본원에 참조로 원용되는 WO 2016/100575A1에 개시되어 있다.
특정 실시양태에서, 트랜스진에 대한 천연 프로모터가 사용될 수 있다. 트랜스진의 발현이 천연 발현을 모방해야 하는 것이 바람직할 경우 천연 프로모터가 바람직할 수 있다. 천연 프로모터는 트랜스진의 발현이 일시적으로 또는 발달적으로, 또는 조직-특이적 방식으로, 또는 특이적 전사 자극에 반응하여 조절되어야 하는 경우 사용될 수 있다. 추가 실시양태에서, 다른 천연 발현 제어 요소, 예컨대, 인핸서 요소, 폴리아데닐화 부위 또는 Kozak 컨센서스 서열을 사용하여 천연 발현을 또한 모방할 수 있다.
특정 실시양태에서, rAAV 게놈은 편집 게놈을 포함한다. 편집 게놈은 편집 게놈과 세포 내 표적 유전자좌를 둘러싸는 게놈 영역의 상동 재조합에 의해 세포의 게놈을 편집하는 데 사용될 수 있다. 특정 실시양태에서, 편집 게놈은 상동 재조합에 의해 유전자의 유전적 결함을 교정하도록 설계된다. 편집 게놈은 일반적으로 (i) 표적 유전자 내의 표적 유전자좌를 편집하기 위한 편집 요소; (ii) 표적 유전자좌에 대해 5'인 제1 게놈 영역과 상동성을 갖는 편집 요소의 5'의 5' 상동성 아암 뉴클레오티드 서열; 및 (iii) 표적 유전자좌에 대해 3'인 제2 게놈 영역과 상동성을 갖는 편집 요소의 3'의 3' 상동성 아암 뉴클레오티드 서열을 포함하며, 여기서 5' 상동성 아암, 편집 요소 및 3' 상동성 아암을 포함하는 편집 게놈의 일부는 표적 유전자좌에 대해 센스 또는 안티센스 배향일 수 있다. 편집 게놈을 사용하여 편집하기에 적합한 표적 유전자는 제한 없이, 페닐알라닌 수산화효소 (PAH), 낭포성 섬유증 전도도 막관통 조절자 (CFTR), 베타 헤모글로빈 (HBB), 안구피부 백색증 II (OCA2), 헌팅틴 (HTT), 근긴장성 이영양증-단백질 키나제 (DMPK), 저-밀도 지질단백질 수용체 (LDLR), 아포지질단백질 B (APOB), 뉴로피브로민 1 (NF1), 다낭성 신장 질환 1 (PKD1), 다낭성 신장 질환 2 (PKD2), 응고 인자 VIII (F8), 디스트로핀 (DMD), 포스페이트-조절 엔도펩티다제 동족체, X-연결 (PHEX), 메틸-CpG-결합 단백질 2 (MECP2) 및 유비퀴틴-특이적 펩티다제 9Y, Y-연결 (USP9Y)을 포함한다.
특정 실시양태에서, 본원에 개시된 rAAV 게놈은 전사 종결인자 (예컨대, 폴리아데닐화 서열)를 추가로 포함한다. 특정 실시양태에서, 전사 종결인자는 트랜스진에 대해 3'이다. 전사 종결인자는 전사를 효과적으로 종결시키는 임의의 서열일 수 있으며, 당업자는 항체 코딩 서열의 적어도 일부의 전사가 요망되는 세포에서 발현되는 임의의 유전자로부터 이러한 서열이 단리될 수 있음을 이해할 것이다. 특정 실시양태에서, 전사 종결인자는 폴리아데닐화 서열을 포함한다. 특정 실시양태에서, 폴리아데닐화 서열은 면역글로불린 유전자의 내인성 폴리아데닐화 서열과 동일하거나 실질적으로 동일하다. 특정 실시양태에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 실시양태에서, 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다 (예컨대, 서열번호 65, 68 또는 69과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열, 또는 이에 상보적인 뉴클레오티드 서열을 포함함). 특정 실시양태에서, 폴리아데닐화 서열은 서열번호 65에 제시된 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 폴리아데닐화 서열은 서열번호 65에 제시된 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 폴리아데닐화 서열은 소 성장 호르몬 (BGH) 폴리아데닐화 서열이다 (예컨대, 서열번호 67과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열, 또는 이에 상보적인 뉴클레오티드 서열을 포함함). 특정 실시양태에서, 폴리아데닐화 서열은 서열번호 67에 제시된 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 폴리아데닐화 서열은 서열번호 67에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, rAAV 게놈은 서열번호 71, 85, 86, 87 또는 88에 제시된 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 편집 요소는 서열번호 71, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 편집 요소는 서열번호 71, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, 본원에 개시된 rAAV 게놈은 TRE의 5'의 5' 역전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 항체 경쇄 코딩 서열과 연관된 폴리아데닐화 서열의 3'의 3' 역전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 추가로 포함한다. 임의의 AAV 혈청형 또는 이의 변이체로부터의 ITR 서열은 본원에 개시된 rAAV 게놈에 사용될 수 있다. 5' 및 3' ITR은 동일한 혈청형의 AAV 또는 상이한 혈청형의 AAV로부터 유래될 수 있다. 본원에 개시된 rAAV 게놈에 사용하기 위한 예시적인 ITR은 본원의 서열번호 39, 40, 41, 42, 43 및 44에 제시되어 있다.
특정 실시양태에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래된다. 특정 실시양태에서, 5' ITR 및 3' ITR 둘 모두는 AAV2로부터 유래된다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 39와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 40과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 39와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 40과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는다. 특정 실시양태에서, rAAV 게놈은 서열번호 39의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 40의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 5' ITR 또는 3' ITR은 AAV5로부터 유래된다. 특정 실시양태에서, 5' ITR 및 3' ITR 둘 모두는 AAV5로부터 유래된다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 42와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 43과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 42와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 43과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는다. 특정 실시양태에서, rAAV 게놈은 서열번호 42의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 43의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드 서열은 실질적으로 서로 상보적이다 (예컨대, 5' 또는 3' ITR에서 1, 2, 3, 4 또는 5 개의 뉴클레오티드 위치에서의 미스매치를 제외하고 서로 상보적임).
특정 실시양태에서, 5' ITR 또는 3' ITR은 변형되어, Rep 단백질에 의한 분해를 감소시키거나 폐지한다 ("비-분해가능한 ITR"). 특정 실시양태에서, 비-분해가능한 ITR은 말단 분해 부위의 뉴클레오티드 서열에서의 삽입, 결실 또는 치환을 포함한다. 이러한 변형은 rAAV 게놈이 감염된 세포에서 복제된 후 AAV의 자가-상보적인 이중-가닥 DNA 게놈의 형성을 가능하게 한다. 예시적인 비-분해가능한 ITR 서열은 당업계에 알려져 있다 (예컨대, 그 전체가 본원에 참조로 원용되는, 미국 특허 번호 7,790,154 및 9,783,824에 제공된 것들 참고). 특정 실시양태에서, 5' ITR은 서열번호 41과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 5' ITR은 서열번호 41과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 5' ITR은 서열번호 41에 제시된 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 3' ITR은 서열번호 44와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 5' ITR은 서열번호 44와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 3' ITR은 서열번호 44에 제시된 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 5' ITR은 서열번호 41에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 44에 제시된 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 5' ITR은 서열번호 41에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 44에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, 5' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가적인 뉴클레오티드 서열에 측접된다. 특정 실시양태에서, 5' ITR은 AAV2 게놈에서 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가적인 46 bp 서열에 측접된다. 특정 실시양태에서, 추가적인 46 bp 서열은 rAAV 게놈에서 5' ITR에 대해 3'이다. 특정 실시양태에서, 46 bp 서열은 서열번호 45에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, 3' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가적인 뉴클레오티드 서열에 측접된다. 특정 실시양태에서, 3' ITR은 AAV2 게놈에서 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가적인 37 bp 서열에 측접된다. 예컨대, Savy et al., Human Gene Therapy Methods (2017) 28(5): 277-289 (이는 그 전체가 본원에 본원의 참조로 원용됨) 참고. 특정 실시양태에서, 추가적인 37 bp 서열은 rAAV 게놈에서 3' ITR에 대해 5'이다. 특정 실시양태에서, 37 bp 서열은 서열번호 46에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, rAAV 게놈은 서열번호 75, 78, 80, 82 또는 84에 제시된 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 편집 요소는 서열번호 75, 78, 80, 82 또는 84에 제시된 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 편집 요소는 서열번호 75, 78, 80, 82 또는 84에 제시된 뉴클레오티드 서열로 이루어진다.
AAV Rep 단백질
본 개시내용은 Rep 단백질 코딩 서열 또는 이의 기능적 변이체의 코딩 서열을 포함하는 제1 핵산 벡터를 제공한다. AAV Rep 유전자의 발현은 2 개의 프로모터 및 대체 스플라이싱을 사용하여 제어되며, 4 개의 Rep 단백질인 Rep78, Rep68, Rep52 및 Rep40을 초래한다. Rep 단백질은 AAV 게놈 복제 및 바이러스 게놈의 패키징에 관여한다. Rep 단백질의 발현은 p5 및 p19 프로모터에 의해 제어된다. p5 프로모터는 대체 스플라이스 변이체 Rep78 및 Rep68의 발현을 구동한다. p19 프로모터는 대체 스플라이스 변이체 Rep52 및 Rep40의 발현을 구동한다. 따라서, 제1 핵산 벡터는 하나 이상의 Rep 단백질 또는 이의 기능적 변이체를 코딩하는 뉴클레오티드 서열을 포함할 수 있다.
하나 이상의 Rep 단백질은 AAV2로부터 유래될 수 있다. 예시적인 AAV2 게놈 서열은 NCBI 참조 서열 NC_001401.2를 통해 찾아볼 수 있다. NCBI 참조 서열에 따르면, Rep68은 뉴클레오티드 321 내지 2252에 의해 코딩되고; Rep78은 뉴클레오티드 321 내지 2186에 의해 코딩되고; Rep40은 뉴클레오티드 993 내지 2252에 의해 코딩되고; Rep52는 뉴클레오티드 993 내지 2186에 의해 코딩된다.
특정 실시양태에서, 본 개시내용은 Rep78을 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep78을 코딩하는 뉴클레오티드 서열은 서열번호 50에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열은 서열번호 50에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep78을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 51에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 51에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형에서, AAV2에 대해 기재된 바와 같은 Rep78을 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 Rep68을 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep68을 코딩하는 뉴클레오티드 서열은 서열번호 52에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열은 서열번호 52에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep68을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 53에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 53에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형에서, AAV2에 대해 기재된 바와 같은 Rep68을 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 Rep40을 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep40을 코딩하는 뉴클레오티드 서열은 서열번호 54에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열은 서열번호 54에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep40을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 48에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 48에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 55에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 55에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형에서, AAV2에 대해 기재된 바와 같은 Rep40을 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep52를 코딩하는 뉴클레오티드 서열은 서열번호 56에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열은 서열번호 56에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep52를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 48에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 48에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 57에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 57에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형에서, AAV2에 대해 기재된 바와 같은 Rep52를 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열은 서열번호 58에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열은 서열번호 58에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열 각각에 작동가능하게 연결될 수 있는 하나 이상의 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 59에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 59에 제시된 서열을 포함하거나 이로 이루어진다.
AAV 캡시드 단백질
본 개시내용은 AAV 캡시드 단백질 코딩 서열을 포함하는 뉴클레오티드 서열을 포함하는 제1 핵산 벡터를 제공한다. 제1 핵산 벡터는 자연 AAV 단리물 및 이의 변이체를 포함하여 당업계에 알려진 임의의 AAV 캡시드로부터의 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함할 수 있다.
AAV 캡시드 단백질은 VP1, VP2 및 VP3 캡시드 단백질을 포함한다. VP1, VP2 및/또는 VP3 캡시드 단백질은 rAAV 게놈을 둘러싸는 캡시드로 조립된다. 특정 실시양태에서, 캡시드 단백질의 조립은 조립-활성화 단백질 (AAP)에 의해 촉진된다. 특정 AAV 혈청형의 캡시드는 조립을 위해 캡시드 단백질을 핵소체로 운반하는 데 AAP의 역할이 필요하다. 예를 들어, AAV1, AAV2, AAV3, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV12는 캡시드를 형성하기 위해 AAP가 필요한 반면, AAV4, AAV5 및 AAV11의 캡시드는 AAP 없이 조립할 수 있다. 예컨대, Earley et al. (2017) J. Virol. 91(3): e01980-16 참고.
상이한 AAV 혈청형 또는 이의 변이체는 상이한 아미노산 서열을 갖는 AAV 캡시드 단백질을 포함한다. 적합한 AAV 캡시드 단백질은 제한 없이, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV-LK03, NP59, VOY101, VOY201, VOY701, VOY801, VOY1101, AAVPHP.N, AAVPHP.A, AAVPHP.B, PHP.B2, PHP.B3, G2A3, G2B4, G2B5, PHP.S, AAVrh10, AAVRh32.33, AAVrh74, AAVHSC1, AAVHSC2, AAVHSC3, AAVHSC4, AAVHSC5, AAVHSC6, AAVHSC7, AAVHSC8, AAVHSC9, AAVHSC10, AAVHSC11, AAVHSC12, AAVHSC13, AAVHSC14, AAVHSC15, AAVHSC16, AAVHSC17 및 이들의 임의의 변이체로부터의 캡시드 단백질을 포함한다. 특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74로 이루어진 군으로부터 선택된다. 특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV8 및 AAVrh74로 이루어진 군으로부터 선택된다. 다양한 AAV 캡시드 단백질의 서열은 예컨대, 이의 개시내용이 그 전체가 본원에 참조로 원용되는, 미국 특허 공개공보 번호: US20030138772, US20140359799, US20150159173, US20150376607, US20170081680 및 US20170360962A1, 및 PCT 공개공보 번호 WO2020227515에 개시되어 있다.
예를 들어, 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이다. 특정 실시양태에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열을 포함한다.
예를 들어, 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기서 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산은 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이다. 특정 실시양태에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열을 포함한다.
예를 들어, 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기서 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산은 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질의 아미노산은 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산은 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산은 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산은 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이다. 특정 실시양태에서, 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 Y이다. 특정 실시양태에서, 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이다. 특정 실시양태에서, 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산은 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이다. 특정 실시양태에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이다. 특정 실시양태에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열을 포함한다.
특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 1, 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 1, 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 8의 아미노산 203-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 8의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 8의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 8의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 8의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 11의 아미노산 203-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 11의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 11의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 11의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 11의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 13의 아미노산 203-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 13의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 13의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 13의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 13의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 16의 아미노산 203-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 16의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 16의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 16의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 16의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드 단백질을 코딩하는 뉴클레오티드는 AAV 캡시드 단백질의 발현을 제어하는 전사 조절 요소에 작동가능하게 연결된다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. AAV 캡시드 단백질의 발현을 제어할 수 있는 당업계에 알려진 임의의 프로모터가 사용될 수 있다. 사용하기에 적합한 프로모터는 당업자에게 알려져 있고, 제한 없이, p40 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터를 포함한다. 다른 적합한 프로모터는 제한 없이, CMV 프로모터, CBA 프로모터 및 CAG 프로모터를 포함한다.
특정 실시양태에서, AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47, 48 또는 49에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47, 48 또는 49에 제시된 서열을 포함하거나 이로 이루어진다.
다른 양태에서, 본 개시내용은 Rep-Cap 요소를 포함하는 제1 뉴클레오티드 서열 및 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터를 제공한다. 특정 실시양태에서, Rep-Cap 요소는 AAV Rep 단백질을 코딩하는 핵산 서열 및 AAV 캡시드 단백질을 코딩하는 핵산 서열을 포함한다. Rep-Cap 요소는 당업계에 알려진 임의의 AAV Rep 단백질을 코딩하는 핵산 서열 및 당업계에 알려진 임의의 AAV 캡시드 단백질을 코딩하는 핵산 서열을 포함할 수 있다. 특정 실시양태에서 Rep-Cap 요소는 서열번호 73 또는 77에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
III. 제2 핵산 벡터
본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 포함한다. 당업자가 인식하는 바와 같이, AAV의 복제는 헬퍼 바이러스 유전자에 의해 코딩되는 헬퍼 인자의 존재에 따라 좌우된다. 헬퍼 인자는 헬퍼 바이러스, 예컨대, 제한 없이, 아데노바이러스, 헤르페스바이러스, 유두종바이러스, 사이토메갈로바이러스, 배큘로바이러스 및 인간 보카바이러스로부터의 헬퍼 바이러스에 의한 동시감염을 통해 제공될 수 있다. 그러나, 헬퍼 바이러스의 존재 하에 AAV를 성장시키는 것은 숙주 세포의 용해 및/또는 AAV 생성물의 오염을 야기할 수 있다. 이와 같이, AAV 복제에 필요한 헬퍼 인자를 코딩하는 헬퍼 바이러스의 유전자는 숙주 세포를 형질주입시키는 데 사용되는 벡터에 제공될 수 있다.
본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 AAV (예컨대, rAAV) 생산을 위한 숙주 세포 내로의 다음의 2 개의 핵산 벡터의 형질주입을 수반한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 특정 실시양태에서, 제2 핵산 벡터는 제1 핵산 벡터에서 발견되는 AAV 생산의 임의의 구성요소를 포함하지 않는다. 특정 실시양태에서, 제2 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함하지 않는다. 특정 실시양태에서, 제2 핵산 벡터는 AAV 캡시드 단백질 코딩 서열을 포함하지 않는다. 특정 실시양태에서, 제2 핵산 벡터는 Rep 코딩 서열 또는 이의 기능적 단편의 코딩 서열을 포함하지 않는다. 특정 실시양태에서, 제2 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함하지 않고/않거나, 제2 핵산 벡터는 AAV 캡시드 단백질 코딩 서열을 포함하지 않고/않거나, 제2 핵산 벡터는 Rep 코딩 서열 또는 이의 기능적 단편의 코딩 서열을 포함하지 않는다.
특정 실시양태에서, 제2 핵산 벡터는 아데노바이러스, 헤르페스바이러스, 폭스바이러스, 사이토메갈로바이러스 및 배큘로바이러스로 이루어진 군으로부터 선택되는 헬퍼 바이러스로부터 유래될 수 있는 하나 이상의 헬퍼 바이러스 유전자를 포함한다. 헬퍼 바이러스 유전자는 헬퍼 바이러스 유전자의 발현을 제어하는 전사 조절 요소에 작동가능하게 연결될 수 있다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. 사용하기에 적합한 프로모터는 당업자에게 알려져 있고, 제한 없이, RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터를 포함한다.
특정 실시양태에서, 제2 핵산 벡터는 하나 이상의 헬퍼 바이러스 유전자를 포함한다. 하나 이상의 헬퍼 바이러스 유전자는 아데노바이러스 (AdV)로부터 유래될 수 있다. 효율적인 AAV 생산에 필요한 것으로 알려진 최소 세트의 AdV 헬퍼 인자는 AdV 분자 E1, E2, E4 및 VA RNA로 이루어진다 (예컨대, Meier et al. (2020) Viruses 12(6): 662 참고). 특히, 효율적인 AAV 생산에 필요한 최소 세트의 AdV 헬퍼 인자는 AdV 분자 E1A, E1B, E2A, E4 및 VA RNA를 포함한다. 특정 실시양태에서, 제2 핵산 벡터는 숙주 세포 (예컨대, 숙주 AAV 생산 세포)에서 효율적인 AAV 생산 (예컨대, AAV 복제 및 패키징)을 허용할 충분한 세트의 헬퍼 바이러스 유전자를 포함한다.
전형적인 AdV 게놈은 초기 단계 및 후기 단계로 나누어지는 약 40 개의 엄격하게 조절되는 단백질을 발현한다. 초기 단계 단백질은 E1A, E1B, E2A 및 E4를 포함한다. 간략하게, E1A 및 E2A 단백질은 AAV Rep 단백질의 발현을 제어하는 AAV 프로모터 p5 및 p19를 활성화하는 기능을 한다. E1A 매개된 p5 활성은 AAV 복제에 필요한 것으로 밝혀졌다. E2A는 AAV 복제의 다양한 양태를 촉진하는 것으로 알려진 단일-가닥 DNA 결합 단백질이다. E1B 유전자는 E1B19K 및 E1B55K 종양단백질을 코딩한다. E1B19K는 E1A 유도된 아폽토시스를 억제하고, E1B55K는 종양 억압 단백질 p53을 억제한다. E1B55K는 E4orf6과 함께 기능하여, AAV 제2 가닥 합성 및 바이러스 DNA 복제를 촉진한다. E1B55K는 또한 AAV mRNA 수송(export)을 촉진하고 세포 mRNA 수송을 억제하여, 함께 AAV 유전자 발현을 촉진하는 것으로 나타났다. E1B19K는 E1A, E1B55K, E2A 및 E4orf6과 같은 다른 AdV 헬퍼 인자와 공동-발현될 때 AAV 역가를 향상시키는 기능을 하는 것으로 밝혀졌다.
VA RNA는 세포 내재 면역 단백질 이중-가닥 RNA-활성화된 키나제 (PKR)를 억제하는 기능을 하는 것으로 밝혀졌으며, 이의 억제는 효율적인 바이러스 단백질 합성을 보장한다. VA RNA는 또한 AAV 구조 단백질의 합성 및 조립을 촉진하는 것으로 나타났다. AdV 게놈 내의 VA 핵산은 VA RNA를 발생시키는 비-번역된 핵산 서열이라는 것이 당업자에게 용이하게 이해될 것이다.
가장 통상적으로 사용되는 헬퍼 기능 중 하나는 인간 AdV 유형 5로부터 비롯된다. 아데노바이러스 헬퍼 바이러스 유전자는 다른 알려진 아데노바이러스, 예를 들어, AdV 유형 2로부터 유래될 수 있다. AdV5 게놈은 약 36 킬로베이스이며, 예시적인 AdV5 게놈 서열은 NCBI 참조 서열 AC_000008.1을 통해 찾아볼 수 있다. NCBI 참조 서열에 따르면, E1A는 뉴클레오티드 560 내지 1545에 의해 코딩되고; E1B19K는 뉴클레오티드 1714 내지 2244에 의해 코딩되고; E1B55K는 뉴클레오티드 2019 내지 3509에 의해 코딩되고; E2A는 뉴클레오티드 22443 내지 24032에 의해 코딩되며; E4orf6/7은 뉴클레오티드 32914 내지 34077에 의해 코딩된다.
특정 실시양태에서, 본 개시내용은 AdV5 E2A를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, AdV5 E2A를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 AdV5 E2A를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, AdV5 E2A를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 60에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AdV5 E2A를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 60에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형 (예컨대, AdV2)에서, AdV5에 대해 기재된 바와 같은 E2A를 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 AdV5 E4를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, AdV5 E4를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 AdV5 E4를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, AdV5 E4를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 61에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AdV5 E4를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 61에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형 (예컨대, AdV2)에서, AdV5에 대해 기재된 바와 같은 E4를 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 AdV5 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, AdV5 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 AdV5 VA RNA를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, AdV5 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 62에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AdV5 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 62에 제시된 서열을 포함하거나 이로 이루어진다. VA RNA 핵산 서열은 VA RNA를 발생시키는 (예컨대, "코딩하는") 비-번역된 핵산 서열이라는 것이 당업자에게 용이하게 이해될 것이다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형 (예컨대, AdV2)에서, AdV5에 대해 기재된 바와 같은 VA RNA를 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열 각각에 작동가능하게 연결될 수 있는 하나 이상의 전사 조절 요소를 포함한다. 특정 실시양태에서, AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 63에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 63에 제시된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, 본 개시내용은 효율적인 AAV 생산에 필요한 최소 세트의 AdV 헬퍼 인자를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, 최소 세트의 AdV 헬퍼 인자를 코딩하는 뉴클레오티드를 포함하는 핵산은 AdV 분자 E1A, E1B, E2A, E4 및 VA RNA를 코딩한다.
특정 숙주 세포, 예컨대, HEK293T 세포는 필요한 헬퍼 인자 전부는 아니지만 일부를 내인적으로 제공하고, 나머지 헬퍼 인자는 플라스미드 형질주입을 통해 외인적으로 제공될 수 있다. 예를 들어, HEK293T 세포는 아데노바이러스 E1A 및 E1B 유전자를 내인적으로 발현하고, 나머지 아데노바이러스 헬퍼 유전자, 즉, AdV5 E4, E2A 및 바이러스-연관된 (VA) RNA를 코딩하는 유전자를 제공한다. 이러한 AdV5 헬퍼 유전자는 형질주입을 통해 단일 벡터에 의해 제공될 수 있다. 특정 실시양태에서, 본 개시내용은 E2A, E4 및 VA RNA로 이루어진 군으로부터 선택되는 AdV5 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 제공한다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형 (예컨대, AdV2)으로부터 유래된, AdV5에 대해 기재된 바와 같은 E2A, E4 및 VA RNA를 코딩하는 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 제공한다.
헬퍼 바이러스 유전자는 또한 헤르페스바이러스, 유두종바이러스 및 인간 보카바이러스로부터 유래될 수 있다. 헬퍼 바이러스 인자가 유래될 수 있는 헤르페스바이러스의 예는 HSV-1 및 HSV-2를 포함한다. AAV 생산을 지지하는 데 관여하는 것으로 알려진 HSV-1로부터 유래된 헬퍼 바이러스 인자는 제한 없이, UL5, UL8, UL52, ICP8, ICP0, ICP4, ICP22, UL30 및 UL42를 포함한다. 이러한 HSV-1 헬퍼 바이러스 인자의 다양한 기능 및 이들이 AAV 생산을 지지하는 방법은 당업자에게 알려져 있다. 예를 들어, 단일-가닥 DNA 결합 단백질 ICP8 외에 HSV-1 헬리카제-프리마제 복합체 UL5/UL8/UL52는 AAV 감염 모델에서 AAV 자손 생산을 복원하는 데 충분한 것으로 알려져 있으며; ICP0, ICP4 및 ICP22는 Rep 단백질의 발현을 촉진하는 데 관여되어 있고; HSV-1 DNA 중합효소 UL30/UL42는 AAV DNA의 복제에 관여되어 있다. 따라서, 특정 실시양태에서, 제2 핵산 벡터는 UL5, UL8, UL52, ICP8, ICP0, ICP4, ICP22, UL30 및 UL42로 이루어진 군으로부터 선택되는 하나 이상의 헬퍼 바이러스 유전자를 포함한다. 헬퍼 바이러스 인자가 유래될 수 있는 유두종바이러스의 예는 HPV-16이다. 특정 실시양태에서, HPV-16으로부터 유래된 헬퍼 바이러스 인자는 AdV 헬퍼 인자의 존재 하에 AAV 생산을 향상시킬 수 있다. AAV 복제를 지지하는 데 관여하는 것으로 알려진 이러한 HPV-16 헬퍼 인자는 제한 없이, E1, E2 및 E6을 포함한다. 헬퍼 바이러스 인자가 유래될 수 있는 인간 보카바이러스의 예는 인간 보카바이러스 1 (HBoV1)이다. AAV 생산을 지지하는 데 관여하는 것으로 알려진 HBoV1로부터 유래된 헬퍼 바이러스 인자는 제한 없이, NP1, NS2, NS4 및 바이러스의 긴 비코딩 RNA BocaSR을 포함한다.
IV. 벡터 및 세포
본 개시내용은 AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 제공한다.
제1 핵산 벡터 및 제2 핵산 벡터는 독립적으로 임의의 형태의 핵산 벡터일 수 있다. 적합한 벡터는 제한 없이, 플라스미드, 최소 벡터 (예컨대, 미니서클, 나노플라스미드(Nanoplasmids)TM, 도기본(doggybones) 및 MIDGE 벡터 등), 바이러스, 코스미드, 인공 염색체, 선형 DNA 및 mRNA를 포함한다. 특정 실시양태에서, 제1 핵산 벡터 및/또는 제2 핵산 벡터는 DNA 플라스미드 또는 DNA 최소 벡터이다. 필요한 벡터 요소를 수용할 수 있는 임의의 DNA 플라스미드 또는 DNA 최소 벡터가 제1 핵산 벡터 및 제2 핵산 벡터에 사용될 수 있다. 적합한 DNA 최소 벡터는 제한 없이, 선형 공유 폐쇄 DNA (예컨대, 미니스트링 DNA), 선형 공유 폐쇄 덤벨 모양의 DNA (예컨대, 도기본 DNA, 덤벨 DNA), 미니서클, 나노플라스미드TM, 최소한의 면역학적으로 정의된 유전자 발현 (MIDGE) 벡터, 및 당업자에게 알려진 기타를 포함한다. DNA 최소 벡터 및 이들의 생산 방법은 예컨대, 이들 모두가 그 전체가 본원에 참조로 원용되는 미국 특허 출원 번호 20100233814, 20120282283, 20130216562, 20150218565, 20150218586, 20160008488, 20160215296, 20160355827, 20190185924, 20200277624 및 20210010021에 기재되어 있다.
특정 실시양태에서, 본원에 개시된 벡터 내의 핵산은 예컨대, 코돈/RNA 최적화, 이종 신호 서열로의 대체 및/또는 mRNA 불안정성 요소의 제거에 의해 최적화된다. mRNA에서 코돈 변화를 도입하고/하거나 억제 영역을 제거함으로써 재조합 발현을 위한 최적화된 폴리뉴클레오티드를 생성하는 방법은 예컨대, 미국 특허 번호 5,965,726; 6,174,666; 6,291,664; 6,414,132; 및 6,794,498에 기재된 최적화 방법을 적용함으로써 수행될 수 있으며, 이들 모두는 이에 따라 그 전체가 참조로 본원에 원용된다. 예를 들어, RNA 내의 잠재적 스플라이스 부위 및 불안정성 요소 (예컨대, A/T 또는 A/U 풍부 요소)는 핵산 서열에 의해 코딩된 아미노산을 변경하지 않으면서 돌연변이되어, 재조합 발현을 위한 RNA의 안정성을 증가시킬 수 있다. 변경은 예컨대, 동일한 아미노산에 대해 대체 코돈을 사용하는 유전자 코드의 축퇴성을 활용한다. 특정 실시양태에서, 보존적 돌연변이, 예컨대, 원래의 아미노산과 유사한 화학적 구조 및 특성 및/또는 기능을 갖는 유사한 아미노산을 코딩하기 위해 하나 이상의 코돈을 변경하는 것이 바람직할 수 있다. 이러한 방법은 최적화되지 않은 폴리뉴클레오티드에 의해 코딩된 캡시드의 발현에 비해 코딩된 캡시드 단백질의 발현을 증가시킬 수 있다.
본원에 개시된 벡터는 벡터의 증식 및/또는 벡터에 의해 코딩된 단백질의 발현을 위해 (당업계에 알려진 임의의 기술을 사용하여) 세포 내로 도입될 수 있다. 따라서, 다른 양태에서, 본 개시내용은 본원에 개시된 벡터를 포함하는 재조합 세포를 제공한다. 그리고 추가로, 다른 양태에서, 본 개시내용은 rAAV를 생산하는 방법을 제공하며, 방법은 폴리뉴클레오티드가 발현되고 rAAV가 생산되는 조건 하에서 재조합 세포를 배양하는 단계를 포함한다.
다양한 숙주 세포 및 발현 시스템이 활용될 수 있다. 이러한 발현 시스템은 관심 코딩 서열이 생산되고 후속적으로 정제될 수 있는 비히클을 나타내지만, 또한 본원에 기재된 적절한 뉴클레오티드 코딩 서열로 형질전환되거나 형질주입될 때 rAAV를 생산할 수 있는 세포를 나타낸다. 이들은 예컨대, 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 박테리오파지 DNA, 플라스미드 DNA 또는 코스미드 DNA 발현 벡터로 형질전환된 미생물, 예컨대, 박테리아 (예컨대, 대장균 및 B. 서브틸리스(B. subtilis)); 예컨대, 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 효모 발현 벡터로 형질전환된 효모 (예컨대, 사카로마이세스 피키아(Saccharomyces Pichia)); 예컨대, 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 바이러스 발현 벡터 (예컨대, 배큘로바이러스)로 감염된 곤충 세포 시스템; 예컨대, 재조합 바이러스 발현 벡터 (예컨대, 콜리플라워 모자이크 바이러스, CaMV; 담배 모자이크 바이러스, TMV)로 감염되거나, 예컨대, 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 플라스미드 발현 벡터 (예컨대, Ti 플라스미드)로 형질전환된 식물 세포 시스템 (예컨대, 녹조류, 예컨대, 클라마이도모나스 인하르티이(Chlamydomonas reinhardtii); 또는 예컨대, 포유동물 세포의 게놈으로부터 유래된 프로모터 (예컨대, 메탈로티오네인 프로모터) 또는 포유동물 바이러스로부터 유래된 프로모터 (예컨대, 아데노바이러스 후기 프로모터; 백시니아 바이러스 7.5K 프로모터)를 포함하는 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 발현 작제물을 보유하는 포유동물 세포 시스템 (예컨대, COS (예컨대, COS1 또는 COS), CHO, BHK, MDCK, HEK293, NS0, PER.C6, VERO, CRL7O3O, HsS78Bst, HeLa 및 NIH 3T3, HEK293T, HEK293F, HepG2, SP210, R1.1, B-W, L-M, BSC1, BSC40, YB/20 및 BMT10 세포)을 포함하나, 이에 제한되지 않는다. 특정 실시양태에서, 본원에 기재된 뉴클레오티드 코딩 서열을 발현하기 위한 세포는 인간 세포, 예컨대, 인간 세포주이다. 특정 실시양태에서, 포유동물 발현 벡터는 pOptiVECTM 또는 pcDNA3.3이다. 특정 실시양태에서, 박테리아 세포, 예컨대, 대장균 또는 진핵 세포 (예컨대, 포유동물 세포)는 본원에 기재된 뉴클레오티드 코딩 서열의 발현을 위해 사용된다. 예를 들어, 인간 사이토메갈로바이러스로부터의 주요 중간 초기 유전자 프로모터 요소와 같은 벡터 요소와 함께, 포유동물 세포, 예컨대, CHO 또는 HEK293 세포는 본원에 기재된 폴리뉴클레오티드에 대한 효과적인 발현 시스템이다.
박테리아 시스템에서, 발현될 단백질에 대해 의도된 용도에 따라 다수의 발현 벡터가 유리하게 선택될 수 있다. 예를 들어, 대량의 단백질이 생산되어야 하는 경우, 용이하게 정제되는 높은 수준의 융합 단백질 생성물의 발현을 지시하는 벡터가 바람직할 수 있다. 이러한 벡터는, 단백질 코딩 서열이 lac Z 코딩 영역과 함께 프레임 내 벡터에 개별적으로 결찰되어 융합 단백질이 생산될 수 있도록 하는 대장균 발현 벡터 pUR278 (Ruether U & Mueller-Hill B (1983) EMBO J 2: 1791-1794); 및 pIN 벡터 (Inouye S & Inouye M (1985) Nuc Acids Res 13: 3101-3109; Van Heeke G & Schuster SM (1989) J Biol Chem 24: 5503-5509); 등을 포함하나, 이에 제한되지 않으며, 이들 모두가 그 전체가 본원에 참조로 원용된다. 예를 들어, pGEX 벡터는 또한 글루타티온 5-트랜스퍼라제 (GST)와의 융합 단백질로서 외래 폴리펩티드를 발현시키기 위해 사용될 수 있다. 일반적으로, 이러한 융합 단백질은 가용성이며, 매트릭스 글루타티온 아가로스 비드에 대한 흡착 및 결합 후 유리 글루타티온의 존재 하의 용리에 의해 용해된 세포로부터 쉽게 정제될 수 있다. pGEX 벡터는 클로닝된 표적 유전자 산물이 GST 모이어티로부터 방출될 수 있도록 트롬빈 또는 인자 Xa 프로테아제 절단 부위를 포함하도록 설계된다.
곤충 시스템에서, 예를 들어, 오토그라파 칼리포르니카(Autographa californica) 핵 다각체증 바이러스 (AcNPV)는 외래 유전자를 발현하기 위한 벡터로서 사용될 수 있다. 바이러스는 스포도프테라 프루기페르다(Spodoptera frugiperda) 세포에서 성장한다. 단백질 코딩 서열은 바이러스의 비-필수 영역 (예를 들어, 폴리헤드린 유전자)에 개별적으로 클로닝될 수 있으며, AcNPV 프로모터 (예를 들어, 폴리헤드린 프로모터)의 제어 하에서 배치될 수 있다.
포유동물 숙주 세포에서, 다수의 바이러스-기반 발현 시스템이 활용될 수 있다. 아데노바이러스가 발현 벡터로서 사용되는 경우, 관심 단백질 코딩 서열은 아데노바이러스 전사/번역 제어 복합체, 예컨대, 후기 프로모터 및 3부분 리더(tripartite leader) 서열에 결찰될 수 있다. 그런 다음, 이 키메라 유전자는 생체 외 또는 생체 내 재조합에 의해 아데노바이러스 게놈에 삽입될 수 있다. 바이러스 게놈의 비-필수 영역 (예컨대, 영역 E1 또는 E3)에서의 삽입은 감염된 숙주에서 본원에 기재된 뉴클레오티드 코딩 서열을 발현할 수 있고 생존가능한 재조합 바이러스를 초래할 것이다 (예컨대, 그 전체가 본원에 참조로 원용되는 Logan J & Shenk T (1984) PNAS 81(12): 3655-9 참고). 삽입된 단백질 코딩 서열의 효율적인 번역을 위해 특이적 개시 신호가 또한 필요할 수 있다. 이러한 신호는 ATG 개시 코돈 및 인접 서열을 포함한다. 더욱이, 개시 코돈은 전체 삽입물의 번역을 보장하기 위해 원하는 코딩 서열의 리딩 프레임과 위상이 같아야 한다. 이러한 외인성 번역 제어 신호 및 개시 코돈은 자연 및 합성 둘 모두의 다양한 기원일 수 있다. 발현의 효율성은 적절한 전사 인핸서 요소, 전사 종결인자 등의 포함에 의해 향상될 수 있다 (예컨대, 그 전체가 본원에 참조로 원용되는 Bitter Get al. (1987) Methods Enzymol. 153: 516-544 참고).
게다가, 삽입된 서열의 발현을 조정하거나 원하는 특이적 방식으로 유전자 산물을 변형 및 처리하는 숙주 세포 균주가 선택될 수 있다. 단백질 산물의 이러한 변형 (예컨대, 글리코실화) 및 가공 (예컨대, 절단)은 단백질의 기능에 중요할 수 있다. 상이한 숙주 세포는 단백질 및 유전자 산물의 번역-후 가공 및 변형을 위한 특징적이고 특이적인 메커니즘을 가지고 있다. 발현된 외래 단백질의 올바른 변형 및 가공을 보장하기 위해 적절한 세포주 또는 숙주 시스템이 선택될 수 있다. 이를 위해, 일차 전사물의 적절한 가공, 글리코실화 및 유전자 산물의 인산화를 위한 세포 기구를 보유하는 진핵 숙주 세포가 사용될 수 있다. 이러한 포유동물 숙주 세포는 CHO, VERO, BHK, Hela, MDCK, HEK293, HEK293T, HEK293F, HEK293EBNA, NIH 3T3, W138, BT483, Hs578T, HTB2, BT2O 및 T47D, NS0 (내인적으로 임의의 면역글로불린 쇄를 생산하지 않는 뮤린 골수종 세포주), CAP, CAP-T, CRL7O3O, COS (예컨대, COS1 또는 COS), PER.C6, VERO, AGE1.CR, A549, HsS78Bst, HepG2, C139, EB66, SP210, R1.1, B-W, L-M, BSC1, BSC40, YB/20, BMT10 및 HsS78Bst 세포를 포함하나, 이에 제한되지 않는다.
특정 실시양태에서, 바이러스 복제 기점을 함유하는 발현 벡터를 사용하는 대신, 숙주 세포는 적절한 전사 조절 요소 (예컨대, 프로모터, 인핸서, 서열, 전사 종결인자, 폴리아데닐화 부위 등) 및 선택가능한 마커에 의해 제어되는 폴리뉴클레오티드 (예컨대, DNA 또는 RNA)로 형질전환될 수 있다. 폴리뉴클레오티드의 도입 후, 조작된 세포를 농축 배지에서 1-2 일 동안 성장시킨 다음, 선택 배지로 스위칭할 수 있다. 재조합 플라스미드의 선택가능한 마커는 선택에 대한 저항성을 부여하고, 세포가 플라스미드를 이들의 염색체에 안정적으로 통합하고 성장시켜 초점을 형성할 수 있도록 하며, 이는 결과적으로 클로닝되어 세포주로 확장될 수 있다. 이 방법은 유리하게는 본원에 기재된 단백질 또는 이의 단편을 발현하는 세포주를 조작하기 위해 사용될 수 있다.
이들 모두가 그 전체가 본원에 참조로 원용되는, 각각 tk-, hgprt- 또는 aprt-세포의 단순 헤르페스 바이러스 티미딘 키나제 (Wigler M et al. (1977) Cell 11(1): 223-32), 하이포크산틴구아닌 포스포리보실트랜스퍼라제 (Szybalska EH & Szybalski W (1962) PNAS 48(12): 2026-2034) 및 아데닌 포스포리보실트랜스퍼라제 (Lowy I et al. (1980) Cell 22(3): 817-23) 유전자를 비제한적으로 포함하는 다수의 선택 시스템이 사용될 수 있다. 또한, 항대사물질 저항성은 다음의 유전자에 대한 선택의 기초로서 사용될 수 있다: 이들 모두가 그 전체가 본원에 참조로 원용되는, 메토트렉세이트에 대한 저항성을 부여하는 dhfr (Wigler M et al. (1980) PNAS 77(6): 3567-70; O'Hare K et al. (1981) PNAS 78: 1527-31); 마이코페놀산에 대한 저항성을 부여하는 gpt (Mulligan RC & Berg P (1981) PNAS 78(4): 2072-6); 아미노글리코시드 G-418에 대한 저항성을 부여하는 neo (Wu GY & Wu CH (1991) Biotherapy 3: 87-95; Tolstoshev P (1993) Ann Rev Pharmacol Toxicol 32: 573-596; Mulligan RC (1993) Science 260: 926-932; 및 Morgan RA & Anderson WF (1993) Ann Rev Biochem 62: 191-217; Nabel GJ & Felgner PL (1993) Trends Biotechnol 11(5): 211-5); 및 하이그로마이신에 대한 저항성을 부여하는 hygro (Santerre RF et al. (1984) Gene 30(1-3): 147-56). 재조합 DNA 기술 분야에서 일반적으로 공지된 방법은 원하는 재조합 클론을 선택하기 위해 일상적으로 적용될 수 있으며, 이러한 방법은 이들 모두가 그 전체가 본원에 참조로 원용되는, 예를 들어 Ausubel FM et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, NY (1993); Kriegler M, Gene Transfer and Expression, A Laboratory Manual, Stockton Press, NY (1990); 및 제12장 및 제13장, Dracopoli NC et al. (eds.), Current Protocols in Human Genetics, John Wiley & Sons, NY (1994); Colbere-Garapin F et al. (1981) J Mol Biol 150: 1-14에 기재되어 있다.
V. 아데노-연관된 바이러스 패키징 시스템 및 방법
다른 양태에서, 본 개시내용은 본원에 개시된 재조합 아데노-연관된 바이러스 (rAAV)의 재조합 제조를 위한 패키징 시스템을 제공한다. 특히, 본 개시내용은 본원에 기재된 이중 벡터 형질주입 시스템 하에서 AAV 생산에 유용한 패키징 시스템을 제공한다 (예컨대, AAV 생산은 숙주 세포 내로 전달되는 제1 및 제2 핵산 벡터를 포함하는 패키징 시스템의 사용에 의해 매개됨). 이러한 패키징 시스템은 일반적으로 다음을 포함하거나 이로 이루어진다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 제1 핵산 벡터 및 제2 핵산 벡터는 함께 rAAV의 생산에 필요한 모든 구성요소를 제공할 수 있다. 특정 실시양태에서, rAAV의 생산에 필요한 구성요소는 rAAV가 생산되는 숙주 세포에 의해 제공된다. 이러한 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터는 숙주 세포와 함께, rAAV의 생산에 필요한 모든 구성요소를 제공할 수 있다. 본원에 기재된 패키징 시스템은 rAAV 게놈을 캡시드에 동봉하여 rAAV를 형성하기 위한 세포에서 작동적이다.
특정 실시양태에서, 본 개시내용은 다음을 포함하는, rAAV 패키징 시스템을 제공한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 특정 실시양태에서, 본 개시내용은 다음을 포함하는, rAAV 패키징 시스템을 제공한다: (1) 5'에서 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함한다. 본 개시내용의 패키징 시스템의 제1 핵산 벡터는 AAV Rep 단백질 코딩 서열 또는 이의 기능적 변이체의 코딩 서열, 및 AAV 캡시드 단백질 코딩 서열을 추가로 포함한다. 따라서, 본 개시내용은 AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열, 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는 패키징 시스템의 제1 핵산 벡터를 제공한다. 특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열, 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는다.
임의의 AAV Rep 단백질이 본원에 개시된 패키징 시스템에 사용될 수 있다. 패키징 시스템의 특정 실시양태에서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 코딩한다. 적합한 AAV2 Rep 단백질은 제한 없이, Rep 78/68 또는 Rep 68/52를 포함할 수 있다. 패키징 시스템의 특정 실시양태에서, AAV2 Rep 단백질을 코딩하는 뉴클레오티드 서열은 서열번호 64의 AAV2 Rep 아미노산 서열과 최소 퍼센트 서열 동일성을 갖는 단백질을 코딩하는 뉴클레오티드 서열을 포함하며, 여기서 최소 퍼센트 서열 동일성은 AAV2 Rep 단백질의 아미노산 서열의 길이에 걸쳐 70% 이상 (예컨대, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100%)이다. 패키징 시스템의 특정 실시양태에서, AAV2 Rep 단백질은 서열번호 64에 제시된 아미노산 서열을 갖는다.
특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 헬퍼 바이러스 유전자를 포함한다. 본 개시내용의 패키징 시스템의 제2 핵산 벡터는 하나 이상의 헬퍼 바이러스 유전자를 포함할 수 있다. 본 개시내용의 특정 양태는 패키징 시스템의 제2 핵산 벡터가 본원에 기재된 바와 같은 제1 핵산 벡터에서 발견되는 AAV 생산의 임의의 구성요소를 포함하지 않는다는 것을 제공한다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함하지 않는다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 AAV 캡시드 단백질 코딩 서열을 포함하지 않는다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 Rep 코딩 서열 또는 이의 기능적 변이체의 코딩 서열을 포함하지 않는다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함하지 않고/않거나, 패키징 시스템의 제2 핵산 벡터는 AAV 캡시드 단백질 코딩 서열을 포함하지 않고/않거나, 패키징 시스템의 제2 핵산 벡터는 Rep 코딩 서열 또는 이의 기능적 변이체의 코딩 서열을 포함하지 않는다.
패키징 시스템의 특정 실시양태에서, 헬퍼 바이러스는 아데노바이러스, 헤르페스 바이러스 (단순 헤르페스 바이러스 (HSV) 포함), 폭스바이러스 (예컨대, 백시니아 바이러스), 사이토메갈로바이러스 (CMV) 및 배큘로바이러스로 이루어진 군으로부터 선택된다. 헬퍼 바이러스가 아데노바이러스인 패키징 시스템의 특정 실시양태에서, 아데노바이러스 게놈은 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 패키징 시스템의 특정 실시양태에서, 여기서 아데노바이러스 게놈은 E2, E4 및 VA로 이루어진 군으로부터 선택되는 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 헬퍼 바이러스가 HSV인 패키징 시스템의 특정 실시양태에서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 HSV 유전자 중 하나 이상을 포함한다.
패키징 시스템의 특정 실시양태에서, 패키징 시스템의 제1 및 제2 핵산 벡터는 2 개의 플라스미드 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 제1 플라스미드 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 제2 플라스미드 내에 함유된다.
패키징 시스템의 특정 실시양태에서, 패키징 시스템의 제1 및 제2 핵산 벡터는 2 개의 재조합 헬퍼 바이러스 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 제1 재조합 헬퍼 바이러스 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 제2 재조합 헬퍼 바이러스 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제1 및 제2 핵산 벡터는 단일 재조합 헬퍼 바이러스 내에 함유된다.
추가 양태에서, 본 개시내용은 rAAV의 재조합 제조 방법을 제공하며, 여기서 방법은 rAAV 게놈을 캡시드에 봉입하여 rAAV를 형성하도록 작동하는 조건 하에서 본원에 기재된 바와 같은 패키징 시스템으로 세포를 형질주입 또는 형질도입하는 단계를 포함한다. rAAV의 재조합 제조를 위한 예시적인 방법은 일시적 형질주입 (예컨대, 하나 이상의 형질주입 플라스미드를 이용한), 바이러스 감염 (예컨대, 하나 이상의 재조합 헬퍼 바이러스, 예컨대, 아데노바이러스, 폭스바이러스 (예컨대, 백시니아 바이러스), 헤르페스 바이러스 (HSV, 사이토메갈로바이러스 또는 배큘로바이러스 포함)를 이용한) 및 안정한 생산자 세포주 형질주입 또는 감염 (예컨대, 안정한 생산자 세포, 예컨대, 포유동물 또는 곤충 세포를 이용한)을 포함한다.
따라서, 본 개시내용은 rAAV의 제조를 위한 패키징 시스템을 제공하며, 여기서 패키징 시스템은 다음을 포함한다: (1) AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 특정 실시양태에서, 본 개시내용은 rAAV의 제조를 위한 패키징 시스템을 제공하며, 여기서 패키징 시스템은 다음을 포함한다. (1) 5'에서 3'으로, AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
따라서, 본 개시내용은 rAAV의 재조합 제조 방법을 제공하며, 여기서 방법은 다음을 포함하는, 패키징 시스템으로 세포를 형질주입 또는 형질도입하는 단계를 포함한다: (1) AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 특정 실시양태에서, 본 개시내용은 rAAV의 재조합 제조 방법을 제공하며, 여기서 방법은 다음을 포함하는, 패키징 시스템으로 세포를 형질주입 또는 형질도입하는 단계를 포함한다: (1) 5'에서 3'으로, AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
특정 실시양태에서, (1) AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.1 μg의 DNA/1E6 세포 내지 4 μg의 DNA/1E6 세포이다. 예를 들어, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3, 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9 또는 4 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 1 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.6 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.7 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.75 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.8 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.9 μg의 DNA/1E6 세포이다.
특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.1 내지 1:20이다. 예를 들어, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.1, 1:0.2, 1:0.3, 1:0.4, 1:0.5, 1:0.6, 1:0.7, 1:0.8, 1:1, 1:1.1, 1:1.2, 1:1.3, 1:1.4, 1:1.5, 1:1.6, 1:1.7, 1:1.8, 1:1.9, 1:2, 1:2.1, 1:2.2, 1:2.3, 1:2.4, 1:2.5, 1:2.6, 1:2.7, 1:2.8, 1:2.9, 1:3, 1:3.1, 1:3.2, 1:3.2, 1:3.3, 1:3.4, 1:3.5, 1:3.6, 1:3.7, 1:3.8, 1:3.9, 1:4, 1.4.5, 1:5, 1:5.5, 1:6, 1:6.5, 1:7, 1:7.5, 1:8, 1:8.5, 1:9, 1:9.5, 1:10, 1:10.5, 1:11, 1:11.5, 1:12, 1:12.5, 1:13, 1:13.5, 1:14, 1:14.5, 1:15, 1:15.5, 1:16, 1:16.5, 1:17, 1:17.5, 1:18, 1:18.5, 1:19, 1:19.5 또는 1:20이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.2, 1:0.4, 1:0.6, 1:0.8, 1:1, 1:2, 1:3 또는 1:4로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:2이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.2 내지 1:1이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.6이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.8이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:1이다.
특정 실시양태에서, 본원에 개시된 rAAV의 재조합 제조 방법은 다음을 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래한다: (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터. 특정 실시양태에서, 본원에 개시된 rAAV의 재조합 제조 방법은 다음을 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래한다: (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터.
특정 실시양태에서, 포유동물 세포는 세포 배양물로 제공된다. 특정 실시양태에서, 세포 배양물은 2 리터 이상, 50 리터 이상, 또는 2000 리터 이상의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 5000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 4000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 3000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 2500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 2000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 1500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 1000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 250 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 100 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 50 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 25 리터의 부피를 갖는다. 특정 실시양태에서, 본원에 기재된 방법은 2 리터 이상, 50 리터 이상, 또는 2000 리터 이상의 부피를 갖는 생물반응기에서 수행된다. 특정 실시양태에서, 본원에 기재된 방법은 2000 리터의 부피를 갖는 생물반응기에서 수행된다.
실시예
다음의 실시예는 제한이 아닌 예시를 위해 제공된다.
실시예 1: 재료 및 방법
다음의 실시예에서는 다음의 일반적인 재료 및 방법을 사용하였다.
소규모 생산: HEK293 세포를 1 회 이상의 계대 동안 확장시키고, 형질주입 전에 적절한 양의 세포 배양 배지를 함유하는 진탕 플라스크에 접종하였다. 진탕 플라스크를 진탕기에서 37℃, 8% CO2 및 135 rpm에서 항온처리하였다. 세포가 1.8E6 내지 2.4E6 개의 세포/mL (실시예 1-8의 경우) 또는 3.6E6 내지 5E6 개의 세포/mL (실시예 9의 경우)의 밀도에 도달하였을 때 세포를 형질주입시켰다. 계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 혼합함으로써 형질주입 혼합물을 제조하였다. 그런 다음, 형질주입 혼합물을 진탕 플라스크에 첨가하고, 수확 전 72 시간 동안 37℃, 8% CO2 및 135 rpm에서 진탕기에서 항온처리하였다. 72 시간의 항온처리 후, 세포를 1 M Tris (pH 9.5), 10% Triton X-100, 1 M MgCl2, 엔도뉴클레아제 (예컨대, 벤조나제(BENZONASE)®, 데나라세(DENARASE)®) 및 5 M NaCl을 함유하는 용해 완충액을 사용하여 용해시키고, 진탕 플라스크를 37℃, 8% CO2 및 135 rpm에서 60 분 동안 항온처리하였다. 조질의 용해물 샘플을 원심분리에 의해 수집하였다.
2 L 생물반응기 생산: HEK293 세포를 1 회 이상의 계대 동안 확장시키고, 형질주입 전에 적절한 양의 세포 배양 배지를 함유하는 2 L 생물반응기 (Millipore Mobius)에 접종하였다. pH를 형질주입-전 7.1±0.1로 이동시키고, 세포를 1.8E6 내지 2.4E6 개의 세포/mL (실시예 4-8의 경우) 또는 3.6E6 내지 5E6 개의 세포/mL (실시예 9-11의 경우)의 밀도로 형질주입시켰다. 계산된 부피의 벡터(들), OptiPro SFM 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 혼합함으로써 형질주입 혼합물을 제조하고, 형질주입 혼합물을 세포에 첨가하기 전에 10 분 동안 평형화되도록 하였다. 형질주입 69-75 시간 후에 세포를 수확하였다. 수확된 세포를 1 M Tris (pH 9.5), 10% Triton X-100, 1 M MgCl2, 엔도뉴클레아제 (예컨대, 벤조나제®, 데나라세®) 및 5 M NaCl을 함유하는 용해 완충액을 사용하여 용해시켰다. 적절한 부피의 용해 완충액을 생물반응기에 첨가하고, 세포를 37℃ 및 283 rpm에서 120 분 동안 항온처리하였다. 세포 잔해물을 제거하기 위해 원심분리 후에 조질의 용해물 샘플을 수집하였다.
세포당 벡터 게놈의 수 (vg/세포)의 벡터 게놈 생산성은 트랜스진을 포함하는 벡터 (즉, 트랜스진 벡터)의 트랜스진 페이로드에 특이적인 프라이머/프로브 세트를 사용하는 표준 방법에 의해 액적 디지털 PCR (ddPCR)에 의해 결정되었다. 리터당 벡터 게놈의 수 (vg/L)의 벡터 게놈 생산성은 트랜스진을 포함하는 벡터 (즉, 트랜스진 벡터)의 트랜스진 페이로드에 특이적인 프라이머/프로브 세트를 사용하는 표준 방법에 의해 액적 디지털 PCR (ddPCR)에 의해 결정되었다. 세포당 캡시드의 수는 Cap 서열을 포함하는 벡터에 의해 코딩된 바와 같은 캡시드의 에피토프에 대해 지시된 고정화된 항체를 이용하는 표준 방법에 의한 효소-연결된 면역흡착 검정 (ELISA)을 사용하여 결정되었다. 온전한 벡터 게놈의 백분율 (즉, 전체 캡시드의 백분율)은 ddPCR에 의해 결정된 벡터 게놈 생산성을 (실시예 2-4에서의) ELISA에 의해 결정된 세포당 캡시드의 수로 나눔으로써 계산하거나, (실시예 5에서의) 분석적 초원심분리 침강 속도 (AUC) 분석에 의해 결정되었다.
실시예 2: 이중 및 삼중 형질주입 시스템 간의 비교
벡터 게놈 (VG) 생산성과 관련하여 이중 벡터 형질주입 시스템의 유용성 및 삼중 형질주입 시스템과 비교하여 수득될 수 있는 온전한 벡터 게놈의 백분율을 평가하기 위해 초기 소-규모 생산, 개념-증명 연구를 수행하였다. 형질주입 조건을 표 1에 제시된 조건에 따라 설정하였다.
표 1: 형질주입 조건
표 1에 제시된 바와 같이, 이중 벡터 형질주입 시스템은 제1 V4 벡터 및 제2 V3 벡터를 포함하였다. 삼중 벡터 형질주입 시스템은 벡터 V1, V2 및 V3을 포함한다. 표 1에서, 벡터 비율은 질량을 기반으로 하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다.
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 원뿔형 튜브에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다. 수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
표 2: 벡터 요소
도 1a-1c는 이중 및 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 1a), 캡시드 생산성 (도 1b), 및 온전한 벡터 게놈의 백분율 (도 1c)을 도시한다. 도 1a 및 1c에 도시된 바와 같이, 이중 벡터 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 벡터 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 이들 데이터는 이중 벡터 형질주입 시스템을 사용하는 것이 대조군 삼중 벡터 형질주입 시스템과 비교하여 증가된 rAAV 역가를 초래한다는 것을 입증한다. 도 1a-1c에 도시된 다양한 조건이 표 1에 제시되어 있다.
이중 형질주입 시스템으로부터 수득된 증가된 VG 생산성 및 온전한 벡터 게놈의 증가된 백분율이 상이한 트랜스진 벡터를 사용하여 복제될 수 있는지 여부를 결정하기 위해 추가적인 형질주입 조건을 이용하여 확인 실험을 수행하였다. 형질주입 조건은 표 3에 제시된 조건에 따라 설정되었으며, 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다. 표 2에서, 벡터 비율은 질량을 기반으로 하였다.
표 3: 형질주입 조건
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 원뿔형 튜브에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다. 수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
도 2a-2c는 이중 및 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 2a), 캡시드 생산성 (도 2b), 및 온전한 벡터 게놈의 백분율 (도 2c)을 도시한다. 도 2a 및 2c에 도시된 바와 같이, 이중 벡터 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 벡터 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 이중 벡터 형질주입 시스템의 증가된 생산성은 인간 게놈 특이적 상동성 아암을 포함하는 편집 게놈 (조건 1 및 2) 또는 마우스 게놈 특이적 상동성 아암을 포함하는 편집 게놈 (조건 3 및 4)을 포함하는 2 개 이상의 상이한 트랜스진 벡터에 걸쳐 일관된 것으로 밝혀졌다. 도 2a-2c에 도시된 다양한 조건은 표 3에 제시되어 있다.
종합하면, 본 실시예에 제시된 데이터는 삼중 형질주입 시스템과 비교하여 이중 벡터 형질주입 시스템의 효능을 나타낸다. 특히, 이중 벡터 형질주입 시스템은 조질의 용해물 역가 및 온전한 벡터 게놈의 백분율을 증가시켰다.
실시예 3: 이중 벡터 형질주입 시스템 설계 간의 비교
이중 벡터 형질주입 시스템에서 벡터 요소의 구성이 생산성에 영향을 미치는지 여부를 조사하기 위해, 2 개의 이중 벡터 형질주입 시스템 설계을 테스트하였다. 각각의 설계에 기반한 생산으로부터 수득된 벡터 게놈 (VG) 생산성 및 온전한 벡터 게놈의 백분율을 평가하였다. 이중 벡터 형질주입 시스템 설계-1 ("설계-1") 및 설계-2 ("설계-2")는 벡터 게놈 및 헬퍼 서열과 관련하여 Rep/Cap 서열이 상주하는 벡터가 상이하다. 도 3a-3b는 설계-1 (도 3a) 및 설계-2 (도 3b)의 개략도를 제공한다. 도시된 바와 같이, 설계-1은 Rep/Cap 서열 및 트랜스진 ("GOI")을 포함하는 제1 벡터, 및 헬퍼 서열을 포함하는 제2 벡터를 포함하고 (도 3a); 설계-2는 트랜스진 ("GOI")을 포함하는 제1 벡터, 및 헬퍼 및 Rep/Cap 서열 둘 모두를 포함하는 제2 벡터를 포함한다 (도 3b). 형질주입 조건은 표 4에 제시된 조건에 따라 설정되었다.
표 4: 형질주입 조건
표 4에 제시된 바와 같이, 설계-1은 제1 V4 벡터 및 제2 V3 벡터를 포함한다. 설계-2는 제1 V1 벡터 및 제2 V7 벡터를 포함한다. 삼중 형질주입으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율을 대조군으로서 평가하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다. 표 4에서, 벡터 비율은 이중 벡터 형질주입 시스템 설계를 비교할 때 벡터의 상이한 크기를 고려하기 위해 플라스미드 크기 (즉, 몰 비율)를 기반으로 하였다.
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 원뿔형 튜브에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다. 수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
도 4a-4c는 이중 및 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 4a), 캡시드 생산성 (도 4b), 및 온전한 벡터 게놈의 백분율 (도 4c)을 도시한다. 도 4a 및 4c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 추가로, 도 4a 및 도 4c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된 VG 생산성 및 계산된 온전한 벡터 게놈의 백분율은 설계-2를 사용한 생산으로부터 수득된 것들보다 더 높은 것으로 밝혀졌다. 이러한 결과에 기반하여, 추가 연구를 위해 설계-1을 선택하였다. 도 4a-4c에 도시된 다양한 조건이 표 4에 제시되어 있다.
제3 이중 벡터 형질주입 시스템 설계 ("설계-3")를 테스트하였다. 3 개의 설계 각각에 기반한 생산으로부터 수득된 벡터 게놈 (VG) 생산성 및 온전한 벡터 게놈의 백분율을 나란히 평가하였다. 위에 논의된 바와 같이, 설계-1은 Rep/Cap 서열 및 트랜스진 ("GOI")을 포함하는 제1 벡터, 및 헬퍼 서열을 포함하는 제2 벡터를 포함하고 (도 3a); 설계-2는 트랜스진 ("GOP")을 포함하는 제1 벡터, 및 헬퍼 및 Rep/Cap 서열 둘 모두를 포함하는 제2 벡터를 포함하고 (도 3b); 설계 3은 트랜스진 ("GOI") 및 헬퍼 서열을 포함하는 제1 벡터, 및 Rep/Cap 서열을 포함하는 제2 벡터를 포함한다 (도 3c). 형질주입 조건은 표 5에 제시된 조건에 따라 설정되었다.
표 5: 형질주입 조건
표 5에 기재된 바와 같이, 설계-1은 제1 V20 벡터 및 제2 V3 벡터를 포함한다. 설계-2는 제1 V19 벡터 및 제2 V7 벡터를 포함한다. 설계-3은 제1 V21 벡터 및 제2 V2 벡터를 포함한다. 삼중 형질주입으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율을 대조군으로서 평가하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다. 표 5에서, 벡터 비율은 1:1 (1:1:1) 몰 비율로부터 전환된 질량-기반 비율이었다.
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 원뿔형 튜브에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다. 수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
도 5a-5c는 이중 및 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 5a), 캡시드 생산성 (도 5b), 및 온전한 벡터 게놈의 백분율 (도 5c)을 도시한다. 도 5a 및 5c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 추가로, 도 5a 및 도 5c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된, VG 생산성 및 계산된 온전한 벡터 게놈의 백분율은 설계-2 및 설계-3을 사용한 생산으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 이들 데이터는 설계-1 이중 벡터 형질주입 시스템을 사용하는 것이 설계-2 이중 벡터 형질주입 시스템, 설계-3 이중 벡터 형질주입 시스템 및 대조군 삼중 벡터 형질주입 시스템과 비교하여 증가된 rAAV 역가를 초래한다는 것을 입증한다. 도 5a-5c에 도시된 다양한 조건이 표 5에 제시되어 있다.
실시예 4: 이중 및 삼중 형질주입 시스템 간의 비교
실시예 3에서 관찰된 삼중 형질주입에 비해 설계-1의 증가된 생산성을 확인하기 위해, 형질주입 조건을 설정하여, 증가된 효능이 더 큰 규모 (2 L 규모)에서 유지되는지 여부, 및 설계-1의 증가된 효능이 상이한 트랜스진을 갖는 그리고 상이한 캡시드로의 rAAV 게놈의 패키징 전반에 걸쳐 확장되는지 여부를 조사하였다. 형질주입 조건은 표 6에 제시된 조건에 따라 설정되었다. 표 6에서, 벡터 비율은 질량을 기반으로 하였다.
표 6: 형질주입 조건
표 6에 제시된 바와 같이, 형질주입 조건 1, 2, 3, 4, 5 및 6을 설정하여, 설계-1의 증가된 효능이 상이한 트랜스진을 갖는 rAAV 게놈의 패키징 전반에 걸쳐 확장되는지 여부를 조사하였다. 상이한 트랜스진을 갖는 rAAV 게놈의 패키징 전반에 걸쳐 설계-1의 효능을 조사하는 것 외에도, 조건 6 및 7은 또한 효능이 상이한 캡시드로의 rAAV 게놈의 패키징 전반에 걸쳐 확장되는지 여부를 평가한다. 조건 1-5는 각각 AAVHSCS15 캡시드를 활용하고, 조건 6은 AAVHSCS17 캡시드를 활용하고, 조건 7은 AAV2 캡시드를 활용하였다. 삼중 형질주입으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율을 대조군으로서 평가하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다.
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 전달 조립체(assembly)에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다.
수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
도 6a-6c는 설계-1 및 대조군 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 6a), 캡시드 생산성 (도 6b) 및 온전한 벡터 게놈의 백분율 (도 6c)을 도시한다. 도 6a 및 6c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 테스트된 모든 조건에서 삼중 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 이들 결과에 기반하여, 상이한 캡시드에 상이한 트랜스진을 갖는 rAAV의 패키징 전반에 걸쳐, 삼중 형질주입에 비해 설계-1을 사용한 생산의 증가된 효능이 관찰되었다. 이중 벡터 형질주입 시스템의 증가된 생산성은 5 개의 상이한 rAAV 게놈에 대해 일관된 것으로 밝혀졌으며, 그 중 2 개는 편집 게놈 (조건 1 및 2)을 포함한다. 이들 데이터는 대조군 삼중 벡터 형질주입 시스템에 비해 설계-1 이중 벡터 형질주입 시스템을 사용하여 수득된 증가된 rAAV 역가가 상이한 캡시드에 상이한 트랜스진을 갖는 rAAV의 패키징 전반에 걸쳐 확장된다는 것을 입증한다. 도 6a-6c에 도시된 다양한 조건이 표 6에 제시되어 있다.
도 7a-7c는 설계-1을 사용한 AAV2 캡시드 (조건 7) 및 대조군 삼중 형질주입 시스템을 활용한 생산으로부터 수득된 VG 생산성 (도 7a), 캡시드 생산성 (도 7b) 및 온전한 벡터 게놈의 백분율 (도 7c)을 도시한다. 도 7a 및 7c에 도시된 바와 같이, 설계-1을 사용한 AAV2 캡시드를 활용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 도 7a-7c의 데이터는 소-규모 생산 연구로부터 생성되었다.
별도의 실험에서, 설계-1이 또한 AAVHSC13 캡시드를 포함하는 rAAV를 생산할 수 있다는 것이 밝혀졌다 (그 전체가 본원에 원용되는 미국 특허 번호 9,803,218 참고).
이들 데이터는 (삼중 플라스미드 시스템 대조군에 비해) 설계-1 이중 플라스미드 시스템에 의해 나타난 AAV 생산의 개선이 일반적으로 적용가능할 가능성이 있음을 시사한다.
실시예 5: 이중 및 삼중 형질주입 시스템 간의 비교
실시예 3 및 4는 대조군 삼중 형질주입 시스템을 사용한 생산과 비교하여, 설계-1을 사용한 생산으로부터 수득된 조질의 용해물에서 측정된 증가된 VG 생산성 및 온전한 벡터 게놈의 증가된 백분율을 입증하였다.
증가된 VG 생산성 및 온전한 벡터 게놈의 증가된 백분율이 정제-후 유지되었는지 확인하기 위해, 표 7에 제시된 것들에 따라 설정된 형질주입으로부터 수득된 조질의 용해물을 정화하고, 후속적으로 친화도 및 음이온 교환 크로마토그래피에 의해 정제하였다. 표 7에서, 50 L 규모에서 수행한 조건 3을 제외하고, 조건 1, 2 및 4를 각각 표 6의 조건 2, 3 및 5 (즉, 2 L 규모)에 따라 수행하였다. 상이한 벡터 비율을 사용하여 생산된 용해물을 별도로 정제하였다. 조건 1-3은 각각 AAVHSCS15 캡시드를 활용한 반면, 조건 4는 AAVHSCS17 캡시드를 활용하였다. 설계-1 이중 플라스미드 시스템으로부터 수득된 온전한 벡터 게놈은 표시된 대조군 삼중 플라스미드 시스템으로부터 수득된 온전한 벡터 게놈의 양에 대한 백분율 증가로서 표현되었다 (표 7 및 도 8). 표 7에서, 벡터 비율은 질량을 기반으로 하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다.
표 7: 형질주입 조건
도 8에 묘사된 데이터는 침강 계수에 기반하여 거대분자를 정량화하는 데 사용되는 방법인 분석적 초원심분리 침강 속도 (AUC) 분석에 기반한다. AUC는 상응하는 삼중 플라스미드 시스템 대조군에 비해, 각각의 설계-1 이중 플라스미드 시스템에 의해 생산된 벡터 게놈이 결여된 온전한 벡터 게놈 및 캡시드의 백분율을 결정하는 데 사용되었다. 도 8에서, 조건 1 및 2에 대해, 설계-1 벡터 비율 (즉, 표 7에 도시된 1:2, 1:3 및 1:4 비율) 각각으로부터 수득된 정제된 벡터에 대해 AUC를 수행하여, 온전한 벡터 게놈의 수를 결정한 다음, 평균화하고, 상응하는 삼중 플라스미드 시스템 대조군에 대한 퍼센트 증가로서 제시하였다. 도 8에 도시된 바와 같이, 테스트된 4 개의 설계-1 이중 플라스미드 시스템 각각에 대해 (상응하는 삼중 플라스미드 시스템 대조군으로부터 수득된 온전한 벡터 게놈의 수에 비해) 온전한 벡터 게놈의 수의 증가를 수득하였다. 이러한 데이터는 (삼중 플라스미드 시스템 대조군에 비해) 설계-1 이중 플라스미드 시스템에 의해 나타난 AAV 생산의 개선이 일반적으로 적용가능하고 확장가능할 가능성이 있음을 시사한다.
실시예 6: 이중 형질주입 시스템에서 캡시드 배경 발현
설계-1이 다른 이중 플라스미드 형질주입 시스템 설계를 능가하는 이유를 설명하기 위한 노력으로, 배경 캡시드 발현의 수준을 설계-1에서 결정하고, 설계-2의 배경 캡시드 발현의 수준과 비교하였다. 형질주입 조건은 표 8에 제시된 것들에 따라 설정되었다. 표 8에서, 벡터 비율은 질량을 기반으로 하였다.
표 8: 형질주입 조건
표 8에 도시된 바와 같이, 설계-1 및 설계-2를, 각각 각각의 이중 설계에 대해 Rep/Cap 함유 벡터만을 이용하여 함께 테스트하였다. 동일한 양의 Rep/Cap 함유 벡터를 단독으로 사용하거나 (예컨대, 조건 2 및 4), 이중 설계에서 벡터로서 사용하였다 (예컨대, 조건 1 및 3).
설계-2 (벡터 V7만의 형질주입; 조건 2)로부터의 배경 캡시드 생성의 수준은 설계-2의 이중 형질주입 (벡터 V1 및 V7 둘 모두의 형질주입; 조건 1)으로부터 생성된 배경 캡시드의 수준과 동일한 것으로 밝혀졌다 (도 9). 도 9에 도시된 바와 같이, 설계-1로부터의 배경 캡시드 생성은 설계-1의 이중 형질주입으로부터 생성된 배경 캡시드의 수준의 1% 미만이었다 (조건 4를 조건 3과 비교함).
실시예 7: 이중 및 삼중 형질주입 시스템으로부터 AAV의 대규모 생산 및 품질 평가
설계-1의 개선된 생산성이 대규모 생산에서 유지되는지 여부를 조사하기 위해, 설계-1에 대해 1:2의 벡터 비율에서 표 6의 조건 4를 50 L 생물반응기 규모에서 반복하였다. 진탕 플라스크 및 2 L 생물반응기 규모에서의 경향과 일관되게, 50 L 생물반응기로부터의 결과는 삼중 형질주입 시스템 ("3 TFX"; 삼중 형질주입 대조군의 조건에 대해 표 6 참고)으로부터 수득된 조질의 용해물과 비교하여 설계-1 ("2 TFX")로부터 수득된 조질의 용해물에서 VG 생산성의 거의 2-배의 증가, 비슷한 캡시드 생산 및 계산된 온전한 벡터 게놈의 배가(doubling)를 나타냈다 (도 10a-10c). 이러한 데이터는 대조군 삼중 벡터 형질주입 시스템과 비교하여 설계-1 이중 벡터 형질주입 시스템을 사용하여 수득된 증가된 rAAV 역가가 대규모 생산에서 유지된다는 것을 입증한다.
설계-1 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터의 산물 품질을 특성화하기 위해 다양한 분석적 방법을 사용하였다 (도 10d-10j). 도시된 바와 같이, 순도 퍼센트 (도 10d), 응집 퍼센트 (도 10e), 및 잔여 숙주 세포 단백질의 수준 (도 10f; BLoQ는 정량 한계 미만을 의미함)은 모두 형질주입 방법에 관계없이 일관되게 유지되었다. 삼중 형질주입 시스템으로부터 수득된 것들과 비교하여 설계-1로부터 수득된 정제된 AAV 벡터에 패키징된 잔류 숙주 세포 DNA (도 10g), Rep/Cap (도 10h), Ela (도 10i) 및 헬퍼 서열 (도 10j)의 양에서 편차가 발견되지 않았다.
실시예 8: 이중 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터의 생체활성
설계-1로부터 수득된 AAV 벡터 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터 간의 산물 비교성을 보장하기 위해, 설계 1에 대해 1:4의 벡터 비율에서 표 6의 조건 5로부터 수득된 AAV 벡터, 및 연관된 삼중 형질주입 대조군을 정제하고, 생체 내 생체활성에 대해 평가하였다. rAAV 게놈은 뮤린-특이적 상동성 아암에 측접된 간 특이적 프로모터의 제어 하에서 페닐알라닌 수산화효소 (PAH)를 발현하는 편집 게놈을 포함한다. 설계-1 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터를 고전적인 페닐케톤뇨증의 여러 특징을 나타내는 모델인 Pahenu2 마우스에 주사하였다. 2 개의 용량뿐만 아니라 비히클-단독 대조군을 평가하였다. 매주 혈청 샘플을 채취하고, 페닐알라닌 (Phe)의 수준을 분석하였다. 도 11a 및 11b에 도시된 바와 같이, 1E12 VG/kg (도 11a) 및 1E14 VG/kg (도 11b)의 두 용량 모두에서, 설계-1 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터의 투약-후 혈청 Phe 수준의 감소로 표시된 바와 같은 생체활성은 6-주 기간에 걸쳐 구별할 수 없었다. 더욱이, 6 주째에, 간에서의 벡터 게놈 및 PAH mRNA 발현의 정량은 VG 형질도입 및 트랜스진 발현의 용량 의존적 증가를 나타내었지만, 각각의 용량에서 설계-1 및 삼중 형질주입 그룹 사이에는 유의한 차이가 없었다 (도 11c 및 11d). 표적-내 통합의 정량은 1E14 VG/kg 용량에서 완료되었으며, 설계-1 또는 삼중 형질주입 시스템으로부터 생산된 AAV 벡터에 대해 비슷한 통합 효율성을 입증하였다 (도 11e).
실시예 9: 벡터 비율의 최적화
개선된 생산성을 초래하는 최적의 벡터 비율이 있는지 여부를 조사하기 위해, 다양한 설계-1 벡터 비율을 테스트하였다. 소규모 생산을 위해 실시예 1에 기재된 바와 같이 형질주입을 설정하였다.
도 12a-12c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 표시된 V3:V12 벡터 비율을 테스트한, 조건 1 하에서의 생산으로부터 수득된 VG 생산성 (도 12a), 캡시드 생산성 (도 12b), 및 온전한 벡터 게놈의 백분율 (도 12c)을 도시한다. V3 및 V12 내에 함유된 요소는 표 2에 제시되어 있다. 도 12a-12c에 도시된 바와 같이, 개선된 VG 및 캡시드 생산성은 1E6 개의 세포당 0.6 내지 1 μg의 형질주입된 총 DNA를 사용하여 1:0.3 내지 1:1의 V3:V12 벡터 비율에서 달성되었다.
도 13a-13c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 표시된 V3:V8 비율을 테스트한, 조건 2 하에서의 생산으로부터 수득된 VG 생산성 (도 13a), 캡시드 생산성 (도 13b), 및 온전한 벡터 게놈의 백분율 (도 13c)을 도시한다. V3 및 V8 내에 함유된 요소는 표 2에 제시되어 있다. 도 13a-13c에 도시된 바와 같이, 개선된 VG 및 캡시드 생산성은 1E6 개의 세포당 0.6 내지 1 μg의 형질주입된 총 DNA를 사용하여 1:0.6 내지 1:1의 V3:V8 벡터 비율에서 달성되었다. 이러한 데이터는 증가된 rAAV 역가가 이러한 벡터 비율 및 형질주입된 총 DNA의 수준을 사용하여 달성된다는 것을 입증한다.
실시예 10: 이중 플라스미드 형질주입을 사용한 다중 캡시드 혈청형의 평가
설계-1의 개선된 생산성이 다른 AAV 캡시드 혈청형에 걸쳐 유지되는지 여부를 조사하기 위해, 설계-1 또는 삼중 형질주입 시스템으로부터 생산된 AAV 벡터를 AAV 캡시드 혈청형 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74를 활용하여 테스트하였다. 2 L 생물반응기 생산을 위해 실시예 1에 기재된 바와 같이 형질주입을 설정하였다. 형질주입 조건은 표 9에 제시된 것들에 따라 설정되었다.
표 9: 형질주입 조건
도 14a-14c는 표 9에 제시된 조건 하에서 생산으로부터 수득된 VG 생산성 (도 14a), 캡시드 생산성 (도 14b) 및 온전한 벡터 게놈의 백분율 (도 14c)을 도시한다. 도 14a에 도시된 바와 같이, 상응하는 삼중 형질주입 시스템 대조군에 비해 설계-1을 사용한 생산으로부터 수득된 개선된 VG 생산성은 테스트된 모든 AAV 캡시드 혈청형에 걸쳐 유지된다. 도 14b에 도시된 바와 같이, 상응하는 삼중 형질주입 시스템 대조군에 비해 설계-1을 사용한 생산으로부터 수득된 캡시드 생산성은 개선되거나 유지된다. 도 14c에 도시된 바와 같이, 상응하는 삼중 형질주입 시스템 대조군에 비해 설계-1을 사용한 생산으로부터 수득된 온전한 벡터 게놈의 백분율은 개선되거나 유지된다. 이러한 데이터는 대조군 삼중 벡터 형질주입 시스템과 비교하여 설계-1 이중 벡터 형질주입 시스템을 사용하여 수득된 증가된 rAAV 역가가 상이한 AAV 캡시드 혈청형에 걸쳐 확장된다는 것을 입증한다.
실시예 11: 2000 L까지의 이중 플라스미드 확장성
실시예 7은 설계-1의 개선된 생산성이 50 L 생물반응기 규모에서 유지된다는 것을 보여주었다. 50 L 생물반응기로부터의 결과는 삼중 형질주입 시스템 대조군으로부터 수득된 조질의 용해물과 비교하여 설계-1로부터 수득된 조질의 용해물에서의 VG 생산성의 거의 2-배 증가를 나타냈다.
설계-1의 개선된 VG 생산성이 확장가능한지 여부를 조사하기 위해, 50 L 생물반응기 규모에서의 생산성을 2000 L 생물반응기 규모에서의 생산성과 비교하였다. 세포를 50 L 및 2000 L 생물반응기에 접종한 것을 제외하고는, 2 L 생물반응기 생산을 위해 실시예 1에 기재된 바와 같이 형질주입을 설정하였다. 세포를 3.6E6 내지 5E6 개의 세포/mL의 밀도로 형질주입시켰다. 50 L 생물반응기 및 2000 L 생물반응기에 대한 형질주입 조건은 표 10에 제시된 조건에 따라 설정되었다.
표 10: 형질주입 조건
도 15는 50 L 및 2000 L 생물반응기 규모가 비슷한 VG 생산성을 달성한다는 것을 도시한다. 이러한 데이터는 설계-1 이중 플라스미드 형질주입 시스템의 확장성을 입증한다.
본 발명의 추가 실시양태는 다음의 조항에서 제시된다:
1. 제1 핵산 벡터로서, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는, 핵산 벡터.
2. 조항 1에 있어서, 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는, 핵산 벡터.
3. 조항 1에 있어서, 5'으로부터 3'으로 다음을 포함하는, 헥산 벡터: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열.
4. 조항 1-3 중 어느 하나에 있어서, 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 핵산 벡터.
5. 재조합 AAV (rAAV) 패키징 시스템으로서, (i) 다음을 포함하는 제1 핵산 벡터: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열, 및 (ii) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 포함하는, 패키징 시스템.
6. 조항 5에 있어서, 제1 핵산 벡터가 5'으로부터 3'으로 다음을 포함하는, 패키징 시스템: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열.
7. 조항 5 또는 6에 있어서, 제1 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 패키징 시스템.
8. 조항 5-7 중 어느 하나에 있어서, 제2 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 패키징 시스템.
9. 조항 1-8 중 어느 하나에 있어서, 트랜스진이 폴리펩티드를 코딩하는, 핵산 벡터 또는 패키징 시스템.
10. 조항 1-8 중 어느 하나에 있어서, 트랜스진이 miRNA, shRNA, siRNA, 안티센스 RNA, gRNA, 안타고미르, miRNA 스폰지, RNA 압타자임, RNA 압타머, lncRNA, 리보자임 또는 mRNA를 코딩하는, 핵산 벡터 또는 패키징 시스템.
11. 조항 1-8 중 어느 하나에 있어서, 트랜스진이 페닐알라닌 수산화효소 (PAH), 글루코스-6-포스파타제 (G6Pase), 이두로네이트-2-설파타제 (I2S), 아릴설파타제 A (ARSA) 및 프라탁신 (FXN)으로 이루어진 군으로부터 선택되는 단백질을 코딩하는, 핵산 벡터 또는 패키징 시스템.
12. 임의의 전술한 조항에 있어서, rAAV 게놈이 트랜스진에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
13. 조항 12에 있어서, 전사 조절 요소가 프로모터 요소 및/또는 인트론 요소를 포함하는, 핵산 벡터 또는 패키징 시스템.
14. 임의의 전술한 조항에 있어서, rAAV 게놈이 폴리아데닐화 서열을 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
15. 조항 14에 있어서, 폴리아데닐화 서열이 트랜스진에 대해 3'인, 핵산 벡터 또는 패키징 시스템.
16. 임의의 전술한 조항에 있어서, rAAV 게놈이 서열번호 71, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
17. 임의의 전술한 조항에 있어서, rAAV 게놈이 트랜스진의 5'의 5' 역전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 트랜스진의 3'의 3' 역전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
18. 조항 17에 있어서, 5' ITR 뉴클레오티드 서열이 서열번호 39, 41 또는 42에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일하고/하거나, 3' ITR 뉴클레오티드 서열이 서열번호 40, 43 또는 44에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한, 핵산 벡터 또는 패키징 시스템.
19. 임의의 전술한 조항에 있어서, rAAV 게놈이 서열번호 75, 78, 80, 82 또는 84에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
20. 임의의 전술한 조항에 있어서, AAV Rep 단백질이 야생형 Rep 단백질 또는 이의 변이체인, 핵산 벡터 또는 패키징 시스템.
21. 임의의 전술한 조항에 있어서, AAV Rep 단백질이 AAV2 Rep 단백질 또는 이의 변이체인, 핵산 벡터 또는 패키징 시스템.
22. 임의의 전술한 조항에 있어서, 제1 뉴클레오티드 서열이 AAV Rep 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
23. 조항 22에 있어서, 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 핵산 벡터 또는 패키징 시스템.
24. 조항 23에 있어서, 프로모터가 P5 프로모터, P19 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
25. 임의의 전술한 조항에 있어서, AAV 캡시드 단백질이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh10, AAVRh32.33, AAVrh74, AAV-DJ, AAV-LK03, NP59, VOY101, VOY201, VOY701, VOY801, VOY1101, AAVPHP.N, AAVPHP.A, AAVPHP.B, PHP.B2, PHP.B3, G2A3, G2B4, G2B5 및 PHP.S로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
26. 임의의 전술한 조항에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
27. 조항 26에 있어서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G인, 핵산 벡터 또는 패키징 시스템.
28. 조항 27에 있어서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C인, 핵산 벡터 또는 패키징 시스템.
29. 조항 27에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
30. 임의의 전술한 조항에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
31. 조항 30에 있어서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G인, 핵산 벡터 또는 패키징 시스템.
32. 조항 31에 있어서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C인, 핵산 벡터 또는 패키징 시스템.
33. 조항 31에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
34. 임의의 전술한 조항에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
35. 조항 34에 있어서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산이 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산이 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질의 아미노산이 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산이 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G인, 핵산 벡터 또는 패키징 시스템.
36. 조항 35에 있어서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산이 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산이 Q이거나; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산이 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 Y이거나; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산이 K이거나; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산이 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산이 S이거나; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G이거나; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 또는 (i) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C인, 핵산 벡터 또는 패키징 시스템.
37. 조항 35에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
38. 임의의 전술한 조항에 있어서, 제3 뉴클레오티드 서열이 AAV 캡시드 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
39. 조항 38에 있어서, 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 핵산 벡터 또는 패키징 시스템.
40. 조항 39에 있어서, 프로모터가 P40 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
41. 임의의 전술한 조항에 있어서, 제1 핵산 벡터가 서열번호 73 또는 77에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
42. 임의의 전술한 조항에 있어서, 제2 뉴클레오티드 서열이 서열번호 71, 75, 78, 80, 82, 84, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
43. 임의의 전술한 조항에 있어서, 제1 뉴클레오티드 서열이 서열번호 50, 51, 52, 53, 54, 55, 56, 57, 58 또는 59에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하고; 제2 뉴클레오티드 서열이 서열번호 71, 75, 78, 80, 82, 84, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하고; 제3 뉴클레오티드 서열이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736, 138-736 및/또는 1-736의 아미노산 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 코딩하는, 핵산 벡터 또는 패키징 시스템.
44. 조항 43에 있어서, 제1 핵산 벡터가 5'으로부터 3'으로 제1 뉴클레오티드 서열; 제2 뉴클레오티드 서열; 및 제3 뉴클레오티드 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
45. 조항 5-44 중 어느 하나에 있어서, 헬퍼 바이러스 유전자가 아데노바이러스, 헤르페스 바이러스, 폭스바이러스, 사이토메갈로바이러스 및 배큘로바이러스로 이루어진 군으로부터 선택되는 헬퍼 바이러스로부터 유래되는, 패키징 시스템.
46. 조항 5-45 중 어느 하나에 있어서, 헬퍼 바이러스 유전자가 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 아데노바이러스로부터 유래된 RNA 유전자인, 패키징 시스템.
47. 조항 5-46 중 어느 하나에 있어서, 제2 핵산 벡터가 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 패키징 시스템.
48. 조항 47에 있어서, 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 패키징 시스템.
49. 조항 48에 있어서, 프로모터가 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 패키징 시스템.
50. 조항 5-49 중 어느 하나에 있어서, 제2 핵산 벡터가 서열번호 60, 61 또는 62에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 패키징 시스템.
51. 조항 5-50 중 어느 하나에 있어서, 제2 핵산 벡터가 서열번호 63에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 패키징 시스템.
52. 조항 5-45 중 어느 하나에 있어서, 헬퍼 바이러스 유전자가 UL5/8/52, ICP0, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 헤르페스 바이러스로부터 유래된 유전자인, 패키징 시스템.
53. 조항 52에 있어서, 제2 핵산 벡터가 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 패키징 시스템.
54. 조항 53에 있어서, 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 패키징 시스템.
55. 조항 54에 있어서, 프로모터가 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 패키징 시스템.
56. 조항 1-4 또는 9-44 중 어느 하나의 핵산 벡터, 또는 조항 5-55 중 어느 하나의 패키징 시스템을 포함하는, 숙주 세포.
57. 조항 56에 있어서, 숙주 세포가 포유동물 세포인, 숙주 세포.
58. 조항 57에 있어서, 포유동물 세포가 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택되는, 숙주 세포.
59. 조항 57 또는 58에 있어서, 포유동물 세포가 HEK293 세포인, 숙주 세포.
60. rAAV의 재조합 제조 방법으로서, rAAV가 생산되는 조건 하에서 조항 5-55 중 어느 하나의 패키징 시스템을 포유동물 세포에 도입하는 단계를 포함하는, 방법.
61. 조항 60에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.2, 1:0.4, 1:0.6, 1:0.8, 1:1, 1:2, 1:3 또는 1:4로 이루어진 군으로부터 선택되는, 방법.
62. 조항 60 또는 61에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:2인, 방법.
63. 조항 60 또는 61에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.2 내지 1:1인, 방법.
64. 조항 63에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.6인, 방법.
65. 조항 63에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.8인, 방법.
66. 조항 63에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:1인, 방법.
67. 조항 60-66 중 어느 하나에 있어서, 방법이 패키징 시스템의 0.1 내지 4 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는, 방법.
68. 조항 60-67 중 어느 하나에 있어서, 방법이 패키징 시스템의 0.5 내지 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는, 방법.
69. 조항 60-68 중 어느 하나에 있어서, 방법이 패키징 시스템의 0.6, 0.7, 0.8, 0.9 또는 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는, 방법.
70. 조항 60-68 중 어느 하나에 있어서, 방법이 패키징 시스템의 0.75 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는, 방법.
71. 조항 60-70 중 어느 하나에 있어서, 방법이 (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래하는, 방법.
72. 조항 60-70 중 어느 하나에 있어서, 방법이 (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 온전한 벡터 게놈의 증가된 백분율을 초래하는, 방법.
73. 조항 60-72 중 어느 하나에 있어서, 포유동물 세포가 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택되는, 방법.
74. 조항 60-73 중 어느 하나에 있어서, 포유동물 세포가 HEK293 세포인, 방법.
75. 조항 60-74 중 어느 하나에 있어서, 포유동물 세포가 세포 배양물에서 항온처리되는, 방법.
76. 조항 56-59 중 어느 하나에 정의된 바와 같은 숙주 세포의 집단으로서, 숙주 세포가 세포 배양물로 제공되는, 숙주 세포의 집단.
77. 조항 75 또는 조항 76에 있어서, 세포 배양물이 2 리터 이상, 50 리터 이상 또는 2000 리터 이상의 부피를 갖는, 방법 또는 숙주 세포의 집단.
본 발명은 본원에 기재된 구체적인 실시양태에 의해 범주가 제한되지 않는다. 실제로, 기재된 것들 외에 본 발명의 다양한 변형이 전술한 설명 및 첨부 도면으로부터 당업자에게 명백해질 것이다. 이러한 변형은 첨부된 청구범위의 범주 내에 속하도록 의도된다.
본원에 인용된 모든 참고문헌 (예컨대, 공개물 또는 특허 또는 특허 출원)은 각각의 개별 참고문헌 (예컨대, 공개물 또는 특허 또는 특허 출원)이 모든 목적을 위해 그 전체가 참조로 원용되도록 구체적으로 그리고 개별적으로 표시된 것과 동일한 정도로 모든 목적을 위해 그 전체가 참조로 본원에 원용된다. 다른 실시양태는 다음의 청구범위 내에 있다.
SEQUENCE LISTING <110> OXFORD BIOMEDICA SOLUTIONS LLC <120> ADENO-ASSOCIATED VIRUS PACKAGING SYSTEMS <130> G211157PM <140> PCT/US2022/073138 <141> 2022-06-24 <150> US 63/202,817 <151> 2021-06-25 <150> US 63/262,218 <151> 2021-10-07 <150> US 63/266,646 <151> 2022-01-11 <160> 106 <170> PatentIn version 3.5 <210> 1 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Adeno-associated virus 9 <400> 1 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 2 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 2 Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 3 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 3 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 4 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 4 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 5 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 5 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 6 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 7 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 7 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 8 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 9 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 9 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 10 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 10 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 11 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 11 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 12 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 13 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 13 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 14 <211> 0 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 14 000 <210> 15 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 16 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 16 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 17 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 17 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 18 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 18 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240 caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300 acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360 ccatg 365 <210> 19 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 19 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg 380 <210> 20 <211> 479 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 20 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120 ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180 cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240 ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300 gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360 tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420 tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggag 479 <210> 21 <211> 1246 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 21 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120 ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180 cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240 ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300 gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360 tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420 tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480 gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540 ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600 gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660 ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720 gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780 acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840 gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900 gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960 gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020 tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080 agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140 gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200 ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246 <210> 22 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 22 aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60 tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120 cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180 ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240 gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300 ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360 catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420 cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480 ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540 ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600 tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660 cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720 ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780 gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840 ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900 acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953 <210> 23 <211> 1168 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 23 cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60 tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120 aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180 gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240 gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300 gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360 gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420 gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480 tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540 tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600 cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660 gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720 gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780 ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840 gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900 cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960 cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020 cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080 atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140 tttttttctt ccatttcagg tgtcgtga 1168 <210> 24 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 24 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60 cacctgcctg aaatcacttt ttttcaggtt gg 92 <210> 25 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 25 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60 cacctgcctg aaatcactt 79 <210> 26 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 26 cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60 ttattgtgct gtctcatcat tttggcaaag aattc 95 <210> 27 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 27 cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60 ttattgtgct gtctcatcat tttggcaaag 90 <210> 28 <211> 918 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 28 ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60 gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120 cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180 cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240 gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300 cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360 ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420 gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480 ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540 agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600 ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660 ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720 gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780 cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840 cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900 cttcgctcgc accaagag 918 <210> 29 <211> 192 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 29 ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60 tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120 cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180 agtgtgagag gg 192 <210> 30 <211> 205 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 30 aatgactcct ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc 60 agcgtaggcg ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat 120 aactggggtg accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca 180 ctgcttaaat acggacgagg acagg 205 <210> 31 <211> 913 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 31 tagggaggtc ctgcacagaa ggggaggagg gggcagcagc tgtctgacca ctgttggtct 60 tgcaacttgt gtccccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 120 cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga 180 ggcaggagaa gaaatcaaca tcctggactt atcctctggg cctctcccca cccccaggat 240 tgtaactgaa atgcttcact ggtgctcctt ttgttttaag gcattggatc ttcatagcta 300 ctgatcgtgc ccaagcacac agtatctgca gcaaccactt aggcctccag gaatgtggtg 360 accattgacc ctaattcatt ccccttcatg gatcctatgt aaccatcctc caaaaagagc 420 tttcgcaaac tcaaataaac acaggaaagg aagaccttct tatctttgag agtatatgtt 480 tagccctata gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag 540 gcattttggg gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga 600 ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac 660 gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc 720 tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc 780 gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 840 gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 900 tacggacgag gac 913 <210> 32 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 32 gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag gcattttggg 60 gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga ttctgcagtg 120 agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac gccaccccct 180 ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc tttcggtaag 240 tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 300 gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 360 aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 420 gac 423 <210> 33 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 33 gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60 tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120 aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180 ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240 gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300 ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360 ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420 gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480 aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540 cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag gg 592 <210> 34 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 34 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc ac 72 <210> 35 <211> 170 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 35 cgatgctcta atctctctag acaaggttca tatttgtatg ggttacttat tctctctttg 60 ttgactaagt caataatcag aatcagcagg tttgcagtca gattggcagg gataagcagc 120 ctagctcagg agaagtgagt ataaaagccc caggctggga gcagccatca 170 <210> 36 <211> 1873 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 36 gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60 ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120 tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180 acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360 actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480 acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540 ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600 ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780 aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840 cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900 cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960 ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020 ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080 gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140 gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200 caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260 cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320 gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380 aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440 gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500 tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560 aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620 gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680 ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740 cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800 ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860 ttggcaaaga att 1873 <210> 37 <211> 1061 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 37 tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60 cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120 tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180 agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240 gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300 agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360 ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420 gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480 ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540 tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600 gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660 cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720 gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780 cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840 ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900 ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960 ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020 atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061 <210> 38 <211> 398 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 38 ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60 tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120 cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180 agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240 aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300 ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360 ccctctggat ccactgctta aatacggacg aggacagg 398 <210> 39 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 39 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcct 145 <210> 40 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 40 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 41 <211> 106 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 41 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106 <210> 42 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 42 ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60 agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120 cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167 <210> 43 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 43 tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60 tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120 cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167 <210> 44 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 44 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gcc 143 <210> 45 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 45 ggaggggtgg agtcgtgacg tgaattacgt catagggtta gggagg 46 <210> 46 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 46 gtagataagt agcatggcgg gttaatcatt aactaca 37 <210> 47 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 47 tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60 gggtatttaa gcccgagtga gcacgcaggg tctcca 96 <210> 48 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 48 gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60 cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120 cagtatttaa gcgcc 135 <210> 49 <211> 154 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 49 ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg tggttgaggt 60 ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccgccc ccagtgacgc 120 agatataagt gagcccaaac gggtgcgcga gtca 154 <210> 50 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 50 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataa 1866 <210> 51 <211> 1995 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 51 tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60 gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120 gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180 catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240 ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300 aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360 ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420 accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480 cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540 agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600 ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660 gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720 cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780 tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840 tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900 aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960 aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020 atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080 ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140 accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200 aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260 gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320 aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380 gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440 cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500 tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560 gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620 agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680 tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740 gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800 aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860 caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920 ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980 atctttgaac aataa 1995 <210> 52 <211> 1930 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 52 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 caaccttagt 1930 <210> 53 <211> 2059 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 53 tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60 gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120 gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180 catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240 ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300 aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360 ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420 accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480 cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540 agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600 ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660 gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720 cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780 tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840 tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900 aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960 aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020 atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080 ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140 accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200 aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260 gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320 aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380 gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440 cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500 tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560 gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620 agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680 tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740 gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800 aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860 caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920 ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980 atctttgaac aataaatgac ttaaaccagg tatggctgcc gatggttatc ttccagattg 2040 gctcgaggac aaccttagt 2059 <210> 54 <211> 1258 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 54 atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60 gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120 gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180 gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240 aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300 ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360 gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420 cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480 aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540 tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600 tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660 atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720 gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780 tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840 cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900 aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960 tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020 cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080 aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140 actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgact 1200 taaaccaggt atggctgccg atggttatct tccagattgg ctcgaggaca accttagt 1258 <210> 55 <211> 1531 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 55 gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60 cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120 cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg 180 acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg 240 ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac 300 aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc 360 aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt 420 atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt 480 tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct 540 tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt 600 gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc 660 tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg 720 gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt 780 ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg 840 actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg 900 accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt 960 ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca 1020 aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa 1080 agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg 1140 cagccatcga cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa 1200 tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg 1260 aatcagaatt caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc 1320 gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt 1380 catcatatca tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat 1440 ttggatgact gcatctttga acaataaatg acttaaacca ggtatggctg ccgatggtta 1500 tcttccagat tggctcgagg acaaccttag t 1531 <210> 56 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 56 atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60 gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120 gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180 gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240 aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300 ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360 gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420 cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480 aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540 tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600 tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660 atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720 gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780 tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840 cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900 aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960 tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020 cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080 aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140 actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194 <210> 57 <211> 1467 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 57 gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60 cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120 cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg 180 acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg 240 ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac 300 aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc 360 aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt 420 atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt 480 tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct 540 tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt 600 gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc 660 tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg 720 gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt 780 ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg 840 actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg 900 accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt 960 ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca 1020 aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa 1080 agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg 1140 cagccatcga cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa 1200 tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg 1260 aatcagaatt caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc 1320 gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt 1380 catcatatca tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat 1440 ttggatgact gcatctttga acaataa 1467 <210> 58 <211> 1930 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 58 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 caaccttagt 1930 <210> 59 <211> 2059 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 59 tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60 gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120 gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180 catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240 ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300 aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360 ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420 accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480 cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540 agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600 ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660 gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720 cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780 tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840 tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900 aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960 aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020 atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080 ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140 accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200 aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260 gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320 aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380 gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440 cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500 tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560 gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620 agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680 tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740 gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800 aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860 caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920 ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980 atctttgaac aataaatgac ttaaaccagg tatggctgcc gatggttatc ttccagattg 2040 gctcgaggac aaccttagt 2059 <210> 60 <211> 5336 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 60 ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60 acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120 taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180 ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240 cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300 ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360 cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420 aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480 cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540 acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600 gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660 caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720 atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780 ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840 gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900 ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960 acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020 gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080 gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140 ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200 gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260 tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320 ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380 tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440 cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500 agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560 tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620 gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680 tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740 ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800 ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860 aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920 ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980 cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040 gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100 aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160 gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220 cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280 tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340 aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400 aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460 ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520 gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580 aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640 ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700 gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760 gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820 cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880 gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940 cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000 tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060 aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120 gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180 cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240 aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300 ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360 atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420 tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480 ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540 gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600 cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660 ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720 ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780 aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840 cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900 cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960 ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020 gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080 agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140 ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200 ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260 gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320 taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380 gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440 cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500 ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560 cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620 ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680 cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740 ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800 gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860 tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920 cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980 ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040 cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100 tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160 ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220 accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280 agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcg 5336 <210> 61 <211> 3201 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 61 cccgggcgtt ttagggcgga gtaacttgca tgtattggga attgtagttt ttttaaaatg 60 ggaagtgacg tatcgtggga aaacggaagt gaagatttga ggaagttgtg ggttttttgg 120 ctttcgtttc tgggcgtagg ttcgcgtgcg gttttctggg tgttttttgt ggactttaac 180 cgttacgtca ttttttagtc ctatatatac tcgctctgta cttggccctt tttacactgt 240 gactgattga gctggtgccg tgtcgagtgg tgttttttaa taggtttttt tactggtaag 300 gctgactgtt atggctgccg ctgtggaagc gctgtatgtt gttctggagc gggagggtgc 360 tattttgcct aggcaggagg gtttttcagg tgtttatgtg tttttctctc ctattaattt 420 tgttatacct cctatggggg ctgtaatgtt gtctctacgc ctgcgggtat gtattccccc 480 gggctatttc ggtcgctttt tagcactgac cgatgttaac caacctgatg tgtttaccga 540 gtcttacatt atgactccgg acatgaccga ggaactgtcg gtggtgcttt ttaatcacgg 600 tgaccagttt ttttacggtc acgccggcat ggccgtagtc cgtcttatgc ttataagggt 660 tgtttttcct gttgtaagac aggcttctaa tgtttaaatg tttttttttt tgttatttta 720 ttttgtgttt aatgcaggaa cccgcagaca tgtttgagag aaaaatggtg tctttttctg 780 tggtggttcc ggaacttacc tgcctttatc tgcatgagca tgactacgat gtgcttgctt 840 ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata tcgccgccca 900 tgcaacaagc ttacataggg gctacgctgg ttagcatagc tccgagtatg cgtgtcataa 960 tcagtgtggg ttcttttgtc atggttcctg gcggggaagt ggccgcgctg gtccgtgcag 1020 acctgcacga ttatgttcag ctggccctgc gaagggacct acgggatcgc ggtatttttg 1080 ttaatgttcc gcttttgaat cttatacagg tctgtgagga acctgaattt ttgcaatcat 1140 gattcgctgc ttgaggctga aggtggaggg cgctctggag cagattttta caatggccgg 1200 acttaatatt cgggatttgc ttagagacat attgataagg tggcgagatg aaaattattt 1260 gggcatggtt gaaggtgctg gaatgtttat agaggagatt caccctgaag ggtttagcct 1320 ttacgtccac ttggacgtga gggcagtttg ccttttggaa gccattgtgc aacatcttac 1380 aaatgccatt atctgttctt tggctgtaga gtttgaccac gccaccggag gggagcgcgt 1440 tcacttaata gatcttcatt ttgaggtttt ggataatctt ttggaataaa aaaaaaaaaa 1500 catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560 ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620 agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680 caactactac acagagcgag ctaagcgacg agaccggaga cgcagatctg tttgtcacgc 1740 ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800 tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgcctacctc 1860 cttttgagac agagacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920 acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980 cgctgattca ggaatgggtt gttccctggg atatggttct gacgcgggag gagcttgtaa 2040 tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100 tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160 tgcagtgcat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220 ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280 aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340 ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400 actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460 agatcagggt gcgctgctgt gcccggagga caaggcgtct catgctgcgg gcggtgcgaa 2520 tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580 agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640 cccccatgta ggcgtggact tccccttcgc cgcccgttga gcaaccgcaa gttggacagc 2700 agcctgtggc tcagcagctg gacagcgaca tgaacttaag cgagctgccc ggggagttta 2760 ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820 atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880 actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940 ggtacggtga tcaatataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000 ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacatgcaa caggttcacg 3060 attctttatt cctgggcaat gtaggagaag gtgtaagagt tggtagcaaa agtttcagtg 3120 gtgtattttc cactttccca ggaccatgta aaagacatag agtaagtgct tacctcgcta 3180 gtttctgtgg attcactaga a 3201 <210> 62 <211> 743 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 62 tcgatgtagg atgttgcccc tcctgacgcg gtaggagaag gggagggtgc cctgcatgtc 60 tgccgctgct cttgctcttg ccgctgctga ggaggggggc gcatctgccg cagcaccgga 120 tgcatctggg aaaagcaaaa aaggggctcg tccctgtttc cggaggaatt tgcaagcggg 180 gtcttgcatg acggggaggc aaacccccgt tcgccgcagt ccggccggcc cgagactcga 240 accgggggtc ctgcgactca acccttggaa aataaccctc cggctacagg gagcgagcca 300 cttaatgctt tcgctttcca gcctaaccgc ttacgccgcg cgcggccagt ggccaaaaaa 360 gctagcgcag cagccgccgc gcctggaagg aagccaaaag gagcgctccc ccgttgtctg 420 acgtcgcaca cctgggttcg acacgcgggc ggtaaccgca tggatcacgg cggacggccg 480 gatccggggt tcgaaccccg gtcgtccgcc atgataccct tgcgaattta tccaccagac 540 cacggaagag tgcccgctta caggctctcc ttttgcacgg tctagagcgt caacgactgc 600 gcacgcctca ccggccagag cgtcccgacc atggagcact ttttgccgct gcgcaacatc 660 tggaaccgcg tccgcgactt tccgcgcgcc tccaccaccg ccgccggcat cacctggatg 720 tccaggtaca tctacggatt acg 743 <210> 63 <211> 9280 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 63 ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60 acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120 taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180 ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240 cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300 ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360 cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420 aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480 cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540 acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600 gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660 caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720 atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780 ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840 gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900 ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960 acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020 gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080 gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140 ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200 gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260 tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320 ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380 tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440 cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500 agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560 tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620 gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680 tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740 ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800 ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860 aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920 ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980 cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040 gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100 aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160 gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220 cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280 tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340 aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400 aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460 ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520 gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580 aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640 ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700 gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760 gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820 cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880 gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940 cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000 tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060 aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120 gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180 cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240 aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300 ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360 atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420 tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480 ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540 gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600 cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660 ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720 ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780 aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840 cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900 cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960 ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020 gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080 agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140 ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200 ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260 gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320 taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380 gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440 cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500 ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560 cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620 ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680 cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740 ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800 gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860 tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920 cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980 ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040 cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100 tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160 ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220 accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280 agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcgcccg 5340 ggcgttttag ggcggagtaa cttgcatgta ttgggaattg tagttttttt aaaatgggaa 5400 gtgacgtatc gtgggaaaac ggaagtgaag atttgaggaa gttgtgggtt ttttggcttt 5460 cgtttctggg cgtaggttcg cgtgcggttt tctgggtgtt ttttgtggac tttaaccgtt 5520 acgtcatttt ttagtcctat atatactcgc tctgtacttg gcccttttta cactgtgact 5580 gattgagctg gtgccgtgtc gagtggtgtt ttttaatagg tttttttact ggtaaggctg 5640 actgttatgg ctgccgctgt ggaagcgctg tatgttgttc tggagcggga gggtgctatt 5700 ttgcctaggc aggagggttt ttcaggtgtt tatgtgtttt tctctcctat taattttgtt 5760 atacctccta tgggggctgt aatgttgtct ctacgcctgc gggtatgtat tcccccgggc 5820 tatttcggtc gctttttagc actgaccgat gttaaccaac ctgatgtgtt taccgagtct 5880 tacattatga ctccggacat gaccgaggaa ctgtcggtgg tgctttttaa tcacggtgac 5940 cagttttttt acggtcacgc cggcatggcc gtagtccgtc ttatgcttat aagggttgtt 6000 tttcctgttg taagacaggc ttctaatgtt taaatgtttt tttttttgtt attttatttt 6060 gtgtttaatg caggaacccg cagacatgtt tgagagaaaa atggtgtctt tttctgtggt 6120 ggttccggaa cttacctgcc tttatctgca tgagcatgac tacgatgtgc ttgctttttt 6180 gcgcgaggct ttgcctgatt ttttgagcag caccttgcat tttatatcgc cgcccatgca 6240 acaagcttac ataggggcta cgctggttag catagctccg agtatgcgtg tcataatcag 6300 tgtgggttct tttgtcatgg ttcctggcgg ggaagtggcc gcgctggtcc gtgcagacct 6360 gcacgattat gttcagctgg ccctgcgaag ggacctacgg gatcgcggta tttttgttaa 6420 tgttccgctt ttgaatctta tacaggtctg tgaggaacct gaatttttgc aatcatgatt 6480 cgctgcttga ggctgaaggt ggagggcgct ctggagcaga tttttacaat ggccggactt 6540 aatattcggg atttgcttag agacatattg ataaggtggc gagatgaaaa ttatttgggc 6600 atggttgaag gtgctggaat gtttatagag gagattcacc ctgaagggtt tagcctttac 6660 gtccacttgg acgtgagggc agtttgcctt ttggaagcca ttgtgcaaca tcttacaaat 6720 gccattatct gttctttggc tgtagagttt gaccacgcca ccggagggga gcgcgttcac 6780 ttaatagatc ttcattttga ggttttggat aatcttttgg aataaaaaaa aaaaaacatg 6840 gttcttccag ctcttcccgc tcctcccgtg tgtgactcgc agaacgaatg tgtaggttgg 6900 ctgggtgtgg cttattctgc ggtggtggat gttatcaggg cagcggcgca tgaaggagtt 6960 tacatagaac ccgaagccag ggggcgcctg gatgctttga gagagtggat atactacaac 7020 tactacacag agcgagctaa gcgacgagac cggagacgca gatctgtttg tcacgcccgc 7080 acctggtttt gcttcaggaa atatgactac gtccggcgtt ccatttggca tgacactacg 7140 accaacacga tctcggttgt ctcggcgcac tccgtacagt agggatcgcc tacctccttt 7200 tgagacagag acccgcgcta ccatactgga ggatcatccg ctgctgcccg aatgtaacac 7260 tttgacaatg cacaacgtga gttacgtgcg aggtcttccc tgcagtgtgg gatttacgct 7320 gattcaggaa tgggttgttc cctgggatat ggttctgacg cgggaggagc ttgtaatcct 7380 gaggaagtgt atgcacgtgt gcctgtgttg tgccaacatt gatatcatga cgagcatgat 7440 gatccatggt tacgagtcct gggctctcca ctgtcattgt tccagtcccg gttccctgca 7500 gtgcatagcc ggcgggcagg ttttggccag ctggtttagg atggtggtgg atggcgccat 7560 gtttaatcag aggtttatat ggtaccggga ggtggtgaat tacaacatgc caaaagaggt 7620 aatgtttatg tccagcgtgt ttatgagggg tcgccactta atctacctgc gcttgtggta 7680 tgatggccac gtgggttctg tggtccccgc catgagcttt ggatacagcg ccttgcactg 7740 tgggattttg aacaatattg tggtgctgtg ctgcagttac tgtgctgatt taagtgagat 7800 cagggtgcgc tgctgtgccc ggaggacaag gcgtctcatg ctgcgggcgg tgcgaatcat 7860 cgctgaggag accactgcca tgttgtattc ctgcaggacg gagcggcggc ggcagcagtt 7920 tattcgcgcg ctgctgcagc accaccgccc tatcctgatg cacgattatg actctacccc 7980 catgtaggcg tggacttccc cttcgccgcc cgttgagcaa ccgcaagttg gacagcagcc 8040 tgtggctcag cagctggaca gcgacatgaa cttaagcgag ctgcccgggg agtttattaa 8100 tatcactgat gagcgtttgg ctcgacagga aaccgtgtgg aatataacac ctaagaatat 8160 gtctgttacc catgatatga tgctttttaa ggccagccgg ggagaaagga ctgtgtactc 8220 tgtgtgttgg gagggaggtg gcaggttgaa tactagggtt ctgtgagttt gattaaggta 8280 cggtgatcaa tataagctat gtggtggtgg ggctatacta ctgaatgaaa aatgacttga 8340 aattttctgc aattgaaaaa taaacacgtt gaaacataac atgcaacagg ttcacgattc 8400 tttattcctg ggcaatgtag gagaaggtgt aagagttggt agcaaaagtt tcagtggtgt 8460 attttccact ttcccaggac catgtaaaag acatagagta agtgcttacc tcgctagttt 8520 ctgtggattc actagaatcg atgtaggatg ttgcccctcc tgacgcggta ggagaagggg 8580 agggtgccct gcatgtctgc cgctgctctt gctcttgccg ctgctgagga ggggggcgca 8640 tctgccgcag caccggatgc atctgggaaa agcaaaaaag gggctcgtcc ctgtttccgg 8700 aggaatttgc aagcggggtc ttgcatgacg gggaggcaaa cccccgttcg ccgcagtccg 8760 gccggcccga gactcgaacc gggggtcctg cgactcaacc cttggaaaat aaccctccgg 8820 ctacagggag cgagccactt aatgctttcg ctttccagcc taaccgctta cgccgcgcgc 8880 ggccagtggc caaaaaagct agcgcagcag ccgccgcgcc tggaaggaag ccaaaaggag 8940 cgctcccccg ttgtctgacg tcgcacacct gggttcgaca cgcgggcggt aaccgcatgg 9000 atcacggcgg acggccggat ccggggttcg aaccccggtc gtccgccatg atacccttgc 9060 gaatttatcc accagaccac ggaagagtgc ccgcttacag gctctccttt tgcacggtct 9120 agagcgtcaa cgactgcgca cgcctcaccg gccagagcgt cccgaccatg gagcactttt 9180 tgccgctgcg caacatctgg aaccgcgtcc gcgactttcc gcgcgcctcc accaccgccg 9240 ccggcatcac ctggatgtcc aggtacatct acggattacg 9280 <210> 64 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> AAV2 Rep <400> 64 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 65 <211> 198 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 65 gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120 tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180 gtgtgggagg ttttttaa 198 <210> 66 <211> 4186 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 66 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240 gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300 aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360 tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420 tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480 gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540 tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600 tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660 ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720 caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780 ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840 agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900 ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960 tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagcc cctaaaatgg 1020 gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 1080 ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 1140 ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 1200 ggaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 1260 gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 1320 ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 1380 cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 1440 acctgggaca gtgaatcctc taaggtaaat ataaaatttt taagtgtata atgtgttaaa 1500 ctactgattc taattgtttc tctcttttag attccaacct ttggaactga ccgccaccat 1560 gtccaccgct gtgctggaga accctgggct ggggaggaaa ctgtcagact tcgggcagga 1620 gacttcatac attgaggata actgtaacca gaatggcgcc atctctctga tcttcagcct 1680 gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg tttgaggaga acgacgtgaa 1740 tctgacccac atcgagtccc ggccttctag actgaagaag gacgagtacg agttctttac 1800 ccacctggat aagcggtccc tgccagccct gacaaacatc atcaagatcc tgaggcacga 1860 catcggagca accgtgcacg agctgtctcg ggacaagaag aaggataccg tgccctggtt 1920 ccctcggaca atccaggagc tggatagatt tgccaaccag atcctgtctt acggagcaga 1980 gctggacgca gatcaccctg gcttcaagga cccagtgtat cgggcccgga gaaagcagtt 2040 tgccgatatc gcctacaatt ataggcacgg acagccaatc cctcgcgtgg agtatatgga 2100 ggaggagaag aagacctggg gcacagtgtt caagaccctg aagagcctgt acaagacaca 2160 cgcctgctac gagtataacc acatcttccc cctgctggag aagtattgtg gctttcacga 2220 ggacaatatc cctcagctgg aggacgtgag ccagttcctg cagacctgca caggctttag 2280 gctgaggcca gtggcaggac tgctgagctc ccgggacttc ctgggaggac tggccttcag 2340 agtgtttcac tgcacccagt acatcaggca cggctccaag ccaatgtata caccagagcc 2400 cgacatctgt cacgagctgc tgggccacgt gcccctgttt agcgatagat ccttcgccca 2460 gttttcccag gagatcggac tggcatctct gggagcacct gacgagtaca tcgagaagct 2520 ggccaccatc tattggttca cagtggagtt tggcctgtgc aagcagggcg atagcatcaa 2580 ggcctacgga gcaggactgc tgtctagctt cggcgagctg cagtattgtc tgtccgagaa 2640 gccaaagctg ctgcccctgg agctggagaa gaccgccatc cagaactaca ccgtgacaga 2700 gttccagccc ctgtactatg tggccgagtc ttttaacgat gccaaggaga aggtgagaaa 2760 tttcgccgcc acaatcccta ggcccttcag tgtgcgttac gacccttata cccagaggat 2820 cgaggtgctg gataatacac agcagctgaa gatcctggct gactcaatca atagcgaaat 2880 cggaatcctg tgctccgccc tgcagaaaat caaatgagaa ttcaaggcct ctcgagcctc 2940 tagaactata gtgagtcgta ttacgtagat ccagacatga taagatacat tgatgagttt 3000 ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 3060 attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 3120 cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaagcttt acgtacgatc 3180 gtcgagcagc tgttgtcctg gagaacggag tcctgagcag aaaactctca gactttgggc 3240 aggtaagcct gttgggcttc cactgctagg agagaattgg ttccccacat gtgaaagcag 3300 tctgggaaat gctggtattt ccagtctcct aaggctacta agaaatatga ctttatttag 3360 aggcgaggaa aatgcccagg aagtcaactg atgagactag tcttaacaag ttgaggatac 3420 agaaagttgg ggatctgagc tgctaccaac atctgtgtgt ctttgggtgg ctcattggta 3480 tcctctgcct attggcttta tcttctgtac actgaaagga aatggctggt ccttagtcac 3540 ctggggtggg agtccctatc tctccaggga tacttattca atcctttctt ctgggtatca 3600 aaatgacaag cttgtaagaa actgtcctct ttcggctttc aggaggtgat gtcgcatgaa 3660 gagaatttgg ggggggggac ttactcagaa ccaaggaggg agaaattaaa cagagaggga 3720 aatgaacagg agttagcccg gagcctgaag caccttgggg attatgctgg gggtggaggg 3780 aatccattgt cctccctagg gagggcttgc agaacatgtt cttttctgtg atatttgtac 3840 tttccccaga ttgcaaatca tggtttgtac actgagattc agtctctgga ggtaatatgc 3900 cttttctagc ttttccttgg acaggactaa ggggttgagg gttgcctgga gtcagagaaa 3960 tttgtgttaa agaaggttga tatgaaacct gcaggtctag atacgtagat aagtagcatg 4020 gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 4080 gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4140 gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaa 4186 <210> 67 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 67 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag g 171 <210> 68 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 68 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 69 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 69 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120 gaggtttttt aaa 133 <210> 70 <211> 3637 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 70 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240 gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300 aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360 tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420 tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480 gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540 tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600 tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660 ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720 caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780 ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840 agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900 ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960 tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagca tgtccaccgc 1020 tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 1080 cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 1140 agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 1200 catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 1260 taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 1320 aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 1380 aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 1440 agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 1500 cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 1560 gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 1620 cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 1680 ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 1740 agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 1800 ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 1860 tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1920 ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1980 ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 2040 agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 2100 gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 2160 cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 2220 cacaatccct aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct 2280 ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 2340 gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc tctcgagcct ctagaactat 2400 agtgagtcgt attacgtaga tccagacatg ataagataca ttgatgagtt tggacaaacc 2460 acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 2520 tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 2580 tttcaggttc agggggaggt gtgggaggtt ttttaagctt tacgtacgat cgtcgagcag 2640 ctgttgtcct ggagaacgga gtcctgagca gaaaactctc agactttggg caggtaagcc 2700 tgttgggctt ccactgctag gagagaattg gttccccaca tgtgaaagca gtctgggaaa 2760 tgctggtatt tccagtctcc taaggctact aagaaatatg actttattta gaggcgagga 2820 aaatgcccag gaagtcaact gatgagacta gtcttaacaa gttgaggata cagaaagttg 2880 gggatctgag ctgctaccaa catctgtgtg tctttgggtg gctcattggt atcctctgcc 2940 tattggcttt atcttctgta cactgaaagg aaatggctgg tccttagtca cctggggtgg 3000 gagtccctat ctctccaggg atacttattc aatcctttct tctgggtatc aaaatgacaa 3060 gcttgtaaga aactgtcctc tttcggcttt caggaggtga tgtcgcatga agagaatttg 3120 ggggggggga cttactcaga accaaggagg gagaaattaa acagagaggg aaatgaacag 3180 gagttagccc ggagcctgaa gcaccttggg gattatgctg ggggtggagg gaatccattg 3240 tcctccctag ggagggcttg cagaacatgt tcttttctgt gatatttgta ctttccccag 3300 attgcaaatc atggtttgta cactgagatt cagtctctgg aggtaatatg ccttttctag 3360 cttttccttg gacaggacta aggggttgag ggttgcctgg agtcagagaa atttgtgtta 3420 aagaaggttg atatgaaacc tgcaggtcta gatacgtaga taagtagcat ggcgggttaa 3480 tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3540 cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 3600 cagtgagcga gcgagcgcgc agagagggag tggccaa 3637 <210> 71 <211> 4075 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 71 ccttgctgtc ctgccccacc ccacccccca gaatagaatg acacctactc agacaatgcg 60 atgcaatttc ctcattttat taggaaagga cagtgggagt ggcaccttcc agggtcaagg 120 aaggcacggg ggaggggcaa acaacagatg gctggcaact agaaggcaca gcctcgagga 180 acgttttatt ttcccagaga caggctcagg gacttctggg tgtagtggct gtgcagggct 240 tcgtggagca cgctgcagct aaacacgttg ccctcttgcc atcggctctt gtccacggtc 300 agccgtgaat acaggaagaa gctgccatcg ctgtccagca ctggaggggt cgtcttgtag 360 ttgttttcag gctgtccgtt gctctcccat tcgacggcga tgtcgctggg gtagaagccc 420 ttcaccaggc aggtcagaga cacttggttc tttgtcattt cttcttgaga aggaggcagt 480 gtatagactt ggggctctct gggctggccc ttggcctttg agatggtctt ctcgatgctg 540 ctaggcaggc ccttgttaga caccttgcac ttgtactctt tgccgttcag ccagtcctgg 600 tgcagcactg tcagcacgga caccacccgg taggtgctgt taaactgttc ctcgcggggt 660 ttggtcttgg cattatgaac ttccactccg tcaacgtacc aattaaactg cacctcagga 720 tcctcctggg acacatccac caccacacat gtcacttcag gggtccggct gatcatcagg 780 gtgtctttgg gctttggtgg gaacaggaaa acagaagggc cggcgactgg tggagctgga 840 catggtgggc attccacgca gcactttctc tcaacggtct tatccacttt ggtgttgcta 900 ggcttgtggt ccacattaca ggtgtaggtc tgtgtgccga agttggagct aggaacggtg 960 accacgctac tcagagaata caggccagag ctctgcagca cggctgggaa ggtgtgcacg 1020 ccgcttgtca gggcgccgct gttccagctc actgtcacgg gttcggggaa gtagtctttg 1080 accagacaac ccagggcggc tgtgctttca gatgtgcttc tgctgcatgg ggccagtggg 1140 aacacgctgg gtcccttagt actggcgctg ctgacggtga caagggtgcc ttggccccac 1200 acgtcgaagt accagttagg ggatgagcca aaaaagtatc tggcgcagta gtacacagct 1260 gtgtcctcgc ttctcaggct gctcagttcc atgtacacgg tgcttgtgga ggtatctctg 1320 gtcatggtca ctctatcctt gaagttctct gtgtactcgg tgtggccaga tcctggcagg 1380 atctcgccca tccattccag gccttggcca ggggcctgcc gcacccactg gatccagtag 1440 ttgctgaaga tgtggccgct ggccttgcag gacaccttca cgctagctcc gggctttttc 1500 acttcggctc cgctttgaac cagctgcact tggctgtgca cgcctgtggc ggtggccacc 1560 aggaacagga tgatgcagga ccagcccatg gtggcactag ttcagttcca aaggttggaa 1620 tctaaaagag agaaacaatt agaatcagta gtttaacaca ttatacactt aaaaatttta 1680 tatttacctt agaggattca ctgtcccagg tcagtggtgg tgcctgaagc tgaggagaca 1740 gggccctgtc ctcgtccgta tttaagcagt ggatccagag gggcaacggg ggaggctgct 1800 ggtgaatatt aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccact 1860 ggctgggatc tgagtcgccc gcctacgctg cccggacgct ttgcctgggc agtgtacagc 1920 ttccactgca cttaccgaaa ggagtcattc ccctctcaca ctacctaaac cacgccagga 1980 caacctctgc tcctctccac cgaaattcca aggggtcgag tggatgttgg aggtggcatg 2040 ggcccagaga ggtctctgac ctctgcccca gctccaaggt cagcaggcag ggagggctgt 2100 gtgtttgctg tttgctgctt gcaatgtttg cccattttag ggccgcggca cgtgcttaag 2160 gccccctttt gcatccagtt tattcctaca tttgtcacac tgttaacagc ccaccccttc 2220 caatgagacc agtggtatca gtgagttgtg gagatcagga aaagggctca agagaaaggc 2280 agtcaaagcc ctttttctgt ccctgtccca gctgctttaa taagatctcc ataagagaag 2340 agggacagct atgactggga gtagtcagga gaggaggaaa aatctggcta gtaaaacatg 2400 taaggaaaat tttagggatg ttaaagaaaa aaataacaca aaacaaaata taaaaaaaat 2460 ctaacctcaa gtcaaggctt ttctatggaa taaggaatgg acagcagggg gctgtttcat 2520 atactgatga cctctttata gccaaccttt gttcatggca gccagcatat gggcatatgt 2580 tgccaaactc taaaccaaat actcattctg atgttttaaa tgatttgccc tcccatatgt 2640 ccttccgagt gagagacaca aaaaattcca acacactatt gcaatgaaaa taaatttcct 2700 ttattagcca gaagtcagat gctcaagggg cttcatgatg tccccataat ttttggcaga 2760 gggaaaaaga tctccggagg gggaggctgc tggtgaatat taaccaaggt caccccagtt 2820 atcggaggag caaacagggg ctaagtccac ctcgagccat ggcgatgctc taatctctct 2880 agacaaggtt catatttgta tgggttactt attctctctt tgttgactaa gtcaataatc 2940 agaatcagca ggtttgcagt cagattggca gggataagca gcctagctca ggagaagtga 3000 gtataaaagc cccaggctgg gagcagccat cagctagcgc cggcaagagg taagggttta 3060 agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 3120 ctttttttca ggttggaccg gtgccaccat ggacatgagg gtccctgctc agctgctggg 3180 gctcctgctg ctctggctca gcggtgccag atgtgatatc cagatgaccc agtctccatc 3240 tagcctgtcc gccagcgtgg gcgacagagt gaccatcacc tgcggcgcca gcgagaacat 3300 ctatggcgct ctgaactggt accagcagaa acctggcaag gcccctaagc tgctgatcta 3360 cggcgccacc aacctggccg atggcgtgcc tagtagattc agcggatctg gcagcggcac 3420 agacttcacc ctgaccatca gcagcctgca acctgaggac tttgccacat actactgcca 3480 gaacgtgctg aatacacctc tgacattcgg ccaaggaacc aaagtggaaa tcaagcggac 3540 cgtggccgct cctagcgtgt tcatcttccc tccttccgat gaacaactga agagcggaac 3600 cgcctctgtg gtgtgcctgc tgaacaactt ctaccctaga gaggccaagg tgcagtggaa 3660 ggtcgacaac gccctgcaga gcggcaacag ccaggagagc gtgacggaac aggacagcaa 3720 ggacagcacc tacagcctga gctccaccct tacactgtct aaagccgact acgagaagca 3780 caaggtgtac gcctgtgaag tgacacacca gggcctgagc agccctgtga ccaagtcttt 3840 taaccggggc gagtgctgaa ttcgaatcgt acctagggat ccagacatga taagatacat 3900 tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat 3960 ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa 4020 caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaa 4075 <210> 72 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 72 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcgcgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctagagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800 atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860 aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920 aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980 gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100 tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160 tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 73 <211> 4093 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 73 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980 ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040 tggacccggc aacggactcg acaaggggga gccggtcaac gcagcagacg cggcggccct 2100 cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160 caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220 cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280 ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340 ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400 cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460 agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520 caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580 atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640 caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700 ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760 ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820 caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880 catcgccaat aaccttacca gcacggtcca ggtcttcgcg gactcagact atcagctccc 2940 gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000 gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060 cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120 cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180 ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240 ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300 ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360 gactcaaaac aacaacagcg aatttgcttg gcctagagct tcttcttggg ctctcaatgg 3420 acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480 tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540 ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600 aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660 cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720 cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780 gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840 tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900 gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960 gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020 tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080 tcgtaatctg taa 4093 <210> 74 <211> 1353 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 74 tccaccgctg tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag 60 acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg 120 aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat 180 ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc 240 cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac 300 atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc 360 cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag 420 ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt 480 gccgatatcg cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag 540 gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac 600 gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag 660 gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg 720 ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga 780 gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc 840 gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag 900 ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg 960 gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag 1020 gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag 1080 ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag 1140 ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat 1200 ttcgccgcca caatccctag gcccttcagc gtgcggtacg acccttatac ccagaggatc 1260 gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc 1320 ggaatcctgt gctccgccct gcagaaaatc aaa 1353 <210> 75 <211> 3939 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 75 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cggtaccaga tctggcagcg gagagggcag aggaagtctt ctaacatgcg gtgacgtgga 1260 ggagaatccc ggcccttcca ccgctgtgct ggagaaccct gggctgggga ggaaactgtc 1320 agacttcggg caggagactt catacattga ggataactgt aaccagaatg gcgccatctc 1380 tctgatcttc agcctgaagg aggaagtggg cgccctggca aaggtgctgc gcctgtttga 1440 ggagaacgac gtgaatctga cccacatcga gtcccggcct tctagactga agaaggacga 1500 gtacgagttc tttacccacc tggataagcg gtccctgcca gccctgacaa acatcatcaa 1560 gatcctgagg cacgacatcg gagcaaccgt gcacgagctg tctcgggaca agaagaagga 1620 taccgtgccc tggttccctc ggacaatcca ggagctggat agatttgcca accagatcct 1680 gtcttacgga gcagagctgg acgcagatca ccctggcttc aaggacccag tgtatcgggc 1740 ccggagaaag cagtttgccg atatcgccta caattatagg cacggacagc caatccctcg 1800 cgtggagtat atggaggagg agaagaagac ctggggcaca gtgttcaaga ccctgaagag 1860 cctgtacaag acacacgcct gctacgagta taaccacatc ttccccctgc tggagaagta 1920 ttgtggcttt cacgaggaca atatccctca gctggaggac gtgagccagt tcctgcagac 1980 ctgcacaggc tttaggctga ggccagtggc aggactgctg agctcccggg acttcctggg 2040 aggactggcc ttcagagtgt ttcactgcac ccagtacatc aggcacggct ccaagccaat 2100 gtatacacca gagcccgaca tctgtcacga gctgctgggc cacgtgcccc tgtttagcga 2160 tagatccttc gcccagtttt cccaggagat cggactggca tctctgggag cacctgacga 2220 gtacatcgag aagctggcca ccatctattg gttcacagtg gagtttggcc tgtgcaagca 2280 gggcgatagc atcaaggcct acggagcagg actgctgtct agcttcggcg agctgcagta 2340 ttgtctgtcc gagaagccaa agctgctgcc cctggagctg gagaagaccg ccatccagaa 2400 ctacaccgtg acagagttcc agcccctgta ctatgtggcc gagtctttta acgatgccaa 2460 ggagaaggtg agaaatttcg ccgccacaat ccctaggccc ttcagcgtgc ggtacgaccc 2520 ttatacccag aggatcgagg tgctggataa tacacagcag ctgaagatcc tggctgactc 2580 aatcaatagc gaaatcggaa tcctgtgctc cgccctgcag aaaatcaaat gagatccaga 2640 catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg 2700 ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa 2760 acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga 2820 ggttttttaa ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa 2880 gtgctctcag caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg 2940 ggaagaagat gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag 3000 aaactaagca gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc 3060 ctaaacgtga cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat 3120 tttcttgagg tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg 3180 ggaggaagtc tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa 3240 tgtaagtctg caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac 3300 agggaggctg gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca 3360 gaacttagga ctgattttta tttgaatcct taaaaaaaaa atttcttatg aaaatagtac 3420 atggctctta ggagacagaa cttattgtac agaggaacag cgtgagagtc agagtgatcc 3480 cagaacaggt cctggctcca tcctgcacat agttttggtg ctgctggcaa tacggtcccc 3540 acaactgtgg gaaggggtta ggggcaggga tctcatcagg aaagcatagg ggtttaaagt 3600 tctttataga gcacttagaa gattgagaat ccacaaatta tattaataac aaacaaagta 3660 gtgtcgtgtt atatagtaaa tgtgaatttg cagacacatt tagggaaaag ttataattaa 3720 aaaaataggc tgtatatata cctgcaggtc tagatacgta gataagtagc atggcgggtt 3780 aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 3840 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 3900 ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 3939 <210> 76 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 76 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgat 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctagagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800 atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860 aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920 aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980 gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100 tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160 tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 77 <211> 4093 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 77 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980 ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040 tggacccggc aacggactcg ataaggggga gccggtcaac gcagcagacg cggcggccct 2100 cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160 caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220 cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280 ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340 ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400 cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460 agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520 caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580 atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640 caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700 ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760 ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820 caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880 catcgccaat aaccttacca gcacggtcca ggtcttcacg gactcagact atcagctccc 2940 gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000 gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060 cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120 cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180 ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240 ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300 ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360 gactcaaaac aacaacagcg aatttgcttg gcctagagct tcttcttggg ctctcaatgg 3420 acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480 tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540 ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600 aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660 cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720 cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780 gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840 tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900 gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960 gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020 tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080 tcgtaatctg taa 4093 <210> 78 <211> 2356 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 78 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120 tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180 agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240 ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300 cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360 gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420 atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480 atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540 acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600 aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660 tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 720 cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 780 tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 840 gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 900 ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 960 ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 1020 ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 1080 gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 1140 ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 1200 aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 1260 acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 1320 atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 1380 gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 1440 ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 1500 atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 1560 ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 1620 gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 1680 gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 1740 tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 1800 ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 1860 gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 1920 cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga taatacacag 1980 cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 2040 cagaaaatca aatgaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 2100 cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 2160 tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat ctgaggaacc 2220 cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2280 accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 2340 cagagaggga gtggcc 2356 <210> 79 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 79 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960 ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020 aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080 aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140 gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200 aatttcgccg ccacaatccc taggcccttc agtgtgcgtt acgaccctta tacccagagg 1260 atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320 atcggaatcc tgtgctccgc cctgcagaaa atcaaatga 1359 <210> 80 <211> 4452 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 80 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaccc taaaatgggc aaacattgca agcagcaaac 1200 agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 1260 ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 1320 cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 1380 gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 1440 atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 1500 atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 1560 acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 1620 aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 1680 tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 1740 cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 1800 tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 1860 gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 1920 ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 1980 ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 2040 ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 2100 gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 2160 ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 2220 aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 2280 acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 2340 atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 2400 gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 2460 ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 2520 atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 2580 ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 2640 gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 2700 gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 2760 tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 2820 ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 2880 gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 2940 cccttcagtg tgcgttacga cccttatacc cagaggatcg aggtgctgga taatacacag 3000 cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 3060 cagaaaatca aatgagaatt caaggcctct cgagcctcta gaactatagt gagtcgtatt 3120 acgtagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 3180 agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 3240 taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 3300 gggaggtgtg ggaggttttt taagctttac gtacgatcgt cgactgggat gggatgtgga 3360 atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 3420 aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 3480 cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 3540 gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 3600 aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 3660 cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3720 gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3780 taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3840 aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3900 ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3960 tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 4020 catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 4080 ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 4140 aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 4200 ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat atacctgcag 4260 gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt 4320 gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 4380 ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga 4440 gggagtggcc aa 4452 <210> 81 <211> 1735 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 81 atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 60 tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 120 ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 180 tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 240 caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 300 aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 360 cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 420 attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 480 tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 540 aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 600 tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 660 aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 720 gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 780 gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 840 cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 900 ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 960 gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1020 cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1080 cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1140 ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1200 cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1260 tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1320 ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1380 agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1440 gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1500 ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1560 gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1620 cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1680 caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctga 1735 <210> 82 <211> 2521 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 82 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca actcacgggg atttccaagt ctccacccca 240 ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 300 ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 360 gcagagctcg tttagtgaac cgtgccacca tgcccccacc caggaccgga agaggcctgc 420 tgtggctggg cctggtgctc tcttccgtgt gcgtggccct gggaagcgaa acccaggcca 480 acagcacaac cgacgccctg aatgtgctgc tgatcattgt ggacgatctg agaccctccc 540 tgggctgtta cggcgacaaa ctggtgcggt ccccaaacat cgaccagctg gcctcccact 600 ccctgctgtt ccagaacgcc ttcgcccagc aggccgtgtg tgcccccagc agggtgagct 660 tcctgaccgg cagaagacct gacaccacca ggctgtacga ctttaacagc tactggcggg 720 tgcacgccgg caatttcagc accattcctc agtacttcaa ggagaatggc tacgtgacaa 780 tgtccgtggg caaggtgttt catcccggca ttagctccaa ccacaccgac gatagcccat 840 actcctggtc cttccccccc taccatccct ccagcgagaa gtacgagaac accaaaacct 900 gcagaggccc tgacggagag ctgcacgcca acctgctgtg ccctgtggat gtcctggatg 960 tgcccgaagg taagggttta agggatggtt ggttggtggg gtattaatgt ttaattacct 1020 ggagcacctg cctgaaatca ctttttttca ggcaccctgc cagacaagca gtccacagag 1080 caggccatcc agctgctgga gaagatgaag acaagcgcca gccccttctt tctggccgtg 1140 ggataccaca agcctcacat tccattccgg tacccaaaag agttccagaa gctgtaccct 1200 ctggaaaaca tcaccctggc ccctgacccc gaggtgccag acgggctgcc tcctgtggcc 1260 tacaatccct ggatggacat cagacagcgg gaggatgtgc aggccctgaa tatttccgtg 1320 ccctatgggc ccatccctgt ggactttcag cggaaaatca gacagtctta ctttgccagc 1380 gtgtcctacc tggacaccca ggtgggccgc ctgctctcag ccctggacga cctgcagctg 1440 gccaattcca ccatcatcgc cttcaccagc gatcacggct gggccctggg cgagcacggg 1500 gagtgggcca aatacagcaa cttcgatgtg gccacccacg tgcctctgat tttttatgtg 1560 cccggccgga cagccagcct gcccgaggcc ggggagaagc tctttcctta cctggaccct 1620 ttcgactctg ccagccagct gatggaacct ggcagacaga gcatggacct ggtggagctg 1680 gtgagcctct tccccactct ggccggcctg gctggcctgc aggtgccacc aagatgccca 1740 gtgccttctt tccacgtgga gctgtgtaga gagggaaaga acctgctgaa gcacttcaga 1800 tttagagatc tggaggagga tccctacctg ccaggcaacc caagggagct gatcgcctac 1860 agccagtatc ccagaccctc tgatatcccc cagtggaaca gcgataagcc ctccctgaaa 1920 gacatcaaga ttatgggcta ctccatcagg accattgact accggtacac agtgtgggtg 1980 ggcttcaacc ccgatgagtt tctggccaac ttcagcgaca tccacgccgg cgagctgtat 2040 tttgtggact ccgaccccct gcaggaccac aacatgtaca acgactccca gggcggcgac 2100 ctgttccagc tgctgatgcc ctgagatcca gacatgataa gatacattga tgagtttgga 2160 caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 2220 gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 2280 tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aacctgcagg tctagatacg 2340 tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg 2400 ccactccctc tctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 2460 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 2520 a 2521 <210> 83 <211> 3668 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 83 ttttcccaga gacaggctca gggacttctg ggtgtagtgg ctgtgcaggg cttcgtggag 60 cacgctgcag ctaaacacgt tgccctcttg ccatcggctc ttgtccacgg tcagccgtga 120 atacaggaag aagctgccat cgctgtccag cactggaggg gtcgtcttgt agttgttttc 180 aggctgtccg ttgctctccc attcgacggc gatgtcgctg gggtagaagc ccttcaccag 240 gcaggtcaga gacacttggt tctttgtcat ttcttcttga gaaggaggca gtgtatagac 300 ttggggctct ctgggctggc ccttggcctt tgagatggtc ttctcgatgc tgctaggcag 360 gcccttgtta gacaccttgc acttgtactc tttgccgttc agccagtcct ggtgcagcac 420 tgtcagcacg gacaccaccc ggtaggtgct gttaaactgt tcctcgcggg gtttggtctt 480 ggcattatga acttccactc cgtcaacgta ccaattaaac tgcacctcag gatcctcctg 540 ggacacatcc accaccacac atgtcacttc aggggtccgg ctgatcatca gggtgtcttt 600 gggctttggt gggaacagga aaacagaagg gccggcgact ggtggagctg gacatggtgg 660 gcattccacg cagcactttc tctcaacggt cttatccact ttggtgttgc taggcttgtg 720 gtccacatta caggtgtagg tctgtgtgcc gaagttggag ctaggaacgg tgaccacgct 780 actcagagaa tacaggccag agctctgcag cacggctggg aaggtgtgca cgccgcttgt 840 cagggcgccg ctgttccagc tcactgtcac gggttcgggg aagtagtctt tgaccagaca 900 acccagggcg gctgtgcttt cagatgtgct tctgctgcat ggggccagtg ggaacacgct 960 gggtccctta gtactggcgc tgctgacggt gacaagggtg ccttggcccc acacgtcgaa 1020 gtaccagtta ggggatgagc caaaaaagta tctggcgcag tagtacacag ctgtgtcctc 1080 gcttctcagg ctgctcagtt ccatgtacac ggtgcttgtg gaggtatctc tggtcatggt 1140 cactctatcc ttgaagttct ctgtgtactc ggtgtggcca gatcctggca ggatctcgcc 1200 catccattcc aggccttggc caggggcctg ccgcacccac tggatccagt agttgctgaa 1260 gatgtggccg ctggccttgc aggacacctt cacgctagct ccgggctttt tcacttcggc 1320 tccgctttga accagctgca cttggctgtg cacgcctgtg gcggtggcca ccaggaacag 1380 gatgatgcag gaccagccca tggtggcact agttcagttc caaaggttgg aatctaaaag 1440 agagaaacaa ttagaatcag tagtttaaca cattatacac ttaaaaattt tatatttacc 1500 ttagaggatt cactgtccca ggtcagtggt ggtgcctgaa gctgaggaga cagggccctg 1560 tcctcgtccg tatttaagca gtggatccag aggggcaacg ggggaggctg ctggtgaata 1620 ttaaccaagg tcaccccagt tatcggagga gcaaacaggg gctaagtcca ctggctggga 1680 tctgagtcgc ccgcctacgc tgcccggacg ctttgcctgg gcagtgtaca gcttccactg 1740 cacttaccga aaggagtcat tcccctctca cactacctaa accacgccag gacaacctct 1800 gctcctctcc accgaaattc caaggggtcg agtggatgtt ggaggtggca tgggcccaga 1860 gaggtctctg acctctgccc cagctccaag gtcagcaggc agggagggct gtgtgtttgc 1920 tgtttgctgc ttgcaatgtt tgcccatttt agggccgcgg cacgtgctta aggccccctt 1980 ttgcatccag tttattccta catttgtcac actgttaaca gcccacccct tccaatgaga 2040 ccagtggtat cagtgagttg tggagatcag gaaaagggct caagagaaag gcagtcaaag 2100 ccctttttct gtccctgtcc cagctgcttt aataagatct ccataagaga agagggacag 2160 ctatgactgg gagtagtcag gagaggagga aaaatctggc tagtaaaaca tgtaaggaaa 2220 attttaggga tgttaaagaa aaaaataaca caaaacaaaa tataaaaaaa atctaacctc 2280 aagtcaaggc ttttctatgg aataaggaat ggacagcagg gggctgtttc atatactgat 2340 gacctcttta tagccaacct ttgttcatgg cagccagcat atgggcatat gttgccaaac 2400 tctaaaccaa atactcattc tgatgtttta aatgatttgc cctcccatat gtccttccga 2460 gtgagagaca caaaaaattc caacacacta ttgcaatgaa aataaatttc ctttattagc 2520 cagaagtcag atgctcaagg ggcttcatga tgtccccata atttttggca gagggaaaaa 2580 gatctccgga gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg 2640 agcaaacagg ggctaagtcc acctcgagcc atggcgatgc tctaatctct ctagacaagg 2700 ttcatatttg tatgggttac ttattctctc tttgttgact aagtcaataa tcagaatcag 2760 caggtttgca gtcagattgg cagggataag cagcctagct caggagaagt gagtataaaa 2820 gccccaggct gggagcagcc atcagctagc gccggcaaga ggtaagggtt taagggatgg 2880 ttggttggtg gggtattaat gtttaattac ctggagcacc tgcctgaaat cacttttttt 2940 caggttggac cggtgccacc atggacatga gggtccctgc tcagctgctg gggctcctgc 3000 tgctctggct cagcggtgcc agatgtgata tccagatgac ccagtctcca tctagcctgt 3060 ccgccagcgt gggcgacaga gtgaccatca cctgcggcgc cagcgagaac atctatggcg 3120 ctctgaactg gtaccagcag aaacctggca aggcccctaa gctgctgatc tacggcgcca 3180 ccaacctggc cgatggcgtg cctagtagat tcagcggatc tggcagcggc acagacttca 3240 ccctgaccat cagcagcctg caacctgagg actttgccac atactactgc cagaacgtgc 3300 tgaatacacc tctgacattc ggccaaggaa ccaaagtgga aatcaagcgg accgtggccg 3360 ctcctagcgt gttcatcttc cctccttccg atgaacaact gaagagcgga accgcctctg 3420 tggtgtgcct gctgaacaac ttctacccta gagaggccaa ggtgcagtgg aaggtcgaca 3480 acgccctgca gagcggcaac agccaggaga gcgtgacgga acaggacagc aaggacagca 3540 cctacagcct gagctccacc cttacactgt ctaaagccga ctacgagaag cacaaggtgt 3600 acgcctgtga agtgacacac cagggcctga gcagccctgt gaccaagtct tttaaccggg 3660 gcgagtgc 3668 <210> 84 <211> 4483 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 84 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcaca cgtgacgcgt ccttgctgtc ctgccccacc ccacccccca 240 gaatagaatg acacctactc agacaatgcg atgcaatttc ctcattttat taggaaagga 300 cagtgggagt ggcaccttcc agggtcaagg aaggcacggg ggaggggcaa acaacagatg 360 gctggcaact agaaggcaca gcctcgagga acgttttatt ttcccagaga caggctcagg 420 gacttctggg tgtagtggct gtgcagggct tcgtggagca cgctgcagct aaacacgttg 480 ccctcttgcc atcggctctt gtccacggtc agccgtgaat acaggaagaa gctgccatcg 540 ctgtccagca ctggaggggt cgtcttgtag ttgttttcag gctgtccgtt gctctcccat 600 tcgacggcga tgtcgctggg gtagaagccc ttcaccaggc aggtcagaga cacttggttc 660 tttgtcattt cttcttgaga aggaggcagt gtatagactt ggggctctct gggctggccc 720 ttggcctttg agatggtctt ctcgatgctg ctaggcaggc ccttgttaga caccttgcac 780 ttgtactctt tgccgttcag ccagtcctgg tgcagcactg tcagcacgga caccacccgg 840 taggtgctgt taaactgttc ctcgcggggt ttggtcttgg cattatgaac ttccactccg 900 tcaacgtacc aattaaactg cacctcagga tcctcctggg acacatccac caccacacat 960 gtcacttcag gggtccggct gatcatcagg gtgtctttgg gctttggtgg gaacaggaaa 1020 acagaagggc cggcgactgg tggagctgga catggtgggc attccacgca gcactttctc 1080 tcaacggtct tatccacttt ggtgttgcta ggcttgtggt ccacattaca ggtgtaggtc 1140 tgtgtgccga agttggagct aggaacggtg accacgctac tcagagaata caggccagag 1200 ctctgcagca cggctgggaa ggtgtgcacg ccgcttgtca gggcgccgct gttccagctc 1260 actgtcacgg gttcggggaa gtagtctttg accagacaac ccagggcggc tgtgctttca 1320 gatgtgcttc tgctgcatgg ggccagtggg aacacgctgg gtcccttagt actggcgctg 1380 ctgacggtga caagggtgcc ttggccccac acgtcgaagt accagttagg ggatgagcca 1440 aaaaagtatc tggcgcagta gtacacagct gtgtcctcgc ttctcaggct gctcagttcc 1500 atgtacacgg tgcttgtgga ggtatctctg gtcatggtca ctctatcctt gaagttctct 1560 gtgtactcgg tgtggccaga tcctggcagg atctcgccca tccattccag gccttggcca 1620 ggggcctgcc gcacccactg gatccagtag ttgctgaaga tgtggccgct ggccttgcag 1680 gacaccttca cgctagctcc gggctttttc acttcggctc cgctttgaac cagctgcact 1740 tggctgtgca cgcctgtggc ggtggccacc aggaacagga tgatgcagga ccagcccatg 1800 gtggcactag ttcagttcca aaggttggaa tctaaaagag agaaacaatt agaatcagta 1860 gtttaacaca ttatacactt aaaaatttta tatttacctt agaggattca ctgtcccagg 1920 tcagtggtgg tgcctgaagc tgaggagaca gggccctgtc ctcgtccgta tttaagcagt 1980 ggatccagag gggcaacggg ggaggctgct ggtgaatatt aaccaaggtc accccagtta 2040 tcggaggagc aaacaggggc taagtccact ggctgggatc tgagtcgccc gcctacgctg 2100 cccggacgct ttgcctgggc agtgtacagc ttccactgca cttaccgaaa ggagtcattc 2160 ccctctcaca ctacctaaac cacgccagga caacctctgc tcctctccac cgaaattcca 2220 aggggtcgag tggatgttgg aggtggcatg ggcccagaga ggtctctgac ctctgcccca 2280 gctccaaggt cagcaggcag ggagggctgt gtgtttgctg tttgctgctt gcaatgtttg 2340 cccattttag ggccgcggca cgtgcttaag gccccctttt gcatccagtt tattcctaca 2400 tttgtcacac tgttaacagc ccaccccttc caatgagacc agtggtatca gtgagttgtg 2460 gagatcagga aaagggctca agagaaaggc agtcaaagcc ctttttctgt ccctgtccca 2520 gctgctttaa taagatctcc ataagagaag agggacagct atgactggga gtagtcagga 2580 gaggaggaaa aatctggcta gtaaaacatg taaggaaaat tttagggatg ttaaagaaaa 2640 aaataacaca aaacaaaata taaaaaaaat ctaacctcaa gtcaaggctt ttctatggaa 2700 taaggaatgg acagcagggg gctgtttcat atactgatga cctctttata gccaaccttt 2760 gttcatggca gccagcatat gggcatatgt tgccaaactc taaaccaaat actcattctg 2820 atgttttaaa tgatttgccc tcccatatgt ccttccgagt gagagacaca aaaaattcca 2880 acacactatt gcaatgaaaa taaatttcct ttattagcca gaagtcagat gctcaagggg 2940 cttcatgatg tccccataat ttttggcaga gggaaaaaga tctccggagg gggaggctgc 3000 tggtgaatat taaccaaggt caccccagtt atcggaggag caaacagggg ctaagtccac 3060 ctcgagccat ggcgatgctc taatctctct agacaaggtt catatttgta tgggttactt 3120 attctctctt tgttgactaa gtcaataatc agaatcagca ggtttgcagt cagattggca 3180 gggataagca gcctagctca ggagaagtga gtataaaagc cccaggctgg gagcagccat 3240 cagctagcgc cggcaagagg taagggttta agggatggtt ggttggtggg gtattaatgt 3300 ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggaccg gtgccaccat 3360 ggacatgagg gtccctgctc agctgctggg gctcctgctg ctctggctca gcggtgccag 3420 atgtgatatc cagatgaccc agtctccatc tagcctgtcc gccagcgtgg gcgacagagt 3480 gaccatcacc tgcggcgcca gcgagaacat ctatggcgct ctgaactggt accagcagaa 3540 acctggcaag gcccctaagc tgctgatcta cggcgccacc aacctggccg atggcgtgcc 3600 tagtagattc agcggatctg gcagcggcac agacttcacc ctgaccatca gcagcctgca 3660 acctgaggac tttgccacat actactgcca gaacgtgctg aatacacctc tgacattcgg 3720 ccaaggaacc aaagtggaaa tcaagcggac cgtggccgct cctagcgtgt tcatcttccc 3780 tccttccgat gaacaactga agagcggaac cgcctctgtg gtgtgcctgc tgaacaactt 3840 ctaccctaga gaggccaagg tgcagtggaa ggtcgacaac gccctgcaga gcggcaacag 3900 ccaggagagc gtgacggaac aggacagcaa ggacagcacc tacagcctga gctccaccct 3960 tacactgtct aaagccgact acgagaagca caaggtgtac gcctgtgaag tgacacacca 4020 gggcctgagc agccctgtga ccaagtcttt taaccggggc gagtgctgaa ttcgaatcgt 4080 acctagggat ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat 4140 gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 4200 tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 4260 gggggaggtg tgggaggttt tttaagcttg tttaaacgta cgtagataag tagcatggcg 4320 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4380 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 4440 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 4483 <210> 85 <211> 3533 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 85 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcggtacc agatctggca gcggagaggg 1020 cagaggaagt cttctaacat gcggtgacgt ggaggagaat cccggccctt ccaccgctgt 1080 gctggagaac cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat 1140 tgaggataac tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt 1200 gggcgccctg gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat 1260 cgagtcccgg ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa 1320 gcggtccctg ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac 1380 cgtgcacgag ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat 1440 ccaggagctg gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga 1500 tcaccctggc ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc 1560 ctacaattat aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa 1620 gacctggggc acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga 1680 gtataaccac atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc 1740 tcagctggag gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt 1800 ggcaggactg ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg 1860 cacccagtac atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca 1920 cgagctgctg ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga 1980 gatcggactg gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta 2040 ttggttcaca gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc 2100 aggactgctg tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct 2160 gcccctggag ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct 2220 gtactatgtg gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac 2280 aatccctagg cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga 2340 taatacacag cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg 2400 ctccgccctg cagaaaatca aatgagatcc agacatgata agatacattg atgagtttgg 2460 acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 2520 tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 2580 ttttatgttt caggttcagg gggaggtgtg ggaggttttt taactgggat gggatgtgga 2640 atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 2700 aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 2760 cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 2820 gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 2880 aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 2940 cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3000 gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3060 taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3120 aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3180 ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3240 tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 3300 catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 3360 ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 3420 aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 3480 ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat ata 3533 <210> 86 <211> 4061 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 86 tgcggccgct tcaggagcag ttgtgcgaat agctggagaa caccaggctg gatttaaacc 60 cagatcgctc ttacatttgc tctttacctg ctgtgctcag cgttcacgtg ccctctagct 120 gtagttttct gaagtcagcg cacagcaagg cagtgtgctt agaggttaac agaagggaaa 180 acaacaacaa caaaaatcta aatgagaatc ctgactgttt cagctggggg taaggggggc 240 ggattattca tataattgtt ataccagacg gtcgcaggct tagtccaatt gcagagaact 300 cgcttcccag gcttctgaga gtcccggaag tgcctaaacc tgtctaatcg acggggcttg 360 ggtggcccgt cgctccctgg cttcttccct ttacccaggg cgggcagcga agtggtgcct 420 cctgcgtccc ccacaccctc cctcagcccc tcccctccgg cccgtcctgg gcaggtgacc 480 tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga caacgcccac gaggggcgtt 540 actgtgcgga gatgcaccac gcaagagaca ccctttgtaa ctctcttctc ctccctagtg 600 cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc tgcctgtacc tgaggcccta 660 aaaagccaga gacctcactc ccggggagcc agcatgtcca ctgcggtcct ggaaaaccca 720 ggcttgggca ggaaactctc tgactttgga caggtgagcc acggcagcct gagctgctca 780 gttaggggaa tttgggcctc cagagaaaga gatctgaaga ctgctggtgc ttcctggttt 840 cataagctca gtaagaagtc tgaattcgtt ggaagctgat gagaatatcc aggaagtcaa 900 cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac atctgtcctc ggtggctttc 960 acaggaaccc taaaatgggc aaacattgca agcagcaaac agcaaacaca cagccctccc 1020 tgcctgctga ccttggagct ggggcagagg tcagagacct ctctgggccc atgccacctc 1080 caacatccac tcgacccctt ggaatttcgg tggagaggag cagaggttgt cctggcgtgg 1140 tttaggtagt gtgagagggg aatgactcct ttcggtaagt gcagtggaag ctgtacactg 1200 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1260 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1320 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 1380 cttcaggcac caccactgac ctgggacagt gaatcctcta aggtaaatat aaaattttta 1440 agtgtataat gtgttaaact actgattcta attgtttctc tcttttagat tccaaccttt 1500 ggaactgacc gccaccatgt ccaccgctgt gctggagaac cctgggctgg ggaggaaact 1560 gtcagacttc gggcaggaga cttcatacat tgaggataac tgtaaccaga atggcgccat 1620 ctctctgatc ttcagcctga aggaggaagt gggcgccctg gcaaaggtgc tgcgcctgtt 1680 tgaggagaac gacgtgaatc tgacccacat cgagtcccgg ccttctagac tgaagaagga 1740 cgagtacgag ttctttaccc acctggataa gcggtccctg ccagccctga caaacatcat 1800 caagatcctg aggcacgaca tcggagcaac cgtgcacgag ctgtctcggg acaagaagaa 1860 ggataccgtg ccctggttcc ctcggacaat ccaggagctg gatagatttg ccaaccagat 1920 cctgtcttac ggagcagagc tggacgcaga tcaccctggc ttcaaggacc cagtgtatcg 1980 ggcccggaga aagcagtttg ccgatatcgc ctacaattat aggcacggac agccaatccc 2040 tcgcgtggag tatatggagg aggagaagaa gacctggggc acagtgttca agaccctgaa 2100 gagcctgtac aagacacacg cctgctacga gtataaccac atcttccccc tgctggagaa 2160 gtattgtggc tttcacgagg acaatatccc tcagctggag gacgtgagcc agttcctgca 2220 gacctgcaca ggctttaggc tgaggccagt ggcaggactg ctgagctccc gggacttcct 2280 gggaggactg gccttcagag tgtttcactg cacccagtac atcaggcacg gctccaagcc 2340 aatgtataca ccagagcccg acatctgtca cgagctgctg ggccacgtgc ccctgtttag 2400 cgatagatcc ttcgcccagt tttcccagga gatcggactg gcatctctgg gagcacctga 2460 cgagtacatc gagaagctgg ccaccatcta ttggttcaca gtggagtttg gcctgtgcaa 2520 gcagggcgat agcatcaagg cctacggagc aggactgctg tctagcttcg gcgagctgca 2580 gtattgtctg tccgagaagc caaagctgct gcccctggag ctggagaaga ccgccatcca 2640 gaactacacc gtgacagagt tccagcccct gtactatgtg gccgagtctt ttaacgatgc 2700 caaggagaag gtgagaaatt tcgccgccac aatccctagg cccttcagtg tgcgttacga 2760 cccttatacc cagaggatcg aggtgctgga taatacacag cagctgaaga tcctggctga 2820 ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg cagaaaatca aatgagaatt 2880 caaggcctct cgagcctcta gaactatagt gagtcgtatt acgtagatcc agacatgata 2940 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 3000 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 3060 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 3120 taagctttac gtacgatcgt cgactgggat gggatgtgga atccttctag atttcttttg 3180 taatatttat aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc 3240 tcctttcatt ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga 3300 ccaggggagg cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga 3360 atgtgaaaga accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg 3420 gatttgttgg cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac 3480 atatttaccc atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag 3540 gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt 3600 ctcagtagaa aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac 3660 tagaaagact gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaatttctt 3720 atgaaaatag tacatggctc ttaggagaca gaacttattg tacagaggaa cagcgtgaga 3780 gtcagagtga tcccagaaca ggtcctggct ccatcctgca catagttttg gtgctgctgg 3840 caatacggtc cccacaactg tgggaagggg ttaggggcag ggatctcatc aggaaagcat 3900 aggggtttaa agttctttat agagcactta gaagattgag aatccacaaa ttatattaat 3960 aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat ttgcagacac atttagggaa 4020 aagttataat taaaaaaata ggctgtatat atacctgcag g 4061 <210> 87 <211> 2141 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 87 gcggccgcaa ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 60 tttggcacca aaatcaacgg gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc 120 aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctcgt ttagtgaacc 180 gtgccaccat gcccccaccc aggaccggaa gaggcctgct gtggctgggc ctggtgctct 240 cttccgtgtg cgtggccctg ggaagcgaaa cccaggccaa cagcacaacc gacgccctga 300 atgtgctgct gatcattgtg gacgatctga gaccctccct gggctgttac ggcgacaaac 360 tggtgcggtc cccaaacatc gaccagctgg cctcccactc cctgctgttc cagaacgcct 420 tcgcccagca ggccgtgtgt gcccccagca gggtgagctt cctgaccggc agaagacctg 480 acaccaccag gctgtacgac tttaacagct actggcgggt gcacgccggc aatttcagca 540 ccattcctca gtacttcaag gagaatggct acgtgacaat gtccgtgggc aaggtgtttc 600 atcccggcat tagctccaac cacaccgacg atagcccata ctcctggtcc ttccccccct 660 accatccctc cagcgagaag tacgagaaca ccaaaacctg cagaggccct gacggagagc 720 tgcacgccaa cctgctgtgc cctgtggatg tcctggatgt gcccgaaggt aagggtttaa 780 gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 840 tttttttcag gcaccctgcc agacaagcag tccacagagc aggccatcca gctgctggag 900 aagatgaaga caagcgccag ccccttcttt ctggccgtgg gataccacaa gcctcacatt 960 ccattccggt acccaaaaga gttccagaag ctgtaccctc tggaaaacat caccctggcc 1020 cctgaccccg aggtgccaga cgggctgcct cctgtggcct acaatccctg gatggacatc 1080 agacagcggg aggatgtgca ggccctgaat atttccgtgc cctatgggcc catccctgtg 1140 gactttcagc ggaaaatcag acagtcttac tttgccagcg tgtcctacct ggacacccag 1200 gtgggccgcc tgctctcagc cctggacgac ctgcagctgg ccaattccac catcatcgcc 1260 ttcaccagcg atcacggctg ggccctgggc gagcacgggg agtgggccaa atacagcaac 1320 ttcgatgtgg ccacccacgt gcctctgatt ttttatgtgc ccggccggac agccagcctg 1380 cccgaggccg gggagaagct ctttccttac ctggaccctt tcgactctgc cagccagctg 1440 atggaacctg gcagacagag catggacctg gtggagctgg tgagcctctt ccccactctg 1500 gccggcctgg ctggcctgca ggtgccacca agatgcccag tgccttcttt ccacgtggag 1560 ctgtgtagag agggaaagaa cctgctgaag cacttcagat ttagagatct ggaggaggat 1620 ccctacctgc caggcaaccc aagggagctg atcgcctaca gccagtatcc cagaccctct 1680 gatatccccc agtggaacag cgataagccc tccctgaaag acatcaagat tatgggctac 1740 tccatcagga ccattgacta ccggtacaca gtgtgggtgg gcttcaaccc cgatgagttt 1800 ctggccaact tcagcgacat ccacgccggc gagctgtatt ttgtggactc cgaccccctg 1860 caggaccaca acatgtacaa cgactcccag ggcggcgacc tgttccagct gctgatgccc 1920 tgagatccag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 1980 tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 2040 agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 2100 gaggtgtggg aggtttttta acctgcaggt ctagatacgt a 2141 <210> 88 <211> 2042 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 88 ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60 tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120 cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180 agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240 aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300 ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360 ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420 caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480 aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540 accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600 ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660 atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720 aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780 gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840 ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900 gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960 tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020 agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080 gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140 tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200 ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260 acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320 ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380 acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440 tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500 atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560 gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620 ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680 accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740 aaggtgagaa atttcgccgc cacaatccct aggcccttca gcgtgcggta cgacccttat 1800 acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860 aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaat gctttatttg 1920 tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 1980 caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 2040 aa 2042 <210> 89 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 89 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720 <210> 90 <211> 2162 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 90 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca cgcgtggtac ctctggtcgt tacataactt 240 acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 300 acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 360 ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 420 attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 480 gactttccta cttggcagta catctactcg aggccacgtt ctgcttcact ctccccatct 540 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 600 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 660 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 720 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 780 gagcgggatc agccaccgcg gtggcggcct agagtcgacg aggaactgaa aaaccagaaa 840 gttaactggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc ggtggtggtg 900 caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg tacggaagtg 960 ttacttctgc tctaaaagct gcggaattgt acccgcggcc gatccaccgg tcgccaccat 1020 ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 1080 cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg 1140 caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 1200 cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca 1260 gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 1320 caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 1380 gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 1440 gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg 1500 catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga 1560 ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 1620 cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 1680 gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaag 1740 cggccatcaa gcttatcgat accgtcgact agagctcgct gatcagcctc gactgtgcct 1800 tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1860 gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1920 tgtcattcta ttctgggggg tggggtgggg caggacagca aggcctgcag gtctagatac 1980 gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 2040 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 2100 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 2160 aa 2162 <210> 91 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Adeno-associated virus 2 <400> 91 ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60 agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120 gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180 tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240 attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300 tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360 gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420 gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480 atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540 cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600 ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660 cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720 gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780 gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840 cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900 aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960 ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020 ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080 tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140 cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200 aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260 aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320 ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380 gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440 gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500 gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560 ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620 agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680 agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740 ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800 aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860 tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920 ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980 gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040 gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100 ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160 agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccat 2208 <210> 92 <211> 4219 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 92 ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60 agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120 gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180 tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240 attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300 tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360 gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420 gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480 atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540 cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600 ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660 cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720 gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780 gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840 cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900 aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960 ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020 ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080 tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140 cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200 aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260 aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320 ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380 gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440 gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500 gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560 ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620 agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680 agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740 ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800 aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860 tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920 ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980 gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040 gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100 ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160 agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccatac ctggtttaag 2220 tcatttattg ttcaaagatg cagtcatcca aatccacatt gaccagatcg caggcagtgc 2280 aagcgtctgg cacctttccc atgatatgat gaatgtagca cagtttctga tacgcctttt 2340 tgacgacaga aacgggttga gattctgaca cgggaaagca ctctaaacag tctttctgtc 2400 cgtgagtgaa gcagatattt gaattctgat tcattctctc gcattgtctg cagggaaaca 2460 gcatcagatt catgcccacg tgacgagaac atttgttttg gtacctgtct gcgtagttga 2520 tcgaagcttc cgcgtctgac gtcgatggct gcgcaactga ctcgcgcacc cgtttgggct 2580 cacttatatc tgcgtcactg ggggcgggtc ttttcttggc tccacccttt ttgacgtaga 2640 attcatgctc cacctcaacc acgtgatcct ttgcccaccg gaaaaagtct ttgacttcct 2700 gcttggtgac cttcccaaag tcatgatcca gacggcgggt gagttcaaat ttgaacatcc 2760 ggtcttgcaa cggctgctgg tgttcgaagg tcgttgagtt cccgtcaatc acggcgcaca 2820 tgttggtgtt ggaggtgacg atcacgggag tcgggtctat ctgggccgag gacttgcatt 2880 tctggtccac gcgcaccttg cttcctccga gaatggcttt ggccgactcc acgaccttgg 2940 cggtcatctt cccctcctcc caccagatca ccatcttgtc gacacagtcg ttgaagggaa 3000 agttctcatt ggtccagttt acgcacccgt agaagggcac agtgtgggct atggcctccg 3060 cgatgttggt cttcccggta gttgcaggcc caaacagcca gatggtgttc ctcttgccga 3120 actttttcgt ggcccatccc agaaagacgg aagccgcata ttggggatcg tacccgttta 3180 gttccaaaat tttataaatc cgattgctgg aaatgtcctc cacgggctgc tggcccacca 3240 ggtagtcggg ggcggtttta gtcaggctca taatctttcc cgcattgtcc aaggcagcct 3300 tgatttggga ccgcgagttg gaggccgcat tgaaggagat gtatgaggcc tggtcctcct 3360 ggatccactg cttctccgag gtaatcccct tgtccacgag ccacccgacc agctccatgt 3420 acctggctga agtttttgat ctgatcaccg gcgcatcaga attgggattc tgattctctt 3480 tgttctgctc ctgcgtctgc gacacgtgcg tcagatgctg cgccaccaac cgtttacgct 3540 ccgtgagatt caaacaggcg cttaaatact gttccatatt agtccacgcc cactggagct 3600 caggctgggt tttggggagc aagtaattgg ggatgtagca ctcatccacc accttgttcc 3660 cgcctccggc gccatttctg gtctttgtga ccgcgaacca gtttggcaaa gtcggctcga 3720 tcccgcggta aattctctga atcagttttt cgcgaatctg actcaggaaa cgtcccaaaa 3780 ccatggattt caccccggtg gtttccacga gcacgtgcat gtggaagtag ctctctccct 3840 tctcaaattg cacaaagaaa agggcctccg gggccttact cacacggcgc cattccgtca 3900 gaaagtcgcg ctgcagcttc tcggccacgg tcaggggtgc ctgctcaatc agattcagat 3960 ccatgtcaga atctggcggc aactcccatt ccttctcggc cacccagttc acaaagctgt 4020 cagaaatgcc gggcagatgc tcgtcaaggt cgctggggac cttaatcaca atctcgtaaa 4080 accccggcat ggcggctgcg cgttcaaacc tcccgcttca aaatggagac cctgcgtgct 4140 cactcgggct taaataccca gcgtgaccac atggtgtcgc aaaatgtcgc aaaacactca 4200 cgtgacctct aatacagga 4219 <210> 93 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 93 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420 ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480 aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540 tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600 actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660 gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720 accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780 tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840 gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900 atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960 gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020 gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080 ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140 ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200 tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260 ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320 caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380 ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440 ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500 tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560 ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620 atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680 acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740 gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800 gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860 aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920 aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980 gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040 gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100 tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160 tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctgta a 2211 <210> 94 <211> 4263 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 94 ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60 tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120 agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180 tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240 acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300 atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360 tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420 agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480 ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540 tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600 ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660 agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720 agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780 aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840 acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900 aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960 aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020 tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080 taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140 tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200 cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260 ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320 ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380 aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440 tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500 ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560 aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620 tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680 agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740 tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800 tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860 gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920 aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980 gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040 cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100 gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaagcccaa agccaaccag 2160 caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220 aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280 aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta taaccacgcc 2340 gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400 gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460 aagacggctc ctggaaagaa acgtccggta gagcagtcgc cacaagagcc agactcctcc 2520 tcgggcatcg gcaagacagg ccagcagccc gctaaaaaga gactcaattt tggtcagact 2580 ggcgactcag agtcagtccc cgatccacaa cctctcggag aacctccagc aacccccgct 2640 gctgtgggac ctactacaat ggcttcaggc ggtggcgcac caatggcaga caataacgaa 2700 ggcgccgacg gagtgggtaa tgcctcagga aattggcatt gcgattccac atggctgggc 2760 gacagagtca tcaccaccag cacccgcacc tgggccttgc ccacctacaa taaccacctc 2820 tacaagcaaa tctccagtgc ttcaacgggg gccagcaacg acaaccacta cttcggctac 2880 agcaccccct gggggtattt tgatttcaac agattccact gccacttttc accacgtgac 2940 tggcagcgac tcatcaacaa caattgggga ttccggccca agagactcaa cttcaaactc 3000 ttcaacatcc aagtcaagga ggtcacgacg aatgatggcg tcacaaccat cgctaataac 3060 cttaccagca cggttcaagt cttctcggac tcggagtacc agcttccgta cgtcctcggc 3120 tctgcgcacc agggctgcct ccctccgttc ccggcggacg tgttcatgat tccgcaatac 3180 ggctacctga cgctcaacaa tggcagccaa gccgtgggac gttcatcctt ttactgcctg 3240 gaatatttcc cttctcagat gctgagaacg ggcaacaact ttaccttcag ctacaccttt 3300 gaggaagtgc ctttccacag cagctacgcg cacagccaga gcctggaccg gctgatgaat 3360 cctctcatcg accaatacct gtattacctg aacagaactc aaaatcagtc cggaagtgcc 3420 caaaacaagg acttgctgtt tagccgtggg tctccagctg gcatgtctgt tcagcccaaa 3480 aactggctac ctggaccctg ttatcggcag cagcgcgttt ctaaaacaaa aacagacaac 3540 aacaacagca attttacctg gactggtgct tcaaaatata acctcaatgg gcgtgaatcc 3600 atcatcaacc ctggcactgc tatggcctca cacaaagacg acgaagacaa gttctttccc 3660 atgagcggtg tcatgatttt tggaaaagag agcgccggag cttcaaacac tgcattggac 3720 aatgtcatga ttacagacga agaggaaatt aaagccacta accctgtggc caccgaaaga 3780 tttgggaccg tggcagtcaa tttccagagc agcagcacag accctgcgac cggagatgtg 3840 catgctatgg gagcattacc tggcatggtg tggcaagata gagacgtgta cctgcagggt 3900 cccatttggg ccaaaattcc tcacacagat ggacactttc acccgtctcc tcttatgggc 3960 ggctttggac tcaagaaccc gcctcctcag atcctcatca aaaacacgcc tgttcctgcg 4020 aatcctccgg cggagttttc agctacaaag tttgcttcat tcatcaccca atactccaca 4080 ggacaagtga gtgtggaaat tgaatgggag ctgcagaaag aaaacagcaa gcgctggaat 4140 cccgaagtgc agtacacatc caattatgca aaatctgcca acgttgattt tactgtggac 4200 aacaatggac tttatactga gcctcgcccc attggcaccc gttaccttac ccgtcccctg 4260 taa 4263 <210> 95 <211> 2175 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 95 atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60 tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120 gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg tctcgatcga 180 ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240 cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300 gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360 aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420 ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480 aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540 ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600 ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660 gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720 agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780 aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840 cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900 tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960 accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020 ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080 tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140 gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200 aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260 cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320 acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380 tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440 gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500 agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560 tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620 acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680 gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740 gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800 gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860 tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920 acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980 cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040 aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100 tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160 acccgacccc tttaa 2175 <210> 96 <211> 4057 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 96 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga cttaaaccag gtatgtcttt tgttgatcac cctccagatt ggttggaaga 1920 agttggtgaa ggtcttcgcg agtttttggg ccttgaagcg ggcccaccga aaccaaaacc 1980 caatcagcag catcaagatc aagcccgtgg tcttgtgctg cctggttata actatctcgg 2040 acccggaaac ggtctcgatc gaggagagcc tgtcaacagg gcagacgagg tcgcgcgaga 2100 gcacgacatc tcgtacaacg agcagcttga ggcgggagac aacccctacc tcaagtacaa 2160 ccacgcggac gccgagtttc aggagaagct cgccgacgac acatccttcg ggggaaacct 2220 cggaaaggca gtctttcagg ccaagaaaag ggttctcgaa ccttttggcc tggttgaaga 2280 gggtgctaag acggccccta ccggaaagcg gatagacgac cactttccaa aaagaaagaa 2340 ggctcggacc gaagaggact ccaagccttc cacctcgtca gacgccgaag ctggacccag 2400 cggatcccag cagctgcaaa tcccagccca accagcctca agtttgggag ctgatacaat 2460 gtctgcggga ggtggcggcc cattgggcga caataaccaa ggtgccgatg gagtgggcaa 2520 tgcctcggga gattggcatt gcgattccac gtggatgggg gacagagtcg tcaccaagtc 2580 cacccgaacc tgggtgctgc ccagctacaa caaccaccag taccgagaga tcaaaagcgg 2640 ctccgtcgac ggaagcaacg ccaacgccta ctttggatac agcaccccct gggggtactt 2700 tgactttaac cgcttccaca gccactggag cccccgagac tggcaaagac tcatcaacaa 2760 ctactggggc ttcagacccc ggtccctcag agtcaaaatc ttcaacattc aagtcaaaga 2820 ggtcacggtg caggactcca ccaccaccat cgccaacaac ctcacctcca ccgtccaagt 2880 gtttacggac gacgactacc agctgcccta cgtcgtcggc aacgggaccg agggatgcct 2940 gccggccttc cctccgcagg tctttacgct gccgcagtac ggttacgcga cgctgaaccg 3000 cgacaacaca gaaaatccca ccgagaggag cagcttcttc tgcctagagt actttcccag 3060 caagatgctg agaacgggca acaactttga gtttacctac aactttgagg aggtgccctt 3120 ccactccagc ttcgctccca gtcagaacct gttcaagctg gccaacccgc tggtggacca 3180 gtacttgtac cgcttcgtga gcacaaataa cactggcgga gtccagttca acaagaacct 3240 ggccgggaga tacgccaaca cctacaaaaa ctggttcccg gggcccatgg gccgaaccca 3300 gggctggaac ctgggctccg gggtcaaccg cgccagtgtc agcgccttcg ccacgaccaa 3360 taggatggag ctcgagggcg cgagttacca ggtgcccccg cagccgaacg gcatgaccaa 3420 caacctccag ggcagcaaca cctatgccct ggagaacact atgatcttca acagccagcc 3480 ggcgaacccg ggcaccaccg ccacgtacct cgagggcaac atgctcatca ccagcgagag 3540 cgagacgcag ccggtgaacc gcgtggcgta caacgtcggc gggcagatgg ccaccaacaa 3600 ccagagctcc accactgccc ccgcgaccgg cacgtacaac ctccaggaaa tcgtgcccgg 3660 cagcgtgtgg atggagaggg acgtgtacct ccaaggaccc atctgggcca agatcccaga 3720 gacgggggcg cactttcacc cctctccggc catgggcgga ttcggactca aacacccacc 3780 gcccatgatg ctcatcaaga acacgcctgt gcccggaaat atcaccagct tctcggacgt 3840 gcccgtcagc agcttcatca cccagtacag caccgggcag gtcaccgtgg agatggagtg 3900 ggagctcaag aaggaaaact ccaagaggtg gaacccagag atccagtaca caaacaacta 3960 caacgacccc cagtttgtgg actttgcccc ggacagcacc ggggaataca gaaccaccag 4020 acctatcgga acccgatacc ttacccgacc cctttaa 4057 <210> 97 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 97 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaaga gggttctcga acctcttggt ctggttgagg aaggtgctaa gacggctcct 420 ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480 aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540 tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600 actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660 gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720 accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780 tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840 gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900 atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960 gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020 gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080 ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140 ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200 tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260 ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320 cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380 ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440 ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500 tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560 ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620 atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680 acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740 gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800 gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860 aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920 aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980 gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040 gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100 tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160 tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta tgcttgttaa 2220 <210> 98 <211> 4102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 98 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 caacctctct gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaaacccaa 1980 agccaaccag caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct 2040 cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggatg cagcggccct 2100 cgagcacgac aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta 2160 taaccacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220 cctcgggcga gcagtcttcc aggccaagaa gagggttctc gaacctcttg gtctggttga 2280 ggaaggtgct aagacggctc ctggaaagaa acgtccggta gagcagtcgc cacaagagcc 2340 agactcctcc tcgggcattg gcaagacagg ccagcagccc gctaaaaaga gactcaattt 2400 tggtcagact ggcgactcag agtcagtccc cgacccacaa cctctcggag aacctccagc 2460 aacccccgct gctgtgggac ctactacaat ggcttcaggc ggtggcgcac caatggcaga 2520 caataacgaa ggcgccgacg gagtgggtaa tgcctcagga aattggcatt gcgattccac 2580 atggctgggc gacagagtca tcaccaccag cacccgaaca tgggccttgc ccacctataa 2640 caaccacctc tacaagcaaa tctccagtgc ttcaacgggg gccagcaacg acaaccacta 2700 cttcggctac agcaccccct gggggtattt tgatttcaac agattccact gccatttctc 2760 accacgtgac tggcagcgac tcatcaacaa caattgggga ttccggccca agagactcaa 2820 cttcaagctc ttcaacatcc aagtcaagga ggtcacgacg aatgatggcg tcacgaccat 2880 cgctaataac cttaccagca cggttcaagt cttctcggac tcggagtacc agttgccgta 2940 cgtcctcggc tctgcgcacc agggctgcct ccctccgttc ccggcggacg tgttcatgat 3000 tccgcagtac ggctacctaa cgctcaacaa tggcagccag gcagtgggac ggtcatcctt 3060 ttactgcctg gaatatttcc catcgcagat gctgagaacg ggcaataact ttaccttcag 3120 ctacaccttc gaggacgtgc ctttccacag cagctacgcg cacagccaga gcctggaccg 3180 gctgatgaat cctctcatcg accagtacct gtattacctg aacagaactc agaatcagtc 3240 cggaagtgcc caaaacaagg acttgctgtt tagccggggg tctccagctg gcatgtctgt 3300 tcagcccaaa aactggctac ctggaccctg ttaccggcag cagcgcgttt ctaaaacaaa 3360 aacagacaac aacaacagca actttacctg gactggtgct tcaaaatata accttaatgg 3420 gcgtgaatct ataatcaacc ctggcactgc tatggcctca cacaaagacg acaaagacaa 3480 gttctttccc atgagcggtg tcatgatttt tggaaaggag agcgccggag cttcaaacac 3540 tgcattggac aatgtcatga tcacagacga agaggaaatc aaagccacta accccgtggc 3600 caccgaaaga tttgggactg tggcagtcaa tctccagagc agcagcacag accctgcgac 3660 cggagatgtg catgttatgg gagccttacc tggaatggtg tggcaagaca gagacgtata 3720 cctgcagggt cctatttggg ccaaaattcc tcacacggat ggacactttc acccgtctcc 3780 tctcatgggc ggctttggac ttaagcaccc gcctcctcag atcctcatca aaaacacgcc 3840 tgttcctgcg aatcctccgg cagagttttc ggctacaaag tttgcttcat tcatcaccca 3900 gtattccaca ggacaagtga gcgtggagat tgaatgggag ctgcagaaag aaaacagcaa 3960 acgctggaat cccgaagtgc agtatacatc taactatgca aaatctgcca acgttgattt 4020 cactgtggac aacaatggac tttatactga gcctcgcccc attggcaccc gttacctcac 4080 ccgtcccctg tatgcttgtt aa 4102 <210> 99 <211> 2217 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 99 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420 ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480 ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540 gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600 cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660 ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720 atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780 atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840 ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 900 cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960 atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020 agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080 caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140 ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200 tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260 gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1320 attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380 cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440 ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1500 agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560 aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620 gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680 atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1740 atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800 cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 1860 tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920 ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980 ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040 gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100 atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160 ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217 <210> 100 <211> 4269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 100 ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60 tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120 agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180 tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240 acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300 atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360 tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420 agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480 ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540 tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600 ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660 agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720 agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780 aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840 acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900 aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960 aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020 tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080 taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140 tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200 cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260 ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320 ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380 aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440 tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500 ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560 aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620 tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680 agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740 tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800 tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860 gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920 aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980 gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040 cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100 gagggcattc gcgagtggtg ggcgctgaaa cctggagccc cgaagcccaa agccaaccag 2160 caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220 aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280 aaggcctacg accagcagct gcaggcgggt gacaatccgt acctgcggta taaccacgcc 2340 gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400 gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460 aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc tccagactcc 2520 tctacgggca tcggcaagaa aggccaacag cccgccagaa aaagactcaa ttttggtcag 2580 actggcgact cagagtcagt tccagaccct caacctctcg gagaacctcc agcagcgccc 2640 tctggtgtgg gacctaatac aatggctgca ggcggtggcg caccaatggc agacaataac 2700 gaaggcgccg acggagtggg tagttcctcg ggaaattggc attgcgattc cacatggctg 2760 ggcgacagag tcatcaccac cagcacccga acctgggccc tgcccaccta caacaaccac 2820 ctctacaagc aaatctccaa cgggacatcg ggaggagcca ccaacgacaa cacctacttc 2880 ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca cttttcacca 2940 cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag actcagcttc 3000 aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa gaccatcgcc 3060 aataacctca ccagcaccat ccaggtgttt acggactcgg agtaccagct gccgtacgtt 3120 ctcggctctg cccaccaggg ctgcctgcct ccgttcccgg cggacgtgtt catgattccc 3180 cagtacggct acctaacact caacaacggt agtcaggccg tgggacgctc ctccttctac 3240 tgcctggaat actttccttc gcagatgctg agaaccggca acaacttcca gtttacttac 3300 accttcgagg acgtgccttt ccacagcagc tacgcccaca gccagagctt ggaccggctg 3360 atgaatcctc tgattgacca gtacctgtac tacttgtctc ggactcaaac aacaggaggc 3420 acggcaaata cgcagactct gggcttcagc caaggtgggc ctaatacaat ggccaatcag 3480 gcaaagaact ggctgccagg accctgttac cgccaacaac gcgtctcaac gacaaccggg 3540 caaaacaaca atagcaactt tgcctggact gctgggacca aataccatct gaatggaaga 3600 aattcattgg ctaatcctgg catcgctatg gcaacacaca aagacgacga ggagcgtttt 3660 tttcccagta acgggatcct gatttttggc aaacaaaatg ctgccagaga caatgcggat 3720 tacagcgatg tcatgctcac cagcgaggaa gaaatcaaaa ccactaaccc tgtggctaca 3780 gaggaatacg gtatcgtggc agataacttg cagcagcaaa acacggctcc tcaaattgga 3840 actgtcaaca gccagggggc cttacccggt atggtctggc agaaccggga cgtgtacctg 3900 cagggtccca tctgggccaa gattcctcac acggacggca acttccaccc gtctccgctg 3960 atgggcggct ttggcctgaa acatcctccg cctcagatcc tgatcaagaa cacgcctgta 4020 cctgcggatc ctccgaccac cttcaaccag tcaaagctga actctttcat cacgcaatac 4080 agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaggaaaa cagcaagcgc 4140 tggaaccccg agatccagta cacctccaac tactacaaat ctacaagtgt ggactttgct 4200 gttaatacag aaggcgtgta ctctgaaccc cgccccattg gcacccgtta cctcacccgt 4260 aatctgtaa 4269 <210> 101 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 101 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800 atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860 aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920 aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980 gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100 tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160 tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 102 <211> 4093 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 102 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980 ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040 tggacccggc aacggactcg acaaggggga gccggtcaac gcagcagacg cggcggccct 2100 cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160 caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220 cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280 ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340 ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400 cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460 agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520 caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580 atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640 caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700 ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760 ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820 caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880 catcgccaat aaccttacca gcacggtcca ggtcttcacg gactcagact atcagctccc 2940 gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000 gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060 cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120 cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180 ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240 ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300 ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360 gactcaaaac aacaacagcg aatttgcttg gcctggagct tcttcttggg ctctcaatgg 3420 acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480 tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540 ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600 aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660 cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720 cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780 gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840 tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900 gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960 gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020 tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080 tcgtaatctg taa 4093 <210> 103 <211> 2217 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 103 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420 ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480 ggcaagaaag gccagcagcc cgcgaaaaag agactcaact ttgggcagac tggcgactca 540 gagtcagtgc ccgaccctca accaatcgga gaaccccccg caggcccctc tggtctggga 600 tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660 ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720 atcaccacca gcacccgaac ctgggccctc cccacctaca acaaccacct ctacaagcaa 780 atctccaacg ggacttcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840 ccctgggggt attttgactt taacagattc cactgccact tctcaccacg tgactggcag 900 cgactcatca acaacaactg gggattccgg cccaagagac tcaacttcaa gctcttcaac 960 atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020 agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtcct cggctctgcg 1080 caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140 ctgactctga acaatggcag tcaggccgtg ggccgttcct ccttctactg cctggagtac 1200 tttccttctc aaatgctgag aacgggcaac aactttgagt tcagctacca gtttgaggac 1260 gtgccttttc acagcagcta cgcgcacagc caaagcctgg accggctgat gaaccccctc 1320 atcgaccagt acctgtacta cctgtctcgg actcagtcca cgggaggtac cgcaggaact 1380 cagcagttgc tattttctca ggccgggcct aataacatgt cggctcaggc caaaaactgg 1440 ctacccgggc cctgctaccg gcagcaacgc gtctccacga cactgtcgca aaataacaac 1500 agcaactttg cctggaccgg tgccaccaag tatcatctga atggcagaga ctctctggta 1560 aatcccggtg tcgctatggc aacccacaag gacgacgaag agcgattttt tccgtccagc 1620 ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtt 1680 atgctaacca gtgaggaaga aattaaaacc accaacccag tggccacaga acagtacggc 1740 gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaacagt 1800 caaggagcct tacctggcat ggtctggcag aaccgggacg tgtacctgca gggtcctatc 1860 tgggccaaga ttcctcacac ggacggaaac tttcatccct cgccgctgat gggaggcttt 1920 ggactgaaac acccgcctcc tcagatcctg attaagaata cacctgttcc cgcggatcct 1980 ccaactacct tcagtcaagc taagctggcg tcgttcatca cgcagtacag caccggacag 2040 gtcagcgtgg aaattgaatg ggagctgcag aaagaaaaca gcaaacgctg gaacccagag 2100 attcaataca cttccaacta ctacaaatct acaaatgtgg actttgctgt taacacagat 2160 ggcacttatt ctgagcctcg ccccatcggc acccgttacc tcacccgtaa tctgtaa 2217 <210> 104 <211> 4269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 104 ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60 tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120 agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180 tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240 acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300 atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360 tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420 agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480 ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540 tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600 ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660 agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720 agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780 aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840 acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900 aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960 aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020 tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080 taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140 tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200 cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260 ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320 ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380 aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440 tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500 ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560 aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620 tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680 agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740 tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800 tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860 gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920 aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980 gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040 cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100 gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaaacccaa agccaaccag 2160 caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220 aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280 aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta taaccacgcc 2340 gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400 gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460 aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc tccagactcc 2520 tctacgggca tcggcaagaa aggccagcag cccgcgaaaa agagactcaa ctttgggcag 2580 actggcgact cagagtcagt gcccgaccct caaccaatcg gagaaccccc cgcaggcccc 2640 tctggtctgg gatctggtac aatggctgca ggcggtggcg ctccaatggc agacaataac 2700 gaaggcgccg acggagtggg tagttcctca ggaaattggc attgcgattc cacatggctg 2760 ggcgacagag tcatcaccac cagcacccga acctgggccc tccccaccta caacaaccac 2820 ctctacaagc aaatctccaa cgggacttcg ggaggaagca ccaacgacaa cacctacttc 2880 ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca cttctcacca 2940 cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag actcaacttc 3000 aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa gaccatcgcc 3060 aataacctta ccagcacgat tcaggtcttt acggactcgg aataccagct cccgtacgtc 3120 ctcggctctg cgcaccaggg ctgcctgcct ccgttcccgg cggacgtctt catgattcct 3180 cagtacgggt acctgactct gaacaatggc agtcaggccg tgggccgttc ctccttctac 3240 tgcctggagt actttccttc tcaaatgctg agaacgggca acaactttga gttcagctac 3300 cagtttgagg acgtgccttt tcacagcagc tacgcgcaca gccaaagcct ggaccggctg 3360 atgaaccccc tcatcgacca gtacctgtac tacctgtctc ggactcagtc cacgggaggt 3420 accgcaggaa ctcagcagtt gctattttct caggccgggc ctaataacat gtcggctcag 3480 gccaaaaact ggctacccgg gccctgctac cggcagcaac gcgtctccac gacactgtcg 3540 caaaataaca acagcaactt tgcctggacc ggtgccacca agtatcatct gaatggcaga 3600 gactctctgg taaatcccgg tgtcgctatg gcaacccaca aggacgacga agagcgattt 3660 tttccgtcca gcggagtctt aatgtttggg aaacagggag ctggaaaaga caacgtggac 3720 tatagcagcg ttatgctaac cagtgaggaa gaaattaaaa ccaccaaccc agtggccaca 3780 gaacagtacg gcgtggtggc cgataacctg caacagcaaa acgccgctcc tattgtaggg 3840 gccgtcaaca gtcaaggagc cttacctggc atggtctggc agaaccggga cgtgtacctg 3900 cagggtccta tctgggccaa gattcctcac acggacggaa actttcatcc ctcgccgctg 3960 atgggaggct ttggactgaa acacccgcct cctcagatcc tgattaagaa tacacctgtt 4020 cccgcggatc ctccaactac cttcagtcaa gctaagctgg cgtcgttcat cacgcagtac 4080 agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaagaaaa cagcaaacgc 4140 tggaacccag agattcaata cacttccaac tactacaaat ctacaaatgt ggactttgct 4200 gttaacacag atggcactta ttctgagcct cgccccatcg gcacccgtta cctcacccgt 4260 aatctgtaa 4269 <210> 105 <211> 2217 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 105 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120 aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctcc aagcgggtga caatccgtac ctgcggtata atcacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgcgc agtcttccag 360 gccaaaaagc gggttctcga acctctgggc ctggttgaat cgccggttaa gacggctcct 420 ggaaagaaga gaccggtaga gccatcaccc cagcgctctc cagactcctc tacgggcatc 480 ggcaagaaag gccagcagcc cgcaaaaaag agactcaatt ttgggcagac tggcgactca 540 gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600 tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660 ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720 atcaccacca gcacccgcac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780 atctccaacg ggacctcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840 ccctgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcag 900 cgactcatca acaacaactg gggattccgg cccaagaggc tcaacttcaa gctcttcaac 960 atccaagtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020 agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtgct cggctcggcg 1080 caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140 ctgactctga acaatggcag tcaggctgtg ggccggtcgt ccttctactg cctggagtac 1200 tttccttctc aaatgctgag aacgggcaac aactttgaat tcagctacaa cttcgaggac 1260 gtgcccttcc acagcagcta cgcgcacagc cagagcctgg accggctgat gaaccctctc 1320 atcgaccagt acttgtacta cctgtcccgg actcaaagca cgggcggtac tgcaggaact 1380 cagcagttgc tattttctca ggccgggcct aacaacatgt cggctcaggc caagaactgg 1440 ctacccggtc cctgctaccg gcagcaacgc gtctccacga cactgtcgca gaacaacaac 1500 agcaactttg cctggacggg tgccaccaag tatcatctga atggcagaga ctctctggtg 1560 aatcctggcg ttgccatggc tacccacaag gacgacgaag agcgattttt tccatccagc 1620 ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtg 1680 atgctaacca gcgaggaaga aataaagacc accaacccag tggccacaga acagtacggc 1740 gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaatagt 1800 caaggagcct tacctgggat ggtgtggcag aaccgggacg tgtacctgca gggtcccatc 1860 tgggccaaga ttcctcatac ggacggcaac tttcatccct cgccgctgat gggaggcttt 1920 ggactgaagc atccgcctcc tcagatcctg attaaaaaca cacctgttcc cgcggatcct 1980 ccgaccacct tcaatcaggc caagctggct tctttcatca cgcagtacag taccggccag 2040 gtcagcgtgg agatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100 attcagtaca cttccaacta ctacaaatct acaaatgtgg actttgctgt caatactgag 2160 ggtacttatt ccgagcctcg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217 <210> 106 <211> 4099 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 106 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 caacctctct gagggcattc gcgagtggtg ggacctgaaa cctggagccc cgaaacccaa 1980 agccaaccag caaaagcagg acaacggccg gggtctggtg cttcctggct acaagtacct 2040 cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct 2100 cgagcacgac aaggcctacg accagcagct ccaagcgggt gacaatccgt acctgcggta 2160 taatcacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220 cctcgggcgc gcagtcttcc aggccaaaaa gcgggttctc gaacctctgg gcctggttga 2280 atcgccggtt aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgctc 2340 tccagactcc tctacgggca tcggcaagaa aggccagcag cccgcaaaaa agagactcaa 2400 ttttgggcag actggcgact cagagtcagt ccccgaccct caaccaatcg gagaaccacc 2460 agcaggcccc tctggtctgg gatctggtac aatggctgca ggcggtggcg ctccaatggc 2520 agacaataac gaaggcgccg acggagtggg tagttcctca ggaaattggc attgcgattc 2580 cacatggctg ggcgacagag tcatcaccac cagcacccgc acctgggccc tgcccaccta 2640 caacaaccac ctctacaagc aaatctccaa cgggacctcg ggaggaagca ccaacgacaa 2700 cacctacttc ggctacagca ccccctgggg gtattttgac ttcaacagat tccactgcca 2760 cttttcacca cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag 2820 gctcaacttc aagctcttca acatccaagt caaggaggtc acgcagaatg aaggcaccaa 2880 gaccatcgcc aataacctta ccagcacgat tcaggtcttt acggactcgg aataccagct 2940 cccgtacgtg ctcggctcgg cgcaccaggg ctgcctgcct ccgttcccgg cggacgtctt 3000 catgattcct cagtacgggt acctgactct gaacaatggc agtcaggctg tgggccggtc 3060 gtccttctac tgcctggagt actttccttc tcaaatgctg agaacgggca acaactttga 3120 attcagctac aacttcgagg acgtgccctt ccacagcagc tacgcgcaca gccagagcct 3180 ggaccggctg atgaaccctc tcatcgacca gtacttgtac tacctgtccc ggactcaaag 3240 cacgggcggt actgcaggaa ctcagcagtt gctattttct caggccgggc ctaacaacat 3300 gtcggctcag gccaagaact ggctacccgg tccctgctac cggcagcaac gcgtctccac 3360 gacactgtcg cagaacaaca acagcaactt tgcctggacg ggtgccacca agtatcatct 3420 gaatggcaga gactctctgg tgaatcctgg cgttgccatg gctacccaca aggacgacga 3480 agagcgattt tttccatcca gcggagtctt aatgtttggg aaacagggag ctggaaaaga 3540 caacgtggac tatagcagcg tgatgctaac cagcgaggaa gaaataaaga ccaccaaccc 3600 agtggccaca gaacagtacg gcgtggtggc cgataacctg caacagcaaa acgccgctcc 3660 tattgtaggg gccgtcaata gtcaaggagc cttacctggg atggtgtggc agaaccggga 3720 cgtgtacctg cagggtccca tctgggccaa gattcctcat acggacggca actttcatcc 3780 ctcgccgctg atgggaggct ttggactgaa gcatccgcct cctcagatcc tgattaaaaa 3840 cacacctgtt cccgcggatc ctccgaccac cttcaatcag gccaagctgg cttctttcat 3900 cacgcagtac agtaccggcc aggtcagcgt ggagatcgag tgggagctgc agaaggagaa 3960 cagcaaacgc tggaacccag agattcagta cacttccaac tactacaaat ctacaaatgt 4020 ggactttgct gtcaatactg agggtactta ttccgagcct cgccccattg gcacccgtta 4080 cctcacccgt aatctgtaa 4099

Claims (58)

  1. 제1 핵산 벡터로서,
    AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
    트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
    AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
    을 포함하고, 헬퍼 바이러스 유전자를 포함하지 않는 핵산 벡터.
  2. 제1항에 있어서,
    5'으로부터 3'으로
    AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
    트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
    AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
    을 포함하고, 헬퍼 바이러스 유전자를 포함하지 않는 핵산 벡터.
  3. 제1항에 있어서,
    5'으로부터 3'으로
    AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
    트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
    AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
    을 포함하는 핵산 벡터.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    DNA 플라스미드 또는 DNA 최소 벡터인 핵산 벡터.
  5. 재조합 AAV (rAAV) 패키징 시스템으로서,
    (i) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
    트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
    AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
    을 포함하는 제1 핵산 벡터, 및
    (ii) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터
    를 포함하는 패키징 시스템.
  6. 제5항에 있어서,
    상기 제1 핵산 벡터가 5'으로부터 3'으로
    AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
    트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
    AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
    을 포함하는, 패키징 시스템.
  7. 제5항 또는 제6항에 있어서,
    상기 제1 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 패키징 시스템.
  8. 제5항 내지 제7항 중 어느 한 항에 있어서,
    상기 제2 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 패키징 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 트랜스진이 폴리펩티드를 코딩하는, 핵산 벡터 또는 패키징 시스템.
  10. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 트랜스진이 miRNA, shRNA, siRNA, 안티센스 RNA, gRNA, 안타고미르, miRNA 스폰지, RNA 압타자임, RNA 압타머, lncRNA, 리보자임 또는 mRNA를 코딩하는, 핵산 벡터 또는 패키징 시스템.
  11. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 트랜스진이 글루코스-6-포스파타제 (G6Pase) 또는 프라탁신 (FXN)을 코딩하는, 핵산 벡터 또는 패키징 시스템.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서,
    상기 rAAV 게놈이 트랜스진에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
  13. 제12항에 있어서,
    상기 전사 조절 요소가 프로모터 요소 및/또는 인트론 요소를 포함하는, 핵산 벡터 또는 패키징 시스템.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서,
    상기 rAAV 게놈이 폴리아데닐화 서열을 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
  15. 제14항에 있어서,
    상기 폴리아데닐화 서열이 트랜스진에 대해 3'인, 핵산 벡터 또는 패키징 시스템.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서,
    상기 rAAV 게놈이 트랜스진의 5'의 5' 역전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 트랜스진의 3'의 3' 역전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서,
    상기 AAV Rep 단백질이 야생형 Rep 단백질 또는 이의 변이체인, 핵산 벡터 또는 패키징 시스템.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서,
    상기 AAV Rep 단백질이 AAV2 Rep 단백질 또는 이의 변이체인, 핵산 벡터 또는 패키징 시스템.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서,
    상기 제1 뉴클레오티드 서열이 AAV Rep 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
  20. 제19항에 있어서,
    상기 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 핵산 벡터 또는 패키징 시스템.
  21. 제20항에 있어서,
    상기 프로모터가 P5 프로모터, P19 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서,
    상기 AAV 캡시드 단백질이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh10, AAVRh32.33, AAVrh74, AAV-DJ, AAV-LK03, NP59, VOY101, VOY201, VOY701, VOY801, VOY1101, AAVPHP.N, AAVPHP.A, AAVPHP.B, PHP.B2, PHP.B3, G2A3, G2B4, G2B5 및 PHP.S로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서,
    상기 제3 뉴클레오티드 서열이 AAV 캡시드 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
  24. 제23항에 있어서,
    상기 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 핵산 벡터 또는 패키징 시스템.
  25. 제24항에 있어서,
    상기 프로모터가 P40 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
  26. 제5항 내지 제25항 중 어느 한 항에 있어서,
    상기 헬퍼 바이러스 유전자가 아데노바이러스, 헤르페스 바이러스, 폭스바이러스, 사이토메갈로바이러스 및 배큘로바이러스로 이루어진 군으로부터 선택되는 헬퍼 바이러스로부터 유래되는, 패키징 시스템.
  27. 제5항 내지 제26항 중 어느 한 항에 있어서,
    상기 헬퍼 바이러스 유전자가 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 아데노바이러스로부터 유래된 RNA 유전자인, 패키징 시스템.
  28. 제5항 내지 제27항 중 어느 한 항에 있어서,
    상기 제2 핵산 벡터가 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 패키징 시스템.
  29. 제28항에 있어서,
    상기 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 패키징 시스템.
  30. 제29항에 있어서,
    상기 프로모터가 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 패키징 시스템.
  31. 제5항 내지 제30항 중 어느 한 항에 있어서,
    상기 제2 핵산 벡터가 서열번호 60, 61 또는 62에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 패키징 시스템.
  32. 제5항 내지 제31항 중 어느 한 항에 있어서,
    상기 제2 핵산 벡터가 서열번호 63에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 패키징 시스템.
  33. 제5항 내지 제32항 중 어느 한 항에 있어서,
    상기 헬퍼 바이러스 유전자가 UL5/8/52, ICP0, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 헤르페스 바이러스로부터 유래된 유전자인, 패키징 시스템.
  34. 제33항에 있어서,
    상기 제2 핵산 벡터가 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 패키징 시스템.
  35. 제34항에 있어서,
    상기 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 패키징 시스템.
  36. 제35항에 있어서,
    상기 프로모터가 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 패키징 시스템.
  37. 제1항 내지 제4항 및 제9항 내지 제25항 중 어느 한 항의 핵산 벡터, 또는 제5항 내지 제36항 중 어느 한 항의 패키징 시스템을 포함하는 숙주 세포.
  38. 제37항에 있어서,
    상기 숙주 세포가 포유동물 세포인, 숙주 세포.
  39. 제38항에 있어서,
    상기 포유동물 세포가 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택되는, 숙주 세포.
  40. 제38항 또는 제39항에 있어서,
    상기 포유동물 세포가 HEK293 세포인, 숙주 세포.
  41. rAAV가 생산되는 조건 하에서 포유동물 세포에 제5항 내지 제36항 중 어느 한 항의 패키징 시스템을 도입하는 단계를 포함하는, rAAV의 재조합 제조 방법.
  42. 제41항에 있어서,
    상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.2, 1:0.4, 1:0.6, 1:0.8, 1:1, 1:2, 1:3 및 1:4로 이루어진 군으로부터 선택되는, 방법.
  43. 제41항 또는 제42항에 있어서,
    상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:2인, 방법.
  44. 제41항 또는 제42항에 있어서,
    상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.2 내지 1:1인, 방법.
  45. 제44항에 있어서,
    상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.6인, 방법.
  46. 제44항에 있어서,
    상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.8인, 방법.
  47. 제44항에 있어서,
    상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:1인, 방법.
  48. 제41항 내지 제47항 중 어느 한 항에 있어서,
    상기 패키징 시스템의 0.1 내지 4 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는 방법.
  49. 제41항 내지 제48항 중 어느 한 항에 있어서,
    상기 패키징 시스템의 0.5 내지 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는 방법.
  50. 제41항 내지 제49항 중 어느 한 항에 있어서,
    상기 패키징 시스템의 0.6, 0.7, 0.8, 0.9 또는 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는 방법.
  51. 제41항 내지 제49항 중 어느 한 항에 있어서,
    상기 패키징 시스템의 0.75 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는 방법.
  52. 제41항 내지 제51항 중 어느 한 항에 있어서,
    (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터;
    (ii) rAAV 게놈을 포함하는 제2 벡터; 및
    (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터
    를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래하는 방법.
  53. 제41항 내지 제51항 중 어느 한 항에 있어서,
    (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터;
    (ii) rAAV 게놈을 포함하는 제2 벡터; 및
    (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터
    를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 온전한 벡터 게놈의 증가된 백분율을 초래하는 방법.
  54. 제41항 내지 제53항 중 어느 한 항에 있어서,
    상기 포유동물 세포가 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택되는, 방법.
  55. 제41항 내지 제54항 중 어느 한 항에 있어서,
    상기 포유동물 세포가 HEK293 세포인, 방법.
  56. 제41항 내지 제55항 중 어느 한 항에 있어서,
    상기 포유동물 세포가 세포 배양물로 제공되는, 방법.
  57. 제37항 내지 제40항 중 어느 한 항에 있어서,
    상기 숙주 세포의 집단이 세포 배양물로 제공되는, 숙주 세포의 집단.
  58. 제56항 또는 제57항에 있어서,
    상기 세포 배양물이 2 리터 이상, 50 리터 이상, 또는 2000 리터 이상의 부피를 갖는, 방법 또는 숙주 세포의 집단.
KR1020247002671A 2021-06-25 2022-06-24 아데노-연관된 바이러스 패키징 시스템 KR20240025645A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202163202817P 2021-06-25 2021-06-25
US63/202,817 2021-06-25
US202163262218P 2021-10-07 2021-10-07
US63/262,218 2021-10-07
US202263266646P 2022-01-11 2022-01-11
US63/266,646 2022-01-11
PCT/US2022/073138 WO2022272297A1 (en) 2021-06-25 2022-06-24 Adeno-associated virus packaging systems

Publications (1)

Publication Number Publication Date
KR20240025645A true KR20240025645A (ko) 2024-02-27

Family

ID=83080718

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247002671A KR20240025645A (ko) 2021-06-25 2022-06-24 아데노-연관된 바이러스 패키징 시스템

Country Status (7)

Country Link
US (2) US20230038295A1 (ko)
EP (1) EP4359549A1 (ko)
KR (1) KR20240025645A (ko)
AU (1) AU2022299552A1 (ko)
CA (1) CA3223292A1 (ko)
IL (1) IL309532A (ko)
WO (2) WO2022272296A2 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024046403A1 (zh) * 2022-08-31 2024-03-07 江苏金斯瑞蓬勃生物科技有限公司 能够提高腺相关病毒滴度的腺相关病毒结构质粒

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6174666B1 (en) 1992-03-27 2001-01-16 The United States Of America As Represented By The Department Of Health And Human Services Method of eliminating inhibitory/instability regions from mRNA
EP1290205B1 (en) 2000-06-01 2006-03-01 University Of North Carolina At Chapel Hill Duplexed parvovirus vectors
PL220644B1 (pl) 2001-11-13 2015-11-30 Univ Pennsylvania Wirus stowarzyszony z adenowirusem (AAV), kompozycja, wyizolowane białko kapsydowe, wyizolowane lub syntetyczne cząsteczki kwasu nukleinowego, sposób wytwarzania zrekombinowanego wirusa, komórka gospodarza
ES2602352T3 (es) * 2001-12-17 2017-02-20 The Trustees Of The University Of Pennsylvania Secuencias de serotipo 8 de virus adenoasociado (VAA), vectores que las contienen y usos de las mismas
EP2559759A1 (en) 2003-01-28 2013-02-20 Cellectis Custom-made meganuclease and use thereof
EP4234687A2 (en) 2005-04-07 2023-08-30 The Trustees of the University of Pennsylvania Method of increasing the function of an aav vector
US9029134B2 (en) 2006-01-12 2015-05-12 Lucigen Corporation Linear vectors, host cells and cloning methods
US9150882B2 (en) 2006-01-31 2015-10-06 The Board Of Trustees Of The Leland Stanford Junior University Self-complementary parvoviral vectors, and methods for making and using the same
CN101484005A (zh) * 2006-05-04 2009-07-15 韦恩州立大学 通过向体内递送视紫红质核酸恢复视觉响应
WO2009025690A2 (en) 2007-05-23 2009-02-26 Nature Technology Corporation Improved e. coli plasmid dna production
EP2152889B1 (en) 2007-05-29 2017-03-15 Nature Technology Corporation Vectors and methods for genetic immunization
GB0901593D0 (en) 2009-01-30 2009-03-11 Touchlight Genetics Ltd Production of closed linear DNA
US9012226B2 (en) 2009-03-13 2015-04-21 Nature Technology Corporation Bacterial strains with improved plasmid stability
US8927514B2 (en) 2010-04-30 2015-01-06 City Of Hope Recombinant adeno-associated vectors for targeted treatment
GB201013153D0 (en) 2010-08-04 2010-09-22 Touchlight Genetics Ltd Primer for production of closed linear DNA
EP3147295B2 (en) 2011-08-24 2023-11-22 The Board of Trustees of the Leland Stanford Junior University New avv capsid proteins for nucleic acid transfer
US20140359799A1 (en) 2011-12-23 2014-12-04 Case Western Reserve University Targeted gene modification using hybrid recombinant adeno-associated virus
WO2014077863A1 (en) 2012-11-19 2014-05-22 Nature Technology Corporation Replicative minicircle vectors with improved expression
DE102013220859B4 (de) 2013-10-15 2016-09-08 Plasmidfactory Gmbh & Co. Kg Minicircles mit viralen Expressionskassetten und ihre Verwendung zur Transformation von Zellen zur Erzeugung rekombinanter Viren oder viraler Genvektoren
KR20230067694A (ko) 2014-09-24 2023-05-16 시티 오브 호프 고효율 게놈 편집을 위한 아데노-관련 바이러스 벡터 변이체 및 이의 방법
JP6754361B2 (ja) 2014-12-16 2020-09-09 ボード オブ リージェンツ オブ ザ ユニバーシティ オブ ネブラスカ 若年型バッテン病のための遺伝子療法
US10179176B2 (en) 2016-02-16 2019-01-15 The Board Of Trustees Of The Leland Stanford Junior University Recombinant adeno-associated virus capsids resistant to pre-existing human neutralizing antibodies
WO2018033730A1 (en) 2016-08-16 2018-02-22 Touchlight IP Limited Closed linear dna production
GB201706451D0 (en) * 2017-04-24 2017-06-07 Imp Innovations Ltd Cancer treatment
ES2821655T3 (es) 2017-09-19 2021-04-27 Deutsches Krebsforsch Vectores de ADN no integrantes para la modificación genética de células
US10610606B2 (en) * 2018-02-01 2020-04-07 Homology Medicines, Inc. Adeno-associated virus compositions for PAH gene transfer and methods of use thereof
SG11202009009UA (en) 2018-03-21 2020-10-29 Nature Tech Corporation Viral and non-viral nanoplasmid vectors with improved production
BR112021005110A2 (pt) * 2018-09-21 2021-06-15 Nightstarx Limited composições e métodos para fabricação de vetores de terapia genética
EP3966227A1 (en) 2019-05-07 2022-03-16 Voyager Therapeutics, Inc. Compositions and methods for the vectored augmentation of protein destruction, expression and/or regulation

Also Published As

Publication number Publication date
US20230055381A1 (en) 2023-02-23
WO2022272296A2 (en) 2022-12-29
IL309532A (en) 2024-02-01
WO2022272296A9 (en) 2023-09-28
WO2022272296A3 (en) 2023-03-02
AU2022299552A1 (en) 2024-01-04
WO2022272297A1 (en) 2022-12-29
US20230038295A1 (en) 2023-02-09
EP4359549A1 (en) 2024-05-01
CA3223292A1 (en) 2022-12-29

Similar Documents

Publication Publication Date Title
AU2022200502B2 (en) Adeno-associated virus vector variants for high efficiency genome editing and methods thereof
KR100403708B1 (ko) 재조합아데노-수반바이러스(aav)제조방법및이의용도
EP1064393B1 (en) Compositions and methods for helper-free production of recombinant adeno-associated viruses
US6953690B1 (en) Compositions and methods for helper-free production of recombinant adeno-associated viruses
US5756283A (en) Method for improved production of recombinant adeno-associated viruses for gene therapy
KR100510822B1 (ko) 재조합 아데노바이러스 제조용 세포
JP3755827B2 (ja) 組み込み可能な組み換えアデノウィルス、それらの製造及びそれらの治療的利用
US7115391B1 (en) Production of recombinant AAV using adenovirus comprising AAV rep/cap genes
CN113302201A (zh) 重组病毒载体和用于产生所述重组病毒载体的核酸
KR20210132684A (ko) 비에띠 결정 이상증을 치료하기 위한 조성물 및 방법
CA2945965C (en) Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr)
JP2024059727A (ja) Cns変性のための遺伝子治療法
US6383794B1 (en) Methods of producing high titer recombinant adeno-associated virus
CA2206244A1 (en) Adeno-associated derived vector systems for gene delivery and integration into target cells
JP2001506132A (ja) Aavベクターの産生における使用のためのリコンビナーゼ活性化可能aavパッケージングカセット
KR20230043869A (ko) Aav 벡터를 사용한 플라코필린-2(pkp2) 유전자 요법
WO2008095027A2 (en) Adenoviral vector comprising herpes simplex virus type 1 thymidine kinase and a transgene for increasing the expression of the transgene
CN115298316A (zh) 用于制备腺相关病毒载体的方法
KR20240025645A (ko) 아데노-연관된 바이러스 패키징 시스템
CN117545842A (zh) SMN1和miR-23a在治疗脊髓性肌萎缩中的协同效应
KR20230019162A (ko) Smn1 단백질을 코딩하는 코돈-최적화된 핵산
JP2003511037A (ja) AAVrep/cap遺伝子を含むアデノウイルスを使用する組換えAAVの産生
CN117716042A (zh) 腺相关病毒包装系统
TW202229558A (zh) 用於同時基因活化的核酸構建體
EP4112731A1 (en) System for high-level raav production