KR20210086645A - Aav 삼중-플라스미드 시스템 - Google Patents

Aav 삼중-플라스미드 시스템 Download PDF

Info

Publication number
KR20210086645A
KR20210086645A KR1020217014276A KR20217014276A KR20210086645A KR 20210086645 A KR20210086645 A KR 20210086645A KR 1020217014276 A KR1020217014276 A KR 1020217014276A KR 20217014276 A KR20217014276 A KR 20217014276A KR 20210086645 A KR20210086645 A KR 20210086645A
Authority
KR
South Korea
Prior art keywords
plasmid
sequence
nucleic acid
seq
itr
Prior art date
Application number
KR1020217014276A
Other languages
English (en)
Inventor
비비안 최
싱 리
Original Assignee
박스알타 인코퍼레이티드
박스앨타 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박스알타 인코퍼레이티드, 박스앨타 게엠베하 filed Critical 박스알타 인코퍼레이티드
Publication of KR20210086645A publication Critical patent/KR20210086645A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • A61K35/761Adenovirus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/40Systems of functionally co-operating vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/50Vectors for producing vectors

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

재조합 아데노-연관 바이러스를 생산하기 위한 삼중-플라스미드 시스템이 개시되어 있다. 한 측면에서, 본 발명은 (i) 5' 및 3' AAV 역위 말단 반복부 (ITR)에 의해 플랭킹된 적어도 하나의 이종 핵산 서열 및 ITR 외부의 스터퍼 서열을 포함하는 트랜스진-함유 플라스미드; (ii) AAV 복제 (Rep) 및 캡시드 (Cap) 유전자 서열을 포함하는 플라스미드; 및 (iii) 아데노바이러스 (Ad) 헬퍼 플라스미드를 포함하는, 재조합 아데노-연관 바이러스 벡터 (rAAV) 생산을 위한 플라스미드 시스템에 관한 것이다.

Description

AAV 삼중-플라스미드 시스템
상호 참조
본 출원은 2018년 10월 25일에 출원된 미국 특허 가출원 번호 62/750,603을 우선권 주장하며, 이는 그 전문이 본원에 참조로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출된 서열 목록을 포함하며, 이는 그 전문이 본원에 참조로 포함된다. 2019년 10월 22일에 생성된 상기 ASCII 카피는 파일명이 250478_001858_SL.txt이고 크기가 274,165 바이트이다.
아데노-연관 바이러스 (AAV)는 인간 및 다양한 다른 동물 종, 예컨대 영장류, 소, 고양이 및 개를 감염시키는 DNA 파르보바이러스이다. 이는 AAV에 의한 생산적 감염이 헬퍼 바이러스 (예를 들어, 아데노바이러스 또는 헤르페스 바이러스)의 존재 하에서만 발생하기 때문에, 파르보비리다에(Parvoviridae) 과에 속하고, 데펜도바이러스(Dependovirus) 속에 위치한다. 이 작은 비-외피보유 바이러스는 복제 (Rep) 및 캡시드 (Cap) 단백질 세트를 코딩하는 4.6 kbase 단일 가닥 DNA 게놈을 함유한다. 예를 들어, Rep 단백질 (Rep78, Rep68, Rep52 및 Rep40)은 AAV 게놈의 복제, 구조 및 통합에 관여하고, Cap 단백질 (VP1, VP2 및 VP3)은 구조적 기능을 제공하고 비리온 캡시드를 형성한다. 5' 및 3' 말단에서 Rep 및 Cap 오픈 리딩 프레임을 플랭킹하는 것은 145 bp 역위 말단 반복부 (ITR)이다. ITR은 시스에서 핵산 복제 기점으로 및 바이러스에 대한 패키징 신호로 기능한다.
감염이 발생하면 AAV 수명 주기에는 두 단계가 있다: 1) 용해 단계 및 2) 용원 단계. 헬퍼 바이러스의 도움으로 용해 단계가 시작된다. 이 단계 동안, AAV는 생산적 감염을 시작하여 게놈 복제, 바이러스 유전자 발현 및 비리온 생산을 초래한다. 아데노바이러스 헬퍼의 경우, AAV 발현에 대한 헬퍼 기능을 제공하는 아데노바이러스 단백질은 E1a, E1b, E2a, E4 및 VA RNA를 포함한다. 아데노바이러스는 AAV 생산적 감염을 위해 적절한 환경을 제공함으로써 세포 유전자 발현을 조절하는데 도움을 준다. 문헌 [Daya and Berns Clinical Microbiology Reviews Oct 2008, p. 583-593]을 참조한다.
AAV는 유전자 요법을 위해 조작될 수 있는 다목적 바이러스이다. 유전자 요법에 사용되는 그의 DNA 게놈에 바이러스 유전자가 결여된 재조합 아데노-연관 바이러스 벡터 (rAAV)는 주로 그의 DNA 화물을 세포 핵으로 수송 및 전달하기 위해 세포막을 통과하도록 조작된 단백질-기반 나노입자이다. rAAV DNA 게놈은 형질도입된 세포의 핵에서 에피솜으로 지속되는 원형 콘카타머를 형성할 수 있다. rAAV DNA가 숙주 게놈으로 통합되지 않아 장기적인 유전자 발현 및 내구성에 기여하기 때문에, 이는 rAAV가 유전자 요법에 이상적인 이유 중 하나이다.
재조합 형태의 AAV (rAAV)는 벡터 패키징 및 DNA 복제에 필요한 유일한 시스 요소인 ITR을 유지하면서 모든 바이러스 유전자를 치료용 트랜스진 발현 카세트로 대체함으로써 벡터로 개발되었다. 예를 들어, 미국 특허 번호 4,797,368; 5,153,414; 5,139,941; 5,252,479; 및 5,354,678; 및 국제 공개 번호 WO1991/018088; WO1993/024641 및 WO1994/13788을 참조한다. 초기 rAAV 생산 방법은 하기를 포함하는 2-플라스미드 시스템에 의존한다: 1) AAV 헬퍼 플라스미드 (일반적으로 AAV Rep 및 Cap 코딩 영역을 포함하는 반면 AAV ITR이 결여되어 있어 자체 복제하거나 패키징할 수 없음) 및 2) ITR-함유 플라스미드 (일반적으로 바이러스 복제 및 패키징 기능을 제공하는 AAV ITR에 의해 결합된 선택된 관심 트랜스진을 포함함). 헬퍼 플라스미드 및 선택된 유전자를 보유하는 ITR-함유 플라스미드 둘 다는 일시적 형질감염에 의한 생산을 위해 적합한 세포에 도입될 수 있다. 그 후, 형질감염된 세포는 헬퍼 바이러스, 예컨대 아데노바이러스 또는 단순 헤르페스 바이러스로 감염될 수 있으며, 이는 AAV Rep 및 Cap 영역의 전사 및 번역을 지시하는 헬퍼 플라스미드에 존재하는 AAV 프로모터를 전사활성화시킨다. Ad 헬퍼 바이러스와 관련하여, E1a, E1b, E2a, E4 및 VA RNA 유전자는 rAAV 생산에 필요한 헬퍼 기능을 제공할 수 있다. rAAV를 생성하기 위한 생산자 세포로의 헬퍼 바이러스의 감염은 rAAV를 생산하는데 효과적이었으나; 결과적으로 또한 숙주로부터 면역 반응을 유도할 수 있는 헬퍼 바이러스 입자를 생산할 수 있다. 특정 플랫폼에서, AAV 제조에 필요한 바이러스 헬퍼 유전자는 제조 세포주 (예를 들어, HEK293 세포)에 안정적으로 형질감염될 수 있으며, 그에 의해 미량 수준의 잔류 헬퍼 바이러스로부터 나오는 숙주 면역계에 의한 항-헬퍼 바이러스 면역 반응의 가능성을 감소시킨다.
보다 최근에, 삼중-플라스미드 형질감염 방법이 개발되었다. 이 방법은 AAV 혈청형-특이적 Rep 및 Cap 플라스미드 뿐만 아니라 트랜스진-함유 플라스미드를 사용하지만, 제3 플라스미드에 필수 헬퍼 바이러스 유전자를 공급하여 (즉, 바이러스 코딩 서열이 제거되거나 감소됨), 그러므로 숙주 면역계에 의한 잠재적인 항-헬퍼 바이러스 면역 반응을 낮춤으로써 헬퍼 바이러스 감염의 사용을 제거하였다. 제3 플라스미드에 바이러스 헬퍼 유전자를 공급하는 것은 rAAV만을 제공하는 형질감염된 세포에서 헬퍼 바이러스 생산을 크게 감소시킨다. 접착성 HEK293 세포의 다중 플라스미드 일시적 형질감염은 rAAV 생산에 일반적으로 사용되는 방법이다.
다중 플라스미드 시스템에서는 적절한 플라스미드 크기를 유지하는 것이 중요하다. 그러므로, 플라스미드가 최적 크기를 갖도록 보장하기 위해 핵산 서열 (일명 "스터퍼 서열")을 첨가하는 것이 중요할 수 있다. 예를 들어, ITR-함유 플라스미드의 플라스미드 백본이 벡터 캡시드에 패키징되지 않도록 하기 위해, 백본이 너무 커서 캡시드에 효과적으로 패키징될 수 없도록 스터퍼 서열을 첨가해야 할 수 있다. 그러나, 스터퍼 서열이 "침묵"하고 플라스미드가 패키징될 가능성이 적어 면역계를 활성화하지 않는 것이 중요하다.
따라서, 필요한 것은 rAAV를 생산하기 위한 개선된 삼중-플라스미드 기반 시스템이다. 플라스미드 시스템은 트랜스진의 최적 발현을 여전히 유지하면서 개선된 형질감염 및 감소된 면역원성을 제공해야 한다. 본 개시내용의 실시양태는 이러한 플라스미드 시스템에 관한 것이다.
배경기술 섹션에 명시된 바와 같이, rAAV-기반 유전자 요법을 위한 rAAV 플라스미드 시스템을 개선하는 것에 대하여 관련 기술분야에 큰 요구가 있다. 본 개시내용은 이러한 요구 및 다른 요구를 충족시킨다. 본 개시내용의 실시양태는 일반적으로 rAAV의 생산을 위한 플라스미드 시스템 및 보다 구체적으로 삼중-플라스미드 기반 시스템에 관한 것이다.
한 측면에서, 본 발명은 (i) 5' 및 3' AAV 역위 말단 반복부 (ITR)에 의해 플랭킹된 적어도 하나의 이종 핵산 서열 및 ITR 외부의 스터퍼 서열을 포함하는 트랜스진-함유 플라스미드; (ii) AAV 복제 (Rep) 및 캡시드 (Cap) 유전자 서열을 포함하는 플라스미드; 및 (iii) 아데노바이러스 (Ad) 헬퍼 플라스미드를 포함하는, 재조합 아데노-연관 바이러스 벡터 (rAAV) 생산을 위한 플라스미드 시스템에 관한 것이다.
특정 실시양태에서, 스터퍼 서열은 트랜스진-함유 플라스미드 백본의 크기를 증가시킨다. 특정 실시양태에서, 스터퍼 서열은 트랜스진-함유 플라스미드 백본의 크기를 증가시켜 트랜스진-함유 플라스미드 백본이 rAAV 캡시드에 패키징되지 않도록 한다. 특정 실시양태에서, rAAV로의 플라스미드 백본 혼입은 검출 한계 미만이다. 특정 실시양태에서, 트랜스진-함유 플라스미드의 백본은 스터퍼 서열의 첨가 후 야생형 AAV 게놈보다 더 크다.
특정 실시양태에서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열, 코딩 서열 또는 이들의 임의의 조합이 없다. 특정 실시양태에서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열 및 코딩 서열이 없다. 특정 실시양태에서, 스터퍼 서열은 인간 게놈에서 발견되는 불활성 인트론 DNA 서열을 포함한다.
특정 실시양태에서, 스터퍼 서열은 1000 내지 5000개 뉴클레오티드 길이의 핵산 서열 또는 1000 내지 2000개 뉴클레오티드 길이의 핵산 서열을 포함한다.
특정 실시양태에서, 스터퍼 서열은 GAPDH 인트론 2, 단편, 또는 그의 돌연변이체를 포함한다. 특정 실시양태에서, 스터퍼 서열은 불활성화된 겐타마이신 유전자를 포함한다.
특정 실시양태에서, 스터퍼 서열은 서열식별번호(SEQ ID NO): 9와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함한다. 특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편을 포함한다. 특정 실시양태에서, 단편은 800-1000개 뉴클레오티드 길이이다.
특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산으로 이루어진다. 특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편으로 이루어진다. 특정 실시양태에서, 단편은 800-1000개 뉴클레오티드 길이이다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 도 3a와 동일한 순서의 구조를 갖는 플라스미드를 포함하며, 여기서 eGFP 및 SEAP 트랜스진은 적어도 하나의 이종 핵산 서열로 대체될 수 있다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 도 3b와 동일한 순서의 구조를 갖는 플라스미드를 포함하며, 여기서 eGFP 트랜스진은 적어도 하나의 이종 핵산 서열로 대체될 수 있다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 5'에서 3' 방향으로 5' ITR (예를 들어, 서열식별번호: 2 또는 43), 프로모터 (예를 들어, 서열식별번호: 4), 적어도 하나의 이종 핵산 서열, 폴리A 서열 (예를 들어, 서열식별번호: 8), 3' ITR (예를 들어, 서열식별번호: 3), 및 스터퍼 서열 (예를 들어, 서열식별번호: 9)의 핵산 서열을 포함하며, 여기서 각 핵산 서열은 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 발현 카세트 외부에 그러나 5' ITR과 3' ITR 사이에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 i) 3' ITR의 상류 및 폴리A 서열의 하류 또는 ii) 3' ITR의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열에 대한 프로모터의 상류; 또는 v) 5' ITR의 하류 및 3' ITR의 상류에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 i) 3' ITR (예를 들어, 서열식별번호: 3)의 상류 및 폴리A 서열 (예를 들어, 서열식별번호: 8)의 하류 또는 ii) 3' ITR (예를 들어, 서열식별번호: 3)의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 프로모터 (예를 들어, 서열식별번호: 4)의 상류; 또는 v) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 3' ITR (예를 들어, 서열식별번호: 3)의 상류에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 5'에서 3' 방향으로 5' ITR (예를 들어, 서열식별번호: 2 또는 43), 프로모터 (예를 들어, 서열식별번호: 4), 적어도 하나의 이종 핵산 서열, 폴리A 서열 (예를 들어, 서열식별번호: 8), 3' ITR (예를 들어, 서열식별번호: 3), 및 스터퍼 서열 (예를 들어, 서열식별번호: 9)의 핵산 서열을 포함하며, 여기서 각 핵산 서열은 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 발현 카세트 외부에 그러나 5' ITR과 3' ITR 사이에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 i) 3' ITR의 상류 및 폴리A 서열의 하류 또는 ii) 3' ITR의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열에 대한 프로모터의 상류; 또는 v) 5' ITR의 하류 및 3' ITR의 상류에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 i) 3' ITR (예를 들어, 서열식별번호: 3)의 상류 및 폴리A 서열 (예를 들어, 서열식별번호: 8)의 하류 또는 ii) 3' ITR (예를 들어, 서열식별번호: 3)의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 프로모터 (예를 들어, 서열식별번호: 4)의 상류; 또는 v) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 3' ITR (예를 들어, 서열식별번호: 3)의 상류에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, AAV Rep 유전자 서열은 AAV 혈청형 2, 5, 8, 9, 또는 이들의 하이브리드로부터 유래된다. 특정 실시양태에서, AAV Cap 유전자 서열은 AAV 혈청형 2, 5, 8, 9, 또는 이들의 하이브리드로부터 유래된다. 특정 실시양태에서, Rep 및 Cap 유전자 서열을 포함하는 플라스미드는 프로모터를 추가로 포함한다. 특정 실시양태에서, 프로모터는 AAV 프로모터이다. 특정 실시양태에서, 프로모터는 AAV P5 프로모터이다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 E1a, E1b, E2a, E4orf6, 또는 VA RNA로부터 선택된 하나 이상의 아데노바이러스 유전자를 포함한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 5'에서 3' 방향으로 서열식별번호: 18, 17, 16 및 20의 핵산 서열을 포함하며, 여기서 각 핵산 서열은 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 5'에서 3' 방향으로 서열식별번호: 21, 16, 39, 40, 22, 23 및 20의 핵산 서열을 포함하며, 여기서 각 핵산 서열은 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 도 5의 어느 하나의 구축물과 동일한 순서의 구조를 포함한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 서열식별번호: 14와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 서열식별번호: 15와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함한다.
특정 실시양태에서, 이종 핵산 서열은 펩티드, 폴리펩티드 또는 단백질을 코딩하는 관심 이종 유전자이다. 특정 실시양태에서, 펩티드, 폴리펩티드 또는 단백질은 효소, 항체, MHC 분자, T-세포 수용체, B-세포 수용체, 압타머, 아비머, 수용체-결합 리간드, 표적화 펩티드, 치료제, 또는 유전자 편집 분자이다. 특정 실시양태에서, 이종 핵산 서열은 핵산 서열, 예컨대 안티센스, siRNA, shRNA, miRNA, EGS, gRNA, sgRNA, 리보자임 또는 압타머이다.
또 다른 측면에서, 본 발명은 본원에 기재된 플라스미드 시스템 중 어느 하나를 포함하는 숙주 세포에 관한 것이다.
또 다른 측면에서, 본 발명은 본원에 기재된 플라스미드 시스템 중 어느 하나에 의해 생산된 rAAV에 관한 것이다.
또 다른 측면에서, 본 발명은 트랜스진-함유 플라스미드 내의 이종 핵산 서열의 핵산 서열로부터 상류 또는 하류에 약 60개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이의 핵산 태그 서열을 포함하며, 여기서 핵산 태그 서열은 적어도 2개의 상이한 유형의 AAV 벡터 사이에서 범용 벡터 게놈 역가측정을 허용하기 위해 적어도 2개의 상이한 트랜스진-함유 플라스미드에서 사용될 수 있는 것인, 범용 벡터 역가측정을 허용하는 DNA 역가 태그에 관한 것이다. 특정 실시양태에서, 핵산 태그 서열은 약 100개 뉴클레오티드 길이이다.
특정 실시양태에서, 핵산 태그 서열은 트랜스진-함유 플라스미드의 3' ITR 서열로부터 상류에 있지만 트랜스진-함유 플라스미드의 발현 카세트 내에 없다.
특정 실시양태에서, 핵산 태그 서열은 트랜스진-함유 플라스미드의 5' ITR 서열로부터 하류에 있지만 트랜스진-함유 플라스미드의 발현 카세트 내에 없다.
특정 실시양태에서, DNA 역가 태그는 서열식별번호: 61-70의 핵산 서열 중 어느 하나를 포함한다.
또 다른 측면에서, 본 발명은 본원에 기재된 플라스미드 시스템 중 어느 하나로 세포를 형질도입하고, rAAV를 단리하는 것을 포함하는, rAAV를 생산하는 방법에 관한 것이다. 또 다른 측면에서, 본 발명은 상기 방법에 의해 생산된 rAAV에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템을 포함하는 조성물에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템에 의해 생산된 rAAV를 포함하는 제약 조성물에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템에 의해 생산된 rAAV를 대상체에게 투여하며, 그에 의해 핵산 서열을 세포로 전달하는 것을 포함하는, 핵산 서열을 대상체의 세포로 전달하거나 또는 전이시키는 방법에 관한 것이다. 특정 실시양태에서, 대상체의 세포는 배양 중이거나 또는 대상체에 존재한다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템에 의해 생산된 rAAV를 질환 또는 장애의 치료 또는 예방을 필요로 하는 대상체에게 투여하는 것을 포함하는, 대상체에서 질환 또는 장애를 치료하거나 또는 예방하는 방법에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템에 의해 생산된 rAAV와 숙주 세포를 접촉시키는 것을 포함하는, 숙주 세포를 형질도입하는 방법에 관한 것이다.
본 개시내용의 이들 및 다른 목적, 특색 및 장점은 첨부된 설명, 청구범위 및 도면과 함께 하기 명세서를 읽으면 더욱 명백해질 것이다.
도 1은 본 개시내용의 일부 실시양태에 따른 rAAV 생산을 위한 예시적인 삼중-플라스미드 시스템을 도시한다.
도 2는 본 개시내용의 일부 실시양태에 따른, 트랜스진으로서 eGFP 및 SEAP를 혼입한 rAAV 생산을 위한 예시적인 트랜스진-함유 플라스미드를 도시한다.
도 3a-3b는 단일-가닥 (ss) (도 3a) 및 자가-상보적 (sc) rAAV (도 3b) 생산을 위한 트랜스진-함유 플라스미드의 예시적인 유전자 구축물을 제시한다.
도 4a-4b: 도 4a는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다. 도 4b는 AAV 혈청형 2로부터의 프로모터를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다.
도 5는 짧은 (상단 패널) 및 긴 (하단 패널) 실시양태에서 예시적인 Ad 헬퍼 플라스미드를 도시한다.
도 6은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 발현 수준을 제시하는 웨스턴 블롯이다.
도 7은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 발현 수준을 제시하는 웨스턴 블롯이다. 모노클로날 B1 클론을 블롯 분석에 사용하였다.
도 8은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 AAV P5-구동 발현 수준을 제시하는 웨스턴 블롯이다. - : P5 프로모터가 없는 플라스미드 구축물; + : P5 프로모터를 갖는 플라스미드 구축물. 모노클로날 B1 클론을 블롯 분석에 사용하였다.
도 9는 본 개시내용에 따른 짧은 Ad 헬퍼 플라스미드를 사용한 바이러스 게놈 카피 수의 qPCR 검정 결과를 제시한다. 1: 음성 대조군 1 (p헬퍼+pAAV-RC2 (애질런트(Agilent))); 2: 음성 대조군 2 (p헬퍼+pTRUF11); 3: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 4: 짧은 Ad 헬퍼 시험 (짧은-헬퍼 (서열식별번호: 14)+pAAV-RC2 +pTRUF11).
도 10은 본 개시내용에 따른 긴 Ad 헬퍼 플라스미드를 사용한 바이러스 게놈 카피 수의 qPCR 검정 결과를 제시한다. 1: 음성 대조군 1 (pTRUF11+pAAV-RC2 (Rep2Cap2 (애질런트)); 2: 양성 대조군 2 (p헬퍼+ pAAV-RC2+pTRUF11); 3: 짧은 Ad 헬퍼 시험 (짧은-헬퍼 (서열식별번호: 14)+ pUC19-Rep2Cap8 +pITRs (서열식별번호: 1)); 4: 긴 Ad 헬퍼 시험 (긴-헬퍼 (서열식별번호: 15)+ pUC19-Rep2Cap8+pITRs (서열식별번호: 1)).
도 11은 rAAV 생산을 위한 상응하는 트랜스진-함유 플라스미드를 사용하여 생산된 단일-가닥 (상단 패널) 또는 자가-상보적 (하단 패널) DNA 게놈을 함유하는 rAAV에 대한 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 상단 패널의 경우: 1: 음성 대조군 (p헬퍼+AAV-RC2); 2: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 3: ssITR (p헬퍼+pAAV-RC2+ ssITR) (서열식별번호: 1). 하단 패널의 경우: 1: 음성 대조군 (p헬퍼+AAV-RC2); 2: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 3: scITR (p헬퍼+pAAV-RC2+ scITR (서열식별번호: 42).
도 12는 양성 및 음성 대조군과 함께, 본 개시내용에 따른 삼중-플라스미드 시스템에 대한 다중 캡시드 혈청형의 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 1: 음성 대조군 (p헬퍼+pTRUF11); 2: 양성 대조군 (p헬퍼+pTRUF11+pAAV-RC2); 3: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap2 (서열식별번호: 31); 4: p헬퍼+pTRUF11+pUC19-Rep2/5Cap5 (서열식별번호: 24); 5: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap8 (서열식별번호: 35); 6: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap9 (서열식별번호: 37); 7: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap2 (서열식별번호: 31); 8: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-Rep2/5Cap5 (서열식별번호: 24); 9: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap8 (서열식별번호: 35); 10: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap9 (서열식별번호: 37); 11: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pAAV-RC2.
도 13a-13b는 SV40 폴리A 및 qPCR 분석을 위한 100개 뉴클레오티드 길이 DNA 역가 태그 둘 다를 사용한 단일 가닥 ITR (ssITR) 트랜스진 플라스미드 (도 13a) 및 자가-상보적 ITR (scITR) 플라스미드에 대한 용해물 ml당 바이러스 게놈 카피 수를 제시한다.
도 14a-14b: 도 14a는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다. 도 14b는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입하고 P5 프로모터를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다.
도 15는 단일-가닥 (ss) (도 15a) 및 자가-상보적 (sc) rAAV (도 15b) 생산을 위한 트랜스진-함유 플라스미드의 예시적인 ene 구축물을 제시한다. 변형된 플라스미드 둘 다는 더 높은 개발가능성을 갖는 개선된 플라스미드 백본을 함유하였다.
도 16은 qPCR 분석을 위한 100개 뉴클레오티드 길이 DNA 역가 태그를 사용한 변형된 단일 가닥 ITR (ssITR) 트랜스진 플라스미드 (도 16a) 및 변형된 자가-상보적 ITR (scITR) 플라스미드에 대한 용해물 ml당 바이러스 게놈 카피 수를 제시한다.
배경기술 섹션에 명시된 바와 같이, rAAV-기반 유전자 요법을 생성하기 위한 rAAV 생산 기술을 확인하는 것에 대하여 관련 기술분야에 큰 요구가 있다. 본 개시내용은 이러한 요구 및 다른 요구를 충족시킨다. 본 개시내용의 실시양태는 일반적으로 rAAV 생산 및 보다 구체적으로 rAAV 생산을 위한 삼중-플라스미드 기반 시스템에 관한 것이다.
본 개시내용의 다양한 실시양태의 원리 및 특색의 이해를 용이하게 하기 위해, 다양한 예시적인 실시양태가 하기 설명된다. 본 개시내용의 예시적인 실시양태가 상세히 설명되어 있지만, 다른 실시양태가 고려된다는 것을 이해해야 한다. 따라서, 본 개시내용은 하기 설명 또는 실시예에 기재된 성분의 구축 및 배열의 세부사항으로 그 범위가 제한되는 것으로 의도되지 않는다. 본 개시내용은 다른 실시양태가 가능하고, 다양한 방식으로 실행 또는 수행될 수 있다. 또한, 예시적인 실시양태를 설명함에 있어서, 명료성을 위해 특정 용어가 재분류될 것이다.
각 용어는 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같은 가장 넓은 의미를 고려하고 유사한 목적을 달성하기 위해 유사한 방식으로 작동하는 모든 기술적 등가물을 포함하는 것으로 의도된다. 개시된 기술의 실시양태는 이들 특정 세부사항 없이 실행될 수 있음을 이해해야 한다. 다른 경우에, 널리 공지된 방법, 구조 및 기술은 이 설명의 이해를 모호하게 하지 않기 위해 상세히 제시되지 않았다. "한 실시양태", "하나의 실시양태", "예시 실시양태", "일부 실시양태", "특정 실시양태", "다양한 실시양태" 등에 대한 언급은 이렇게 설명된 개시된 기술의 실시양태(들)가 특정한 특색, 구조 또는 특징을 포함할 수 있지만, 모든 실시양태가 반드시 특정한 특색, 구조 또는 특징을 포함하는 것은 아니라는 것을 나타낸다. 또한, 문구 "한 실시양태에서"의 반복된 사용이 반드시 동일한 실시양태를 지칭하는 것은 아니지만, 그럴 수도 있다.
또한, 명세서 및 첨부된 청구범위에서 사용된 바와 같은 단수 형태 "하나"는 문맥상 분명하게 달리 지시하지 않는 한 복수 지시대상을 포함한다는 점에 유의해야 한다. 예를 들어, 성분에 대한 언급은 또한 복수의 성분의 조성물을 포함하도록 의도된다. "하나"의 구성요소를 함유하는 조성물에 대한 언급은 명명된 구성요소 외에 다른 구성요소를 포함하도록 의도된다. 다시 말해서, 용어 "하나"는 수량의 제한을 의미하는 것이 아니라, 언급된 항목 중 "적어도 하나"의 존재를 의미한다.
본원에 사용된 바와 같은 용어 "및/또는"은 "및"을 의미할 수 있고/거나, "또는"을 의미할 수 있고/거나, "배타적-또는"을 의미할 수 있고/거나, "하나"를 의미할 수 있고/거나, "일부, 그러나 전부는 아님"을 의미할 수 있고/거나, "둘 다 아님"을 의미할 수 있고/거나, "둘 다"를 의미할 수 있다. 용어 "또는"은 포괄적인 "또는"을 의미하도록 의도된다.
범위는 본원에서 "약" 또는 "대략" 또는 "실질적으로" 하나의 특정한 값으로부터 및/또는 "약" 또는 "대략" 또는 "실질적으로" 또 다른 특정한 값까지로 표현될 수 있다. 이러한 범위가 표현된 경우, 다른 예시적인 실시양태는 하나의 특정한 값으로부터 및/또는 다른 특정한 값까지를 포함한다. 또한, 용어 "약"은 관련 기술분야의 통상의 기술자에 의해 결정된 바와 같은 특정한 값에 대한 허용가능한 오차 범위 이내를 의미하며, 이는 값이 측정 또는 결정되는 방법, 즉, 측정 시스템의 한계에 부분적으로 의존할 것이다. 예를 들어, "약"은 관련 기술분야의 실행에 따라 허용가능한 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 ±20%, 바람직하게는 최대 ±10%, 보다 바람직하게는 최대 ±5%, 및 보다 바람직하게는 여전히 최대 ±1%의 범위를 의미할 수 있다. 대안적으로, 특히 생물학적 시스템 또는 프로세스와 관련하여, 용어는 값의 10배 이내, 바람직하게는 2배 이내를 의미할 수 있다. 특정한 값이 출원 및 청구범위에 기재되어 있는 경우, 달리 언급되지 않는 한, 용어 "약"은 암시적이며 이 문맥에서 특정한 값에 대한 허용가능한 오차 범위 이내를 의미한다.
"포함하는" 또는 "함유하는" 또는 "비롯한"은 적어도 명명된 화합물, 요소, 입자 또는 방법 단계가 조성물 또는 물품 또는 방법에 존재하지만, 다른 이러한 화합물, 물질, 입자, 방법 단계가 명명된 것과 동일한 기능을 갖더라도, 다른 화합물, 물질, 입자, 방법 단계의 존재를 배제하지 않음을 의미한다.
본 설명 전반에 걸쳐, 특정한 값 또는 파라미터를 갖는 다양한 성분이 확인될 수 있으나, 이들 항목은 예시적인 실시양태로서 제공된다. 실제로, 예시적인 실시양태는 많은 비교가능한 파라미터, 크기, 범위 및/또는 값이 구현될 수 있으므로 본 개시내용의 다양한 측면 및 개념을 제한하지 않는다. 용어 "제1", "제2" 등, "일차", "이차" 등은 임의의 순서, 수량 또는 중요도를 나타내지 않고, 한 요소를 또 다른 요소와 구별하는데 사용된다.
"구체적으로", "바람직하게는", "전형적으로", "일반적으로" 및 "종종"과 같은 용어는 청구된 개시내용의 범위를 제한하거나 특정 특색이 청구된 개시내용의 구조 또는 기능에 중요하거나 필수적이거나 심지어 중요하다는 것을 암시하기 위해 본원에서 사용되지 않는다는 점에 유의한다. 오히려, 이들 용어는 단지 본 개시내용의 특정한 실시양태에서 사용되거나 사용되지 않을 수 있는 대안적인 또는 추가적인 특색을 강조하기 위한 것이다. 또한, "실질적으로" 및 "약"과 같은 용어는 임의의 정량적 비교, 값, 측정 또는 다른 표시에 기인할 수 있는 고유한 불확실성의 정도를 나타내기 위해 본원에서 사용된다는 점에 유의한다.
본원에 개시된 치수 및 값은 인용된 정확한 수치로 엄격히 제한되는 것으로 이해되어서는 안된다. 대신에, 달리 특정되지 않는 한, 각 이러한 치수는 인용된 값 및 해당 값 주변의 기능적으로 동등한 범위 둘 다를 의미하는 것으로 의도된다. 예를 들어, "50 mm"로 개시된 치수는 "약 50 mm"를 의미하는 것으로 의도된다.
또한, 하나 이상의 방법 단계의 언급이 명시적으로 확인된 단계들 사이에 추가 방법 단계 또는 개재 방법 단계의 존재를 배제하지 않는다는 것을 이해해야 한다. 유사하게, 조성물 내의 하나 이상의 성분의 언급이 명시적으로 확인된 것 외의 추가 성분의 존재를 배제하지 않는다는 것도 이해해야 한다.
본원에 사용된 바와 같은 용어 "대상체", "환자", "개체" 및 "동물"은 본원에서 상호교환적으로 사용되며, 제한 없이, 인간 및 수의학 동물 (예를 들어, 고양이, 개, 소, 말, 양, 돼지 등)을 포함하는 포유동물 및 실험 동물 모델을 지칭한다. 바람직한 실시양태에서, 대상체는 인간이다.
본원에 사용된 바와 같은 용어 "유전자 요법"은 질환 또는 상태와 연관된 하나 이상의 증상 (예를 들어, 임상 인자)을 완화시키거나 감쇠시키거나 재발을 방지하기 위해 환자에게 치료용 유전자 (예를 들어, 인자 VIII/IX/X)를 코딩하는 핵산을 제공하는 임의의 치료적 접근법을 포함한다. 상기 용어는 질환 또는 상태를 갖는 개체의 건강을 유지 또는 개선하기 위해 임의의 변형된 형태의 유전자 (예를 들어, 인자 VIII/IX/X 변이체)를 비롯한 치료용 유전자를 코딩하는 핵산을 포함하는 임의의 화합물, 약물, 절차 또는 요법을 투여하는 것을 포함한다. 관련 기술분야의 통상의 기술자는 유전자 요법의 과정 또는 유전자 치료제의 용량이 예를 들어, 본 개시내용에 따라 수득된 결과에 기초하여 변경될 수 있음을 이해할 것이다.
본원에 사용된 바와 같이, 용량 또는 양에 적용되는 용어 "치료 유효"는 상태, 장애 또는 병태를 치료 (예를 들어, 예방 또는 호전)하기 위해 대상체에게 투여될 때 이러한 치료에 영향을 미치기에 충분한 화합물 또는 제약 조성물의 양을 지칭한다. 예를 들어, 혈우병 치료에 유용한 약물의 치료 유효량은 혈우병과 연관된 하나 이상의 증상을 예방 또는 완화시킬 수 있는 양일 수 있다. "치료 유효량"은 투여되는 화합물 또는 박테리아 또는 유사체 뿐만 아니라 질환 및 그의 중증도 및 치료될 포유동물의 연령, 체중, 신체 상태 및 반응성에 따라 달라질 것이다. 정확한 용량은 치료 목적에 따라 달라질 것이며, 공지된 기술을 사용하여 관련 기술분야의 통상의 기술자에 의해 확인가능할 것이다 (예를 들어, 문헌 [Lieberman, Pharmaceutical Dosage Forms (vols. 1-3, 1992)]; [Lloyd, The Art, Science and Technology of Pharmaceutical Compounding (1999)]; [Pickar, Dosage Calculations (1999)]; 및 [Remington: The Science and Practice of Pharmacy, 20th Edition, 2003, Gennaro, Ed., Lippincott, Williams & Wilkins] 참조).
본원에 사용된 바와 같은 용어 "벡터"는 핵산 (예를 들어, 유전자 요법 구축물을 코딩하는)을 숙주 세포로 전이시키는데 사용되는 임의의 비히클을 지칭한다. 일부 실시양태에서, 벡터는 표적 핵산과 함께 비히클을 복제하는 기능을 하는 레플리콘을 포함한다. 일부 실시양태에서, 벡터는 표적 핵산 (예를 들어, 치료용 유전자 또는 치료용 유전자 변이체를 코딩하는 코돈-변경된 폴리뉴클레오티드)을 도입하기 위한 바이러스 입자이다. 유전자 요법에 유용한 많은 변형된 진핵 바이러스가 관련 기술분야에 공지되어 있다. 예를 들어, 아데노-연관 바이러스 (AAV)는 인간이 바이러스를 위한 자연 숙주이고, 천연 바이러스가 임의의 질환에 기여하는 것으로 공지되어 있지 않았으며, 바이러스가 가벼운 면역 반응을 유발하기 때문에 인간 유전자 요법에 사용하기에 특히 적합하다. "재조합 AAV" (rAAV) 및 "AAV"는 본원 전반에 걸쳐 상호교환적으로 사용된다.
용어 "플라스미드"는 주어진 박테리아 세포에서 자율 복제가 가능한 염색체외 원형 DNA를 지칭한다. 예시적인 플라스미드는 pBR322, pUC, pUC19, pUC57, pJ241, 또는 pJ247, pBluescript, pREP4, pCEP4, pCI, 및 p 폴리로부터 유래된 것들을 포함하나 이에 제한되지는 않는다 (Lathe et al., Gene 57 (1987), 193-201). 플라스미드는 또한 표준 분자 생물학 기술에 의해 조작될 수 있다 (Sambrook et al., Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), N.Y.). 또한, 이는 형질감염된 세포 (예를 들어, 세포 영양요구성의 보완 또는 항생제 내성에 의해), 안정화 요소 (예를 들어, cer 서열) 또는 통합적 요소 (예를 들어, LTR 바이러스 서열 및 트랜스포존)를 선택 또는 확인하기 위해 선택 유전자를 포함할 수 있다.
본원에 사용된 바와 같은 용어 "플라스미드 백본"은 전형적으로 복제 기점 (예를 들어, 서열식별번호: 20 및 26), 및 적절한 플라스미드로 형질전환된 숙주만의 특이적 성장에 필요한 항생제 선택 유전자를 함유하는 DNA의 서열을 지칭한다. 특정 실시양태에서, 이들 요소는 rAAV 캡시드에 패키징되도록 의도되지 않는다.
본원에 사용된 바와 같은 용어 "유전자"는 폴리펩티드 쇄를 코딩하는 DNA 분자의 세그먼트 (예를 들어, 코딩 영역)를 지칭한다. 일부 실시양태에서, 유전자는 폴리펩티드 쇄를 생산하는데 관여하는 코딩 영역 (예를 들어, 조절 요소, 예컨대 프로모터, 인핸서, 폴리아데닐화 서열, 5'-비번역된 영역, 3'-비번역된 영역, 또는 인트론) 바로 앞, 뒤 및/또는 개재 영역에 의해 위치된다.
본원에 사용된 바와 같은 용어 "조절 요소"는 세포에서 코딩 서열의 발현을 제공하는 핵산 서열, 예컨대 프로모터, 인핸서, 종결자, 폴리아데닐화 서열, 인트론 등을 지칭한다.
본원에 사용된 바와 같은 용어 "프로모터 요소"는 코딩 서열의 발현 제어를 보조하는 핵산 서열을 지칭한다. 일반적으로, 프로모터 요소는 유전자의 번역 출발 부위의 5'에 위치된다. 그러나, 특정 실시양태에서, 프로모터 요소는 인트론 서열 내에, 또는 코딩 서열의 3'에 위치될 수 있다. 일부 실시양태에서, 유전자 요법에 유용한 프로모터는 표적 단백질의 천연 유전자로부터 유래된다. 일부 실시양태에서, 유전자 요법에 유용한 프로모터는 표적 유기체의 특정한 세포 또는 조직에서의 발현에 특이적이다 (예를 들어, 간-특이적 프로모터) (문헌 [Wu Z et al. Molecular Therapy 16(2):280-9], [Choi VW et al. Molecular Therapy Methods & Clinical Development 2015. 2:15022], 상기 문헌 둘 다는 의도된 모든 목적을 위해 그 전문이 본원에 포함됨). 또 다른 실시양태에서, 복수의 잘 특징화된 프로모터 요소 중 하나가 본원에 기재된 유전자 요법에 사용된다. 잘 특징화된 프로모터 요소의 비제한적인 예는 CMV 초기 프로모터 (예를 들어, hCMVie (서열식별번호: 4))), 3-액틴 프로모터, 및 메틸 CpG 결합 단백질 2 (MeCP2) 프로모터를 포함한다. 일부 실시양태에서, 프로모터는 표적 단백질의 실질적으로 일정한 발현을 구동하는 구성적 프로모터이다. 다른 실시양태에서, 프로모터는 특정한 자극 (예를 들어, 특정한 치료제 또는 작용제에 대한 노출)에 반응하여 표적 단백질의 발현을 구동하는 유도성 프로모터이다. AAV-매개 유전자 요법을 위한 프로모터 설계에 대한 검토는 문헌 [Gray et al. (Human Gene Therapy 22:1143-53 (2011))]을 참조하며, 그의 내용은 모든 목적을 위해 그 전문이 참조로 명시적으로 포함된다.
본원에 사용된 바와 같은 용어 "트랜스진"은 광범위하게 아마도 정상적으로 게놈에 존재하지 않는 서열을 갖는 유전자 또는 핵산, 주어진 게놈에 존재하지만 정상적으로 전사 및 번역 ("발현")되지 않는 유전자, 또는 게놈에 도입하고자 하는 임의의 다른 유전자 또는 핵산을 포함하나 이에 제한되지는 않는, 동물 게놈에 도입되는 임의의 핵산을 지칭한다. 이는 정상적으로 비-트랜스제닉 게놈에 존재할 수 있지만 발현이 변경되기를 원하거나 비-돌연변이된 형태 또는 변경된 또는 변이체 형태로 도입하기를 원하는 유전자를 포함할 수 있다. 트랜스진은 정의된 유전자좌로 특이적으로 표적화될 수 있거나, 염색체 내에 무작위로 통합될 수 있거나, 염색체외 복제 DNA일 수 있다. 트랜스진은 하나 이상의 전사 조절성 서열, 및 선택된 핵산의 최적 발현에 필요할 수 있는 임의의 다른 핵산, 예컨대 인트론을 포함할 수 있다. 트랜스진은 몇 개의 뉴클레오티드 길이만큼 작을 수 있지만, 바람직하게는 적어도 약 50, 100, 150, 200, 250, 300, 350, 400 또는 500개 뉴클레오티드 길이이거나 훨씬 더 길고, 예를 들어, 전체 바이러스 게놈일 수 있다. 트랜스진은 코딩 또는 비-코딩 서열, 또는 이들의 조합일 수 있다. 트랜스진은 일반적으로 적절한 조건 하에 하나 이상의 트랜스진의 발현을 구동할 수 있는 조절 요소를 포함한다.
본원에 사용된 바와 같이, 핵산 서열, 예컨대 코딩 서열 및/또는 제어 서열과 관련된 용어 "이종"은 정상적으로 함께 연결되지 않고/거나 정상적으로 특정한 세포와 회합되지 않은 서열을 나타낸다. 그러므로, "이종" 핵산 서열은 핵산 서열이 AAV 이외의 유기체로부터 유래되거나 합성적으로 유래된 것을 의미한다. 특정 실시양태에서, 이종 핵산 서열 (예를 들어, 관심 이종 유전자)은 폴리펩티드, 예컨대 응고 인자, 효소, 항체 또는 다른 관심 폴리펩티드 (이에 제한되지는 않음)를 코딩할 수 있다. 특정 실시양태에서, 이종 핵산 서열은 구조적 또는 치료적 기능을 갖는 RNA, 예컨대 안티센스, siRNA, shRNA, miRNA, EGS, gRNA, sgRNA, 리보자임 또는 압타머 (이에 제한되지는 않음)를 코딩할 수 있다. 유사하게, 세포에 정상적으로 존재하지 않는 구축물로 형질전환된 세포는 본 발명의 목적을 위해 이종으로 간주될 것이다.
"작동가능하게-연결된"은 서열 중 하나의 기능이 또 다른 서열에 의해 영향을 받도록 물리적으로 연결된 2개 이상의 핵산 서열 요소의 회합을 지칭한다. 예를 들어, 조절성 DNA 서열이 코딩 DNA 서열의 발현에 영향을 미치도록 두 서열이 위치하는 경우 (즉, 코딩 서열 또는 기능적 RNA가 프로모터의 전사 제어 하에 있음) 조절성 DNA 서열은 RNA 또는 폴리펩티드를 코딩하는 DNA 서열에 "작동가능하게 연결된" 또는 "그와 회합"된다고 한다. 코딩 서열은 센스 또는 안티센스 배향으로 조절성 서열에 작동가능하게-연결될 수 있다.
본원에 사용된 바와 같은 용어 "핵산"은 단일- 또는 이중-가닥 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 및 이들의 중합체 및 이들의 보체를 지칭한다. 상기 용어는 합성, 자연 발생 및 비-자연 발생이고, 참조 핵산과 유사한 결합 특성을 갖고, 참조 뉴클레오티드와 유사한 방식으로 대사되는 공지된 뉴클레오티드 유사체 또는 변형된 백본 잔기 또는 연결을 함유하는 핵산을 포함한다. 이러한 유사체의 예는 제한 없이, 포스포로티오에이트, 포스포라미데이트, 메틸 포스포네이트, 키랄-메틸 포스포네이트, 2-O-메틸 리보뉴클레오티드, 및 펩티드-핵산 (PNA)을 포함한다.
용어 "아미노산"은 자연 발생 아미노산과 유사한 방식으로 기능하는 아미노산 유사체 및 아미노산 모방체를 비롯한, 자연 발생 및 비천연 아미노산을 지칭한다. 자연 발생 아미노산은 유전자 코드에 의해 코딩된 것, 뿐만 아니라 나중에 변형되는 아미노산, 예를 들어, 히드록시프롤린, y-카르복시글루타메이트, 및 O-포스포세린을 포함한다. 자연 발생 아미노산은 예를 들어, D- 및 L-아미노산을 포함할 수 있다. 본원에서 사용된 아미노산은 또한 비천연 아미노산을 포함할 수 있다. 아미노산 유사체는 자연 발생 아미노산과 동일한 기본 화학 구조 (즉, 수소, 카르복실기, 아미노기, 및 R 기에 결합된 임의의 탄소)를 갖는 화합물, 예를 들어, 호모세린, 노르류신, 메티오닌 술폭시드, 또는 메티오닌 메틸 술포늄을 지칭한다. 이러한 유사체는 변형된 R 기 (예를 들어, 노르류신) 또는 변형된 펩티드 백본을 갖지만, 자연 발생 아미노산과 동일한 기본 화학 구조를 유지한다. 아미노산 모방체는 아미노산의 일반적인 화학 구조와 상이한 구조를 갖지만, 자연 발생 아미노산과 유사한 방식으로 기능하는 화합물을 지칭한다. 아미노산은 본원에서 이들의 일반적으로 공지된 세 글자 기호 또는 IUPAC-IUB 생화학 명명 위원회에서 권장하는 한 글자 기호로 언급될 수 있다. 마찬가지로, 뉴클레오티드는 이들의 일반적으로 허용되는 단일-글자 코드로 언급될 수 있다.
본원에 사용된 바와 같은 용어 "유도체"는 상응하는 전장 야생형 핵산, 펩티드 또는 단백질과 비교하여 하나 이상의 돌연변이 및/또는 화학적 변형을 포함하는 핵산, 펩티드 또는 단백질 또는 그의 변이체 또는 유사체를 지칭한다. 핵산을 포함하는 화학적 변형의 비제한적인 예는 예를 들어, 염기 모이어티, 당 모이어티, 포스페이트 모이어티, 포스페이트-당 백본 또는 이들의 조합에 대한 변형을 포함한다.
본원에 기재된 플라스미드 시스템에 유용할 수 있는 돌연변이체 유전자 구축물을 코딩하는 핵산 서열은 야생형 (즉, 비돌연변이된) 서열과 동일할 수 있거나, 상이한 코딩 서열일 수 있으며, 유전자 코드의 중복성 또는 동의성의 결과로 이 서열은 야생형 코딩 서열과 동일한 폴리펩티드를 코딩한다. 관련 기술분야의 통상의 기술자는 핵산 내의 각 코돈 (일반적으로 메티오닌에 대한 유일한 코돈인 AUG, 및 일반적으로 트립토판에 대한 유일한 코돈인 TGG 제외)이 기능적으로 동일한 분자를 생성하도록 변형될 수 있음을 인식할 것이다. 따라서, 동일한 폴리펩티드를 코딩하는 핵산의 각 변이는 발현 산물과 관련하여 각 기재된 서열에 내포되어 있지만, 실제 유전자 요법 구축물과 관련해서는 아니다.
아미노산 서열과 관련하여, 관련 기술분야의 통상의 기술자는 코딩된 서열 내의 단일 아미노산 또는 작은 백분율의 아미노산을 변경, 첨가 또는 결실시키는 핵산 또는 펩티드 서열에 대한 개별 치환, 결실 또는 첨가가, 변경이 화학적으로 유사한 아미노산으로의 아미노산의 치환을 초래하는 "보존적으로 변형된 변이체"임을 인식할 것이다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 관련 기술분야에 널리 공지되어 있다. 이러한 보존적으로 변형된 변이체는 본 개시내용의 다형성 변이체, 종간 상동체 및 대립유전자에 추가되고 배제되지 않는다. 기능적으로 유사한 아미노산을 제공하는 보존적 아미노산 치환은 관련 기술분야에 널리 공지되어 있다. 특정한 아미노산의 기능성, 예를 들어 촉매적, 구조적 또는 입체적으로 중요한 아미노산에 따라, 상이한 그룹의 아미노산이 서로에 대한 보존적 치환으로 간주될 수 있다.
2개 이상의 핵산 또는 펩티드 서열의 문맥에서 용어 "동일한" 또는 퍼센트 (%) "동일성"은 동일하거나 특정된 백분율의 아미노산 잔기를 갖는 2개 이상의 서열 또는 하위서열, 또는 하기 기재된 디폴트 파라미터와 함께 BLAST 또는 BLAST 2.0 서열 비교 알고리즘을 사용하여 또는 수동 정렬 및 육안 검사에 의해 측정된 바와 같이 동일한 (즉, 비교 창 또는 지정된 영역에 걸쳐 최대 상응성을 위해 비교 및 정렬된 경우 특정된 영역에 걸쳐 약 60% 동일성, 바람직하게는 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성) 뉴클레오티드를 지칭한다.
관련 기술분야에 공지된 바와 같이, 단백질 (또는 하기 논의된 바와 같은 핵산)이 공지된 서열과 서열 동일성 또는 유사성을 갖는지를 확인하기 위해 수많은 상이한 프로그램이 사용될 수 있다. 서열 동일성 및/또는 유사성은 하기를 포함하나 이에 제한되지는 않는 관련 기술분야에 공지된 표준 기술을 사용하여 결정된다: 문헌 [Smith & Waterman, Adv. Appl. Math., 2:482 (1981)]의 국부 서열 동일성 알고리즘에 의해, 문헌 [Needleman & Wunsch, J. Mol. Biol., 48:443 (1970)]의 서열 동일성 정렬 알고리즘에 의해, 문헌 [Pearson & Lipman, Proc. Natl. Acad. Sci. U.S.A., 85:2444 (1988)]의 유사성 검색 방법에 의해, 이들 알고리즘의 컴퓨터화된 구현 (위스콘신 지네틱스 소프트웨어 패키지에서 GAP, BESTFIT, FASTA 및 TFASTA, 지네틱스 컴퓨터 그룹(Genetics Computer Group), 미국 위스콘신주 매디슨 사이언스 드라이브 575), 문헌 [Devereux et al., Nucl. Acid Res., 12:387-395 (1984)]에 기재된 최량 적합 서열 프로그램에 의해, 바람직하게는 디폴트 설정을 사용하여 또는 검사에 의해. 바람직하게는, 퍼센트 동일성은 하기 파라미터를 기반으로 FastDB에 의해 계산된다: 1의 미스매치 페널티; 1의 갭 페널티; 0.33의 갭 크기 페널티; 및 30의 연결 페널티, 문헌 ["Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149 (1988), Alan R. Liss, Inc], 이들 모두는 참조로 포함된다.
본 개시내용에 따르면, 관련 기술분야의 기술 내에서 통상적인 분자 생물학, 미생물학 및 재조합 DNA 기술이 사용될 수 있다. 이러한 기술은 문헌에 자세히 설명되어 있다. 예를 들어, 특히 문헌 [Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York] (본원에서 "Sambrook et al., 1989"); [DNA Cloning: A Practical Approach, Volumes I and II (D.N. Glover ed. 1985)]; [Oligonucleotide Synthesis (M.J. Gait ed. 1984)]; [Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds.(1985)]; [Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984)]; [Animal Cell Culture (R.I. Freshney, ed. (1986)]; [Immobilized Cells and Enzymes (IRL Press, (1986)]; [B. Perbal, A Practical Guide To Molecular Cloning (1984)]; [F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994)]을 참조한다.
본 개시내용의 플라스미드 시스템
한 측면에서, 본 개시내용은 재조합 아데노 연관 바이러스 벡터 (rAAV)를 조작 및 생산하기 위한 삼중-플라스미드 시스템을 제공한다. 특정 실시양태에서, 3개의 플라스미드 백본은 모두 동일하다. 특정 실시양태에서, 3개의 플라스미드 백본 중 적어도 하나는 상이하다. 특정 실시양태에서, 3개의 플라스미드 백본 모두가 상이하다. 특정 실시양태에서, 3개의 플라스미드 백본 모두는 완전한 AAV 게놈의 재구축을 초래할 수 있는 재조합 발생을 방지하기 위해 상이하다. 특정 실시양태에서, 3개의 플라스미드는 예를 들어 및 제한 없이, pUC19, pBR322, pUC57, pJ241 또는 pJ247에 기초한 플라스미드 백본을 포함한다. 특정 실시양태에서, 3개의 플라스미드는 pUC19, pJ241 및 pJ247에 기초한 플라스미드 백본을 포함한다.
특정 실시양태에서, 한 플라스미드는 rAAV 생산 구축물을 위한 트랜스진-함유 플라스미드로 작용하고, 제2 플라스미드는 AAV Rep-Cap 구축물로 작용하고, 제3 플라스미드는 아데노바이러스 (Ad) 헬퍼 구축물로 작용한다. 각 유형의 예시적인 플라스미드는 도 1에 제시되어 있다.
rAAV 생산을 위한 트랜스진-함유 플라스미드
rAAV 생산을 위한 트랜스진-함유 플라스미드는 AAV 게놈의 내부 부분이 발현 카세트 내에서 관심 이종 핵산 서열로 대체된 적어도 하나의 관심 이종 핵산 서열 (예를 들어, 안티센스 RNA 분자, shRNA, miRNA, 리보자임, 또는 관심 폴리펩티드를 코딩하는 유전자)을 운반하도록 조작된다. 본원에 사용된 바와 같은 "발현 카세트"는 적절한 숙주 세포 (예를 들어, 포유동물)에서 특정한 이종 핵산 서열의 발현을 지시할 수 있는 핵산 서열을 의미하며, 이는 종결 신호에 작동가능하게 연결될 수 있는 관심 핵산 서열에 작동가능하게 연결된 프로모터를 포함할 수 있다. 관심 이종 핵산 서열을 포함하는 발현 카세트는 키메라일 수 있다. 발현 카세트는 또한 자연적으로 발생하지만 이종 발현에 유용한 재조합 형태로 수득된 것일 수 있다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 항생제 내성 유전자를 포함하지 않는다. 특정 실시양태에서, 트랜스진-함유 플라스미드는 암피실린 내성 유전자 (예를 들어, 서열식별번호: 71 및 73)를 포함하지 않는다. 항생제 내성 유전자는 일반적으로 플라스미드 생산을 위한 선택 마커로 사용되지만, 항생제 내성 유전자 (예를 들어, 암피실린 내성 유전자)의 포함은 안전성 문제를 유발할 수 있다. 예를 들어, 환자의 박테리아로의 수평 유전자 전이가 있을 수 있으며, 이는 유전자가 플라스미드에 존재하지 않는 경우 방지될 것이다. 항생제 내성 형질이 환경 미생물에 전파될 불필요한 위험을 회피하기 위해 (예를 들어, 암피실린) 유의한 임상 용도인 항생제를 포함하는 항생제 선택 마커의 사용을 회피하는 것이 특히 중요하다. 또한, 제약 조성물에 잔류 항생제 (예를 들어, 페니실린 및 다른 β-락탐 항생제)가 있을 수 있으므로, 환자에서 심각한 과민 반응을 일으키는 항생제에 대한 항생제 내성 유전자의 사용을 회피해야 한다.
본 발명에 따른 예시적인 트랜스진-함유 플라스미드, 또는 서열식별번호: 1, 42, 71 및 73과 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 플라스미드는 도 2, 3a, 3b, 15a 및 15b 및 서열식별번호: 1, 42, 71 및 73에 제시되어 있다. 도 2, 3a, 3b, 15a 및 15b는 본 발명의 트랜스진-함유 플라스미드의 요소의 순서의 예를 제공한다.
서열식별번호: 71 및 73에 따른 트랜스진-함유 플라스미드는 암피실린 내성 유전자의 모든 흔적을 제거하고 또한 추가 스터퍼 서열로서 작용하는 불활성화된 겐타마이신 내성 유전자를 포함하기 때문에 유리하다 (예를 들어, 오픈 리딩 프레임으로부터 출발 코돈이 제거됨).
트랜스진-함유 플라스미드는 적어도 전사 방향으로 작동가능하게 연결된 성분, 전사 개시 영역을 포함하는 제어 요소, 관심 DNA 및 전사 종결 영역을 제공하기 위해 공지된 기술을 사용하여 구축된다. 제어 요소는 포유동물 세포에서 기능적이 되도록 선택된다. 작동가능하게 연결된 성분을 함유하는 생성된 구축물은 기능적 AAV 역위 말단 반복부 (ITR) 서열과 플랭킹된다 (5' 및 3'). 종결 신호, 예컨대 폴리아데닐화 부위가 또한 플라스미드에 포함될 수 있다.
ITR은 rAAV를 생성하기 위한 바이러스 유전자의 완전한 소화를 허용하는 패키징에 필요한 유일한 시스 요소인 것으로 나타났다. 롤링-서클 DNA 복제 메카니즘이 주로 ITR 내의 D 서열의 존재로 인해 ITR에 의해 플랭킹된 트랜스진 발현 카세트 DNA 서열을 증폭 (즉, 복제)하지만, 플라스미드 DNA 백본 (예를 들어, 복제 기점, 항생제 내성 유전자 발현 카세트 등)은 또한 플랭킹 D 서열 도메인의 부재로 인해 비록 더 낮은 빈도일지라도 벡터 캡시드에 패키징될 수 있다. AAV는 야생형 바이러스 게놈 (~4.7 kbase)과 유사하거나 더 작은 게놈 크기를 패키징하는데 효율적이다. 백본이 캡시드에 패키징되는 것이 불리한 정도로 백본의 크기를 증가시킴으로써 플라스미드 백본의 패키징을 방지할 수 있다. 백본의 확대는 추가 "스터퍼" 서열 (즉, 충전제 성분)에 의해 달성될 수 있으며, 결과적으로 야생형 AAV 게놈보다 더 큰 플라스미드 백본 크기가 생성된다. 이론에 얽매이는 것을 원하지 않지만, 확대된 플라스미드 백본의 존재는 플라스미드 백본을 벡터 캡시드에 패키징하는 rAAV의 확률을 감소시킬 수 있다고 제안된다. 일부 실시양태에서, 확대된 플라스미드 백본은 스터퍼 서열의 사용에 의해 생성된다.
특정 실시양태에서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열 및/또는 코딩 서열 중 적어도 하나가 없다는 점에서 생물학적 활성 측면에서 침묵한다. 특정 실시양태에서, 각각의 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열 및 코딩 서열이 부재한다.
특정 실시양태에서, 스터퍼 서열은 인간 게놈에서 발견되는 불활성 인트론 DNA 서열을 포함한다. 인간 게놈으로부터의 DNA 서열을 사용함으로써, 플라스미드가 캡시드에 패키징되는 경우 스터퍼 서열이 면역 반응을 유발할 확률이 낮아질 것이다. 스터퍼 서열이 오픈 리딩 프레임을 포함하지 않는 것이 또한 중요하다.
스터퍼 서열은 플라스미드 백본이 벡터 캡시드에 패키징되지 않도록 플라스미드 백본의 크기가 rAAV의 최적 패키징 크기보다 더 클만큼 충분히 커야 한다. 스터퍼 서열은 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 2000, 적어도 3000, 적어도 4000, 적어도 5000, 적어도 6000, 적어도 7000, 적어도 8000, 적어도 9000 또는 적어도 10000개 뉴클레오티드로 이루어질 수 있다. 특정 실시양태에서, 스터퍼 서열은 1000 내지 5000개 뉴클레오티드 길이의 핵산을 포함한다. 특정 실시양태에서, 스터퍼 서열은 1000 내지 2000개 뉴클레오티드 길이의 핵산을 포함한다. 특정 실시양태에서, 스터퍼 서열은 800 내지 1500개 뉴클레오티드 길이의 핵산을 포함한다. 특정 실시양태에서, 스터퍼 서열은 800 내지 1000개 뉴클레오티드 길이의 핵산을 포함한다.
바람직한 실시양태에서, 스터퍼 서열은 인간 GAPDH 인트론 2 (NG007073.2)를 포함한다. 이론에 얽매이는 것을 원하지 않지만, 인간 GAPDH 인트론 2의 사용은 이미 인간 게놈에 존재하기 때문에 더 낮은 면역원성을 가지며, 그러므로 우연히 패키징된 경우 면역 반응을 유발하지 않아야 한다. GAPDH 인트론 2는 단일 자연 발생 서열이므로 스터퍼 서열로서 이상적이다. 임의의 추가 뉴클레오티드를 포함하거나 1개 초과의 서열을 함께 연결할 필요가 없으며, 이는 DNA 서열의 비자연적인 부벽을 초래할 것이다.
특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편과 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 스터퍼 서열은 불활성화된 겐타마이신 유전자를 포함한다. 특정 실시양태에서, 겐타마이신 유전자는 발현되지 않도록 변형된다. 예를 들어, 출발 코돈은 제거될 수 있다.
특정 실시양태에서, 스터퍼 서열은 서열식별번호: 72 또는 그의 단편과 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 스터퍼 서열은 서열식별번호: 72 또는 그의 비기능적 단편을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
트랜스진-함유 플라스미드는 임의의 다양한 AAV 혈청형으로부터 ITR을 사용하여 구축될 수 있다. 이들 ITR은 염기 쌍형성하여 상보적 DNA 가닥의 합성을 허용한다. ITR은 이러한 플라스미드에서 기능을 유지하여 관심 이종 핵산 서열을 함유하는 rAAV의 복제 및 패키징을 허용한다. AAV 플라스미드의 말단 반복 서열 내의 돌연변이는 기능적 AAV 벡터의 생성에서 잘 용인된다. 예를 들어, 문헌 [Samulski et al., 1983]; [Muzyczka et al., 1984]; 및 미국 특허 번호 9,163,259를 참조하며, 이들은 모든 목적을 위해 그 전문이 본원에 포함된다. 2개의 ITR 중 하나가 결실된 플라스미드조차도, 구축물 내의 기존 ITR이 전체 AAV ITR 서열을 함유하는 한, AAV 서열은 구조되고, 복제되고, 감염성 비리온을 생산할 수 있다.
AAV ITR 영역의 핵산 서열은 공지되어 있다. ITR은 야생형 핵산 서열을 가질 필요는 없지만, 예를 들어, 뉴클레오티드의 삽입, 결실 또는 치환에 의해 변경될 수 있다. 추가로, AAV ITR은 제한 없이, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, 또는 그의 키메라를 포함하는 여러 AAV 혈청형 중 임의의 것으로부터 유래될 수 있다. 더욱이, AAV 벡터에서 선택된 핵산 서열을 플랭킹하는 5' 및 3' ITR은 의도된 바와 같이 기능하는 한, 즉, 숙주 세포 게놈으로부터의 관심 서열의 절제 및 구조를 허용하기 위해 반드시 동일하거나 동일한 AAV 혈청형 또는 단리물로부터 유래할 필요는 없다. 이 문서에 기재된 rAAV의 5' ITR 서열의 예로서 서열식별번호: 2 및 43이 사용되지만, 말단 분해 부위를 운반하는 임의의 5' ITR 서열은 동일한 기능성을 갖는 벡터를 생산할 것으로 예상된다. 마찬가지로, 이 문서에 기재된 rAAV의 3' ITR 서열의 예로서 서열식별번호: 3이 사용되지만, 말단 분해 부위를 운반하는 임의의 3' ITR 서열은 동일한 기능성을 갖는 벡터를 생산할 것으로 예상된다.
특정 실시양태에서, 5' ITR 서열은 서열식별번호: 2 또는 서열식별번호 43 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 5' ITR은 서열식별번호: 2 또는 서열식별번호 43, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 3' ITR 서열은 서열식별번호: 3 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 3' ITR은 서열식별번호: 3, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 상기 기재된 바와 같은 스터퍼 서열을 포함하는 트랜스진-함유 플라스미드는 발현 카세트에 작동가능하게 연결된다.
특정 실시양태에서, 발현 카세트는 프로모터를 포함한다. 특정 실시양태에서, 적어도 하나의 이종 핵산 서열 (예를 들어, 관심 이종 유전자)은 이종 핵산 서열이 적절한 또는 바람직한 조건 하에 환자의 표적 세포에서 발현될 수 있도록 pol II 프로모터 (구성적, 세포-특이적 또는 유도성)에 작동가능하게 연결된다. 구성적, 세포-특이적 및 유도성 프로모터의 수많은 예가 관련 기술분야에 공지되어 있으며, 통상의 기술자는 특정 의도된 용도를 위한 프로모터, 예를 들어, 근육 세포-특이적 발현을 위한 근육-특이적 골격 α-액틴 프로모터 또는 근육-특이적 크레아틴 키나제 프로모터/인핸서의 선택, 강한 수준의 연속적 또는 거의 연속적 발현을 위한 구성적 CMV 프로모터 (예를 들어, hCMVie (서열식별번호: 4))의 선택, 또는 유도된 발현을 위한 유도성 엑디손 프로모터의 선택을 쉽게 선택할 수 있다. 유도된 발현은 관련 기술분야의 통상의 기술자가 합성되는 단백질의 양을 제어할 수 있도록 한다. 이러한 방식으로, 치료용 산물의 농도를 변경할 수 있다. 널리 공지된 유도성 프로모터의 다른 예는 하기와 같다: 스테로이드 프로모터 (예를 들어, 에스트로겐 및 안드로겐 프로모터) 및 메탈로티오네인 프로모터. 특정 실시양태에서, 프로모터는 pol III 프로모터이다. 특정 실시양태에서, 프로모터는 U6 프로모터이다. 특정 실시양태에서, 프로모터는 H1 프로모터이다. 특정 실시양태에서, 유전자 발현 카세트는 프로모터가 없다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 멀티시스트론이며, 즉, 1개 초과의 유전자를 운반한다. 발현되는 각 유전자에 대해 고유한 mRNA 전사체를 생성할 프로모터와 달리, 멀티시스트론 플라스미드는 동일한 mRNA로부터 2개 이상의 별도의 단백질을 동시에 발현한다. 이러한 경우, 다중 유전자는 각 유전자에 대한 별도의 번역을 허용하는 요소 (예를 들어, 내부 리보솜 진입 부위 (IRES) 또는 2A 펩티드)에 의해 분리된다.
이 문서에 기재된 rAAV의 IRES 서열의 예로서 서열식별번호: 6이 사용되지만, 말단 분해 부위를 운반하는 임의의 5' ITR 서열은 동일한 기능성을 갖는 벡터를 생산할 것으로 예상된다.
IRES는 또 다른 리보솜 동원 부위로서 작용함으로써 mRNA의 내부 영역으로부터 번역의 개시를 허용한다. 특정 실시양태에서, IRES 서열은 서열식별번호: 6 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, IRES는 서열식별번호: 6 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 2A 펩티드를 코딩한다. IRES 요소의 일부 단점을 극복하기 위해 2A 펩티드 (하기 표 1의 비제한적인 예 참조)가 생성되었다. 특히 2A 펩티드는 리보솜이 2A 요소의 C-말단에서 펩티드 결합의 합성을 건너뛰게 하여 2A 서열의 말단 및 다음 펩티드 하류 사이에 분리를 유발함으로써 이들 펩티드가 기능하는 것으로 생각된다는 점에서 "자가-절단"이다. "절단"은 C-말단에서 발견되는 글리신 및 프롤린 잔기 사이에 발생하며, 이는 상류 시스트론은 말단에 첨가된 몇 개의 추가 잔기를 갖는 반면, 하류 시스트론은 프롤린으로 시작될 것임을 의미한다. 2A 절단은 진핵 세포에서 보편적이며, 일부 과학자들은 거의 100% 절단을 보고한다. 특이적 2A 펩티드의 선택은 궁극적으로 수많은 인자, 예컨대 세포 유형 또는 실험 조건에 따라 달라질 것이며, 통상의 기술자는 어느 것을 선택할지를 이해할 것이다.
표 1 4개의 공통 2A 펩티드의 예.
Figure pct00001
* (GSG) 잔기는 절단 효율을 개선하기 위해 펩티드의 5' 말단에 첨가될 수 있다.
한 실시양태에서, 플라스미드는 AAV로부터의 5' 및 3' ITR을 포함하며, 여기서 ITR은 적어도 하나의 유전자를 둘러싼다. 특정 실시양태에서, 스터퍼 서열은 3' ITR의 하류에 위치된다. 특정 실시양태에서, 스터퍼 서열은 5' ITR의 상류에 있다. ITR은 AAV 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및/또는 AAV11, 또는 그의 키메라로부터 유래될 수 있다. 특정 실시양태에서, ITR은 AAV 혈청형 AAV2 및/또는 AAV5로부터 유래된다. 특정 실시양태에서, ITR은 서열식별번호: 2, 3, 또는 43, 또는 그의 기능적 단편 또는 유도체일 수 있다. 일부 실시양태에서, 유전자는 예를 들어 및 제한 없이 eGFP (예를 들어, 서열식별번호: 5) 및/또는 SEAP (예를 들어, 서열식별번호: 7)와 같은 리포터 유전자이다. 일부 실시양태에서, 스터퍼 서열은 GAPDH 인트론 2 또는 그의 단편 또는 변이체이다. 일부 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편이다. ssAAV (도 3a) 및 scAAV (도 3b) rAAV를 생성하기 위해 플라스미드에서 사용하기 위한 예시적인 유전자 구축물이 도 3에 제시되어 있다.
Rep-Cap 플라스미드
제2 플라스미드는 AAV 복제 (Rep) 및 캡시드 (Cap) 유전자 서열을 포함한다. AAV Rep-Cap 플라스미드는 주요 AAV 유전자 오픈 리딩 프레임 (ORF), Rep 유전자 및 Cap 유전자 둘 다를 포함한다. Rep 단백질은 특히 DNA 복제의 AAV 기점의 인식, 결합 및 니킹; DNA 헬리카제 활성; 및 AAV (또는 다른 이종) 프로모터로부터의 전사 조정을 포함하는 많은 기능을 보유하는 것으로 나타났다. Cap 단백질은 필요한 패키징 기능을 공급하고 바이러스 캡시드 쉘에 어셈블리한다. AAV 헬퍼 기능은 본원에서 AAV 벡터로부터 누락된 트랜스에서 AAV 기능을 보완하기 위해 사용된다. Rep 및 Cap 유전자는 번역되어 다중 별개의 단백질 (Rep78, Rep68, Rep52, Rep40 - AAV 수명 주기에 필요함; VP1, VP2, VP3 - 캡시드 단백질)을 생산한다. Rep 및/또는 Cap 유전자는 AAV 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및/또는 AAV11, 또는 그의 키메라로부터 유래될 수 있다. 특정 실시양태에서, AAV Rep 및/또는 Cap 유전자는 유전자 조작된 AAV 및/또는 화학적으로 변형된 AAV를 코딩한다. 예를 들어, 모든 의도된 목적을 위해 본원에 참조로 포함된 U.S. 7,259,151에 인용된 것과 같이 더 적은 면역원성이 되도록 돌연변이된 AAV 비리온을 참조한다. AAV 혈청형의 선택은 AAV 혈청형의 향성에 대해 선택될 수 있다. 하기 표 2는 가장 널리 사용되는 AAV 혈청형의 향성의 예를 제한 없이 제공한다. AAV의 향성은 또한 슈도타이핑 (즉, 상이한 바이러스 혈청형으로부터의 ITR로부터 캡시드 및 게놈의 혼합)을 통해 변형될 수 있다. 이들 혈청형은 슬래시를 사용하여 표시되므로, AAV2/5는 혈청형 5로부터의 캡시드에 패키징된 혈청형 2의 ITR을 운반하는 게놈을 함유하는 바이러스를 나타낸다. 이들 슈도타이핑된 바이러스의 사용은 형질도입 효율을 개선할 수 있을 뿐만 아니라 향성을 변경시킬 수 있다. 예를 들어, AAV2에 의해 효율적으로 형질도입되지 않은 뉴런은 AAV2/5를 사용할 수 있으며, 이는 뇌에 더 널리 분포되어 있으며 개선된 형질도입 효율을 갖는 것으로 나타났다. 또한 다중 상이한 혈청형으로부터 유래된 하이브리드 캡시드를 사용할 수 있으며, 이는 또한 바이러스 향성을 변경시킨다. 예를 들어, 8개의 혈청형으로부터 유래된 하이브리드 캡시드를 함유하는 AAV-DJ는 임의의 야생형 혈청형보다 시험관내에서 더 높은 형질도입 효율을 나타내며; 생체내에서 광범위한 범위의 세포 유형에 걸쳐 매우 높은 감염성을 나타낸다. 돌연변이체 AAV-DJ8은 AAV-DJ의 특성을 나타내지만 향상된 뇌 흡수를 나타낸다. 수많은 AAV 헬퍼 플라스미드, 예컨대 Rep 및 Cap 유전자 발현 산물 둘 다를 코딩하는 일반적으로 사용되는 플라스미드 pAAV/Ad 및 pIM29+45가 기재된 바 있다. 예를 들어, 문헌 [Samulski et al. (1989) J. Virol. 63:3822-3828]; 및 [McCarty et al. (1991) J. Virol. 65:2936-2945] 및 미국 특허 번호 5,139,941; 6,001,650; 6,376,237; 7,259,151을 참조하며, 이들 각각은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
표 2 AAV 혈청형의 조직 향성
Figure pct00002
본 발명에 따른 예시적인 Rep-Cap 플라스미드, 또는 서열식별번호: 24, 31, 33, 35, 37, 41, 59 또는 60과 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 플라스미드는 도 4a, 4b, 14a 및 14b; 및 서열식별번호: 24, 31, 33, 35, 37, 41, 59 및 60에 제시되어 있다. 도 4a, 4b, 14a 및 14b는 본 발명의 AAV Rep-Cap 플라스미드의 플라스미드에서 요소 순서의 예를 제공한다.
특정 실시양태에서, Rep 유전자는 AAV 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및/또는 AAV11, 또는 그의 키메라로부터 유래될 수 있다. 특정 실시양태에서, AAV Rep 유전자는 유전자 조작된 AAV 및/또는 화학적으로 변형된 AAV이다. 특정 실시양태에서, Rep 유전자는 AAV 혈청형 2 (Rep2) 및/또는 Rep5로부터의 유전자를 포함하며, 이는 키메라 (예를 들어, AAV Rep2/5)를 포함한다.
특정 실시양태에서, Cap 유전자는 AAV 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및/또는 AAV11, 또는 그의 키메라로부터 유래될 수 있다. 특정 실시양태에서, AAV Cap 유전자는 유전자 조작된 AAV 및/또는 화학적으로 변형된 AAV이다. 전술한 실시양태 중 임의의 것에서, Cap 유전자는 Rep 유전자와 동일한 AAV 혈청형 또는 Rep 유전자와 상이한 AAV 혈청형으로부터 유래될 수 있다. 전술한 실시양태 중 임의의 것에서, 플라스미드는 상기 혈청형으로부터의 Cap 단백질의 하이브리드를 포함하는 키메라 단백질을 포함하는 AAV 혈청형 2, 5, 8 및/또는 9 중 임의의 것으로부터의 Cap 유전자 (각각 Cap2, Cap5, Cap8 및 Cap9)를 추가로 포함한다.
특정 실시양태에서, Rep-Cap 플라스미드는 AAV 혈청형 2로부터의 Rep 유전자 서열 및 1개 초과의 혈청형으로부터 조합된 키메라 Rep 단백질, 예를 들어 Rep2/5로서, 및 AAV2, AAV5, AAV8 및/또는 AAV9를 포함하는 임의의 AAV 캡시드 혈청형으로부터의 캡시드 유전자 서열을 포함하나 이에 제한되지는 않는다.
특정 실시양태에서, Rep 유전자 서열은 서열식별번호: 11, 12, 28 또는 30, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, Rep 유전자 서열은 서열식별번호: 11, 12, 28 또는 30, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, Cap 유전자 서열은 서열식별번호: 13, 29, 32 또는 36, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, Cap 유전자 서열은 서열식별번호: 13, 29, 32 또는 36, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 프로모터 서열은 서열식별번호: 34, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 프로모터 서열은 서열식별번호: 34, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
한 실시양태에서, Rep-Cap 플라스미드는 본원에 기재된 AAV Rep 및 Cap 단백질의 발현을 제어하기 위해 AAV 프로모터를 추가로 포함한다. 프로모터는 공지된 고려사항, 예컨대 프로모터에 기능적으로 연결된 핵산의 발현 수준 및 벡터가 사용될 세포 유형에 의해 선택된 임의의 원하는 프로모터일 수 있다. 즉, 프로모터는 조직/세포-특이적일 수 있다. 프로모터는 원핵, 진핵, 진균, 핵, 미토콘드리아, 바이러스 또는 식물 프로모터일 수 있다. 프로모터는 벡터에 의해 형질도입되는 세포 유형에 대해 외인성 또는 내인성일 수 있다. 프로모터는 예를 들어, 박테리아 프로모터, 공지된 강한 프로모터, 예컨대 SV40 또는 유도성 메탈로티오네인 프로모터, 또는 AAV 프로모터, 예컨대 AAV P5 프로모터를 포함할 수 있다. 추가적으로, 표적화된 유전자 발현을 위한 키메라 조절성 프로모터가 사용될 수 있다. 관련 기술분야에 공지된 이들 조절 시스템의 예는 에스케리키아 콜라이의 tet 레프레서에 융합된 VPl 6 활성화 도메인을 함유하는 키메라 단백질인 tet 전사활성화제 단백질 (tTA)을 이용하는 테트라사이클린 기반 조절 시스템, EPTG 기반 조절 시스템, CID 기반 조절 시스템, 및 엑디손 기반 조절 시스템을 포함한다. 다른 프로모터는 액틴 유전자, 면역글로불린 유전자, 사이토메갈로바이러스 (CMV) (예를 들어, hCMVie (서열식별번호: 4), 아데노바이러스, 소 유두종 바이러스, 아데노바이러스 프로모터, 예컨대 아데노바이러스 주요 후기 프로모터, 유도성 열충격 프로모터, 호흡기 세포융합 바이러스, 라우스 육종 바이러스 (RSV) 등으로부터 유래된 프로모터를 포함한다. 프로모터는 임의의 AAV 혈청형의 프로모터일 수 있으며, pl9 프로모터 또는 p40 프로모터일 수 있다. 특정 실시양태에서, 프로모터는 AAV2 P5 프로모터 또는 AAV5 P5 프로모터 또는 AAV P5 프로모터일 수 있다. 더욱이, 프로모터 활성을 유지하는 P5 프로모터의 더 작은 단편은 예를 들어, P5 프로모터에서 일련의 결실을 구축하고, 결실을 리포터 유전자에 연결하고, 리포터 유전자가 발현 (즉, 전사 및/또는 번역)되는지 여부를 결정하는 것을 포함하는 표준 절차에 의해 쉽게 결정될 수 있다. 잠재적인 프로모터의 예는 모든 의도된 목적을 위해 본원에 참조로 포함된 WO2005017101에서 찾을 수 있다. 특정 실시양태에서, AAV 프로모터는 AAV 혈청형 2로부터 유래된다. AAV2 프로모터 P5를 포함하는 예시적인 P5-Rep-Cap 플라스미드는 도 4b 및 14b 및 서열식별번호: 34에 제시되어 있다.
Rep-Cap 플라스미드에 적합한 플라스미드 백본은 pHLP19, pUC18, pUC19 및 pAAV-RC2를 포함하나 이에 제한되지는 않으며, 또한 미국 특허 번호 6,001,650 및 6,156,303에 기재된 플라스미드 백본을 참조하며, 둘 다는 모든 목적을 위해 그 전문이 본원에 참조로 포함된다. 특정 실시양태에서, Rep-Cap 플라스미드 백본은 pUC19이다.
Ad 헬퍼 플라스미드
한 실시양태에서, Ad 헬퍼 플라스미드는 Ad2 및/또는 Ad5를 포함하나 이에 제한되지는 않는 아데노바이러스 유전자를 포함한다. 한 실시양태에서, Ad 헬퍼 플라스미드는 Ad5 유전자를 포함한다. Ad5가 rAAV에 대한 효율적인 헬퍼 바이러스이기 때문에 Ad5 유전자 서열이 사용된다. 헬퍼 기능을 위해 아데노바이러스 유전자의 완전한-보체가 필요하지 않다는 것이 공지되어 있다. 실제로, 완전한 보체를 갖지 않는 것이 더 바람직하다. 예를 들어, DNA 복제 및 후기 유전자 합성이 불가능한 아데노바이러스 돌연변이체는 AAV 복제를 허용하는 것으로 나타났다. 문헌 [Ito et al., (1970) J. Gen. Virol. 9: 243; Ishibashi et al., (1971) Virology 45: 317]. 그러므로, Ad 헬퍼 플라스미드는 rAAV 생산에 필요한 필수 Ad 유전자만을 운반하고 감소된 플라스미드 크기 구축물로서 역할을 하도록 최소 크기로 설계된다. E1 영역에 결손이 있거나 결실된 E4 영역을 갖는 아데노바이러스는 AAV 복제를 지원할 수 없는 것으로 나타났다. 그러므로, E1A 및/또는 E4 영역은 직접적으로 또는 간접적으로 AAV 복제에 필수적일 가능성이 있다. 문헌 [Laughlin et al., (1982) J. Virol. 41: 868; Janik et al., (1981) Proc. Natl. Acad. Sci. USA 78: 1925; Carter et al., (1983) Virology 126: 505]. 다른 특징화된 Ad 돌연변이체는 하기를 포함한다: E1B (Laughlin et al. (1982), supra; Janik et al. (1981), supra; Ostrove et al., (1980) Virology 104: 502); E2A (Handa et al., (1975) J. Gen. Virol. 29: 239; Strauss et al., (1976) J. Virol. 17: 140; Myers et al., (1980) J. Virol. 35: 665; Jay et al., (1981) Proc. Natl. Acad. Sci. USA 78: 2927; Myers et al., (1981) J. Biol. Chem. 256: 567); E2B (Carter, Adeno-Associated Virus Helper Functions, in I CRC Handbook of Parvoviruses (P. Tijssen ed., 1990)); E3 (Carter et al. (1983), supra); and E4 (Carter et al. (1983), supra; Carter (1995)). E1B 코딩 영역에 돌연변이를 갖는 아데노바이러스에 의해 제공되는 보조 기능의 연구는 상충되는 결과를 생성하였지만, 문헌 [Samulski et al., (1988) J. Virol. 62: 206-210]은 최근에 E1B55k는 AAV 비리온 생산에 필요하지만 E1B19k는 필요하지 않다고 보고하였다. 또한, 국제 공개 WO 97/17458 및 문헌 [Matshushita et al., (1998) Gene Therapy 5: 938-945]은 다양한 Ad 유전자를 코딩하는 보조 단백질을 설명한다. 특히 바람직한 보조 기능 플라스미드는 아데노바이러스 VA RNA 코딩 영역, 아데노바이러스 E4 ORF6 코딩 영역, 아데노바이러스 E2A 72 kD 코딩 영역, 아데노바이러스 E1A 코딩 영역, 및 무손상 E1B55k 코딩 영역이 결여된 아데노바이러스 E1B 영역을 포함한다. 이들 플라스미드의 예는 국제 공개 번호 WO 01/83797에 기재되어 있다. 이 단락에서 인용된 각 참고문헌은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
본 발명에 따른 예시적인 Ad 헬퍼 플라스미드, 또는 서열식별번호: 14 및 15와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 플라스미드는 도 5 및 서열식별번호: 14 및 15에 제시되어 있다. 도 5는 본 발명의 Ad 헬퍼 플라스미드의 플라스미드에서 요소의 순서의 예를 제공한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 E2a, E4 (orf6), VA1 RNA 유전자 및 파르보바이러스 VP 캡시드 유전자 단위에 대한 아데노바이러스 유전자 서열을 제한 없이 포함할 수 있다. 특정 실시양태에서, Ad 헬퍼 플라스미드는 VA, E4 및 E2A 유전자를 포함할 수 있다. rAAV 생산을 위해 얼마나 많은 플라스미드를 세포에 효율적으로 형질감염시킬 수 있는지에 대한 제한이 있기 때문에, 이들 Ad 유전자를 운반하는 감소된 크기의 플라스미드를 갖는 것은 형질감염에 사용된 3개의 플라스미드 모두의 몰 함량을 증가시키는데 도움이 될 수 있으므로, rAAV를 더 높은 수율로 생산할 확률을 증가시킨다.
한 실시양태에서, Ad 헬퍼 플라스미드는 E2A, E4 ORF 1, 2, 3, 4 및 6/7, 및 VA ("짧은 Ad 헬퍼 플라스미드")를 포함한다. 예시적인 짧은 Ad 헬퍼 플라스미드는 도 5의 상단 패널에 제시되어 있다. 본원에 기재된 더 짧은 플라스미드는 형질감염 단계 동안 "플라스미드 부하"를 감소시켜 3개의 플라스미드 모두의 플라스미드의 전체 카피 수가 증가되어 rAAV 생산을 위한 유전자 발현 및 복제를 위한 더 많은 수의 플라스미드 주형을 제공할 수 있다. 감소된 플라스미드 부하는 놀랍게도 더 큰 배치에 유용하다. 이는 소규모 연구 생산에서 중요한 파라미터가 아닐 수 있지만, 규모 확장 시 훨씬 더 중요할 수 있다. 이러한 예시적인 짧은 Ad 헬퍼 플라스미드는 대략 12 kb이다. 또 다른 실시양태에서, Ad 헬퍼 플라스미드는 E2A, E4 ORF 1, 2, 3, 4 및 6/7, 및 VA, 뿐만 아니라 프로테아제 및 섬유 및 프로모터 pVIII을 코딩하는 유전자를 포함한다 ("긴 Ad 헬퍼 플라스미드"). 예시적인 긴 Ad 헬퍼 플라스미드는 도 5의 하단 패널에 제시되어 있다. 이러한 예시적인 긴 Ad 헬퍼 플라스미드는 대략 18 kb이다.
짧은 구축물 및 긴 구축물 간의 차이는 도 5에 제시되어 있다. 3개의 필수 유전자 요소의 배향은 상이하다. 긴 버전은 rAAV 생산에 영향을 미치는 기능을 가질 수 있는 아데노바이러스 게놈으로부터의 추가 요소를 운반한다. 짧은 버전은 rAAV 생산을 지원할 수 있는 것으로 공지된 최소 유전자 서열을 함유한다.
특정 실시양태에서, VA 서열은 서열식별번호: 16 또는 48-50, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, VA 서열은 서열식별번호: 16 또는 48-50, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, E4 서열은 서열식별번호: 17, 40, 47, 또는 55-58, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, E4 서열은 서열식별번호: 17, 40, 47, 또는 55-58, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, E2A 서열은 서열식별번호: 18, 39, 46 또는 51, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, E2A 서열은 서열식별번호: 18, 39, 46 또는 51, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
Ad 헬퍼 플라스미드에 적합한 플라스미드는 pJ241을 포함하나 이에 제한되지는 않으며, 또한 미국 특허 번호 6,001,650 및 6,156,303에 기재된 플라스미드를 참조하며, 둘 다의 전문은 본원에 참조로 포함된다. 특정 실시양태에서, Ad 헬퍼 플라스미드 백본은 pUC57이다.
추가 유전자
추가 실시양태에서, 3개의 플라스미드 모두는 선택 마커를 함유한다. 선택 마커의 예는 G418 (neor 포함), 퓨로마이신 (puror 포함), 히그로마이신 B (hygr 포함), 블라스티시딘 S (bsrr 포함), 미코페놀산 및 6-티오(구아닌) (gpt 포함) 및 간시클로비르 또는 1 (2'-데옥시-2'-플루오로-베타-D-아라비노푸라노실)-5-아이오도우라실 (FIAU) (HSV-tk 포함), 겐타마이신, 및/또는 카나마이신 (kanr 포함)을 포함하나 이에 제한되지는 않는 약물 내성 유전자와 같은 양성 선택 마커를 포함하나 이에 제한되지는 않는다. 추가 실시양태에서, 모든 3개의 플라스미드 상의 약물 선택 마커는 카나마이신이다. 특정 실시양태에서, 카나마이신 유전자는 서열식별번호: 19 또는 25, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어진다. 특정 실시양태에서, 겐타마이신 유전자는 서열식별번호: 44 또는 72, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어진다.
한 실시양태에서, 3개의 플라스미드 중 하나 이상은 하나 이상의 리포터 유전자를 운반한다. 여러 리포터 유전자가 관련 기술분야에 공지되어 있으며, 일부는 상업적으로 이용가능하다 (문헌 [Alam and Cook, supra] 참조). 리포터 유전자는 유기체 및 분자 생물학 조작에 특히 적합한 플라스미드 내에 삽입될 수 있다. 리포터 유전자의 발현이 프로모터의 제어 하에 있도록 관심 프로모터를 클로닝 부위에 삽입할 수 있다 (문헌 [Rosenthal, N., Methods Enzymol. 152: 704-720 (1987)]; 및 [Shiau, A. and Smith, J. M., Gene 67: 295-299 (1988)] 참조). 이들 플라스미드를 세포 유형 또는 전체 유기체에 도입하기 위해 공지된 방법이 사용된다 (문헌 [Sambrook et al., Molecular Biology, A Laboratory Manual, Cold Spring Harbor Laboratory Press (1989)]; 및 [Nolan, In: Molecular Cloning, Cold Spring Harbor Laboratory Press, (1989)] 참조). 리포터 유전자의 예는 제한 없이, β-갈락토시다제 (LacZ), 반딧불이 루시페라제, 레닐라 루시페라제, 가우시아 루시페라제, 클로람페니콜 아세틸트랜스퍼라제 (CAT), 분비된 배아 알칼리성 포스파타제 (SEAP), 시안 형광 단백질 (CFP), 그린 형광 단백질 (GFP), 향상된 GFP (eGFP), 옐로우 형광 단백질 (YFP), 향상된 YFP (eYFP), 블루 형광 단백질 (BFP), 향상된 BFP (eBFP), 디스코소마 코랄(Discosoma coral)로부터의 레드 형광 단백질 (DsRed), 및/또는 MmGFP (Zemicka-Goetz et al. (1997) Development 124: 1133-1137) 또는 관련 기술분야의 통상의 기술자에게 친숙한 다른 것들을 포함한다. 또 다른 실시양태에서, 3개의 플라스미드 중 하나 이상은 eGFP 및 SEAP 둘 다를 포함하는 리포터 구축물을 운반하며, 내부 리보솜 진입 부위 (IRES)는 eGFP 및 SEAP 사이에 위치된다. 이러한 실시양태에서, 핵에 편재화된 eGFP는 rAAV의 벡터 형질도입 향성을 결정하는데 사용될 수 있는 반면, 세포 외부에서 분비되는 SEAP는 시험관내 설정에서 배양 배지에서 또는 생체내 설정에서 대상체의 혈류에서 형질도입 효율의 정량적 측정을 허용할 수 있다. LacZ는 클로닝된 유전자에 의한 lacZ 유전자의 파괴에 기초하여 원하는 클론의 색상-기반 선택을 가능하게 할 수 있다.
한 실시양태에서, 각 플라스미드는 고유한 DNA 역가 태그를 포함한다. 특정 실시양태에서, DNA 역가 태그는 트랜스진-함유 플라스미드에서만 나타난다. 특정 실시양태에서 DNA 역가 태그는 모든 플라스미드 시스템에서 나타난다. 이 고유한 DNA 역가 태그는 존재하는 벡터의 양을 정량화하기 위해, 예를 들어 qPCR (또는 ddPCR)-기반 벡터 게놈 역가측정 검정을 통해 범용 벡터 게놈 역가측정을 가능하게 하기 위해 포함될 수 있다. 특정 실시양태에서, DNA 역가 태그는 발현 카세트 외부에 그러나 2개의 ITR 사이에 있을 수 있어 패키징되도록 보장할 수 있다. 예를 들어, DNA 역가 태그는 3'ITR 서열의 상류에 있을 수 있다. 또 다른 예로서, DNA 역가 태그는 5'ITR 서열의 하류에 있을 수 있다. 특정 실시양태에서, DNA 역가 태그는 대상체의 게놈 내에서 내인성으로 나타나지 않도록 구축된다. 예를 들어, 서열은 대상체의 DNA와 비교될 수 있다 (예를 들어, Blast 검색 또는 다른 정렬 검색 도구를 통해). 또한, qPCR 분석을 실행하는데 사용되는 프라이머를 분석하여, 비리온을 패키징하는데 사용되는 숙주 세포에서 발견되는 임의의 서열을 확인하지 않는 것을 보장할 수 있다.
DNA 역가 태그는 효율적인 qPCR 분석을 허용하지만 또한 플라스미드에서 최소 양의 게놈 공간을 차지하는 크기일 수 있다. 특정 실시양태에서, DNA 역가 태그 서열은 약 60개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이이고 (예를 들어 서열식별번호: 10), 인간 또는 표준 실험실 동물에 존재하지 않는 서열을 기반으로 설계된다. 특정 실시양태에서, DNA 역가 태그 서열은 약 60개 뉴클레오티드 내지 약 80개 뉴클레오티드, 약 65개 뉴클레오티드 내지 약 95개 뉴클레오티드, 약 70개 뉴클레오티드 내지 약 90개 뉴클레오티드, 또는 약 75개 뉴클레오티드 내지 약 85개 뉴클레오티드이다. 특정 실시양태에서, DNA 역가 태그 서열은 약 60개 뉴클레오티드 내지 약 70개 뉴클레오티드, 약 65개 뉴클레오티드 내지 약 75개 뉴클레오티드, 약 70개 뉴클레오티드 내지 약 80개 뉴클레오티드, 약 75개 뉴클레오티드 내지 약 85개 뉴클레오티드, 약 80개 뉴클레오티드 내지 약 90개 뉴클레오티드, 약 85개 뉴클레오티드 내지 약 95개 뉴클레오티드, 또는 약 90개 뉴클레오티드 내지 약 100개 뉴클레오티드이다. 특정 실시양태에서, DNA 역가 태그 서열은 적어도 약 60개 뉴클레오티드, 적어도 약 65개 뉴클레오티드, 적어도 약 70개 뉴클레오티드, 적어도 약 75개 뉴클레오티드, 적어도 약 80개 뉴클레오티드, 적어도 약 85개 뉴클레오티드, 적어도 약 90개 뉴클레오티드, 적어도 약 95개 뉴클레오티드, 또는 적어도 약 100개 뉴클레오티드이다. 특정 실시양태에서, DNA 역가 서열의 스트레치는 100개 뉴클레오티드 길이이다. 특정 실시양태에서, 100개 뉴클레오티드의 역가 태그는 신속한 qPCR 검정에서 유리할 수 있고, 전체 플라스미드 크기 및 패키징 제한으로 인해 효율적인 패키징을 허용할 수 있다.
DNA 역가 태그를 코딩하는 핵산 서열의 비제한적인 예는 서열식별번호: 61-70을 포함한다.
이종 핵산 서열
본 발명의 플라스미드에 의해 제조된 재조합 AAV는 대상체의 하나 이상의 세포 또는 조직에 투여될 수 있다. 그러므로, 본 발명은 대상체의 세포 또는 조직을 조정하는데 유용할 수 있는 이종 핵산 서열의 전달을 포함한다. 예를 들어, rAAV는 세포 또는 조직의 활성 또는 산물을 상향조절 또는 하향조절할 수 있다.
특정 실시양태에서, 이종 핵산 서열은 하나 이상의 펩티드, 폴리펩티드 또는 단백질을 코딩하는 관심 이종 유전자일 수 있다. 특정 실시양태에서, 이종 핵산 서열은 특정 관심 표적에 결합하는 펩티드, 폴리펩티드 또는 단백질을 코딩할 수 있으며, 이는 대상체에서 질환의 치료 또는 예방에 유용할 수 있다. 이러한 이종 핵산 서열 및 연관 펩티드, 폴리펩티드 또는 단백질의 예는 항체, MHC 분자, T-세포 수용체, B-세포 수용체, 압타머, 아비머, 수용체-결합 리간드, 또는 표적화 펩티드를 코딩하는 유전자를 포함하나 이에 제한되지는 않는다. 본 발명에 유용한 항체는 모노클로날 항체, 폴리클로날 항체, 항체 단편 (예를 들어, Fab, Fab', F(ab')2, Fv, Fc 등), 키메라 항체, 이중특이적 항체, 이종접합체 항체, 단일 쇄 (ScFv), 그의 돌연변이체, 항체 일부를 포함하는 융합 단백질, 인간화 항체, 및 항체의 글리코실화 변이체, 항체의 아미노산 서열 변이체, 및 공유결합으로 변형된 항체를 포함하여 필요한 특이성의 항원 인식 부위를 포함하는 면역글로불린 분자의 임의의 다른 변형된 구성을 포함할 수 있다. 항체는 뮤린, 래트, 인간, 또는 임의의 다른 기원 (키메라 또는 인간화 항체 포함)일 수 있다. 항체는 임의의 클래스의 항체, 예컨대 IgG, IgA 또는 IgM (또는 그의 서브클래스)을 포함하며, 항체는 임의의 특정한 클래스일 필요는 없다. 그의 중쇄의 불변 도메인의 항체 아미노산 서열에 따라, 면역글로불린은 상이한 클래스에 할당될 수 있다. 5개의 주요 클래스의 면역글로불린: IgA, IgD, IgE, IgG 및 IgM이 있으며, 이들 중 여러개는 서브클래스 (이소타입), 예를 들어 IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2로 추가로 나뉠 수 있다. 상이한 클래스의 면역글로불린에 상응하는 중쇄 불변 도메인은 각각 알파, 델타, 엡실론, 감마 및 뮤라고 불린다. 상이한 클래스의 면역글로불린의 서브유닛 구조 및 3차원 구성은 널리 공지되어 있다.
특정 실시양태에서, 이종 핵산 서열 (예를 들어, 관심 이종 유전자)은 대상체에서 질환의 치료 또는 예방에 유용할 수 있는 펩티드, 폴리펩티드 또는 단백질을 코딩할 수 있다. 예를 들어, 이종 핵산 서열은 질환 Y의 치료를 위해 단백질 X를 코딩할 수 있다. 단백질 X는 예를 들어, 돌연변이된 단백질을 치환하거나 돌연변이된 단백질을 차단하는 작용을 할 수 있다. 이러한 핵산 서열 및 연관 질환은 하기를 포함하나 이에 제한되지는 않는다: 글리코겐 저장 결핍 유형 1A와 연관된 글루코스-6-포스파타제를 코딩하는 핵산 서열; Pepck 결핍과 연관된 포스포에놀피루베이트-카르복시키나제를 코딩하는 DNA; 갈락토스혈증과 연관된 갈락토스-1 포스페이트 우리딜 트랜스퍼라제를 코딩하는 DNA; 페닐케톤뇨증과 연관된 페닐알라닌 히드록실라제를 코딩하는 DNA; 메이플 시럽 소변 질환과 연관된 분지쇄 알파-케토산 데히드로게나제를 코딩하는 DNA; 티로신혈증 유형 1과 연관된 푸마릴아세토아세테이트 히드롤라제를 코딩하는 DNA; 메틸말론산혈증과 연관된 메틸말로닐-CoA 뮤타제를 코딩하는 DNA; 중간쇄 아세틸 CoA 결핍과 연관된 중간쇄 아실 CoA 데히드로게나제를 코딩하는 DNA; 오르니틴 트랜스카르바밀라제 결핍과 연관된 오르니틴 트랜스카르바밀라제를 코딩하는 DNA; 시트룰린혈증과 연관된 아르기니노숙신산 신세타제를 코딩하는 DNA; 가족성 고콜레스테롤혈증과 연관된 저밀도 지단백질 수용체 단백질을 코딩하는 DNA; 크리글러-나자르병과 연관된 UDP-글루쿠로노실트랜스퍼라제를 코딩하는 DNA; 중증 복합 면역결핍 질환과 연관된 아데노신 데아미나제를 코딩하는 DNA; 통풍 및 레쉬-니한 증후군과 연관된 히포크산틴 구아닌 포스포리보실 트랜스퍼라제를 코딩하는 DNA; 비오티니다제 결핍과 연관된 비오티니다제를 코딩하는 DNA; 파브리병과 연관된 알파-갈락토시다제-A를 코딩하는 DNA; 고쉐병과 연관된 베타-글루코세레브로시다제를 코딩하는 DNA; Sly 증후군과 연관된 베타-글루쿠로니다제를 코딩하는 DNA; 젤웨거 증후군과 연관된 퍼옥시좀 막 단백질 70 kDa을 코딩하는 DNA; 급성 간헐성 포르피린증과 연관된 포르포빌리노겐 데아미나제를 코딩하는 DNA; 알파-1 항트립신 결핍 (폐기종)의 치료를 위한 알파-1 항트립신을 코딩하는 DNA; 유전성 혈관부종 (HAE)의 치료를 위한 C1-에스테라제를 코딩하는 DNA; 페닐케톤뇨증의 치료를 위한 페닐알라닌 히드록실라제를 코딩하는 DNA; 폼페병의 치료를 위한 산 알파-글루코시다제를 코딩하는 DNA; 윌슨병의 치료를 위한 ATP7B를 코딩하는 DNA; 뮤코다당질축적증 유형 I (MPSI)의 치료를 위한 알파-L-이두로니다제를 코딩하는 DNA; 뮤코다당질축적증 유형 II (MPSII)의 치료를 위한 이두로네이트 술파타제를 코딩하는 DNA; 뮤코다당질축적증 유형 IIIA (MPSIIIA)의 치료를 위한 헤파란 술파미다제를 코딩하는 DNA; 뮤코다당질축적증 유형 IIIB (MPSIIIB)의 치료를 위한 N-아세틸글루코사미니다제를 코딩하는 DNA; 뮤코다당질축적증 유형 IIIC (MPSIIIC)의 치료를 위한 헤파란-알파-글루코사미니드 N-아세틸트랜스퍼라제를 코딩하는 DNA; 뮤코다당질축적증 유형 IIID (MPSIIID)의 치료를 위한 N-아세틸글루코사민 6-술파타제를 코딩하는 DNA; 뮤코다당질축적증 유형 IVA (MPSIVA)의 치료를 위한 갈락토스-6-술페이트 술파타제를 코딩하는 DNA; 뮤코다당질축적증 유형 IVB (MPSIVB)의 치료를 위한 베타-갈락토시다제를 코딩하는 DNA; 뮤코다당질축적증 유형 VI (MPSVI)의 치료를 위한 N-아세틸갈락토사민-4-술파타제를 코딩하는 DNA; 뮤코다당질축적증 유형 VII (MPSVII)의 치료를 위한 베타-글루쿠로니다제를 코딩하는 DNA; 뮤코다당질축적증 유형 IX (MPSIX)의 치료를 위한 히알루로니다제를 코딩하는 DNA; 지중해빈혈증 또는 신부전으로 인한 빈혈의 치료를 위한 에리트로포이에틴을 코딩하는 DNA; 허혈성 질환의 치료를 위한 혈관 내피 성장 인자를 코딩하는 DNA, 안지오포이에틴-1을 코딩하는 DNA, 및 섬유모세포 성장 인자를 코딩하는 DNA; 예를 들어, 죽상경화증, 혈전증 또는 색전증에서 나타나는 바와 같은 폐색 혈관의 치료를 위한 트롬보모듈린 및 조직 인자 경로 억제제를 코딩하는 DNA; 파킨슨병의 치료를 위한 방향족 아미노산 데카르복실라제 (AADC)를 코딩하는 DNA 및 티로신 히드록실라제 (TH)를 코딩하는 DNA; 울혈성 심부전의 치료를 위한 베타 아드레날린 수용체를 코딩하는 DNA, 포스포람반에 대한 안티센스를 코딩하는 DNA 또는 이의 돌연변이체 형태를 코딩하는 DNA, 근소포체(소포체) 아데노신 트리포스파타제-2 (SERCA2)를 코딩하는 DNA, 및 심장 아데닐릴 시클라제를 코딩하는 DNA; 다양한 암의 치료를 위한 종양 억제 유전자, 예컨대 p53을 코딩하는 DNA; 염증성 및 면역 장애 및 암의 치료를 위한 시토카인, 예컨대 다양한 인터루킨 중 하나를 코딩하는 DNA; 근디스트로피의 치료를 위한 디스트로핀 또는 미니디스트로핀을 코딩하는 DNA 및 우트로핀 또는 미니우트로핀을 코딩하는 DNA; 스타가르트병의 치료를 위한 ABCA4를 코딩하는 DNA; 및 당뇨병의 치료를 위한 인슐린을 코딩하는 DNA.
특정 실시양태에서, 이종 핵산 서열 (예를 들어, 관심 이종 유전자)은 혈액 응고 단백질을 코딩하는 펩티드, 폴리펩티드 또는 단백질을 코딩할 수 있으며, 상기 단백질은 혈액 장애 (예를 들어, 혈우병)를 갖는 대상체의 세포로 전달될 수 있다. 이러한 핵산 및 연관 펩티드, 폴리펩티드 또는 단백질의 예는 혈우병 B의 치료를 위한 대상체에게 인자 IX, 혈우병 A의 치료를 위한 대상체에게 인자 VIII, 인자 VII 결핍의 치료를 위한 인자 VII, 인자 X 결핍의 치료를 위한 인자 X, 인자 XI 결핍의 치료를 위한 인자 XI, 인자 XIII 결핍의 치료를 위한 인자 XIII, 및 단백질 C 결핍의 치료를 위한 단백질 C를 코딩하는 DNA를 포함하나 이에 제한되지는 않는다.
본 발명은 또한 유전적 및/또는 후천성 질환에 대한 유전자 발현 수준을 높이거나 낮추기 위해 숙주 세포 게놈과 상호작용할 수 있는 조작된 인공 DNA 결합 도메인 펩티드, 전사 활성화제 또는 전사 레프레서 및 뉴클레아제의 발현을 포함한다.
본 발명은 또한 안티센스, siRNA, shRNA, miRNA, EGS, gRNA, sgRNA, 리보자임 또는 압타머를 포함하나 이에 제한되지는 않는 이종 핵산 서열의 발현을 포함하며, 이는 유전적 및/또는 후천성 질환에 대한 단백질의 유전자 발현 또는 활성을 변경할 수 있는 세포 DNA, RNA 및/또는 단백질과 상호작용할 수 있다.
본 발명은 또한 세포를 감염시켜 유전자 조작된 세포 요법 물질 또는 약물 산물을 생성하는데 사용되는 rAAV를 포함하나 이에 제한되지는 않는 세포 요법을 위한 중간체 및/또는 중요한 원료의 발현을 포함한다.
본 발명은 또한 세포에서 관심 게놈 유전자좌 (즉, 표적)를 변형시키는데 사용되는 유전자 편집 분자인 이종 핵산 서열을 포함한다. 이러한 변형은 유전자의 표적 유전자좌에서 유전자 서열의 파괴, 결실, 복구, 돌연변이, 첨가, 변경 또는 변형을 포함하나 이에 제한되지는 않는다. 유전자-편집 분자의 예는 엔도뉴클레아제, 예컨대 아연 핑거 뉴클레아제 (ZFn), 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN), 메가뉴클레아제, 제한 엔도뉴클레아제, 레콤비나제, 및 클러스터링된 규칙적으로 산재된 짧은 회문 반복부 (CRISPR)/CRISPR-연관 (Cas) 단백질을 포함하나 이에 제한되지는 않는다.
rAAV의 전달
본원에 기재된 재조합 AAV는 본 발명의 플라스미드에 의해 제조된 rAAV의 유효량을 그를 필요로 하는 대상체에게 투여함으로써 관심 질환의 치료 및/또는 예방을 위한 치료적으로 유용한 농도로 사용될 수 있다. 본 발명의 플라스미드에 의해 제조된 rAAV로 치료될 대상체는 또한 질환을 치료하거나 또는 예방하기 위한 공지된 효능을 갖는 다른 치료제 또는 장치와 함께 투여될 수 있다.
대상체에게 rAAV의 전달은 근육내 주사 또는 대상체의 혈류로의 투여에 의해 이루어질 수 있다. 혈류로의 투여는 수술 분야에서 널리 공지된 기술인 단리된 사지 관류에 의해 돌연변이체 비리온을 혈류로 정맥, 동맥 또는 임의의 다른 혈관 도관으로 주사함으로써 이루어질 수 있으며, 상기 방법은 본질적으로 통상의 기술자가 rAAV의 투여전 전신 순환으로부터 사지를 단리할 수 있게 한다. 더욱이, 특정 조건의 경우, 돌연변이체 비리온을 대상체의 CNS에 전달하는 것이 바람직할 수 있다. "CNS"는 척추동물의 뇌 및 척수의 모든 세포 및 조직을 의미한다. 그러므로, 상기 용어는 신경 세포, 아교 세포, 성상세포, 뇌척수액 (CSF), 간질 공간, 골, 연골, 뇌내 뇌실, 두개내, 대수조 주사, 경막내, 경동맥내, 비강내 등을 포함하나 이에 제한되지는 않는다. 시험관내에서 형질도입된 rAAV 또는 세포는 관련 기술분야에 공지된 신경외과 기술을 사용하여, 예컨대 정위 주사에 의해 바늘, 카테터 또는 관련 장치로 예를 들어, 뇌실 영역, 뿐만 아니라 선조체 (예를 들어, 선조체의 꼬리핵 또는 피각), 척수 및 신경근 접합부 또는 소뇌 소엽으로 주사에 의해 CNS 또는 뇌로 직접적으로 전달될 수 있다. 예를 들어, 문헌 [Stein et al., J Virol 73:3424-3429, 1999]; [Davidson et al., PNAS 97:3428-3432, 2000]; [Davidson et al., Nat. Genet. 3:219-223, 1993]; 및 [Alisky and Davidson, Hum. Gene Ther. 11:2315-2329, 2000]을 참조하며, 이들 각각은 모든 목적을 위해 그 전문이 본원에 포함된다. 눈에 투여하기 위한 방법은 망막하, 유리체내, 경공막 또는 두개내를 포함할 수 있다.
표 3 본 발명의 플라스미드에서 사용하기 위한 예시적인 서열
Figure pct00003
Figure pct00004
Figure pct00005
실시예
본 개시내용은 또한 하기 실시예에 의해 설명되고 입증된다. 그러나, 명세서의 어느 곳에서나 이들 및 다른 실시예의 사용은 단지 예시일 뿐이며, 본 개시내용 또는 임의의 예시된 용어의 범위 및 의미를 제한하지 않는다. 마찬가지로, 본 개시내용은 본원에 기재된 임의의 바람직한 실시양태로 제한되지 않는다. 실제로, 본 명세서를 읽으면 본 개시내용의 많은 변형 및 변경이 관련 기술분야의 통상의 기술자에게 명백할 수 있고, 이러한 변경은 본 개시내용의 취지 또는 범위에서 벗어나지 않고 이루어질 수 있다. 따라서, 본 개시내용은 그 청구범위가 자격이 되는 등가물의 전체 범위와 함께 첨부된 청구범위의 조건에 의해서만 제한되어야 한다.
실시예 1: Cap 단백질의 시험관내 발현
본 실시예는 Rep2 및 Cap2 유전자를 운반하는 대조군 pAAV-RC2 기반 플라스미드 (애질런트)로부터의 동일한 캡시드 단백질의 발현 수준과 비교하여 pUC19-기반 플라스미드로부터의 AAV293 (애질런트) 세포에서 캡시드 단백질의 시험관내 발현을 조사하였다 (도 4a).
Rep2Cap2-pAAV-RC (즉, 도 4a에 제시된 바와 같은 pAAV-RC2)로 출발하여 다양한 Rep 및 Cap 유전자를 갖는 4개의 플라스미드의 제1 세트를 pAAV-RC 배경에서 생성하였다. pAAV-RC2를 사용하여 Rep2/5Cap5-pAAV-RC, Rep2Cap8-pAAV-RC, 및 Rep2Cap9-pAAV-RC를 생성하였다 (도 4a).
제1 세트와 동일한 복제 및 캡시드 단백질을 사용하여 pUC19-Kan 배경에서 4개의 플라스미드의 제2 세트를 생성하였다. 그러므로, Rep2Cap2-pUC19-Kan, Rep2/5Cap5-pUC19-Kan, Rep2Cap8-pUC19-Kan, 및 Rep2Cap9-pUC19-Kan (도 4a 및 14a).
실험을 위해, 8개의 플라스미드를 각각 Ad 헬퍼 플라스미드, p헬퍼 (애질런트) (예를 들어, 서열식별번호: 45)와 함께 1:1 비율로 별도로 형질감염시켰다.
pUC19-Kan-기반 플라스미드로부터의 Cap 단백질의 발현 수준을 모노클로날 B1 항체를 사용하여 웨스턴 블로팅을 통해 pAAV-RC2-기반 플라스미드로부터의 동일한 Cap 단백질의 발현 수준과 비교하였다 (도 6). 양성 대조군 AAV2 참조 표준 물질 (RSM) 및 AAV8 RSM은 AAV2 및 AAV8 Cap 단백질을 함유하는 참조 표준 물질인 반면, 음성 대조군은 어떠한 Cap-보유 플라스미드도 없는 HEK293으로부터의 세포 용해물이었다. 캡시드 단백질의 발현 수준은 pUC19-기반 플라스미드 및 pAAV-RC2-기반 플라스미드 둘 다에 대해 AAV5 > AAV8 > AAV9 > AAV2였다.
도 7은 Cap 단백질 VP1-VP3의 양을 보다 명확하게 구체적으로 분석하기 위해 감소된 샘플로 수행된 웨스턴 블롯 분석이다.
다음으로, AAV2 P5 프로모터를 Rep2Cap2 pUC19-Kan, Rep2Cap8 pUC19-Kan 및 Rep2Cap9 pUC19-Kan 플라스미드에 첨가하였다 (예를 들어, 도 4b 및 14b). 도 8은 P5 프로모터가 없는 것과 비교하여 상기 기재된 것과 동일한 조건 하에 시험된 P5 프로모터를 사용하여 발현된 AAV 혈청형 2, 8 및 9로부터의 Cap 단백질의 발현 수준을 제시한다. P5 프로모터가 더 높은 수준의 캡시드 단백질 발현을 제공하는 것으로 밝혀졌다. 트랜스진-함유 플라스미드 및 Ad 헬퍼 플라스미드를 1:1 비율로 투여하였다.
실시예 2: 짧은 및 긴 Ad 헬퍼 플라스미드의 기능 시험
본 실시예의 목적은 짧은 Ad 헬퍼 플라스미드 및 긴 Ad 헬퍼 플라스미드 대 상업용 p헬퍼의 기능을 시험하는 것이었다. 각 플라스미드를 조합하여 사용하기 전에 각 플라스미드가 기능하는지를 보장하기 위해 개별적으로 시험하였다.
도 9는 HEK293 숙주 세포 시스템에서 짧은 Ad 헬퍼 플라스미드 (서열식별번호: 14)를 사용한 양성 시험 결과를 제시한다. ITR과 AAV Rep2 및 Cap2 유전자를 운반하는 애질런트 RC2 플라스미드 사이에 트랜스진으로서 GFP를 운반하는 pTRUF11 트랜스진-함유 플라스미드와 함께 짧은 헬퍼 플라스미드를 공동-형질감염시킴으로써 짧은 Ad 헬퍼 플라스미드 (서열식별번호: 14)를 시험하였다. 음성 대조군은 1) 상업용 Ad 헬퍼 플라스미드 (p헬퍼) 및 애질런트 플라스미드 RC2 및 2) p헬퍼 및 pTRUF11로 이루어지고; 양성 대조군은 p헬퍼, pTRUF11 및 애질런트 RC2 플라스미드로 이루어졌다. 48시간 후, HEK293 세포를 트리톤 X-100으로 용해시키고, 벤조나제 뉴클레아제로 처리하여 DNA 및 RNA로 분해하였다. AAV 입자를 함유하는 세포 용해물을 DNase I로 처리하고, qPCR을 수행하기 전에 계열 희석하여 세포 용해물 ml당 바이러스 게놈 카피 수를 결정하였다. 도 9는 qPCR 검정 결과를 보여주며, 칼럼 1 및 2는 음성 대조군을 나타내고, 칼럼 3은 양성 대조군을 제시하며, 칼럼 4는 rAAV를 생산하기 위해 짧은 Ad 헬퍼 플라스미드를 2개의 다른 플라스미드와 함께 사용하였을 때 수득된 바이러스 게놈 카피 수를 제시한다.
본 개시내용에 따라 긴 Ad 헬퍼 플라스미드 (서열식별번호: 15)를 시험하기 위해 유사한 실험을 수행하였다 (도 10). 도 10은 qPCR에 의해 결정된 바와 같이 음성 대조군 (칼럼 1), 양성 대조군 (칼럼 2), 짧은 Ad 헬퍼 플라스미드 (서열식별번호: 14) + Rep-Cap 보유 플라스미드 + ITR-GFP 보유 플라스미드 (칼럼 3), 및 긴 Ad 헬퍼 플라스미드 + Rep-Cap 보유 플라스미드 + ITR-GFP 보유 플라스미드 (칼럼 4)의 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 따라서, 긴 Ad 헬퍼 플라스미드도 AAV 생산을 초래하였다.
실시예 3: 삼중-플라스미드 시스템을 사용한 rAAV 비리온 생산
rAAV 비리온을 형성하는 본 개시내용에 따른 단일 가닥 (ss)- 및 자가-상보적 (sc)-ITR-보유 플라스미드의 능력을 시험하였다. 본 실험에서, 플라스미드를 HEK293 세포 (애질런트)에 공동-형질감염시켰다. 각 형질감염의 경우, Ad-헬퍼 플라스미드, Rep-Cap 플라스미드 및 트랜스진-함유 플라스미드를 1:1:1 몰비로 사용하고, 10 cm 플레이트당 총 DNA 10 ug을 사용하였다. 음성 대조군은 시판되는 Ad 헬퍼 플라스미드 (애질런트) 및 시판되는 Rep-Cap-보유 플라스미드 (애질런트)인 반면, 양성 대조군은 상이한 ITR-보유 플라스미드 (ATCC)를 사용하였다. 도 11의 상단 패널은 ss-ITR-보유 플라스미드에 대한 세포 용해물 ml당 바이러스 게놈 카피 수를 제시하는 반면 (상기와 같이 qPCR에 의해 측정됨), 하단 패널은 sc-ITR-보유 플라스미드에 대한 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 두 패널 모두에서, 칼럼 1은 음성 대조군에 대한 카피 수를 나타내고, 칼럼 2는 양성 대조군을 나타내고, 칼럼 3은 본 개시내용에 따른 플라스미드를 제시한다.
다음으로, 본 개시내용에 따른 3개의 플라스미드를 qPCR 검정을 위해 HEK293 세포 (다시, 1:1:1 비율)에 공동-형질감염시켰다. 음성 대조군 (도 12의 칼럼 1)은 시판되는 Ad 헬퍼 플라스미드 및 ITR-보유 플라스미드였다. 양성 대조군 (도 12의 칼럼 2)은 시판되는 Rep-Cap-보유 플라스미드를 포함하였다. 칼럼 3-6은 AAV 혈청형 2, 5, 8 또는 9로부터의 Rep 및 Cap 단백질을 코딩하는 pUC19-기반 플라스미드와 함께 동일한 시판되는 Ad 헬퍼 플라스미드 및 ITR-보유 플라스미드로 형질감염된 세포로부터의 AAV 게놈 카피 수에 상응한다 (도면의 상단에 걸쳐 표시됨). 도 12의 칼럼 7-10은 본 개시내용에 따른 Ad 헬퍼 플라스미드, pUC19-기반 Rep-Cap-보유 플라스미드, 및 ITR-보유 플라스미드로 형질감염된 세포로부터의 AAV 게놈 카피 수에 상응한다. 도 12의 칼럼 11은 본 개시내용에 따른 Ad 헬퍼 플라스미드 및 ss-ITR 플라스미드 및 시판되는 Rep-Cap-보유 플라스미드로 형질감염된 세포로부터의 AAV 게놈 카피 수에 상응하는 또 다른 양성 대조군이다.
실시예 4: rAAV의 정제 및 생산
HEK293 세포를 본 개시내용에 따른 3개의 플라스미드를 포함하는 플라스미드 시스템으로 공동-형질감염시켰다. 세포를 화학적으로 용해시키고, 세포 펠릿 및 배지를 수집하였다. 세포 용해물을 청징화하고 벤조나제로 처리하였다. 청징화된 용해물을 적절한 친화성 칼럼에서 실행시켰다 (예를 들어, AAV8 캡시드를 포함하는 플라스미드 시스템의 경우, 친화성 칼럼은 AVB였고; AAV9를 포함하는 플라스미드 시스템의 경우, 친화성 칼럼은 AAV9-POROS 캡쳐셀렉트(CaptureSelect)였음). 완충액 교환 후, rAAV를 칼럼으로부터 용출하였다. 그 후, 바이러스 게놈 카피 수를 결정하기 위해 qPCR에 의해 제한이 아닌 예로서 rAAV를 특징화하였다 (도 9-13, 16 참조). 순도 및 동일성을 결정하기 위한 은 염색에 의해, 내독소 활성 및 미생물 오염을 측정하기 위한 리물루스 아메바세포 용해물(Limulus amebocyte lysate) (LAL) 검정에 의해, 및 생물학적 활성을 결정하기 위한 시험관내 형질도입 검정에 의해 rAAV를 추가로 평가할 수 있다. 다른 특징화 검정은 바이러스 게놈의 크기 및 무결성을 시험하기 위한 알칼리성 전기영동, 캡시드를 검사하기 위한 ELISA, rAAV 입자의 감염성을 결정하기 위한 감염성 센터 검정, 및 rAAV 입자를 관찰하기 위한 전자 현미경검사법을 포함한다. 특정 단백질에 대한 웨스턴 블로팅을 또한 적절한 항체를 사용함으로써 수행할 수 있다 (도 6-8 참조).
실시예 5: 벡터 게놈을 역가측정하기 위한 태그의 사용
서열, 예컨대 폴리A 서열을 qPCR 정량화에 사용할 수 있지만, 범용 역가측정을 위해 이러한 서열을 사용하는 것은 이상적이지 않다. 예를 들어, 각 트랜스진은 상이한 폴리A 서열 (예를 들어, SV40, bGH 폴리A 등)을 사용하며, 그에 의해 모든 트랜스진 플랫폼에 걸쳐 벡터를 정량하는데 사용하지 못하게 할 수 있다. 따라서, 트랜스진 카세트 외부에 있는 별도의 DNA 역가 태그 (즉, 트랜스진 mRNA 전사체의 일부로서 전사되지 않음)를 임의의 트랜스진 카세트를 보편적으로 정량하는 그의 능력에 대해 시험하였다.
100개 뉴클레오티드 DNA 역가 태그가 3' ITR 서열의 상류에 포함되었다. 이 동일한 역가 태그는 임의의 프로젝트에 대한 단일 참조 표준으로 사용될 수 있는 qPCR 기술을 통해 범용 벡터 게놈 역가측정을 허용하기 위해 rAAV 생산을 위한 임의의 트랜스진-함유 플라스미드에서 사용할 수 있다. 표적 서열로서 SV40 폴리A 또는 100개 뉴클레오티드 DNA 역가 태그를 사용하여 AAV의 동일한 배치에 대해 qPCR 적정 결과를 비교하였다.
2개의 상이한 바이러스 벡터: rAAV8-ssITR (서열식별번호: 1) 및 rAAV8-scITR (서열식별번호: 42)을 단일-가닥 (서열식별번호: 1) 또는 자가-상보적 (서열식별번호: 42) 트랜스진-함유 플라스미드인 트랜스진-함유 플라스미드와 함께 생산하였다. 2개의 상이한 표적 서열을 사용하여 유사한 qPCR 역가를 수득하였으며, 이는 100개 뉴클레오티드 DNA 역가 태그가 qPCR-기반 벡터 적정을 위해 현장에서 널리 사용된 SV40 폴리A와 동일하게 작동함을 나타낸다 (도 13a (rAAV8-ssITR) 및 13B (rAAV8-scITR)).
실시예 6: 벡터 게놈을 역가측정하기 위한 태그의 사용
DNA 역가 태그의 유용성을 추가로 확인하기 위해, 실시예 5에서 사용된 동일한 100개 뉴클레오티드 DNA 역가 태그를 2개의 추가 바이러스 벡터: rAAV9-ssITR (서열식별번호: 71) 및 rAAV9-scITR (서열식별번호: 73)에서 3' ITR 서열의 상류에 포함시켰다.
여러 가능한 실시양태가 상기 개시되어 있지만, 본 개시내용의 실시양태는 그렇게 제한되지 않는다. 이들 예시적인 실시양태는 본 개시내용의 범위를 완전하게 하거나 불필요하게 제한하려는 것이 아니라, 대신에 관련 기술분야의 통상의 기술자가 본 개시내용을 실시할 수 있도록 본 개시내용의 원리를 설명하기 위해 선택되고 설명되었다. 실제로, 본원에 설명된 것들에 더하여 본 개시내용의 다양한 변형은 전술한 설명으로부터 관련 기술분야의 통상의 기술자에게 명백하게 될 것이다. 이러한 변형은 첨부된 청구항의 범위 내에 속하도록 의도된다. 또한, 본원에서 사용된 용어는 예시적인 실시양태를 설명하기 위한 목적으로만 사용되며, 본 개시내용의 다양한 실시양태의 범위는 첨부된 청구범위 및 그의 균등물에 의해서만 제한될 것이기 때문에 용어는 제한하려는 의도가 아니다. 따라서, 본 개시내용의 범위는 전술한 설명 및 상기 논의된 실시양태가 아니라 다음의 청구범위에 의해 표시되고, 그 균등물의 의미 및 범위 내에 있는 모든 변경이 본원에 포함되도록 의도된다.
본원에서 인용된 모든 특허, 출원, 간행물, 시험 방법, 문헌 및 기타 자료는 본 명세서에 물리적으로 존재하는 것처럼 그 전문이 본원에 참조로 포함된다.
SEQUENCE LISTING <110> BAXALTA INCORPORATED BAXALTA GMBH <120> AAV TRIPLE-PLASMID SYSTEM <130> 250478.001858 <140> <141> <150> 62/750,603 <151> 2018-10-25 <160> 77 <170> PatentIn version 3.5 <210> 1 <211> 10630 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (6316)..(6415) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (6316)..(6415) <223> This region may encompass 60-100 nucleotides <400> 1 tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 60 actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt aacaagggtg aacactatcc 120 catatcacca gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg 180 cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 240 aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 300 aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 360 atttttttct ccattttttt ttcctccttt agaaaaactc atcgagcatc aaatgaaact 420 gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 480 aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 540 ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 600 caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 660 tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 720 caaccaaacc gttattcatt cgtgattgcg cctgagcgag gcgaaatacg cgatcgctgt 780 taaaaggaca attacaaaca ggaatcgagt gcaaccggcg caggaacact gccagcgcat 840 caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaacgct gtttttccgg 900 ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 960 gaagtggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1020 caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1080 gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1140 cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcattt 1200 ttttttcctc ctttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 1260 tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 1320 accatctggc cccagcgctg cgatgatacc gcgagaacca cgctcaccgg ctccggattt 1380 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 1440 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 1500 tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg gtgtcacgct cgtcgtttgg 1560 tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 1620 gtgcacgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 1680 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 1740 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 1800 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 1860 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 1920 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 1980 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 2040 atattcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 2100 tacatatttg aatgtattta gaaaaataaa caaatagggg tcagtgttac aaccaattaa 2160 ccaattctga acattatcgc gagcccattt atacctgaat atggctcata acaccccttg 2220 tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 2280 acgccgtagc gccgatggta gtgtggggac tccccatgcg agagtaggga actgccaggc 2340 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgcccgggc taattgaggg 2400 gtgtcgccct tattcgactc ggggctcgag ctgcgcgctc gctcgctcac tgaggccgcc 2460 cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg 2520 cgcagagagg gagtggccaa ctccatcact aggggttcct ttaattaaac gcgtttacat 2580 aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa 2640 taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg 2700 actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc 2760 cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 2820 tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 2880 tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 2940 gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 3000 caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg 3060 aggtctatat aggcgcgccg aactgaaaaa ccagaaagtt aactggtaag tttagtcttt 3120 ttgtctttta tttcaggtcc cggatccggt ggtggtgcaa atcaaagaac tgctcctcag 3180 tggatgttgc ctttacttct aggcctgtac ggaagtgtta cttctgctct aaaagctcct 3240 gcagggaatt cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca 3300 tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg 3360 agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc 3420 ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct 3480 accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc 3540 aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt 3600 tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg 3660 gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg 3720 ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg 3780 gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc 3840 tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga 3900 agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg 3960 acgagctgta caagtaatag actagtgccc ctctccctcc ccccccccta acgttactgg 4020 ccgaagccgc ttggaataag gccggtgtgc gtttgtctat atgttatttt ccaccatatt 4080 gccgtctttt ggcaatgtga gggcccggaa acctggccct gtcttcttga cgagcattcc 4140 taggggtctt tcccctctcg ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc 4200 agttcctctg gaagcttctt gaagacaaac aacgtctgta gcgacccttt gcaggcagcg 4260 gaacccccca cctggcgaca ggtgcctctg cggccaaaag ccacgtgtat aagatacacc 4320 tgcaaaggcg gcacaacccc agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa 4380 atggctcacc tcaagcgtat tcaacaaggg gctgaaggat gcccagaagg taccccattg 4440 tatgggatct gatctggggc ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa 4500 aaacgtctag gccccccgaa ccacggggac gtggttttcc tttgaaaaac acgatgataa 4560 taccggtgcc accatgctgc tgctgctgct gctgctgggc ctgaggctac agctctccct 4620 gggcatcatc ccagttgagg aggagaaccc ggacttctgg aaccgcgagg cagccgaggc 4680 cctgggtgcc gccaagaagc tgcagcctgc acagacagcc gccaagaacc tcatcatctt 4740 cctgggcgat gggatggggg tgtctacggt gacagctgcc aggatcctaa aagggcagaa 4800 gaaggacaaa ctggggcctg agatacccct ggccatggac cgcttcccat atgtggctct 4860 gtccaagaca tacaatgtag acaaacatgt gccagacagt ggagccacag ccacggccta 4920 cctgtgcggg gtcaagggca acttccagac cattggcttg agtgcagccg cccgctttaa 4980 ccagtgcaac acgacacgcg gcaacgaggt catctccgtg atgaatcggg ccaagaaagc 5040 agggaagtca gtgggagtgg taaccaccac acgagtgcag cacgcctcgc cagccggcac 5100 ctacgcccac acggtgaacc gcaactggta ctcggacgcc gacgtgcctg cctcggcccg 5160 ccaggagggg tgccaggaca tcgctacgca gctcatctcc aacatggaca ttgacgtgat 5220 cctaggtgga ggccgaaagt acatgtttcg catgggaacc ccagaccctg agtacccaga 5280 tgactacagc caaggtggga ccaggctgga cgggaagaat ctggtgcagg aatggctggc 5340 gaagcgccag ggtgcccggt atgtgtggaa ccgcactgag ctcatgcagg cttccctgga 5400 cccgtctgtg acccatctca tgggtctctt tgagcctgga gacatgaaat acgagatcca 5460 ccgagactcc acactggacc cctccctgat ggagatgaca gaggctgccc tgcgcctgct 5520 gagcaggaac ccccgcggct tcttcctctt cgtggagggt ggtcgcatcg accatggtca 5580 tcatgaaagc agggcttacc gggcactgac tgagacgatc atgttcgacg acgccattga 5640 gagggcgggc cagctcacca gcgaggagga cacgctgagc ctcgtcactg ccgaccactc 5700 ccacgtcttc tccttcggag gctaccccct gcgagggagc tccatcttcg ggctggcccc 5760 tggcaaggcc cgggacagga aggcctacac ggtcctccta tacggaaacg gtccaggcta 5820 tgtgctcaag gacggcgccc ggccggatgt taccgagagc gagagcggga gccccgagta 5880 tcggcagcag tcagcagtgc ccctggacga agagacccac gcaggcgagg acgtggcggt 5940 gttcgcgcgc ggcccgcagg cgcacctggt tcacggcgtg caggagcaga ccttcatagc 6000 gcacgtcatg gccttcgccg cctgcctgga gccctacacc gcctgcgacc tggcgccccc 6060 cgccggcacc accgacgccg cgcacccggg ttactctaga gtcggggcgg ccggccgctt 6120 cgagcagaca tgagtcgaca gatcttttaa aaaacctccc acacaattgt tgttgttaac 6180 ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 6240 aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 6300 catgtctgtt taaacnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnattta 6420 aataggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 6480 aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 6540 agcgagcgcg cagagagtat acatcgatgt gagttcgcgg gtggctgggg ggccctgggc 6600 tgcgaccgcc cccgaaccgc gtctacgagc cttgcgggct ccgggtcttt gcagtcgtat 6660 gggggcaggg tagctgttcc ccgcaaggag agctcaaggt cagcgctcgg acctggcgga 6720 gccccgcacc caggctgtgg cgccctgtgc agctccgccc ttgcggcgcc atctgcccgg 6780 agcctccttc ccctagtccc cagaaacagg aggtccctac tcccgcccga gatcccgacc 6840 cggaccccta ggtgggggac gctttctttc ctttcgcgct ctgcggggtc acgtgtcgca 6900 gaggagcccc tcccccacgg cctccggcac cgcaggcccc gggatgctag tgcgcagcgg 6960 gtgcatccct gtccggatgc tgcgcctgcg gtagagcggc cgccatgttg caaccgggaa 7020 ggaaatgaat gggcagccgt taggaaagcc tgccggtgac taaccctgcg ctcctgcctc 7080 gatgggtgga gtcgcgtgtg gcggggaagt caggtggagc gaggctagct ggcccgattt 7140 ctcctccggg tgatgctttt cctagattat tctctggtaa atcaaagaag tgggtttatg 7200 gaggtcctct tgtgtcccct ccccgcagag gtgtggtggc tgtggcatgg tgccaagccg 7260 ggagaagctg agtcatgggt agttggaaaa ggacatttcc accgcaaaat ggcccctctg 7320 gtggtggccc cttcctgcag cgccggctca cctcacggcc ccgcccttcc cctgccagcc 7380 tagcgttgac ccgaccccaa aggccaggct gtaaatgtca ccgggaggat tgggtgtctg 7440 ggcgcctcgg ggaacctgcc cttctcccca ttccgtcttc cggaaaccag atctcccacc 7500 gcaccctggt ctgaggttaa atatagctgc tgacctttct gtagctgggg gcctgggctg 7560 gggctctctc ccatcccttc tccccacaca catgcactta cctgtgctcc cactcctgat 7620 ttctggaaaa gagctaggaa ggacaggcaa cttggcaaat caaagccctg ggactagggg 7680 gttaaaatac agcttcccct cttcccaccc gccccagtct ctgtcccttt tgtaggaggg 7740 acttagagaa ggggtgggct tgccctgtcc agttaatttc tgacctttac tcctgccctt 7800 tgagtttgat gatgctgagt gtacaagcgt tttctcccta aagggtgcag ctgagctagg 7860 cagcagcaag cattcctggg gtggcatagt ggggtggtga ataccatgta caaagcttgt 7920 gcccagactg tgggtggcag tgccccacat ggccgcttct cctggaaggg cttcgtatga 7980 ctgggggtgt tgggcagccc tggagccttc agttgcagcc atgccttaag ccaggccagc 8040 ctggcaggga agctcaaggg agataaaatt caacctcttg ggccctcctg ggggtaagga 8100 gatgctgcat tcgccctctt aatggggagg tggcctaggg ctgctcacat attctggagg 8160 agcctcccct cctcatgcct tcttgcctct tgtctcttag gcatgcaaaa gagtcgaata 8220 agggcgacac aaaatttatt ctaaatgcat aataaatact gataacatct tatagtttgt 8280 attatatttt gtattatcgt tgacatgtat aattttgata tcaaaaactg attttccctt 8340 tattattttc gagatttatt ttcttaattc tctttaacaa actagaaata ttgtatatac 8400 aaaaaatcat aaataataga tgaatagttt aattataggt gttcatcaat cgaaaaagca 8460 acgtatctta tttaaagtgc gttgcttttt tctcatttat aaggttaaat aattctcata 8520 tatcaagcaa agtgacaggc gcccttaaat attctgacaa atgctctttc cctaaactcc 8580 ccccataaaa aaacccgccg aagcgggttt ttacgttatt tgcggattaa cgattactcg 8640 ttatcagaac cgcccagggg gcccgagctt aagactggcc gtcgttttac aacacagaaa 8700 gagtttgtag aaacgcaaaa aggccatccg tcaggggcct tctgcttagt ttgatgcctg 8760 gcagttccct actctcgcct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 8820 ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 8880 gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 8940 aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 9000 gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 9060 ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 9120 cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 9180 cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 9240 gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 9300 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 9360 agttcttgaa gtggtgggct aactacggct acactagaag aacagtattt ggtatctgcg 9420 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 9480 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 9540 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgacgcgc 9600 gcgtaactca cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca agtcagcgta 9660 atgctctgct taggtggcgg tacttgggtc gatatcaaag tgcatcactt cttcccgtat 9720 gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt gcacgtagat 9780 cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg cggtggcaat 9840 gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct cactacgcgg 9900 ctgctcaaac ttgggcagaa cgtaagccgc gagagcgcca acaaccgctt cttggtcgaa 9960 ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat cggagtccgg 10020 ctgatgttgg gagtaggtgg ctacgtcacc gaactcacga ccgaaaagat caagagcagc 10080 ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc ccatacttga 10140 gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc tgctccataa 10200 catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg 10260 tacaaaaaaa cagtcataac aagccatgaa aaccgccact gcgccgttac caccgctgcg 10320 ttcggtcaag gttctggacc agttgcgtga gcgcattttt ttttcctcct cggcgtttac 10380 gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg 10440 aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct 10500 tgcgtataat atttgcccat agtgaaaacg ggggcgaaga agttgtccat attggccacg 10560 tttaaatcaa aactggtgaa actcacccag ggattggcgc tgacgaaaaa catattctca 10620 ataaaccctt 10630 <210> 2 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 2 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct 130 <210> 3 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 3 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag aga 133 <210> 4 <211> 503 <212> DNA <213> Human cytomegalovirus <400> 4 acgcgtttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 60 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 120 gtcaatgggt ggactattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 180 tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 240 agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 300 ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac 360 ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 420 aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 480 gtgtacggtg ggaggtctat ata 503 <210> 5 <211> 723 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 5 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720 tag 723 <210> 6 <211> 575 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 6 gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60 gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120 ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180 gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240 aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300 tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360 acgttgtgag ttggatagtt gtggaaagag tcaaatggct cacctcaagc gtattcaaca 420 aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480 gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg 540 ggacgtggtt ttcctttgaa aaacacgatg ataat 575 <210> 7 <211> 1560 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 atgctgctgc tgctgctgct gctgggcctg aggctacagc tctccctggg catcatccca 60 gttgaggagg agaacccgga cttctggaac cgcgaggcag ccgaggccct gggtgccgcc 120 aagaagctgc agcctgcaca gacagccgcc aagaacctca tcatcttcct gggcgatggg 180 atgggggtgt ctacggtgac agctgccagg atcctaaaag ggcagaagaa ggacaaactg 240 gggcctgaga tacccctggc catggaccgc ttcccatatg tggctctgtc caagacatac 300 aatgtagaca aacatgtgcc agacagtgga gccacagcca cggcctacct gtgcggggtc 360 aagggcaact tccagaccat tggcttgagt gcagccgccc gctttaacca gtgcaacacg 420 acacgcggca acgaggtcat ctccgtgatg aatcgggcca agaaagcagg gaagtcagtg 480 ggagtggtaa ccaccacacg agtgcagcac gcctcgccag ccggcaccta cgcccacacg 540 gtgaaccgca actggtactc ggacgccgac gtgcctgcct cggcccgcca ggaggggtgc 600 caggacatcg ctacgcagct catctccaac atggacattg acgtgatcct aggtggaggc 660 cgaaagtaca tgtttcgcat gggaacccca gaccctgagt acccagatga ctacagccaa 720 ggtgggacca ggctggacgg gaagaatctg gtgcaggaat ggctggcgaa gcgccagggt 780 gcccggtatg tgtggaaccg cactgagctc atgcaggctt ccctggaccc gtctgtgacc 840 catctcatgg gtctctttga gcctggagac atgaaatacg agatccaccg agactccaca 900 ctggacccct ccctgatgga gatgacagag gctgccctgc gcctgctgag caggaacccc 960 cgcggcttct tcctcttcgt ggagggtggt cgcatcgacc atggtcatca tgaaagcagg 1020 gcttaccggg cactgactga gacgatcatg ttcgacgacg ccattgagag ggcgggccag 1080 ctcaccagcg aggaggacac gctgagcctc gtcactgccg accactccca cgtcttctcc 1140 ttcggaggct accccctgcg agggagctcc atcttcgggc tggcccctgg caaggcccgg 1200 gacaggaagg cctacacggt cctcctatac ggaaacggtc caggctatgt gctcaaggac 1260 ggcgcccggc cggatgttac cgagagcgag agcgggagcc ccgagtatcg gcagcagtca 1320 gcagtgcccc tggacgaaga gacccacgca ggcgaggacg tggcggtgtt cgcgcgcggc 1380 ccgcaggcgc acctggttca cggcgtgcag gagcagacct tcatagcgca cgtcatggcc 1440 ttcgccgcct gcctggagcc ctacaccgcc tgcgacctgg cgccccccgc cggcaccacc 1500 gacgccgcgc acccgggtta ctctagagtc ggggcggccg gccgcttcga gcagacatga 1560 <210> 8 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 8 agatctttta aaaaacctcc cacacaattg ttgttgttaa cttgtttatt gcagcttata 60 atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 120 attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtct 168 <210> 9 <211> 1632 <212> DNA <213> Homo sapiens <400> 9 gtgagttcgc gggtggctgg ggggccctgg gctgcgaccg cccccgaacc gcgtctacga 60 gccttgcggg ctccgggtct ttgcagtcgt atgggggcag ggtagctgtt ccccgcaagg 120 agagctcaag gtcagcgctc ggacctggcg gagccccgca cccaggctgt ggcgccctgt 180 gcagctccgc ccttgcggcg ccatctgccc ggagcctcct tcccctagtc cccagaaaca 240 ggaggtccct actcccgccc gagatcccga cccggacccc taggtggggg acgctttctt 300 tcctttcgcg ctctgcgggg tcacgtgtcg cagaggagcc cctcccccac ggcctccggc 360 accgcaggcc ccgggatgct agtgcgcagc gggtgcatcc ctgtccggat gctgcgcctg 420 cggtagagcg gccgccatgt tgcaaccggg aaggaaatga atgggcagcc gttaggaaag 480 cctgccggtg actaaccctg cgctcctgcc tcgatgggtg gagtcgcgtg tggcggggaa 540 gtcaggtgga gcgaggctag ctggcccgat ttctcctccg ggtgatgctt ttcctagatt 600 attctctggt aaatcaaaga agtgggttta tggaggtcct cttgtgtccc ctccccgcag 660 aggtgtggtg gctgtggcat ggtgccaagc cgggagaagc tgagtcatgg gtagttggaa 720 aaggacattt ccaccgcaaa atggcccctc tggtggtggc cccttcctgc agcgccggct 780 cacctcacgg ccccgccctt cccctgccag cctagcgttg acccgacccc aaaggccagg 840 ctgtaaatgt caccgggagg attgggtgtc tgggcgcctc ggggaacctg cccttctccc 900 cattccgtct tccggaaacc agatctccca ccgcaccctg gtctgaggtt aaatatagct 960 gctgaccttt ctgtagctgg gggcctgggc tggggctctc tcccatccct tctccccaca 1020 cacatgcact tacctgtgct cccactcctg atttctggaa aagagctagg aaggacaggc 1080 aacttggcaa atcaaagccc tgggactagg gggttaaaat acagcttccc ctcttcccac 1140 ccgccccagt ctctgtccct tttgtaggag ggacttagag aaggggtggg cttgccctgt 1200 ccagttaatt tctgaccttt actcctgccc tttgagtttg atgatgctga gtgtacaagc 1260 gttttctccc taaagggtgc agctgagcta ggcagcagca agcattcctg gggtggcata 1320 gtggggtggt gaataccatg tacaaagctt gtgcccagac tgtgggtggc agtgccccac 1380 atggccgctt ctcctggaag ggcttcgtat gactgggggt gttgggcagc cctggagcct 1440 tcagttgcag ccatgcctta agccaggcca gcctggcagg gaagctcaag ggagataaaa 1500 ttcaacctct tgggccctcc tgggggtaag gagatgctgc attcgccctc ttaatgggga 1560 ggtggcctag ggctgctcac atattctgga ggagcctccc ctcctcatgc cttcttgcct 1620 cttgtctctt ag 1632 <210> 10 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (1)..(100) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (1)..(100) <223> This sequence may encompass 60-100 nucleotides <400> 10 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 100 <210> 11 <211> 1845 <212> DNA <213> Adeno-associated virus <400> 11 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaaaatca ggagagctac ctctccttca actccaccgg caactctcgg 780 agccagatca aggccgcgct cgacaacgcg accaaaatta tgagtctgac aaaaagcgcg 840 gtggactacc tcgtggggag ctccgttccc gaggacattt caaaaaacag aatctggcaa 900 atttttgaga tgaatggcta cgacccggcc tacgcgggat ccatcctcta cggctggtgt 960 cagcgctcct tcaacaagag gaacaccgtc tggctctacg gacccgccac gaccggcaag 1020 accaacatcg cggaggccat cgcccacact gtgccctttt acggctgcgt gaactggacc 1080 aatgaaaact ttccctttaa tgactgtgtg gacaaaatgc tcatttggtg ggaggaggga 1140 aagatgacca acaaggtggt tgaatccgcc aaggccatcc tggggggctc aaaggtgcgg 1200 gtcgatcaga aatgtaaatc ctctgttcaa attgattcta cccctgtcat tgtaacttcc 1260 aatacaaaca tgtgtgtggt ggtggatggg aattccacga cctttgaaca ccagcagccg 1320 ctggaggacc gcatgttcaa atttgaactg actaagcggc tcccgccaga ttttggcaag 1380 attactaagc aggaagtcaa ggactttttt gcttgggcaa aggtcaatca ggtgccggtg 1440 actcacgagt ttaaagttcc cagggaattg gcgggaacta aaggggcgga gaaatctcta 1500 aaacgcccac tgggtgacgt caccaatact agctataaaa gtctggagaa gcgggccagg 1560 ctctcatttg ttcccgagac gcctcgcagt tcagacgtga ctgttgatcc cgctcctctg 1620 cgaccgctca attggaattc aaggtatgat tgcaaatgtg actatcatgc tcaatttgac 1680 aacatttcta acaaatgtga tgaatgtgaa tatttgaatc ggggcaaaaa tggatgtatc 1740 tgtcacaatg taactcactg tcaaatttgt catgggattc ccccctggga aaaggaaaac 1800 ttgtcagatt ttggggattt tgacgatgcc aataaagaac agtaa 1845 <210> 12 <211> 1866 <212> DNA <213> Adeno-associated virus <400> 12 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataa 1866 <210> 13 <211> 2211 <212> DNA <213> Adeno-associated virus <400> 13 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800 atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860 aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920 aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980 gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100 tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160 tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 14 <211> 12003 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 14 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 60 cgcgcgcgta actcacgtta agggattttg gtcatgagct tgcgccgtcc cgtcaagtca 120 gcgtaatgct ctgcttttag aaaaactcat cgagcatcaa atgaaactgc aatttattca 180 tatcaggatt atcaatacca tatttttgaa aaagccgttt ctgtaatgaa ggagaaaact 240 caccgaggca gttccatagg atggcaagat cctggtatcg gtctgcgatt ccgactcgtc 300 caacatcaat acaacctatt aatttcccct cgtcaaaaat aaggttatca agtgagaaat 360 caccatgagt gacgactgaa tccggtgaga atggcaaaag tttatgcatt tctttccaga 420 cttgttcaac aggccagcca ttacgctcgt catcaaaatc actcgcatca accaaaccgt 480 tattcattcg tgattgcgcc tgagcgaggc gaaatacgcg atcgctgtta aaaggacaat 540 tacaaacagg aatcgagtgc aaccggcgca ggaacactgc cagcgcatca acaatatttt 600 cacctgaatc aggatattct tctaatacct ggaacgctgt ttttccgggg atcgcagtgg 660 tgagtaacca tgcatcatca ggagtacgga taaaatgctt gatggtcgga agtggcataa 720 attccgtcag ccagtttagt ctgaccatct catctgtaac atcattggca acgctacctt 780 tgccatgttt cagaaacaac tctggcgcat cgggcttccc atacaagcga tagattgtcg 840 cacctgattg cccgacatta tcgcgagccc atttataccc atataaatca gcatccatgt 900 tggaatttaa tcgcggcctc gacgtttccc gttgaatatg gctcatattc ttcctttttc 960 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 1020 tttagaaaaa taaacaaata ggggtcagtg ttacaaccaa ttaaccaatt ctgaacatta 1080 tcgcgagccc atttatacct gaatatggct cataacaccc cttgtttgcc tggcggcagt 1140 agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 1200 ggtagtgtgg ggactcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 1260 ggctcagtcg aaagactggg cctttcgccc gggctaatta gggggtgtcg cccttcgctg 1320 aaggggtgcg cggatccgta tacgtttaaa cgcggccgcg gtacccaact ccatgctcaa 1380 cagtccccag gtacagccca ccctgcgtcg caaccaggaa cagctctaca gcttcctgga 1440 gcgccactcg ccctacttcc gcagccacag tgcgcagatt aggagcgcca cttctttttg 1500 tcacttgaaa aacatgtaaa aataatgtac tagagacact ttcaataaag gcaaatgctt 1560 ttatttgtac actctcgggt gattatttac ccccaccctt gccgtctgcg ccgtttaaaa 1620 atcaaagggg ttctgccgcg catcgctatg cgccactggc agggacacgt tgcgatactg 1680 gtgtttagtg ctccacttaa actcaggcac aaccatccgc ggcagctcgg tgaagttttc 1740 actccacagg ctgcgcacca tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa 1800 gtcgcagttg gggcctccgc cctgcgcgcg cgagttgcga tacacagggt tgcagcactg 1860 gaacactatc agcgccgggt ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc 1920 cgcgtccagg tcctccgcgt tgctcagggc gaacggagtc aactttggta gctgccttcc 1980 caaaaagggc gcgtgcccag gctttgagtt gcactcgcac cgtagtggca tcaaaaggtg 2040 accgtgcccg gtctgggcgt taggatacag cgcctgcata aaagccttga tctgcttaaa 2100 agccacctga gcctttgcgc cttcagagaa gaacatgccg caagacttgc cggaaaactg 2160 attggccgga caggccgcgt cgtgcacgca gcaccttgcg tcggtgttgg agatctgcac 2220 cacatttcgg ccccaccggt tcttcacgat cttggccttg ctagactgct ccttcagcgc 2280 gcgctgcccg ttttcgctcg tcacatccat ttcaatcacg tgctccttat ttatcataat 2340 gcttccgtgt agacacttaa gctcgccttc gatctcagcg cagcggtgca gccacaacgc 2400 gcagcccgtg ggctcgtgat gcttgtaggt cacctctgca aacgactgca ggtacgcctg 2460 caggaatcgc cccatcatcg tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc 2520 gcggtgctcc tcgttcagcc aggtcttgca tacggccgcc agagcttcca cttggtcagg 2580 cagtagtttg aagttcgcct ttagatcgtt atccacgtgg tacttgtcca tcagcgcgcg 2640 cgcagcctcc atgcccttct cccacgcaga cacgatcggc acactcagcg ggttcatcac 2700 cgtaatttca ctttccgctt cgctgggctc ttcctcttcc tcttgcgtcc gcataccacg 2760 cgccactggg tcgtcttcat tcagccgccg cactgtgcgc ttacctcctt tgccatgctt 2820 gattagcacc ggtgggttgc tgaaacccac catttgtagc gccacatctt ctctttcttc 2880 ctcgctgtcc acgattacct ctggtgatgg cgggcgctcg ggcttgggag aagggcgctt 2940 ctttttcttc ttgggcgcaa tggccaaatc cgccgccgag gtcgatggcc gcgggctggg 3000 tgtgcgcggc accagcgcgt cttgtgatga gtcttcctcg tcctcggact cgatacgccg 3060 cctcatccgc ttttttgggg gcgcccgggg aggcggcggc gacggggacg gggacgacac 3120 gtcctccatg gttgggggac gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg 3180 ctgctcctct tcccgactgg ccatttcctt ctcctatagg cagaaaaaga tcatggagtc 3240 agtcgagaag aaggacagcc taaccgcccc ctctgagttc gccaccaccg cctccaccga 3300 tgccgccaac gcgcctacca ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt 3360 gattatcgag caggacccag gttttgtaag cgaagacgac gaggaccgct cagtaccaac 3420 agaggataaa aagcaagacc aggacaacgc agaggcaaac gaggaacaag tcgggcgggg 3480 ggacgaaagg catggcgact acctagatgt gggagacgac gtgctgttga agcatctgca 3540 gcgccagtgc gccattatct gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat 3600 agcggatgtc agccttgcct acgaacgcca cctattctca ccgcgcgtac cccccaaacg 3660 ccaagaaaac ggcacatgcg agcccaaccc gcgcctcaac ttctaccccg tatttgccgt 3720 gccagaggtg cttgccacct atcacatctt tttccaaaac tgcaagatac ccctatcctg 3780 ccgtgccaac cgcagccgag cggacaagca gctggccttg cggcagggcg ctgtcatacc 3840 tgatatcgcc tcgctcaacg aagtgccaaa aatctttgag ggtcttggac gcgacgagaa 3900 gcgcgcggca aacgctctgc aacaggaaaa cagcgaaaat gaaagtcact ctggagtgtt 3960 ggtggaactc gagggtgaca acgcgcgcct agccgtacta aaacgcagca tcgaggtcac 4020 ccactttgcc tacccggcac ttaacctacc ccccaaggtc atgagcacag tcatgagtga 4080 gctgatcgtg cgccgtgcgc agcccctgga gagggatgca aatttgcaag aacaaacaga 4140 ggagggccta cccgcagttg gcgacgagca gctagcgcgc tggcttcaaa cgcgcgagcc 4200 tgccgacttg gaggagcgac gcaaactaat gatggccgca gtgctcgtta ccgtggagct 4260 tgagtgcatg cagcggttct ttgctgaccc ggagatgcag cgcaagctag aggaaacatt 4320 gcactacacc tttcgacagg gctacgtacg ccaggcctgc aagatctcca acgtggagct 4380 ctgcaacctg gtctcctacc ttggaatttt gcacgaaaac cgccttgggc aaaacgtgct 4440 tcattccacg ctcaagggcg aggcgcgccg cgactacgtc cgcgactgcg tttacttatt 4500 tctatgctac acctggcaga cggccatggg cgtttggcag cagtgcttgg aggagtgcaa 4560 cctcaaggag ctgcagaaac tgctaaagca aaacttgaag gacctatgga cggccttcaa 4620 cgagcgctcc gtggccgcgc acctggcgga catcattttc cccgaacgcc tgcttaaaac 4680 cctgcaacag ggtctgccag acttcaccag tcaaagcatg ttgcagaact ttaggaactt 4740 tatcctagag cgctcaggaa tcttgcccgc cacctgctgt gcacttccta gcgactttgt 4800 gcccattaag taccgcgaat gccctccgcc gctttggggc cactgctacc ttctgcagct 4860 agccaactac cttgcctacc actctgacat aatggaagac gtgagcggtg acggtctact 4920 ggagtgtcac tgtcgctgca acctatgcac cccgcaccgc tccctggttt gcaattcgca 4980 gctgcttaac gaaagtcaaa ttatcggtac ctttgagctg cagggtccct cgcctgacga 5040 aaagtccgcg gctccggggt tgaaactcac tccggggctg tggacgtcgg cttaccttcg 5100 caaatttgta cctgaggact accacgccca cgagattagg ttctacgaag accaatcccg 5160 cccgccaaat gcggagctta ccgcctgcgt cattacccag ggccacattc ttggccaatt 5220 gcaagccatc aacaaagccc gccaagagtt tctgctacga aagggacggg gggtttactt 5280 ggacccccag tccggcgagg agctcaaccc aatccccccg ccgccgcagc cctatcagca 5340 gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa gaagctgcag ctgccgccgc 5400 cacccacgga cgaggaggaa tactgggaca gtcaggcaga ggaggttttg gacgaggagg 5460 aggaggacat gatggaagac tgggagagcc tagacgagga agcttccgag gtcgaagagg 5520 tgtcagacga aacaccgtca ccctcggtcg cattcccctc gccggcgccc cagaaatcgg 5580 caaccggttc cagcatggct acaacctccg ctcctcaggc gccgccggca ctgcccgttc 5640 gccgacccaa ccgtagatgg gacaccactg gaaccagggc cggtaagtcc aagcagccgc 5700 cgccgttagc ccaagagcaa caacagcgcc aaggctaccg ctcatggcgc gggcacaaga 5760 acgccatagt tgcttgcttg caagactgtg ggggcaacat ctccttcgcc cgccgctttc 5820 ttctctacca tcacggcgtg gccttccccc gtaacatcct gcattactac cgtcatctct 5880 acagcccata ctgcaccggc ggcagcggca gcggcagcaa cagcagcggc cacacagaag 5940 caaaggcgac cggatagcaa gactctgaca aagcccaaga aatccacagc ggcggcagca 6000 gcaggaggag gagcgctgcg tctggcgccc aacgaacccg tatcgacccg cgagcttaga 6060 aacaggattt ttcccactct gtatgctata tttcaacaga gcaggggcca agaacaagag 6120 ctgaaaataa aaaacaggtc tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc 6180 gaagatcagc ttcggcgcac gctggaagac gcggaggctc tcttcagtaa atactgcgcg 6240 ctgactctta aggactagtt tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat 6300 ctccagcggc cacacccggc gccagcacct gtcgtcagcg ccattatgag caaggaaatt 6360 cccacgccct acatgtggag ttaccagcca caaatgggac ttgcggctgg agctgcccaa 6420 gactactcaa cccgaataaa ctacatgagc gcgggacccc acatgatatc ccgggtcaac 6480 ggaatccgcg cccaccgaaa ccgaattctc ttggaacagg cggctattac caccacacct 6540 cgtaataacc ttaatccccg tagttggccc gctgccctgg tgtaccagga aagtcccgct 6600 cccaccactg tggtacttcc cagagacgcc caggccgaag ttcagatgac taactcaggg 6660 gcgcagcttg cgggcggctt tcgtcacagg gtgcggtcgc ccgggcgacg taggttttag 6720 ggcggagtaa cttgtatgtg ttgggaattg tagttttctt aaaatgggaa gttacgtaac 6780 gtgggaaaac ggaagtgacg atttgaggaa gttgtgggtt ttttggcttt cgtttctggg 6840 cgtaggttcg cgtgcggttt tctgggtgtt ttttgtggac tttaaccgtt acgtcatttt 6900 ttagtcctat atatactcgc tctgcacttg gccctttttt acactgtgac tgattgagct 6960 ggtgccgtgt cgagtggtgt ttttttaata ggttttcttt tttactggta aggctgactg 7020 ttatggctgc cgctgtggaa gcgctgtatg ttgttctgga gcgggagggt gctattttgc 7080 ctaggcagga gggtttttca ggtgtttatg tgtttttctc tcctattaat tttgttatac 7140 ctcctatggg ggctgtaatg ttgtctctac gcctgcgggt atgtattccc ccgggctatt 7200 tcggtcgctt tttagcactg accgatgtga atcaacctga tgtgtttacc gagtcttaca 7260 ttatgactcc ggacatgacc gaggagctgt cggtggtgct ttttaatcac ggtgaccagt 7320 ttttttacgg tcacgccggc atggccgtag tccgtcttat gcttataagg gttgtttttc 7380 ctgttgtaag acaggcttct aatgtttaaa tgtttttttg ttattttatt ttgtgtttat 7440 gcagaaaccc gcagacatgt ttgagagaaa aatggtgtct ttttctgtgg tggttccgga 7500 gcttacctgc ctttatctgc atgagcatga ctacgatgtg ctttcttttt tgcgcgaggc 7560 tttgcctgat tttttgagca gcaccttgca ttttatatcg ccgcccatgc aacaagctta 7620 catcggggct acgctggtta gcatagctcc gagtatgcgt gtcataatca gtgtgggttc 7680 ttttgtcatg gttcctggcg gggaagtggc cgcgctggtc cgtgcagacc tgcacgatta 7740 tgttcagctg gccctgcgaa gggacctacg ggatcgcggt atttttgtta atgttccgct 7800 tttgaatctt atacaggtct gtgaggaacc tgaatttttg caatcatgat tcgctgcttg 7860 aggctgaagg tggagggcgc tctggagcag atttttacaa tggccggact taatattcgg 7920 gatttgctta gagatatatt gagaaggtgg cgagatgaga attatttggg catggttgaa 7980 ggtgctggaa tgtttataga ggagattcac cctgaagggt ttagccttta cgtccacttg 8040 gacgtgaggg ccgtttgcct tttggaagcc attgtgcaac atcttacaaa tgccattatc 8100 tgttctttgg ctgtagagtt tgaccacgcc accggagggg agcgcgttca cttaatagat 8160 cttcattttg aggttttgga taatcttttg gaataaaaaa aaaaacatgg ttcttccagc 8220 tcttcccgct cctcccgtgt gtgactcgca gaacgaatgt gtaggttggc tgggtgtggc 8280 ttattctgcg gtggtggatg ttatcagggc agcggcgcat gaaggagttt acatagaacc 8340 cgaagccagg gggcgcctgg atgctttgag agagtggata tactacaact actacacaga 8400 gcgatctaag cggcgagacc ggagacgcag atctgtttgt cacgcccgca cctggttttg 8460 cttcaggaaa tatgactacg tccggcgttc catttggcat gacactacga ccaacacgat 8520 ctcggttgtc tcggcgcact ccgtacagta gggatcgtct acctcctttt gagacagaaa 8580 cccgcgctac catactggag gatcatccgc tgctgcccga atgtaacact ttgacaatgc 8640 acaacgtgag ttacgtgcga ggtcttccct gcagtgtggg atttacgctg attcaggaat 8700 gggttgttcc ctgggatatg gttctaacgc gggaggagct tgtaatcctg aggaagtgta 8760 tgcacgtgtg cctgtgttgt gccaacattg atatcatgac gagcatgatg atccatggtt 8820 acgagtcctg ggctctccac tgtcattgtt ccagtcccgg ttccctgcag tgtatagccg 8880 gcgggcaggt tttggccagc tggtttagga tggtggtgga tggcgccatg tttaatcaga 8940 ggtttatatg gtaccgggag gtggtgaatt acaacatgcc aaaagaggta atgtttatgt 9000 ccagcgtgtt tatgaggggt cgccacttaa tctacctgcg cttgtggtat gatggccacg 9060 tgggttctgt ggtccccgcc atgagctttg gatacagcgc cttgcactgt gggattttga 9120 acaatattgt ggtgctgtgc tgcagttact gtgctgattt aagtgagatc agggtgcgct 9180 gctgtgcccg gaggacaagg cgccttatgc tgcgggcggt gcgaatcatc gctgaggaga 9240 ccactgccat gttgtattcc tgcaggacgg agcggcggcg gcagcagttt attcgcgcgc 9300 tgctgcagca ccaccgccct atcctgatgc acgattatga ctctaccccc atgtaggcgt 9360 ggacttctcc ttcgccgccc gttaagcaac cgcaagttgg acagcagcct gtggctcagc 9420 agctggacag cgacatgaac ttaagtgagc tgcccgggga gtttattaat atcactgatg 9480 agcgtttggc tcgacaggaa accgtgtgga atataacacc taagaatatg tctgttaccc 9540 atgatatgat gctttttaag gccagccggg gagaaaggac tgtgtactct gtgtgttggg 9600 agggaggtgg caggttgaat actagggttc tgtgagtttg attaaggtac ggtgatctgt 9660 ataagctatg tggtggtggg gctatactac tgaatgaaaa atgacttgaa attttctgca 9720 attgaaaaat aaacacgttg aaacataaca caaacgattc tttattcttg ggcaatgtat 9780 gaaaaagtgt aagaggatgt ggcaaatatt tcattaatgt agttgtggcc agaccagtcc 9840 catgaaaatg acatagagta tgcacttgga gttgtgtctc ctgtttcctg tgtaccgttt 9900 agtgtaattc aaccgcggat gtcgcccctc ctgacgcggt aggaggaggg gagggtgccc 9960 tgcatgtctg ccgctgctct tgctcttgcc gctgctgagg aggggggcgc atctgccgca 10020 gcaccggatg catctgggaa aagcaaaaaa ggggctcgtc cctgtttccg gaggaatttg 10080 caagcggggt cttgcatgac ggggaggcaa acccccgttc gccgcagtcc ggccggtccg 10140 agactcgaac cgggggtccc gcgactcaac ccttggaaaa taaccctccg gctacaggga 10200 gcgagccact taatgctttc gctttccagc ctaaccgctt acgctgcgcg cggccagtgg 10260 ccaaaaaagc tagcgcagca gccgccgcgc ctggaaggaa gccaaaagga gcactccccc 10320 gttgtctgac gtcgcacacc tgggttcgac acgcgggcgg taaccgcatg gatcacggcg 10380 gacggccgga tacggggctc gaaccccggt cgtccgccat gatacccttg cgaatttatc 10440 caccagacca cggaagagtg cccgcttaca ggctctcctt ttgcacggtc tagagcgtca 10500 acgattgcgc gcgcctgacc ggccagagcg tcccgaccat ggagcacttt ttgccgctgc 10560 gcaacatctg gaaccgcgtc cgcgactttc cgcgcgcctc caccaccgcc gccggcatca 10620 cctggatgtc caggtacatc tacggatatc atttaattaa gtactgtcga cgcgtacaaa 10680 acgtcaaaag ggcgacacaa aatttattct aaatgcataa taaatactga taacatctta 10740 tagtttgtat tatattttgt attatcgttg acatgtataa ttttgatatc aaaaactgat 10800 tttcccttta ttattttcga gatttatttt cttaattctc tttaacaaac tagaaatatt 10860 gtatatacaa aaaatcataa ataatagatg aatagtttaa ttataggtgt tcatcaatcg 10920 aaaaagcaac gtatcttatt taaagtgcgt tgcttttttc tcatttataa ggttaaataa 10980 ttctcatata tcaagcaaag tgacaggcgc ccttaaatat tctgacaaat gctctttccc 11040 taaactcccc ccataaaaaa acccgccgaa gcgggttttt acgttatttg cggattaacg 11100 attactcgtt atcagaaccg cccagggggc ccgagcttaa gactggccgt cgttttacaa 11160 cacagaaaga gtttgtagaa acgcaaaaag gccatccgtc aggggccttc tgcttagttt 11220 gatgcctggc agttccctac tctcgccttc cgcttcctcg ctcactgact cgctgcgctc 11280 ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 11340 agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 11400 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 11460 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 11520 gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 11580 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 11640 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 11700 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 11760 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 11820 tgctacagag ttcttgaagt ggtgggctaa ctacggctac actagaagaa cagtatttgg 11880 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 11940 caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 12000 aaa 12003 <210> 15 <211> 17817 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 60 accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 120 taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 180 tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 240 tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 300 gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 360 cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 420 gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 480 ttcttctaat acctggaacg ctgtttttcc ggggatcgca gtggtgagta accatgcatc 540 atcaggagta cggataaaat gcttgatggt cggaagtggc ataaattccg tcagccagtt 600 tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 660 caactctggc gcatcgggct tcccatacaa gcgatagatt gtcgcacctg attgcccgac 720 attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 780 cctcgacgtt tcccgttgaa tatggctcat attcttcctt tttcaatatt attgaagcat 840 ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 900 aataggggtc agtgttacaa ccaattaacc aattctgaac attatcgcga gcccatttat 960 acctgaatat ggctcataac accccttgtt tgcctggcgg cagtagcgcg gtggtcccac 1020 ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggactc 1080 cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac 1140 tgggcctttc gcccgggcta attagggggt gtcgcccttc gctgaagggg tgaccgtata 1200 cgtttaaact taattaatcg acagaagcac catgtccttg ggtccggcct gctgaatgcg 1260 caggcggtcg gccatgcccc aggcttcgtt ttgacatcgg cgcaggtctt tgtagtagtc 1320 ttgcatgagc ctttctaccg gcacttcttc ttctccttcc tcttgtcctg catctcttgc 1380 atctatcgct gcggcggcgg cggagtttgg ccgtaggtgg cgccctcttc ctcccatgcg 1440 tgtgaccccg aagcccctca tcggctgaag cagggctagg tcggcgacaa cgcgctcggc 1500 taatatggcc tgctgcacct gcgtgagggt agactggaag tcatccatgt ccacaaagcg 1560 gtggtatgcg cccgtgttga tggtgtaagt gcagttggcc ataacggacc agttaacggt 1620 ctggtgaccc ggctgcgaga gctcggtgta cctgagacgc gagtaagccc tcgagtcaaa 1680 tacgtagtcg ttgcaagtcc gcaccaggta ctggtatccc accaaaaagt gcggcggcgg 1740 ctggcggtag aggggccagc gtagggtggc cggggctccg ggggcgagat cttccaacat 1800 aaggcgatga tatccgtaga tgtacctgga catccaggtg atgccggcgg cggtggtgga 1860 ggcgcgcgga aagtcgcgga cgcggttcca gatgttgcgc agcggcaaaa agtgctccat 1920 ggtcgggacg ctctggccgg tcaggcgcgc gcaatcgttg acgctctaga ccgtgcaaaa 1980 ggagagcctg taagcgggca ctcttccgtg gtctggtgga taaattcgca agggtatcat 2040 ggcggacgac cggggttcga gccccgtatc cggccgtccg ccgtgatcca tgcggttacc 2100 gcccgcgtgt cgaacccagg tgtgcgacgt cagacaacgg gggagtgctc cttttggctt 2160 ccttccaggc gcggcggctg ctgcgctagc ttttttggcc actggccgcg cgcagcgtaa 2220 gcggttaggc tggaaagcga aagcattaag tggctcgctc cctgtagccg gagggttatt 2280 ttccaagggt tgagtcgcgg gacccccggt tcgagtctcg gaccggccgg actgcggcga 2340 acgggggttt gcctccccgt catgcaagac cccgcttgca aattcctccg gaaacaggga 2400 cgagcccctt ttttgctttt cccagatgca tccggtgctg cggcagatgc gcccccctcc 2460 tcagcagcgg caagagcaag agcagcggca gacatgcagg gcaccctccc ctcctcctac 2520 cgcgtcagga ggggcgacat ccgcggttga cgcggcagca gatggtgatt acgaaccccc 2580 gcggcgccgg gcccggcact acctggactt ggaggagggc gagggcctgg cgcggctagg 2640 agcgccctct cctgagcggt acccaagggt gcagctgaag cgtgatacgc gtgaggcgta 2700 cgtgccgcgg cagaacctgt ttcgcgaccg cgagggagag gagcccgagg agatgcggga 2760 tcgaaagttc cacgcagggc gcgagctgcg gcatggcctg aatcgcgagc ggttgctgcg 2820 cgaggaggac tttgagcccg acgcgcgaac cgggattagt cccgcgcgcg cacacgtggc 2880 ggccgccgac ctggtaaccg catacgagca gacggtgaac caggagatta actttcaaaa 2940 aagctttaac aaccacgtgc gtacgcttgt ggcgcgcgag gaggtggcta taggactgat 3000 gcatctgtgg gactttgtaa gcgcgctgga gcaaaaccca aatagcaagc cgctcatggc 3060 gcagctgttc cttatagtgc agcacagcag ggacaacgag gcattcaggg atgcgctgct 3120 aaacatagta gagcccgagg gccgctggct gctcgatttg ataaacatcc tgcagagcat 3180 agtggtgcag gagcgcagct tgagcctggc tgacaaggtg gccgccatca actattccat 3240 gcttagcctg ggcaagtttt acgcccgcaa gatataccat accccttacg ttcccataga 3300 caaggaggta aagatcgagg ggttctacat gcgcatggcg ctgaaggtgc ttaccttgag 3360 cgacgacctg ggcgtttatc gcaacgagcg catccacaag gccgtgagcg tgagccggcg 3420 gcgcgagctc agcgaccgcg agctgatgca cagcctgcaa agggccctgg ctggcacggg 3480 cagcggcgat agagaggccg agtcctactt tgacgcgggc gctgacctgc gctgggcccc 3540 aagccgacgc gccctggagg cagctggggc cggacctggg ctggcggtgg cacccgcgcg 3600 cgctggcaac gtcggcggcg tggaggaata tgacgaggac gatgagtacg agccagagga 3660 cggcgagtac taagcggtga tgtttctgat cagatgatgc aagacgcaac ggacccggcg 3720 gtgcgggcgg cgctgcagag ccagccgtcc ggccttaact ccacggacga ctggcgccag 3780 gtcatggacc gcatcatgtc gctgactgcg cgcaatcctg acgcgttccg gcagcagccg 3840 caggccaacc ggctctccgc aattctggaa gcggtggtcc cggcgcgcgc aaaccccacg 3900 cacgagaagg tgctggcgat cgtaaacgcg ctggccgaaa acagggccat ccggcccgac 3960 gaggccggcc tggtctacga cgcgctgctt cagcgcgtgg ctcgttacaa cagcggcaac 4020 gtgcagacca acctggaccg gctggtgggg gatgtgcgcg aggccgtggc gcagcgtgag 4080 cgcgcgcagc agcagggcaa cctgggctcc atggttgcac taaacgcctt cctgagtaca 4140 cagcccgcca acgtgccgcg gggacaggag gactacacca actttgtgag cgcactgcgg 4200 ctaatggtga ctgagacacc gcaaagtgag gtgtaccagt ctgggccaga ctattttttc 4260 cagaccagta gacaaggcct gcagaccgta aacctgagcc aggctttcaa aaacttgcag 4320 gggctgtggg gggtgcgggc tcccacaggc gaccgcgcga ccgtgtctag cttgctgacg 4380 cccaactcgc gcctgttgct gctgctaata gcgcccttca cggacagtgg cagcgtgtcc 4440 cgggacacat acctaggtca cttgctgaca ctgtaccgcg aggccatagg tcaggcgcat 4500 gtggacgagc atactttcca ggagattaca agtgtcagcc gcgcgctggg gcaggaggac 4560 acgggcagcc tggaggcaac cctaaactac ctgctgacca accggcggca gaagatcccc 4620 tcgttgcaca gtttcgcacc ctttggcgca tcccattctc cagtaacttt atgtccatgg 4680 gcgcactcac agacctgggc caaaaccttc tctacgccaa ctccgcccac gcgctagaca 4740 tgacttttga ggtggatccc atggacgagc ccacccttct ttatgttttg tttgaagtct 4800 ttgacgtggt ccgtgtgcac cggccgcacc gcggcgtcat cgaaaccgtg tacctgcgca 4860 cgcccttctc ggccggcaac gccacaacat aaagaagcaa gcaacatcaa caacagctgc 4920 cgccatgggc tccagtgagc aggaactgaa agccattgtc aaagatcttg gttgtgggcc 4980 atattttttg ggcacctatg acaagcgctt tccaggcttt gtttctccac acaagctcgc 5040 ctgcgccata gtcaatacgg ccggtcgcga gactgggggc gtacactgga tggcctttgc 5100 ctggaacccg cactcaaaaa catgctacct ctttgagccc tttggctttt ctgaccagcg 5160 actcaagcag gtttaccagt ttgagtacga gtcactcctg cgccgtagcg ccattgcttc 5220 ttcccccgac cgctgtataa cgctggaaaa gtccacccaa agcgtacagg ggcccaactc 5280 ggccgcctgt ggactattct gctgcatgtt tctccacgcc tttgccaact ggccccaaac 5340 tcccatggat cacaacccca ccatgaacct tattaccggg gtacccaact ccatgctcaa 5400 cagtccccag gtacagccca ccctgcgtcg caaccaggaa cagctctaca gcttcctgga 5460 gcgccactcg ccctacttcc gcagccacag tgcgcagatt aggagcgcca cttctttttg 5520 tcacttgaaa aacatgtaaa aataatgtac tagagacact ttcaataaag gcaaatgctt 5580 ttatttgtac actctcgggt gattatttac ccccaccctt gccgtctgcg ccgtttaaaa 5640 atcaaagggg ttctgccgcg catcgctatg cgccactggc agggacacgt tgcgatactg 5700 gtgtttagtg ctccacttaa actcaggcac aaccatccgc ggcagctcgg tgaagttttc 5760 actccacagg ctgcgcacca tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa 5820 gtcgcagttg gggcctccgc cctgcgcgcg cgagttgcga tacacagggt tgcagcactg 5880 gaacactatc agcgccgggt ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc 5940 cgcgtccagg tcctccgcgt tgctcagggc gaacggagtc aactttggta gctgccttcc 6000 caaaaagggc gcgtgcccag gctttgagtt gcactcgcac cgtagtggca tcaaaaggtg 6060 accgtgcccg gtctgggcgt taggatacag cgcctgcata aaagccttga tctgcttaaa 6120 agccacctga gcctttgcgc cttcagagaa gaacatgccg caagacttgc cggaaaactg 6180 attggccgga caggccgcgt cgtgcacgca gcaccttgcg tcggtgttgg agatctgcac 6240 cacatttcgg ccccaccggt tcttcacgat cttggccttg ctagactgct ccttcagcgc 6300 gcgctgcccg ttttcgctcg tcacatccat ttcaatcacg tgctccttat ttatcataat 6360 gcttccgtgt agacacttaa gctcgccttc gatctcagcg cagcggtgca gccacaacgc 6420 gcagcccgtg ggctcgtgat gcttgtaggt cacctctgca aacgactgca ggtacgcctg 6480 caggaatcgc cccatcatcg tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc 6540 gcggtgctcc tcgttcagcc aggtcttgca tacggccgcc agagcttcca cttggtcagg 6600 cagtagtttg aagttcgcct ttagatcgtt atccacgtgg tacttgtcca tcagcgcgcg 6660 cgcagcctcc atgcccttct cccacgcaga cacgatcggc acactcagcg ggttcatcac 6720 cgtaatttca ctttccgctt cgctgggctc ttcctcttcc tcttgcgtcc gcataccacg 6780 cgccactggg tcgtcttcat tcagccgccg cactgtgcgc ttacctcctt tgccatgctt 6840 gattagcacc ggtgggttgc tgaaacccac catttgtagc gccacatctt ctctttcttc 6900 ctcgctgtcc acgattacct ctggtgatgg cgggcgctcg ggcttgggag aagggcgctt 6960 ctttttcttc ttgggcgcaa tggccaaatc cgccgccgag gtcgatggcc gcgggctggg 7020 tgtgcgcggc accagcgcgt cttgtgatga gtcttcctcg tcctcggact cgatacgccg 7080 cctcatccgc ttttttgggg gcgcccgggg aggcggcggc gacggggacg gggacgacac 7140 gtcctccatg gttgggggac gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg 7200 ctgctcctct tcccgactgg ccatttcctt ctcctatagg cagaaaaaga tcatggagtc 7260 agtcgagaag aaggacagcc taaccgcccc ctctgagttc gccaccaccg cctccaccga 7320 tgccgccaac gcgcctacca ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt 7380 gattatcgag caggacccag gttttgtaag cgaagacgac gaggaccgct cagtaccaac 7440 agaggataaa aagcaagacc aggacaacgc agaggcaaac gaggaacaag tcgggcgggg 7500 ggacgaaagg catggcgact acctagatgt gggagacgac gtgctgttga agcatctgca 7560 gcgccagtgc gccattatct gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat 7620 agcggatgtc agccttgcct acgaacgcca cctattctca ccgcgcgtac cccccaaacg 7680 ccaagaaaac ggcacatgcg agcccaaccc gcgcctcaac ttctaccccg tatttgccgt 7740 gccagaggtg cttgccacct atcacatctt tttccaaaac tgcaagatac ccctatcctg 7800 ccgtgccaac cgcagccgag cggacaagca gctggccttg cggcagggcg ctgtcatacc 7860 tgatatcgcc tcgctcaacg aagtgccaaa aatctttgag ggtcttggac gcgacgagaa 7920 gcgcgcggca aacgctctgc aacaggaaaa cagcgaaaat gaaagtcact ctggagtgtt 7980 ggtggaactc gagggtgaca acgcgcgcct agccgtacta aaacgcagca tcgaggtcac 8040 ccactttgcc tacccggcac ttaacctacc ccccaaggtc atgagcacag tcatgagtga 8100 gctgatcgtg cgccgtgcgc agcccctgga gagggatgca aatttgcaag aacaaacaga 8160 ggagggccta cccgcagttg gcgacgagca gctagcgcgc tggcttcaaa cgcgcgagcc 8220 tgccgacttg gaggagcgac gcaaactaat gatggccgca gtgctcgtta ccgtggagct 8280 tgagtgcatg cagcggttct ttgctgaccc ggagatgcag cgcaagctag aggaaacatt 8340 gcactacacc tttcgacagg gctacgtacg ccaggcctgc aagatctcca acgtggagct 8400 ctgcaacctg gtctcctacc ttggaatttt gcacgaaaac cgccttgggc aaaacgtgct 8460 tcattccacg ctcaagggcg aggcgcgccg cgactacgtc cgcgactgcg tttacttatt 8520 tctatgctac acctggcaga cggccatggg cgtttggcag cagtgcttgg aggagtgcaa 8580 cctcaaggag ctgcagaaac tgctaaagca aaacttgaag gacctatgga cggccttcaa 8640 cgagcgctcc gtggccgcgc acctggcgga catcattttc cccgaacgcc tgcttaaaac 8700 cctgcaacag ggtctgccag acttcaccag tcaaagcatg ttgcagaact ttaggaactt 8760 tatcctagag cgctcaggaa tcttgcccgc cacctgctgt gcacttccta gcgactttgt 8820 gcccattaag taccgcgaat gccctccgcc gctttggggc cactgctacc ttctgcagct 8880 agccaactac cttgcctacc actctgacat aatggaagac gtgagcggtg acggtctact 8940 ggagtgtcac tgtcgctgca acctatgcac cccgcaccgc tccctggttt gcaattcgca 9000 gctgcttaac gaaagtcaaa ttatcggtac ctttgagctg cagggtccct cgcctgacga 9060 aaagtccgcg gctccggggt tgaaactcac tccggggctg tggacgtcgg cttaccttcg 9120 caaatttgta cctgaggact accacgccca cgagattagg ttctacgaag accaatcccg 9180 cccgccaaat gcggagctta ccgcctgcgt cattacccag ggccacattc ttggccaatt 9240 gcaagccatc aacaaagccc gccaagagtt tctgctacga aagggacggg gggtttactt 9300 ggacccccag tccggcgagg agctcaaccc aatccccccg ccgccgcagc cctatcagca 9360 gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa gaagctgcag ctgccgccgc 9420 cacccacgga cgaggaggaa tactgggaca gtcaggcaga ggaggttttg gacgaggagg 9480 aggaggacat gatggaagac tgggagagcc tagacgagga agcttccgag gtcgaagagg 9540 tgtcagacga aacaccgtca ccctcggtcg cattcccctc gccggcgccc cagaaatcgg 9600 caaccggttc cagcatggct acaacctccg ctcctcaggc gccgccggca ctgcccgttc 9660 gccgacccaa ccgtagatgg gacaccactg gaaccagggc cggtaagtcc aagcagccgc 9720 cgccgttagc ccaagagcaa caacagcgcc aaggctaccg ctcatggcgc gggcacaaga 9780 acgccatagt tgcttgcttg caagactgtg ggggcaacat ctccttcgcc cgccgctttc 9840 ttctctacca tcacggcgtg gccttccccc gtaacatcct gcattactac cgtcatctct 9900 acagcccata ctgcaccggc ggcagcggca gcggcagcaa cagcagcggc cacacagaag 9960 caaaggcgac cggatagcaa gactctgaca aagcccaaga aatccacagc ggcggcagca 10020 gcaggaggag gagcgctgcg tctggcgccc aacgaacccg tatcgacccg cgagcttaga 10080 aacaggattt ttcccactct gtatgctata tttcaacaga gcaggggcca agaacaagag 10140 ctgaaaataa aaaacaggtc tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc 10200 gaagatcagc ttcggcgcac gctggaagac gcggaggctc tcttcagtaa atactgcgcg 10260 ctgactctta aggactagtt tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat 10320 ctccagcggc cacacccggc gccagcacct gtcgtcagcg ccattatgag caaggaaatt 10380 cccacgccct acatgtggag ttaccagcca caaatgggac ttgcggctgg agctgcccaa 10440 gactactcaa cccgaataaa ctacatgagc gcgggacccc acatgatatc ccgggtcaac 10500 ggaatccgcg cccaccgaaa ccgaattctc ttggaacagg cggctattac caccacacct 10560 cgtaataacc ttaatccccg tagttggccc gctgccctgg tgtaccagga aagtcccgct 10620 cccaccactg tggtacttcc cagagacgcc caggccgaag ttcagatgac taactcaggg 10680 gcgcagcttg cgggcggctt tcgtcacagg gtgcggtcgc ccgggcaggg tataactcac 10740 ctgacaatca gagggcgagg tattcagctc aacgacgagt cggtgagctc ctcgcttggt 10800 ctccgtccgg acgggacatt tcagatcggc ggcgccggcc gtccttcatt cacgcctcgt 10860 caggcaatcc taactctgca gacctcgtcc tctgagccgc gctctggagg cattggaact 10920 ctgcaattta ttgaggagtt tgtgccatcg gtctacttta accccttctc gggacctccc 10980 ggccactatc cggatcaatt tattcctaac tttgacgcgg taaaggactc ggcggacggc 11040 tacgactgaa tgttaagtgg agaggcagag caactgcgcc tgaaacacct ggtccactgt 11100 cgccgccaca agtgctttgc ccgcgactcc ggtgagtttt gctactttga attgcccgag 11160 gatcatatcg agggcccggc gcacggcgtc cggcttaccg cccagggaga gcttgcccgt 11220 agcctgattc gggagtttac ccagcgcccc ctgctagttg agcgggacag gggaccctgt 11280 gttctcactg tgatttgcaa ctgtcgatct tattcccttt aactaataaa aaaaaataat 11340 aaagcatcac ttacttaaaa tcagttagca aatttctgtc cagtttattc agcagcacct 11400 ccttgccctc ctcccagctc tggtattgca gcttcctcct ggctgcaaac tttctccaca 11460 atctaaatgg aatgtcagtt tcctcctgtt cctgtccatc cgcacccact atcttcatgt 11520 tgttgcagat gaagcgcgca agaccgtctg aagatacctt caaccccgtg tatccatatg 11580 acacggaaac cggtcctcca actgtgcctt ttcttactcc tccctttgta tcccccaatg 11640 ggtttcaaga gagtccccct ggggtactct ctttgcgcct atccgaacct ctagttacct 11700 ccaatggcat gcttgcgctc aaaatgggca acggcctctc tctggacgag gccggcaacc 11760 ttacctccca aaatgtaacc actgtgagcc cacctctcaa aaaaaccaag tcaaacataa 11820 acctggaaat atctgcaccc ctcacagtta cctcagaagc cctaactgtg gctgccgccg 11880 cacctctaat ggtcgcgggc aacacactca ccatgcaatc acaggccccg ctaaccgtgc 11940 acgactccaa acttagcatt gccacccaag gacccctcac agtgtcagaa ggaaagctag 12000 ccctgcaaac atcaggcccc ctcaccacca ccgatagcag tacccttact atcactgcct 12060 caccccctct aactactgcc actggtagct tgggcattga cttgaaagag cccatttata 12120 cacaaaatgg aaaactagga ctaaagtacg gggctccttt gcatgtaaca gacgacctaa 12180 acactttgac cgtagcaact ggtccaggtg tgactattaa taatacttcc ttgcaaacta 12240 aagttactgg agccttgggt tttgattcac aaggcaatat gcaacttaat gtagcaggag 12300 gactaaggat tgattctcaa aacagacgcc ttatacttga tgttagttat ccgtttgatg 12360 ctcaaaacca actaaatcta agactaggac agggccctct ttttataaac tcagcccaca 12420 acttggatat taactacaac aaaggccttt acttgtttac agcttcaaac aattccaaaa 12480 agcttgaggt taacctaagc actgccaagg ggttgatgtt tgacgctaca gccatagcca 12540 ttaatgcagg agatgggctt gaatttggtt cacctaatgc accaaacaca aatcccctca 12600 aaacaaaaat tggccatggc ctagaatttg attcaaacaa ggctatggtt cctaaactag 12660 gaactggcct tagttttgac agcacaggtg ccattacagt aggaaacaaa aataatgata 12720 agctaacttt gtggaccaca ccagctccat ctcctaactg tagactaaat gcagagaaag 12780 atgctaaact cactttggtc ttaacaaaat gtggcagtca aatacttgct acagtttcag 12840 ttttggctgt taaaggcagt ttggctccaa tatctggaac agttcaaagt gctcatctta 12900 ttataagatt tgacgaaaat ggagtgctac taaacaattc cttcctggac ccagaatatt 12960 ggaactttag aaatggagat cttactgaag gcacagccta tacaaacgct gttggattta 13020 tgcctaacct atcagcttat ccaaaatctc acggtaaaac tgccaaaagt aacattgtca 13080 gtcaagttta cttaaacgga gacaaaacta aacctgtaac actaaccatt acactaaacg 13140 gtacacagga aacaggagac acaactccaa gtgcatactc tatgtcattt tcatgggact 13200 ggtctggcca caactacatt aatgaaatat ttgccacatc ctcttacact ttttcataca 13260 ttgcccaaga ataaagaatc gtttgtgtta tgtttcaacg tgtttatttt tcaattgcag 13320 aaaatttcaa gtcatttttc attcagtagt atagccccac caccacatag cttatacaga 13380 tcaccgtacc ttaatcaaac tcacagaacc ctagtattca acctgccacc tccctcccaa 13440 cacacagagt acacagtcct ttctccccgg ctggccttaa aaagcatcat atcatgggta 13500 acagacatat tcttaggtgt tatattccac acggtttcct gtcgagccaa acgctcatca 13560 gtgatattaa taaactcccc gggcagctca cttaagttca tgtcgctgtc cagctgctga 13620 gccacaggct gctgtccaac ttgcggttgc ttaacgggcg gcgaaggaga agtccacgcc 13680 tacatggggg tagagtcata atcgtgcatc aggatagggc ggtggtgctg cagcagcgcg 13740 cgaataaact gctgccgccg ccgctccgtc ctgcaggaat acaacatggc agtggtctcc 13800 tcagcgatga ttcgcaccgc ccgcagcata aggcgccttg tcctccgggc acagcagcgc 13860 accctgatct cacttaaatc agcacagtaa ctgcagcaca gcaccacaat attgttcaaa 13920 atcccacagt gcaaggcgct gtatccaaag ctcatggcgg ggaccacaga acccacgtgg 13980 ccatcatacc acaagcgcag gtagattaag tggcgacccc tcataaacac gctggacata 14040 aacattacct cttttggcat gttgtaattc accacctccc ggtaccatat aaacctctga 14100 ttaaacatgg cgccatccac caccatccta aaccagctgg ccaaaacctg cccgccggct 14160 atacactgca gggaaccggg actggaacaa tgacagtgga gagcccagga ctcgtaacca 14220 tggatcatca tgctcgtcat gatatcaatg ttggcacaac acaggcacac gtgcatacac 14280 ttcctcagga ttacaagctc ctcccgcgtt agaaccatat cccagggaac aacccattcc 14340 tgaatcagcg taaatcccac actgcaggga agacctcgca cgtaactcac gttgtgcatt 14400 gtcaaagtgt tacattcggg cagcagcgga tgatcctcca gtatggtagc gcgggtttct 14460 gtctcaaaag gaggtagacg atccctactg tacggagtgc gccgagacaa ccgagatcgt 14520 gttggtcgta gtgtcatgcc aaatggaacg ccggacgtag tcatatttcc tgaagcaaaa 14580 ccaggtgcgg gcgtgacaaa cagatctgcg tctccggtct cgccgcttag atcgctctgt 14640 gtagtagttg tagtatatcc actctctcaa agcatccagg cgccccctgg cttcgggttc 14700 tatgtaaact ccttcatgcg ccgctgccct gataacatcc accaccgcag aataagccac 14760 acccagccaa cctacacatt cgttctgcga gtcacacacg ggaggagcgg gaagagctgg 14820 aagaaccatg tttttttttt tattccaaaa gattatccaa aacctcaaaa tgaagatcta 14880 ttaagtgaac gcgctcccct ccggtggcgt ggtcaaactc tacagccaaa gaacagataa 14940 tggcatttgt aagatgttgc acaatggctt ccaaaaggca aacggccctc acgtccaagt 15000 ggacgtaaag gctaaaccct tcagggtgaa tctcctctat aaacattcca gcaccttcaa 15060 ccatgcccaa ataattctca tctcgccacc ttctcaatat atctctaagc aaatcccgaa 15120 tattaagtcc ggccattgta aaaatctgct ccagagcgcc ctccaccttc agcctcaagc 15180 agcgaatcat gattgcaaaa attcaggttc ctcacagacc tgtataagat tcaaaagcgg 15240 aacattaaca aaaataccgc gatcccgtag gtcccttcgc agggccagct gaacataatc 15300 gtgcaggtct gcacggacca gcgcggccac ttccccgcca ggaaccatga caaaagaacc 15360 cacactgatt atgacacgca tactcggagc tatgctaacc agcgtagccc cgatgtaagc 15420 ttgttgcatg ggcggcgata taaaatgcaa ggtgctgctc aaaaaatcag gcaaagcctc 15480 gcgcaaaaaa gaaagcacat cgtagtcatg ctcatgcaga taaaggcagg taagctccgg 15540 aaccaccaca gaaaaagaca ccatttttct ctcaaacatg tctgcgggtt tctgcataaa 15600 cacaaaataa aataacaaaa aaacatttaa acattagaag cctgtcttac aacaggaaaa 15660 acaaccctta taagcataag acggactacg gccatgccgg cgtgaccgta aaaaaactgg 15720 tcaccgtgat taaaaagcac caccgacagc tcctcggtca tgtccggagt cataatgtaa 15780 gactcggtaa acacatcagg ttgattcaca tcggtcagtg ctaaaaagcg accgaaatag 15840 cccgggggaa tacatacccg caggcgtaga gacaacatta cagcccccat aggaggtata 15900 acaaaattaa taggagagaa aaacacataa acacctgaaa aaccctcctg cctaggcaaa 15960 atagcaccct cccgctccag aacaacatac agcgcttcca cagcggcagc cataacagtc 16020 agccttacca gtaaaaaaga aaacctatta aaaaaacacc actcgacacg gcaccagctc 16080 aatcagtcac agtgtaaaaa agggccaagt gcagagcgag tatatatagg actaaaaaat 16140 gacgtaacgg ttaaagtcca caaaaaacac ccagaaaacc gcacgcgaac ctacgcccag 16200 aaacgaaagc caaaaaaccc acaacttcct caaatcgtca cttccgtttt cccacgttac 16260 gtaacttccc attttaagaa aactacaatt cccaacacat acaagttact ccgccctaaa 16320 acctacgtca acgttattta aatgtcgacg cgtacaaaac gtcaaaaggg cgacacaaaa 16380 tttattctaa atgcataata aatactgata acatcttata gtttgtatta tattttgtat 16440 tatcgttgac atgtataatt ttgatatcaa aaactgattt tccctttatt attttcgaga 16500 tttattttct taattctctt taacaaacta gaaatattgt atatacaaaa aatcataaat 16560 aatagatgaa tagtttaatt ataggtgttc atcaatcgaa aaagcaacgt atcttattta 16620 aagtgcgttg cttttttctc atttataagg ttaaataatt ctcatatatc aagcaaagtg 16680 acaggcgccc ttaaatattc tgacaaatgc tctttcccta aactcccccc ataaaaaaac 16740 ccgccgaagc gggtttttac gttatttgcg gattaacgat tactcgttat cagaaccgcc 16800 cagggggccc gagcttaaga ctggccgtcg ttttacaaca cagaaagagt ttgtagaaac 16860 gcaaaaaggc catccgtcag gggccttctg cttagtttga tgcctggcag ttccctactc 16920 tcgccttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 16980 gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 17040 aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 17100 gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 17160 aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 17220 gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 17280 ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 17340 cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 17400 ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 17460 actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 17520 tgggctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 17580 gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 17640 ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 17700 cctttgatct tttctacggg gtctgacgct cagtggaacg acgcgcgcgt aactcacgtt 17760 aagggatttt ggtcatgagc ttgcgccgtc ccgtcaagtc agcgtaatgc tctgctt 17817 <210> 16 <211> 743 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 16 tgatatccgt agatgtacct ggacatccag gtgatgccgg cggcggtggt ggaggcgcgc 60 ggaaagtcgc ggacgcggtt ccagatgttg cgcagcggca aaaagtgctc catggtcggg 120 acgctctggc cggtcaggcg cgcgcaatcg ttgacgctct agaccgtgca aaaggagagc 180 ctgtaagcgg gcactcttcc gtggtctggt ggataaattc gcaagggtat catggcggac 240 gaccggggtt cgagccccgt atccggccgt ccgccgtgat ccatgcggtt accgcccgcg 300 tgtcgaaccc aggtgtgcga cgtcagacaa cgggggagtg ctccttttgg cttccttcca 360 ggcgcggcgg ctgctgcgct agcttttttg gccactggcc gcgcgcagcg taagcggtta 420 ggctggaaag cgaaagcatt aagtggctcg ctccctgtag ccggagggtt attttccaag 480 ggttgagtcg cgggaccccc ggttcgagtc tcggaccggc cggactgcgg cgaacggggg 540 tttgcctccc cgtcatgcaa gaccccgctt gcaaattcct ccggaaacag ggacgagccc 600 cttttttgct tttcccagat gcatccggtg ctgcggcaga tgcgcccccc tcctcagcag 660 cggcaagagc aagagcagcg gcagacatgc agggcaccct cccctcctcc taccgcgtca 720 ggaggggcga catccgcggt tga 743 <210> 17 <211> 3201 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 17 cgacgtaggt tttagggcgg agtaacttgt atgtgttggg aattgtagtt ttcttaaaat 60 gggaagttac gtaacgtggg aaaacggaag tgacgatttg aggaagttgt gggttttttg 120 gctttcgttt ctgggcgtag gttcgcgtgc ggttttctgg gtgttttttg tggactttaa 180 ccgttacgtc attttttagt cctatatata ctcgctctgc acttggccct tttttacact 240 gtgactgatt gagctggtgc cgtgtcgagt ggtgtttttt taataggttt tcttttttac 300 tggtaaggct gactgttatg gctgccgctg tggaagcgct gtatgttgtt ctggagcggg 360 agggtgctat tttgcctagg caggagggtt tttcaggtgt ttatgtgttt ttctctccta 420 ttaattttgt tatacctcct atgggggctg taatgttgtc tctacgcctg cgggtatgta 480 ttcccccggg ctatttcggt cgctttttag cactgaccga tgtgaatcaa cctgatgtgt 540 ttaccgagtc ttacattatg actccggaca tgaccgagga gctgtcggtg gtgcttttta 600 atcacggtga ccagtttttt tacggtcacg ccggcatggc cgtagtccgt cttatgctta 660 taagggttgt ttttcctgtt gtaagacagg cttctaatgt ttaaatgttt ttttgttatt 720 ttattttgtg tttatgcaga aacccgcaga catgtttgag agaaaaatgg tgtctttttc 780 tgtggtggtt ccggagctta cctgccttta tctgcatgag catgactacg atgtgctttc 840 ttttttgcgc gaggctttgc ctgatttttt gagcagcacc ttgcatttta tatcgccgcc 900 catgcaacaa gcttacatcg gggctacgct ggttagcata gctccgagta tgcgtgtcat 960 aatcagtgtg ggttcttttg tcatggttcc tggcggggaa gtggccgcgc tggtccgtgc 1020 agacctgcac gattatgttc agctggccct gcgaagggac ctacgggatc gcggtatttt 1080 tgttaatgtt ccgcttttga atcttataca ggtctgtgag gaacctgaat ttttgcaatc 1140 atgattcgct gcttgaggct gaaggtggag ggcgctctgg agcagatttt tacaatggcc 1200 ggacttaata ttcgggattt gcttagagat atattgagaa ggtggcgaga tgagaattat 1260 ttgggcatgg ttgaaggtgc tggaatgttt atagaggaga ttcaccctga agggtttagc 1320 ctttacgtcc acttggacgt gagggccgtt tgccttttgg aagccattgt gcaacatctt 1380 acaaatgcca ttatctgttc tttggctgta gagtttgacc acgccaccgg aggggagcgc 1440 gttcacttaa tagatcttca ttttgaggtt ttggataatc ttttggaata aaaaaaaaaa 1500 catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560 ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620 agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680 caactactac acagagcgat ctaagcggcg agaccggaga cgcagatctg tttgtcacgc 1740 ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800 tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgtctacctc 1860 cttttgagac agaaacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920 acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980 cgctgattca ggaatgggtt gttccctggg atatggttct aacgcgggag gagcttgtaa 2040 tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100 tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160 tgcagtgtat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220 ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280 aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340 ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400 actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460 agatcagggt gcgctgctgt gcccggagga caaggcgcct tatgctgcgg gcggtgcgaa 2520 tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580 agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640 cccccatgta ggcgtggact tctccttcgc cgcccgttaa gcaaccgcaa gttggacagc 2700 agcctgtggc tcagcagctg gacagcgaca tgaacttaag tgagctgccc ggggagttta 2760 ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820 atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880 actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940 ggtacggtga tctgtataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000 ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacacaaac gattctttat 3060 tcttgggcaa tgtatgaaaa agtgtaagag gatgtggcaa atatttcatt aatgtagttg 3120 tggccagacc agtcccatga aaatgacata gagtatgcac ttggagttgt gtctcctgtt 3180 tcctgtgtac cgtttagtgt a 3201 <210> 18 <211> 5336 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 18 caccctgtga cgaaagccgc ccgcaagctg cgcccctgag ttagtcatct gaacttcggc 60 ctgggcgtct ctgggaagta ccacagtggt gggagcggga ctttcctggt acaccagggc 120 agcgggccaa ctacggggat taaggttatt acgaggtgtg gtggtaatag ccgcctgttc 180 caagagaatt cggtttcggt gggcgcggat tccgttgacc cgggatatca tgtggggtcc 240 cgcgctcatg tagtttattc gggttgagta gtcttgggca gctccagccg caagtcccat 300 ttgtggctgg taactccaca tgtagggcgt gggaatttcc ttgctcataa tggcgctgac 360 gacaggtgct ggcgccgggt gtggccgctg gagatgacgt agttttcgcg cttaaatttg 420 agaaagggcg cgaaactagt ccttaagagt cagcgcgcag tatttactga agagagcctc 480 cgcgtcttcc agcgtgcgcc gaagctgatc ttcgcttttg tgatacaggc agctgcgggt 540 gagggatcgc agagacctgt tttttatttt cagctcttgt tcttggcccc tgctctgttg 600 aaatatagca tacagagtgg gaaaaatcct gtttctaagc tcgcgggtcg atacgggttc 660 gttgggcgcc agacgcagcg ctcctcctcc tgctgctgcc gccgctgtgg atttcttggg 720 ctttgtcaga gtcttgctat ccggtcgcct ttgcttctgt gtggccgctg ctgttgctgc 780 cgctgccgct gccgccggtg cagtatgggc tgtagagatg acggtagtaa tgcaggatgt 840 tacgggggaa ggccacgccg tgatggtaga gaagaaagcg gcgggcgaag gagatgttgc 900 ccccacagtc ttgcaagcaa gcaactatgg cgttcttgtg cccgcgccat gagcggtagc 960 cttggcgctg ttgttgctct tgggctaacg gcggcggctg cttggactta ccggccctgg 1020 ttccagtggt gtcccatcta cggttgggtc ggcgaacggg cagtgccggc ggcgcctgag 1080 gagcggaggt tgtagccatg ctggaaccgg ttgccgattt ctggggcgcc ggcgagggga 1140 atgcgaccga gggtgacggt gtttcgtctg acacctcttc gacctcggaa gcttcctcgt 1200 ctaggctctc ccagtcttcc atcatgtcct cctcctcctc gtccaaaacc tcctctgcct 1260 gactgtccca gtattcctcc tcgtccgtgg gtggcggcgg cagctgcagc ttctttttgg 1320 gtgccatcct gggaagcaag ggcccgcggc tgctgctgat agggctgcgg cggcgggggg 1380 attgggttga gctcctcgcc ggactggggg tccaagtaaa ccccccgtcc ctttcgtagc 1440 agaaactctt ggcgggcttt gttgatggct tgcaattggc caagaatgtg gccctgggta 1500 atgacgcagg cggtaagctc cgcatttggc gggcgggatt ggtcttcgta gaacctaatc 1560 tcgtgggcgt ggtagtcctc aggtacaaat ttgcgaaggt aagccgacgt ccacagcccc 1620 ggagtgagtt tcaaccccgg agccgcggac ttttcgtcag gcgagggacc ctgcagctca 1680 aaggtaccga taatttgact ttcgttaagc agctgcgaat tgcaaaccag ggagcggtgc 1740 ggggtgcata ggttgcagcg acagtgacac tccagtagac cgtcaccgct cacgtcttcc 1800 attatgtcag agtggtaggc aaggtagttg gctagctgca gaaggtagca gtggccccaa 1860 agcggcggag ggcattcgcg gtacttaatg ggcacaaagt cgctaggaag tgcacagcag 1920 gtggcgggca agattcctga gcgctctagg ataaagttcc taaagttctg caacatgctt 1980 tgactggtga agtctggcag accctgttgc agggttttaa gcaggcgttc ggggaaaatg 2040 atgtccgcca ggtgcgcggc cacggagcgc tcgttgaagg ccgtccatag gtccttcaag 2100 ttttgcttta gcagtttctg cagctccttg aggttgcact cctccaagca ctgctgccaa 2160 acgcccatgg ccgtctgcca ggtgtagcat agaaataagt aaacgcagtc gcggacgtag 2220 tcgcggcgcg cctcgccctt gagcgtggaa tgaagcacgt tttgcccaag gcggttttcg 2280 tgcaaaattc caaggtagga gaccaggttg cagagctcca cgttggagat cttgcaggcc 2340 tggcgtacgt agccctgtcg aaaggtgtag tgcaatgttt cctctagctt gcgctgcatc 2400 tccgggtcag caaagaaccg ctgcatgcac tcaagctcca cggtaacgag cactgcggcc 2460 atcattagtt tgcgtcgctc ctccaagtcg gcaggctcgc gcgtttgaag ccagcgcgct 2520 agctgctcgt cgccaactgc gggtaggccc tcctctgttt gttcttgcaa atttgcatcc 2580 ctctccaggg gctgcgcacg gcgcacgatc agctcactca tgactgtgct catgaccttg 2640 gggggtaggt taagtgccgg gtaggcaaag tgggtgacct cgatgctgcg ttttagtacg 2700 gctaggcgcg cgttgtcacc ctcgagttcc accaacactc cagagtgact ttcattttcg 2760 ctgttttcct gttgcagagc gtttgccgcg cgcttctcgt cgcgtccaag accctcaaag 2820 atttttggca cttcgttgag cgaggcgata tcaggtatga cagcgccctg ccgcaaggcc 2880 agctgcttgt ccgctcggct gcggttggca cggcaggata ggggtatctt gcagttttgg 2940 aaaaagatgt gataggtggc aagcacctct ggcacggcaa atacggggta gaagttgagg 3000 cgcgggttgg gctcgcatgt gccgttttct tggcgtttgg ggggtacgcg cggtgagaat 3060 aggtggcgtt cgtaggcaag gctgacatcc gctatggcga ggggcacatc gctgcgctct 3120 tgcaacgcgt cgcagataat ggcgcactgg cgctgcagat gcttcaacag cacgtcgtct 3180 cccacatcta ggtagtcgcc atgcctttcg tccccccgcc cgacttgttc ctcgtttgcc 3240 tctgcgttgt cctggtcttg ctttttatcc tctgttggta ctgagcggtc ctcgtcgtct 3300 tcgcttacaa aacctgggtc ctgctcgata atcacttcct cctcctcaag cgggggtgcc 3360 tcgacgggga aggtggtagg cgcgttggcg gcatcggtgg aggcggtggt ggcgaactca 3420 gagggggcgg ttaggctgtc cttcttctcg actgactcca tgatcttttt ctgcctatag 3480 gagaaggaaa tggccagtcg ggaagaggag cagcgcgaaa ccacccccga gcgcggacgc 3540 ggtgcggcgc gacgtccccc aaccatggag gacgtgtcgt ccccgtcccc gtcgccgccg 3600 cctccccggg cgcccccaaa aaagcggatg aggcggcgta tcgagtccga ggacgaggaa 3660 gactcatcac aagacgcgct ggtgccgcgc acacccagcc cgcggccatc gacctcggcg 3720 gcggatttgg ccattgcgcc caagaagaaa aagaagcgcc cttctcccaa gcccgagcgc 3780 ccgccatcac cagaggtaat cgtggacagc gaggaagaaa gagaagatgt ggcgctacaa 3840 atggtgggtt tcagcaaccc accggtgcta atcaagcatg gcaaaggagg taagcgcaca 3900 gtgcggcggc tgaatgaaga cgacccagtg gcgcgtggta tgcggacgca agaggaagag 3960 gaagagccca gcgaagcgga aagtgaaatt acggtgatga acccgctgag tgtgccgatc 4020 gtgtctgcgt gggagaaggg catggaggct gcgcgcgcgc tgatggacaa gtaccacgtg 4080 gataacgatc taaaggcgaa cttcaaacta ctgcctgacc aagtggaagc tctggcggcc 4140 gtatgcaaga cctggctgaa cgaggagcac cgcgggttgc agctgacctt caccagcaac 4200 aagacctttg tgacgatgat ggggcgattc ctgcaggcgt acctgcagtc gtttgcagag 4260 gtgacctaca agcatcacga gcccacgggc tgcgcgttgt ggctgcaccg ctgcgctgag 4320 atcgaaggcg agcttaagtg tctacacgga agcattatga taaataagga gcacgtgatt 4380 gaaatggatg tgacgagcga aaacgggcag cgcgcgctga aggagcagtc tagcaaggcc 4440 aagatcgtga agaaccggtg gggccgaaat gtggtgcaga tctccaacac cgacgcaagg 4500 tgctgcgtgc acgacgcggc ctgtccggcc aatcagtttt ccggcaagtc ttgcggcatg 4560 ttcttctctg aaggcgcaaa ggctcaggtg gcttttaagc agatcaaggc ttttatgcag 4620 gcgctgtatc ctaacgccca gaccgggcac ggtcaccttt tgatgccact acggtgcgag 4680 tgcaactcaa agcctgggca cgcgcccttt ttgggaaggc agctaccaaa gttgactccg 4740 ttcgccctga gcaacgcgga ggacctggac gcggatctga tctccgacaa gagcgtgctg 4800 gccagcgtgc accacccggc gctgatagtg ttccagtgct gcaaccctgt gtatcgcaac 4860 tcgcgcgcgc agggcggagg ccccaactgc gacttcaaga tatcggcgcc cgacctgcta 4920 aacgcgttgg tgatggtgcg cagcctgtgg agtgaaaact tcaccgagct gccgcggatg 4980 gttgtgcctg agtttaagtg gagcactaaa caccagtatc gcaacgtgtc cctgccagtg 5040 gcgcatagcg atgcgcggca gaaccccttt gatttttaaa cggcgcagac ggcaagggtg 5100 ggggtaaata atcacccgag agtgtacaaa taaaagcatt tgcctttatt gaaagtgtct 5160 ctagtacatt atttttacat gtttttcaag tgacaaaaag aagtggcgct cctaatctgc 5220 gcactgtggc tgcggaagta gggcgagtgg cgctccagga agctgtagag ctgttcctgg 5280 ttgcgacgca gggtgggctg tacctgggga ctgttgagca tggagttggg taccgc 5336 <210> 19 <211> 810 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 19 ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 60 accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 120 taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 180 tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 240 tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 300 gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 360 cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 420 gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 480 ttcttctaat acctggaacg ctgtttttcc ggggatcgca gtggtgagta accatgcatc 540 atcaggagta cggataaaat gcttgatggt cggaagtggc ataaattccg tcagccagtt 600 tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 660 caactctggc gcatcgggct tcccatacaa gcgatagatt gtcgcacctg attgcccgac 720 attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 780 cctcgacgtt tcccgttgaa tatggctcat 810 <210> 20 <211> 674 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 20 atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 60 ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 120 cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 180 tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 240 gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 300 aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 360 tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 420 aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtgggct 480 aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 540 ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 600 ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 660 atcttttcta cggg 674 <210> 21 <211> 118 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 21 tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 60 tgtatttaga aaaataaaca aataggggtc agtgttacaa ccaattaacc aattctga 118 <210> 22 <211> 301 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 22 tattctaaat gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta 60 tcgttgacat gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt 120 tattttctta attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa 180 tagatgaata gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa 240 gtgcgttgct tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac 300 a 301 <210> 23 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 23 ggcgccctta aatattctga caaatgctct ttccctaaac tccccccata aaaaaacccg 60 ccgaagcggg tttttacgtt atttgcggat taacgattac tcgttatcag aaccgcccag 120 <210> 24 <211> 6838 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 24 ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080 aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200 agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260 ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320 cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380 cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440 actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500 cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560 tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620 gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680 tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740 tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800 tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860 aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920 acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980 ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160 accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460 tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520 cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580 tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtaacaaa 2640 agcttatcga gcggccgcaa gaggcagtat tttactgaca cgaatacacg gtttattgag 2700 ggtatgcgac atgaatgggt taaaggggtc gggtaaggta tcgggttccg ataggtctgg 2760 tggttctgta ttccccggtg ctgtccgggg caaagtccac aaactggggg tcgttgtagt 2820 tgtttgtgta ctggatctct gggttccacc tcttggagtt ttccttcttg agctcccact 2880 ccatctccac ggtgacctgc ccggtgctgt actgggtgat gaagctgctg acgggcacgt 2940 ccgagaagct ggtgatattt ccgggcacag gcgtgttctt gatgagcatc atgggcggtg 3000 ggtgtttgag tccgaatccg cccatggccg gagaggggtg aaagtgcgcc cccgtctctg 3060 ggatcttggc ccagatgggt ccttggaggt acacgtccct ctccatccac acgctgccgg 3120 gcacgatttc ctggaggttg tacgtgccgg tcgcgggggc agtggtggag ctctggttgt 3180 tggtggccat ctgcccgccg acgttgtacg ccacgcggtt caccggctgc gtctcgctct 3240 cgctggtgat gagcatgttg ccctcgaggt acgtggcggt ggtgcccggg ttcgccggct 3300 ggctgttgaa gatcatagtg ttctccaggg cataggtgtt gctgccctgg aggttgttgg 3360 tcatgccgtt cggctgcggg ggcacctggt aactcgcgcc ctcgagctcc atcctattgg 3420 tcgtggcgaa ggcgctgaca ctggcgcggt tgaccccgga gcccaggttc cagccctggg 3480 ttcggcccat gggccccggg aaccagtttt tgtaggtgtt ggcgtatctc ccggccaggt 3540 tcttgttgaa ctggactccg ccagtgttat ttgtgctcac gaagcggtac aagtactggt 3600 ccaccagcgg gttggccagc ttgaacaggt tctgactggg agcgaagctg gagtggaagg 3660 gcacctcctc aaagttgtag gtaaactcaa agttgttgcc cgttctcagc atcttgctgg 3720 gaaagtactc taggcagaag aagctgctcc tctcggtggg attttctgtg ttgtcgcggt 3780 tcagcgtcgc gtaaccgtac tgcggcagcg taaagacctg cggagggaag gccggcaggc 3840 atccctcggt cccgttgccg acgacgtagg gcagctggta gtcgtcgtcc gtaaacactt 3900 ggacggtgga ggtgaggttg ttggcgatgg tggtggtgga gtcctgcacc gtgacctctt 3960 tgacttgaat gttgaagatt ttgactctga gggaccgggg tctgaagccc cagtagttgt 4020 tgatgagtct ttgccagtct cgggggctcc agtggctgtg gaagcggtta aagtcaaagt 4080 acccccaggg ggtgctgtat ccaaagtagg cgttggcgtt gcttccgtcg acggagccgc 4140 ttttgatctc tcggtactgg tggttgttgt agctgggcag cacccaggtt cgggtggact 4200 tggtgacgac tctgtccccc atccacgtgg aatcgcaatg ccaatctccc gaggcattgc 4260 ccactccatc ggcaccttgg ttattgtcgc ccaatgggcc gccacctccc gcagacattg 4320 tatcagctcc caaacttgag gctggttggg ctgggatttg cagctgctgg gatccgctgg 4380 gtccagcttc ggcgtctgac gaggtggaag gcttggagtc ctcttcggtc cgagccttct 4440 ttctttttgg aaagtggtcg tctatccgct ttccggtagg ggccgtctta gcaccctctt 4500 caaccaggcc aaaaggttcg agaacccttt tcttggcctg aaagactgcc tttccgaggt 4560 ttcccccgaa ggatgtgtcg tcggcgagct tctcctgaaa ctcggcgtcc gcgtggttgt 4620 acttgaggta ggggttgtct cccgcctcaa gctgctcgtt gtacgagatg tcgtgctctc 4680 gcgcgacctc gtctgccctg ttgacaggct ctcctcgatc gagaccgttt ccgggtccga 4740 gatagttata accaggcagc acaagaccac gggcttgatc ttgatgctgc tgattgggtt 4800 ttggtttcgg tgggcccgct tcaaggccca aaaactcgcg aagaccttca ccaacttctt 4860 ccaaccaatc tggagggtga tcaacaaaag acatgactac tcgctttatt tactgttctt 4920 tattggcatc gtcaaaatcc ccaaaatctg acaagttttc cttttcccag gggggaatcc 4980 catgacaaat ttgacagtga gttacattgt gacagataca tccatttttg ccccgattca 5040 aatattcaca ttcatcacat ttgttagaaa tgttgtcaaa ttgagcatga tagtcacatt 5100 tgcaatcata ccttgaattc caattgagcg gtcgcagagg agcgggatca acagtcacgt 5160 ctgaactgcg aggcgtctcg ggaacaaatg agagcctggc ccgcttctcc agacttttat 5220 agctagtatt ggtgacgtca cccagtgggc gttttagaga tttctccgcc cctttagttc 5280 ccgccaattc cctgggaact ttaaactcgt gagtcaccgg cacctgattg acctttgccc 5340 aagcaaaaaa gtccttgact tcctgcttag taatcttgcc aaaatctggc gggagccgct 5400 tagtcagttc aaatttgaac atgcggtcct ccagcggctg ctggtgttca aaggtcgtgg 5460 aattcccatc caccaccaca cacatgtttg tattggaagt tacaatgaca ggggtagaat 5520 caatttgaac agaggattta catttctgat cgacccgcac ctttgagccc cccaggatgg 5580 ccttggcgga ttcaaccacc ttgttggtca tctttccctc ctcccaccaa atgagcattt 5640 tgtccacaca gtcattaaag ggaaagtttt cattggtcca gttcacgcag ccgtaaaagg 5700 gcacagtgtg ggcgatggcc tccgcgatgt tggtcttgcc ggtcgtggcg ggtccgtaga 5760 gccagacggt gttcctcttg ttgaaggagc gctgacacca gccgtagagg atggatcccg 5820 cgtaggccgg gtcgtagcca ttcatctcaa aaatttgcca gattctgttt tttgaaatgt 5880 cctcgggaac ggagctcccc acgaggtagt ccaccgcgct ttttgtcaga ctcataattt 5940 tggtcgcgtt gtcgagcgcg gccttgatct ggctccgaga gttgccggtg gagttgaagg 6000 agaggtagct ctcctgattt tcctggatcc actgcttctc cgaggtaatc cccttgtcca 6060 cgagccaccc gaccagctcc atgtacctgg ctgaagtttt tgatctgatc accggcgcat 6120 cagaattggg attctgattc tctttgttct gctcctgcgt ctgcgacacg tgcgtcagat 6180 gctgcgccac caaccgttta cgctccgtga gattcaaaca ggcgcttaaa tactgttcca 6240 tattagtcca cgcccactgg agctcaggct gggttttggg gagcaagtaa ttggggatgt 6300 agcactcatc caccaccttg ttcccgcctc cggcgccatt tctggtcttt gtgaccgcga 6360 accagtttgg caaagtcggc tcgatcccgc ggtaaattct ctgaatcagt ttttcgcgaa 6420 tctgactcag gaaacgtccc aaaaccatgg atttcacccc ggtggtttcc acgagcacgt 6480 gcatgtggaa gtagctctct cccttctcaa attgcacaaa gaaaagggcc tccggggcct 6540 tactcacacg gcgccattcc gtcagaaagt cgcgctgcag cttctcggcc acggtcaggg 6600 gtgcctgctc aatcagattc agatccatgt cagaatctgg cggcaactcc cattccttct 6660 cggccaccca gttcacaaag ctgtcagaaa tgccgggcag atgctcgtca aggtcgctgg 6720 ggaccttaat cacaatctcg taaaaccccg gcatggcggc tgcgcagatc agaagttcct 6780 atactttcta gagaatagga acttcggaat aggaacttct gatcttccgg gggatcca 6838 <210> 25 <211> 816 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 25 ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 60 accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 120 taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 180 tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 240 tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 300 gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 360 cgcctgagcg agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 420 atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 480 ttcttctaat acctggaatg ctgttttccc agggatcgca gtggtgagta accatgcatc 540 atcaggagta cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt 600 tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 660 caactctggc gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac 720 attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 780 cctagagcaa gacgtttccc gttgaatatg gctcat 816 <210> 26 <211> 673 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 26 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 60 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 120 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 180 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 240 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 300 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 360 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 420 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 480 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 540 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 600 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 660 tcttttctac ggg 673 <210> 27 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 27 aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc 60 tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc 120 cagtcgggaa acctgtcgtg cca 143 <210> 28 <211> 5121 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 28 ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 60 gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 120 caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 180 taagggattt tggtcatgtg attatcaaaa aggatcttca cctagatcct tttaaattaa 240 aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttagaaa 300 aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat 360 ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg 420 gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat 480 ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc 540 ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg ccagccatta 600 cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga 660 gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac 720 cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct 780 aatacctgga atgctgtttt cccagggatc gcagtggtga gtaaccatgc atcatcagga 840 gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg 900 accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct 960 ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg 1020 cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg cggcctagag 1080 caagacgttt cccgttgaat atggctcata ctcttccttt ttcaatatta ttgaagcatt 1140 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 1200 ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt 1260 aacatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc 1320 ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg 1380 taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt 1440 cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg 1500 tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc 1560 aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg 1620 gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca 1680 cgacgttgta aaacgacggc cagtgaattc gagctcggta cccgtaacaa aagcttatcg 1740 agcggccgca agaggcagta ttttactgac acgaatacac ggtttattga gggtatgcga 1800 catgaatggg ttaaaggggt cgggtaaggt atcgggttcc gataggtctg gtggttctgt 1860 attccccggt gctgtccggg gcaaagtcca caaactgggg gtcgttgtag ttgtttgtgt 1920 actggatctc tgggttccac ctcttggagt tttccttctt gagctcccac tccatctcca 1980 cggtgacctg cccggtgctg tactgggtga tgaagctgct gacgggcacg tccgagaagc 2040 tggtgatatt tccgggcaca ggcgtgttct tgatgagcat catgggcggt gggtgtttga 2100 gtccgaatcc gcccatggcc ggagaggggt gaaagtgcgc ccccgtctct gggatcttgg 2160 cccagatggg tccttggagg tacacgtccc tctccatcca cacgctgccg ggcacgattt 2220 cctggaggtt gtacgtgccg gtcgcggggg cagtggtgga gctctggttg ttggtggcca 2280 tctgcccgcc gacgttgtac gccacgcggt tcaccggctg cgtctcgctc tcgctggtga 2340 tgagcatgtt gccctcgagg tacgtggcgg tggtgcccgg gttcgccggc tggctgttga 2400 agatcatagt gttctccagg gcataggtgt tgctgccctg gaggttgttg gtcatgccgt 2460 tcggctgcgg gggcacctgg taactcgcgc cctcgagctc catcctattg gtcgtggcga 2520 aggcgctgac actggcgcgg ttgaccccgg agcccaggtt ccagccctgg gttcggccca 2580 tgggccccgg gaaccagttt ttgtaggtgt tggcgtatct cccggccagg ttcttgttga 2640 actggactcc gccagtgtta tttgtgctca cgaagcggta caagtactgg tccaccagcg 2700 ggttggccag cttgaacagg ttctgactgg gagcgaagct ggagtggaag ggcacctcct 2760 caaagttgta ggtaaactca aagttgttgc ccgttctcag catcttgctg ggaaagtact 2820 ctaggcagaa gaagctgctc ctctcggtgg gattttctgt gttgtcgcgg ttcagcgtcg 2880 cgtaaccgta ctgcggcagc gtaaagacct gcggagggaa ggccggcagg catccctcgg 2940 tcccgttgcc gacgacgtag ggcagctggt agtcgtcgtc cgtaaacact tggacggtgg 3000 aggtgaggtt gttggcgatg gtggtggtgg agtcctgcac cgtgacctct ttgacttgaa 3060 tgttgaagat tttgactctg agggaccggg gtctgaagcc ccagtagttg ttgatgagtc 3120 tttgccagtc tcgggggctc cagtggctgt ggaagcggtt aaagtcaaag tacccccagg 3180 gggtgctgta tccaaagtag gcgttggcgt tgcttccgtc gacggagccg cttttgatct 3240 ctcggtactg gtggttgttg tagctgggca gcacccaggt tcgggtggac ttggtgacga 3300 ctctgtcccc catccacgtg gaatcgcaat gccaatctcc cgaggcattg cccactccat 3360 cggcaccttg gttattgtcg cccaatgggc cgccacctcc cgcagacatt gtatcagctc 3420 ccaaacttga ggctggttgg gctgggattt gcagctgctg ggatccgctg ggtccagctt 3480 cggcgtctga cgaggtggaa ggcttggagt cctcttcggt ccgagccttc tttctttttg 3540 gaaagtggtc gtctatccgc tttccggtag gggccgtctt agcaccctct tcaaccaggc 3600 caaaaggttc gagaaccctt ttcttggcct gaaagactgc ctttccgagg tttcccccga 3660 aggatgtgtc gtcggcgagc ttctcctgaa actcggcgtc cgcgtggttg tacttgaggt 3720 aggggttgtc tcccgcctca agctgctcgt tgtacgagat gtcgtgctct cgcgcgacct 3780 cgtctgccct gttgacaggc tctcctcgat cgagaccgtt tccgggtccg agatagttat 3840 aaccaggcag cacaagacca cgggcttgat cttgatgctg ctgattgggt tttggtttcg 3900 gtgggcccgc ttcaaggccc aaaaactcgc gaagaccttc accaacttct tccaaccaat 3960 ctggagggtg atcaacaaaa gacatgacta ctcgctttat ttactgttct ttattggcat 4020 cgtcaaaatc cccaaaatct gacaagtttt ccttttccca ggggggaatc ccatgacaaa 4080 tttgacagtg agttacattg tgacagatac atccattttt gccccgattc aaatattcac 4140 attcatcaca tttgttagaa atgttgtcaa attgagcatg atagtcacat ttgcaatcat 4200 accttgaatt ccaattgagc ggtcgcagag gagcgggatc aacagtcacg tctgaactgc 4260 gaggcgtctc gggaacaaat gagagcctgg cccgcttctc cagactttta tagctagtat 4320 tggtgacgtc acccagtggg cgttttagag atttctccgc ccctttagtt cccgccaatt 4380 ccctgggaac tttaaactcg tgagtcaccg gcacctgatt gacctttgcc caagcaaaaa 4440 agtccttgac ttcctgctta gtaatcttgc caaaatctgg cgggagccgc ttagtcagtt 4500 caaatttgaa catgcggtcc tccagcggct gctggtgttc aaaggtcgtg gaattcccat 4560 ccaccaccac acacatgttt gtattggaag ttacaatgac aggggtagaa tcaatttgaa 4620 cagaggattt acatttctga tcgacccgca cctttgagcc ccccaggatg gccttggcgg 4680 attcaaccac cttgttggtc atctttccct cctcccacca aatgagcatt ttgtccacac 4740 agtcattaaa gggaaagttt tcattggtcc agttcacgca gccgtaaaag ggcacagtgt 4800 gggcgatggc ctccgcgatg ttggtcttgc cggtcgtggc gggtccgtag agccagacgg 4860 tgttcctctt gttgaaggag cgctgacacc agccgtagag gatggatccc gcgtaggccg 4920 ggtcgtagcc attcatctca aaaatttgcc agattctgtt ttttgaaatg tcctcgggaa 4980 cggagctccc cacgaggtag tccaccgcgc tttttgtcag actcataatt ttggtcgcgt 5040 tgtcgagcgc ggccttgatc tggctccgag agttgccggt ggagttgaag gagaggtagc 5100 tctcctgatt ttcctggatc c 5121 <210> 29 <211> 2175 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 29 ttaaaggggt cgggtaaggt atcgggttcc gataggtctg gtggttctgt attccccggt 60 gctgtccggg gcaaagtcca caaactgggg gtcgttgtag ttgtttgtgt actggatctc 120 tgggttccac ctcttggagt tttccttctt gagctcccac tccatctcca cggtgacctg 180 cccggtgctg tactgggtga tgaagctgct gacgggcacg tccgagaagc tggtgatatt 240 tccgggcaca ggcgtgttct tgatgagcat catgggcggt gggtgtttga gtccgaatcc 300 gcccatggcc ggagaggggt gaaagtgcgc ccccgtctct gggatcttgg cccagatggg 360 tccttggagg tacacgtccc tctccatcca cacgctgccg ggcacgattt cctggaggtt 420 gtacgtgccg gtcgcggggg cagtggtgga gctctggttg ttggtggcca tctgcccgcc 480 gacgttgtac gccacgcggt tcaccggctg cgtctcgctc tcgctggtga tgagcatgtt 540 gccctcgagg tacgtggcgg tggtgcccgg gttcgccggc tggctgttga agatcatagt 600 gttctccagg gcataggtgt tgctgccctg gaggttgttg gtcatgccgt tcggctgcgg 660 gggcacctgg taactcgcgc cctcgagctc catcctattg gtcgtggcga aggcgctgac 720 actggcgcgg ttgaccccgg agcccaggtt ccagccctgg gttcggccca tgggccccgg 780 gaaccagttt ttgtaggtgt tggcgtatct cccggccagg ttcttgttga actggactcc 840 gccagtgtta tttgtgctca cgaagcggta caagtactgg tccaccagcg ggttggccag 900 cttgaacagg ttctgactgg gagcgaagct ggagtggaag ggcacctcct caaagttgta 960 ggtaaactca aagttgttgc ccgttctcag catcttgctg ggaaagtact ctaggcagaa 1020 gaagctgctc ctctcggtgg gattttctgt gttgtcgcgg ttcagcgtcg cgtaaccgta 1080 ctgcggcagc gtaaagacct gcggagggaa ggccggcagg catccctcgg tcccgttgcc 1140 gacgacgtag ggcagctggt agtcgtcgtc cgtaaacact tggacggtgg aggtgaggtt 1200 gttggcgatg gtggtggtgg agtcctgcac cgtgacctct ttgacttgaa tgttgaagat 1260 tttgactctg agggaccggg gtctgaagcc ccagtagttg ttgatgagtc tttgccagtc 1320 tcgggggctc cagtggctgt ggaagcggtt aaagtcaaag tacccccagg gggtgctgta 1380 tccaaagtag gcgttggcgt tgcttccgtc gacggagccg cttttgatct ctcggtactg 1440 gtggttgttg tagctgggca gcacccaggt tcgggtggac ttggtgacga ctctgtcccc 1500 catccacgtg gaatcgcaat gccaatctcc cgaggcattg cccactccat cggcaccttg 1560 gttattgtcg cccaatgggc cgccacctcc cgcagacatt gtatcagctc ccaaacttga 1620 ggctggttgg gctgggattt gcagctgctg ggatccgctg ggtccagctt cggcgtctga 1680 cgaggtggaa ggcttggagt cctcttcggt ccgagccttc tttctttttg gaaagtggtc 1740 gtctatccgc tttccggtag gggccgtctt agcaccctct tcaaccaggc caaaaggttc 1800 gagaaccctt ttcttggcct gaaagactgc ctttccgagg tttcccccga aggatgtgtc 1860 gtcggcgagc ttctcctgaa actcggcgtc cgcgtggttg tacttgaggt aggggttgtc 1920 tcccgcctca agctgctcgt tgtacgagat gtcgtgctct cgcgcgacct cgtctgccct 1980 gttgacaggc tctcctcgat cgagaccgtt tccgggtccg agatagttat aaccaggcag 2040 cacaagacca cgggcttgat cttgatgctg ctgattgggt tttggtttcg gtgggcccgc 2100 ttcaaggccc aaaaactcgc gaagaccttc accaacttct tccaaccaat ctggagggtg 2160 atcaacaaaa gacat 2175 <210> 30 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 30 cat 3 <210> 31 <211> 6980 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080 aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200 agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260 ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320 cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380 cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440 actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500 cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560 tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620 gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680 tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740 tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800 tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860 aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920 acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980 ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160 accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460 tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520 cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580 tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640 ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700 tttattgatt aacaagcaat tacagattac gagtcaggta tctggtgcca atggggcgag 2760 gctctgaata cacgccatta gtgtccacag taaagtccac attaacagac ttgttgtagt 2820 tggaagtgta ctgaatttcg ggattccagc gtttgctgtt ttccttctgc agctcccact 2880 cgatctccac gctgacctgt cccgtggagt actgtgtgat gaaggaagca aactttgccg 2940 cactgaaggt ggtcgaagga ttcgcaggta ccggggtgtt cttgatgaga atctgtggag 3000 gagggtgttt aagtccgaat ccacccatga ggggagaggg gtgaaaatgt ccgtccgtgt 3060 gtggaatctt tgcccagatg ggcccctgaa ggtacacatc tctgtcctgc cagaccatgc 3120 ctggaagaac gccttgtgtg ttgacatctg cggtagctgc ttgtctgttg cctctctgga 3180 ggttggtaga tacagaacca tactgctccg tagccacggg attggttgtc ctgatttcct 3240 cttcgtctgt aatcatgacc ttttcaatgt ccacatttgt tttctctgag ccttgcttcc 3300 caaagatgag aaccccgctc tgaggaaaaa acttttcttc atcgtccttg tggcttgcca 3360 tggccgggcc cggattcacc agagagtctc tgccattgag gtggtacttg gtagctccag 3420 tccacgagta ttcactgttg ttgttatccg cagatgtctt tgatactcgc tgctggcggt 3480 aacagggtcc aggaagccag ttcctagact ggtcccgaat gtcactcgct ccggcctgag 3540 aaaactgaag ccttgactgc gtggtggttc cacttggagt gtttgttctg ctcaagtaat 3600 acaggtactg gtcgatgaga ggattcatga gacggtccag actctggctg tgagcgtagc 3660 tgctgtggaa aggaacgtcc tcaaaagtgt agctgaaggt aaagttgttt ccggtacgca 3720 gcatctgaga aggaaagtac tccaggcagt aaaatgaaga gcgtcctact gcctgactcc 3780 cgttgttcag ggtgaggtat ccatactgtg gcaccatgaa gacgtctgct gggaacggcg 3840 ggaggcatcc ttgatgcgcc gagccgagga cgtacgggag ctggtactcc gagtcagtaa 3900 acacctgaac cgtgctggta aggttattgg caatcgtcgt cgtaccgtca ttctgcgtga 3960 cctctttgac ttgaatgtta aagagcttga agttgagtct cttgggtcgg aatccccagt 4020 tgttgttgat gagtctttgc cagtcacgtg gtgaaaagtg gcagtggaat ctgttgaagt 4080 caaaataccc ccaaggggtg ctgtagccaa agtagtgatt gtcgttcgag gctcctgatt 4140 ggctggaaat ttgtttgtag aggtggttgt tgtaggtggg cagggcccag gttcgggtgc 4200 tggtggtgat gactctgtcg cccatccatg tggaatcgca atgccaattt cccgaggaat 4260 tacccactcc gtcggcgccc tcgttattgt ctgccattgg tgcgccactg cctgtagcca 4320 tcgtattagt tcccagacca gagggggctg ctggtggctg tccgagaggc tgggggtcag 4380 gtactgagtc tgcgtctcca gtctgaccaa aattcaatct ttttcttgca ggctgctggc 4440 ccgcctttcc ggttcccgag gaggagtctg gctccacagg agagtgctct accggcctct 4500 tttttcccgg agccgtctta acaggttcct caaccaggcc cagaggttca agaaccctct 4560 ttttcgcctg gaagactgct cgtccgaggt tgcccccaaa agacgtatct tctttaaggc 4620 gctcctgaaa ctccgcgtcg gcgtggttgt acttgaggta cgggttgtct ccgctgtcga 4680 gctgccggtc gtaggctttg tcgtgctcga gggccgcggc gtctgcctcg ttgaccggct 4740 ctcccttgtc gagtccgttg aagggtccga ggtacttgta cccaggaagc acaagacccc 4800 tgctgtcgtc cttatgccgc tctgcgggct ttggtggtgg tgggccaggt ttgagcttcc 4860 accactgtct tattccttca gagagagtgt cctcgagcca atctggaaga taaccatcgg 4920 cagccatacc tgatttaaat catttattgt tcaaagatgc agtcatccaa atccacattg 4980 accagatcgc aggcagtgca agcgtctggc acctttccca tgatatgatg aatgtagcac 5040 agtttctgat acgccttttt gacgacagaa acgggttgag attctgacac gggaaagcac 5100 tctaaacagt ctttctgtcc gtgagtgaag cagatatttg aattctgatt cattctctcg 5160 cattgtctgc agggaaacag catcagattc atgcccacgt gacgagaaca tttgttttgg 5220 tacctgtctg cgtagttgat cgaagcttcc gcgtctgacg tcgatggctg cgcaactgac 5280 tcgcgcaccc gtttgggctc acttatatct gcgtcactgg gggcgggtct tttcttggct 5340 ccaccctttt tgacgtagaa ttcatgctcc acctcaacca cgtgatcctt tgcccaccgg 5400 aaaaagtctt tgacttcctg cttggtgacc ttcccaaagt catgatccag acggcgggtg 5460 agttcaaatt tgaacatccg gtcttgcaac ggctgctggt gttcgaaggt cgttgagttc 5520 ccgtcaatca cggcgcacat gttggtgttg gaggtgacga tcacgggagt cgggtctatc 5580 tgggccgagg acttgcattt ctggtccacg cgcaccttgc ttcctccgag aatggctttg 5640 gccgactcca cgaccttggc ggtcatcttc ccctcctccc accagatcac catcttgtcg 5700 acacagtcgt tgaagggaaa gttctcattg gtccagttta cgcacccgta gaagggcaca 5760 gtgtgggcta tggcctccgc gatgttggtc ttcccggtag ttgcaggccc aaacagccag 5820 atggtgttcc tcttgccgaa ctttttcgtg gcccatccca gaaagacgga agccgcatat 5880 tggggatcgt acccgtttag ttccaaaatt ttataaatcc gattgctgga aatgtcctcc 5940 acgggctgct ggcccaccag gtagtcgggg gcggttttag tcaggctcat aatctttccc 6000 gcattgtcca aggcagcctt gatttgggac cgcgagttgg aggccgcatt gaaggagatg 6060 tatgaggcct ggtcctcctg gatccactgc ttctccgagg taatcccctt gtccacgagc 6120 cacccgacca gctccatgta cctggctgaa gtttttgatc tgatcaccgg cgcatcagaa 6180 ttgggattct gattctcttt gttctgctcc tgcgtctgcg acacgtgcgt cagatgctgc 6240 gccaccaacc gtttacgctc cgtgagattc aaacaggcgc ttaaatactg ttccatatta 6300 gtccacgccc actggagctc aggctgggtt ttggggagca agtaattggg gatgtagcac 6360 tcatccacca ccttgttccc gcctccggcg ccatttctgg tctttgtgac cgcgaaccag 6420 tttggcaaag tcggctcgat cccgcggtaa attctctgaa tcagtttttc gcgaatctga 6480 ctcaggaaac gtcccaaaac catggatttc accccggtgg tttccacgag cacgtgcatg 6540 tggaagtagc tctctccctt ctcaaattgc acaaagaaaa gggcctccgg ggccttactc 6600 acacggcgcc attccgtcag aaagtcgcgc tgcagcttct cggccacggt caggggtgcc 6660 tgctcaatca gattcagatc catgtcagaa tctggcggca actcccattc cttctcggcc 6720 acccagttca caaagctgtc agaaatgccg ggcagatgct cgtcaaggtc gctggggacc 6780 ttaatcacaa tctcgtaaaa ccccggcatg gcggctgcgc gttcaaacct cccgcttcaa 6840 aatggagacc ctgcgtgctc actcgggctt aaatacccag cgtgaccaca tggtgtcgca 6900 aaatgtcgca aaacactcac gtgacctcta atacaggacc tccctaaccc tatgacgtaa 6960 ttcacgtcac gactccacca 6980 <210> 32 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60 agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120 gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180 tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240 attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300 tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360 gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420 gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480 atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540 cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600 ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660 cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720 gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780 gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840 cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900 aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960 ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020 ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080 tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140 cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200 aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260 aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320 ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380 gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440 gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500 gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560 ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620 agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680 agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740 ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800 aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860 tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920 ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980 gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040 gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100 ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160 agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccat 2208 <210> 33 <211> 6893 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 33 ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080 aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200 agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260 ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320 cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380 cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440 actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500 cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560 tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620 gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680 tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740 tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800 tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860 aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920 acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980 ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160 accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460 tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520 cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580 tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640 ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700 tttattgatt aacaagcaat tacagattac gagtcaggta tctggtgcca atggggcgag 2760 gctctgaata cacgccatta gtgtccacag taaagtccac attaacagac ttgttgtagt 2820 tggaagtgta ctgaatttcg ggattccagc gtttgctgtt ttccttctgc agctcccact 2880 cgatctccac gctgacctgt cccgtggagt actgtgtgat gaaggaagca aactttgccg 2940 cactgaaggt ggtcgaagga ttcgcaggta ccggggtgtt cttgatgaga atctgtggag 3000 gagggtgttt aagtccgaat ccacccatga ggggagaggg gtgaaaatgt ccgtccgtgt 3060 gtggaatctt tgcccagatg ggcccctgaa ggtacacatc tctgtcctgc cagaccatgc 3120 ctggaagaac gccttgtgtg ttgacatctg cggtagctgc ttgtctgttg cctctctgga 3180 ggttggtaga tacagaacca tactgctccg tagccacggg attggttgtc ctgatttcct 3240 cttcgtctgt aatcatgacc ttttcaatgt ccacatttgt tttctctgag ccttgcttcc 3300 caaagatgag aaccccgctc tgaggaaaaa acttttcttc atcgtccttg tggcttgcca 3360 tggccgggcc cggattcacc agagagtctc tgccattgag gtggtacttg gtagctccag 3420 tccacgagta ttcactgttg ttgttatccg cagatgtctt tgatactcgc tgctggcggt 3480 aacagggtcc aggaagccag ttcctagact ggtcccgaat gtcactcgct ccggcctgag 3540 aaaactgaag ccttgactgc gtggtggttc cacttggagt gtttgttctg ctcaagtaat 3600 acaggtactg gtcgatgaga ggattcatga gacggtccag actctggctg tgagcgtagc 3660 tgctgtggaa aggaacgtcc tcaaaagtgt agctgaaggt aaagttgttt ccggtacgca 3720 gcatctgaga aggaaagtac tccaggcagt aaaatgaaga gcgtcctact gcctgactcc 3780 cgttgttcag ggtgaggtat ccatactgtg gcaccatgaa gacgtctgct gggaacggcg 3840 ggaggcatcc ttgatgcgcc gagccgagga cgtacgggag ctggtactcc gagtcagtaa 3900 acacctgaac cgtgctggta aggttattgg caatcgtcgt cgtaccgtca ttctgcgtga 3960 cctctttgac ttgaatgtta aagagcttga agttgagtct cttgggtcgg aatccccagt 4020 tgttgttgat gagtctttgc cagtcacgtg gtgaaaagtg gcagtggaat ctgttgaagt 4080 caaaataccc ccaaggggtg ctgtagccaa agtagtgatt gtcgttcgag gctcctgatt 4140 ggctggaaat ttgtttgtag aggtggttgt tgtaggtggg cagggcccag gttcgggtgc 4200 tggtggtgat gactctgtcg cccatccatg tggaatcgca atgccaattt cccgaggaat 4260 tacccactcc gtcggcgccc tcgttattgt ctgccattgg tgcgccactg cctgtagcca 4320 tcgtattagt tcccagacca gagggggctg ctggtggctg tccgagaggc tgggggtcag 4380 gtactgagtc tgcgtctcca gtctgaccaa aattcaatct ttttcttgca ggctgctggc 4440 ccgcctttcc ggttcccgag gaggagtctg gctccacagg agagtgctct accggcctct 4500 tttttcccgg agccgtctta acaggttcct caaccaggcc cagaggttca agaaccctct 4560 ttttcgcctg gaagactgct cgtccgaggt tgcccccaaa agacgtatct tctttaaggc 4620 gctcctgaaa ctccgcgtcg gcgtggttgt acttgaggta cgggttgtct ccgctgtcga 4680 gctgccggtc gtaggctttg tcgtgctcga gggccgcggc gtctgcctcg ttgaccggct 4740 ctcccttgtc gagtccgttg aagggtccga ggtacttgta cccaggaagc acaagacccc 4800 tgctgtcgtc cttatgccgc tctgcgggct ttggtggtgg tgggccaggt ttgagcttcc 4860 accactgtct tattccttca gagagagtgt cctcgagcca atctggaaga taaccatcgg 4920 cagccatacc tgatttaaat catttattgt tcaaagatgc agtcatccaa atccacattg 4980 accagatcgc aggcagtgca agcgtctggc acctttccca tgatatgatg aatgtagcac 5040 agtttctgat acgccttttt gacgacagaa acgggttgag attctgacac gggaaagcac 5100 tctaaacagt ctttctgtcc gtgagtgaag cagatatttg aattctgatt cattctctcg 5160 cattgtctgc agggaaacag catcagattc atgcccacgt gacgagaaca tttgttttgg 5220 tacctgtctg cgtagttgat cgaagcttcc gcgtctgacg tcgatggctg cgcaactgac 5280 tcgcgcaccc gtttgggctc acttatatct gcgtcactgg gggcgggtct tttcttggct 5340 ccaccctttt tgacgtagaa ttcatgctcc acctcaacca cgtgatcctt tgcccaccgg 5400 aaaaagtctt tgacttcctg cttggtgacc ttcccaaagt catgatccag acggcgggtg 5460 agttcaaatt tgaacatccg gtcttgcaac ggctgctggt gttcgaaggt cgttgagttc 5520 ccgtcaatca cggcgcacat gttggtgttg gaggtgacga tcacgggagt cgggtctatc 5580 tgggccgagg acttgcattt ctggtccacg cgcaccttgc ttcctccgag aatggctttg 5640 gccgactcca cgaccttggc ggtcatcttc ccctcctccc accagatcac catcttgtcg 5700 acacagtcgt tgaagggaaa gttctcattg gtccagttta cgcacccgta gaagggcaca 5760 gtgtgggcta tggcctccgc gatgttggtc ttcccggtag ttgcaggccc aaacagccag 5820 atggtgttcc tcttgccgaa ctttttcgtg gcccatccca gaaagacgga agccgcatat 5880 tggggatcgt acccgtttag ttccaaaatt ttataaatcc gattgctgga aatgtcctcc 5940 acgggctgct ggcccaccag gtagtcgggg gcggttttag tcaggctcat aatctttccc 6000 gcattgtcca aggcagcctt gatttgggac cgcgagttgg aggccgcatt gaaggagatg 6060 tatgaggcct ggtcctcctg gatccactgc ttctccgagg taatcccctt gtccacgagc 6120 cacccgacca gctccatgta cctggctgaa gtttttgatc tgatcaccgg cgcatcagaa 6180 ttgggattct gattctcttt gttctgctcc tgcgtctgcg acacgtgcgt cagatgctgc 6240 gccaccaacc gtttacgctc cgtgagattc aaacaggcgc ttaaatactg ttccatatta 6300 gtccacgccc actggagctc aggctgggtt ttggggagca agtaattggg gatgtagcac 6360 tcatccacca ccttgttccc gcctccggcg ccatttctgg tctttgtgac cgcgaaccag 6420 tttggcaaag tcggctcgat cccgcggtaa attctctgaa tcagtttttc gcgaatctga 6480 ctcaggaaac gtcccaaaac catggatttc accccggtgg tttccacgag cacgtgcatg 6540 tggaagtagc tctctccctt ctcaaattgc acaaagaaaa gggcctccgg ggccttactc 6600 acacggcgcc attccgtcag aaagtcgcgc tgcagcttct cggccacggt caggggtgcc 6660 tgctcaatca gattcagatc catgtcagaa tctggcggca actcccattc cttctcggcc 6720 acccagttca caaagctgtc agaaatgccg ggcagatgct cgtcaaggtc gctggggacc 6780 ttaatcacaa tctcgtaaaa ccccggcatg gcggctgcgc agatcagaag ttcctatact 6840 ttctagagaa taggaacttc ggaataggaa cttctgatct tccgggggat cca 6893 <210> 34 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 34 ccccggcatg gcggctgcgc gttcaaacct cccgcttcaa aatggagacc ctgcgtgctc 60 actcgggctt aaatacccag cgtgaccaca tggtgtcgca aaatgtcgca aaacactcac 120 gtgacctcta atacaggacc tccctaaccc tatgacgtaa ttcacgtcac gactccacc 179 <210> 35 <211> 6989 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 35 ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080 aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200 agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260 ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320 cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380 cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440 actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500 cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560 tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620 gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680 tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740 tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800 tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860 aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920 acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980 ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160 accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460 tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520 cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580 tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640 ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700 tttattgatt aacaagcaat tacagattac gggtgaggta acgggtgcca atggggcggg 2760 gttcagagta cacgccttct gtattaacag caaagtccac acttgtagat ttgtagtagt 2820 tggaggtgta ctggatctcg gggttccagc gcttgctgtt ttccttctgc agctcccatt 2880 caatttccac gctgacctgt ccggtgctgt attgcgtgat gaaagagttc agctttgact 2940 ggttgaaggt ggtcggagga tccgcaggta caggcgtgtt cttgatcagg atctgaggcg 3000 gaggatgttt caggccaaag ccgcccatca gcggagacgg gtggaagttg ccgtccgtgt 3060 gaggaatctt ggcccagatg ggaccctgca ggtacacgtc ccggttctgc cagaccatac 3120 cgggtaaggc cccctggctg ttgacagttc caatttgagg agccgtgttt tgctgctgca 3180 agttatctgc cacgataccg tattcctctg tagccacagg gttagtggtt ttgatttctt 3240 cctcgctggt gagcatgaca tcgctgtaat ccgcattgtc tctggcagca ttttgtttgc 3300 caaaaatcag gatcccgtta ctgggaaaaa aacgctcctc gtcgtctttg tgtgttgcca 3360 tagcgatgcc aggattagcc aatgaatttc ttccattcag atggtatttg gtcccagcag 3420 tccaggcaaa gttgctattg ttgttttgcc cggttgtcgt tgagacgcgt tgttggcggt 3480 aacagggtcc tggcagccag ttctttgcct gattggccat tgtattaggc ccaccttggc 3540 tgaagcccag agtctgcgta tttgccgtgc ctcctgttgt ttgagtccga gacaagtagt 3600 acaggtactg gtcaatcaga ggattcatca gccggtccaa gctctggctg tgggcgtagc 3660 tgctgtggaa aggcacgtcc tcgaaggtgt aagtaaactg gaagttgttg ccggttctca 3720 gcatctgcga aggaaagtat tccaggcagt agaaggagga gcgtcccacg gcctgactac 3780 cgttgttgag tgttaggtag ccgtactggg gaatcatgaa cacgtccgcc gggaacggag 3840 gcaggcagcc ctggtgggca gagccgagaa cgtacggcag ctggtactcc gagtccgtaa 3900 acacctggat ggtgctggtg aggttattgg cgatggtctt ggtgccttca ttctgcgtga 3960 cctccttgac ctggatgttg aagagcttga agctgagtct cttgggccgg aatccccagt 4020 tgttgttgat gagtcgctgc cagtcacgtg gtgaaaagtg gcagtggaat ctgttaaagt 4080 caaaataccc ccagggggtg ctgtagccga agtaggtgtt gtcgttggtg gctcctcccg 4140 atgtcccgtt ggagatttgc ttgtagaggt ggttgttgta ggtgggcagg gcccaggttc 4200 gggtgctggt ggtgatgact ctgtcgccca gccatgtgga atcgcaatgc caatttcccg 4260 aggaactacc cactccgtcg gcgccttcgt tattgtctgc cattggtgcg ccaccgcctg 4320 cagccattgt attaggtccc acaccagagg gcgctgctgg aggttctccg agaggttgag 4380 ggtctggaac tgactctgag tcgccagtct gaccaaaatt gagtcttttt ctggcgggct 4440 gttggccttt cttgccgatg cccgtagagg agtctggaga acgctggggt gatggctcta 4500 ccggtctctt ctttccagga gccgtcttag cgccttcctc aaccagaccg agaggttcga 4560 gaacccgctt cttggcctgg aagactgctc gcccgaggtt gcccccaaaa gacgtatctt 4620 cttgcagacg ctcctgaaac tcggcgtcgg cgtggttata ccgcaggtac ggattgtcac 4680 ccgcctgcag ctgctggtcg taggccttgt cgtgctcgag ggccgctgcg tccgccgcgt 4740 tgacgggctc ccccttgtcg agtccgttga agggtccgag gtacttgtag ccaggaagca 4800 ccagaccccg gccgtcgtcc tgcttttgct ggttggcttt gggcttcggg gctccaggtt 4860 tcagcgccca ccactcgcga atgccctcag agaggttgtc ctcgagccaa tctggaagat 4920 aaccatcggc agccatacct gatttaaatc atttattgtt caaagatgca gtcatccaaa 4980 tccacattga ccagatcgca ggcagtgcaa gcgtctggca cctttcccat gatatgatga 5040 atgtagcaca gtttctgata cgcctttttg acgacagaaa cgggttgaga ttctgacacg 5100 ggaaagcact ctaaacagtc tttctgtccg tgagtgaagc agatatttga attctgattc 5160 attctctcgc attgtctgca gggaaacagc atcagattca tgcccacgtg acgagaacat 5220 ttgttttggt acctgtctgc gtagttgatc gaagcttccg cgtctgacgt cgatggctgc 5280 gcaactgact cgcgcacccg tttgggctca cttatatctg cgtcactggg ggcgggtctt 5340 ttcttggctc cacccttttt gacgtagaat tcatgctcca cctcaaccac gtgatccttt 5400 gcccaccgga aaaagtcttt gacttcctgc ttggtgacct tcccaaagtc atgatccaga 5460 cggcgggtga gttcaaattt gaacatccgg tcttgcaacg gctgctggtg ttcgaaggtc 5520 gttgagttcc cgtcaatcac ggcgcacatg ttggtgttgg aggtgacgat cacgggagtc 5580 gggtctatct gggccgagga cttgcatttc tggtccacgc gcaccttgct tcctccgaga 5640 atggctttgg ccgactccac gaccttggcg gtcatcttcc cctcctccca ccagatcacc 5700 atcttgtcga cacagtcgtt gaagggaaag ttctcattgg tccagtttac gcacccgtag 5760 aagggcacag tgtgggctat ggcctccgcg atgttggtct tcccggtagt tgcaggccca 5820 aacagccaga tggtgttcct cttgccgaac tttttcgtgg cccatcccag aaagacggaa 5880 gccgcatatt ggggatcgta cccgtttagt tccaaaattt tataaatccg attgctggaa 5940 atgtcctcca cgggctgctg gcccaccagg tagtcggggg cggttttagt caggctcata 6000 atctttcccg cattgtccaa ggcagccttg atttgggacc gcgagttgga ggccgcattg 6060 aaggagatgt atgaggcctg gtcctcctgg atccactgct tctccgaggt aatccccttg 6120 tccacgagcc acccgaccag ctccatgtac ctggctgaag tttttgatct gatcaccggc 6180 gcatcagaat tgggattctg attctctttg ttctgctcct gcgtctgcga cacgtgcgtc 6240 agatgctgcg ccaccaaccg tttacgctcc gtgagattca aacaggcgct taaatactgt 6300 tccatattag tccacgccca ctggagctca ggctgggttt tggggagcaa gtaattgggg 6360 atgtagcact catccaccac cttgttcccg cctccggcgc catttctggt ctttgtgacc 6420 gcgaaccagt ttggcaaagt cggctcgatc ccgcggtaaa ttctctgaat cagtttttcg 6480 cgaatctgac tcaggaaacg tcccaaaacc atggatttca ccccggtggt ttccacgagc 6540 acgtgcatgt ggaagtagct ctctcccttc tcaaattgca caaagaaaag ggcctccggg 6600 gccttactca cacggcgcca ttccgtcaga aagtcgcgct gcagcttctc ggccacggtc 6660 aggggtgcct gctcaatcag attcagatcc atgtcagaat ctggcggcaa ctcccattcc 6720 ttctcggcca cccagttcac aaagctgtca gaaatgccgg gcagatgctc gtcaaggtcg 6780 ctggggacct taatcacaat ctcgtaaaac cccggcatgg cggctgcgcg ttcaaacctc 6840 ccgcttcaaa atggagaccc tgcgtgctca ctcgggctta aatacccagc gtgaccacat 6900 ggtgtcgcaa aatgtcgcaa aacactcacg tgacctctaa tacaggacct ccctaaccct 6960 atgacgtaat tcacgtcacg actccacca 6989 <210> 36 <211> 2217 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 36 ttacagatta cgggtgaggt aacgggtgcc aatggggcgg ggttcagagt acacgccttc 60 tgtattaaca gcaaagtcca cacttgtaga tttgtagtag ttggaggtgt actggatctc 120 ggggttccag cgcttgctgt tttccttctg cagctcccat tcaatttcca cgctgacctg 180 tccggtgctg tattgcgtga tgaaagagtt cagctttgac tggttgaagg tggtcggagg 240 atccgcaggt acaggcgtgt tcttgatcag gatctgaggc ggaggatgtt tcaggccaaa 300 gccgcccatc agcggagacg ggtggaagtt gccgtccgtg tgaggaatct tggcccagat 360 gggaccctgc aggtacacgt cccggttctg ccagaccata ccgggtaagg ccccctggct 420 gttgacagtt ccaatttgag gagccgtgtt ttgctgctgc aagttatctg ccacgatacc 480 gtattcctct gtagccacag ggttagtggt tttgatttct tcctcgctgg tgagcatgac 540 atcgctgtaa tccgcattgt ctctggcagc attttgtttg ccaaaaatca ggatcccgtt 600 actgggaaaa aaacgctcct cgtcgtcttt gtgtgttgcc atagcgatgc caggattagc 660 caatgaattt cttccattca gatggtattt ggtcccagca gtccaggcaa agttgctatt 720 gttgttttgc ccggttgtcg ttgagacgcg ttgttggcgg taacagggtc ctggcagcca 780 gttctttgcc tgattggcca ttgtattagg cccaccttgg ctgaagccca gagtctgcgt 840 atttgccgtg cctcctgttg tttgagtccg agacaagtag tacaggtact ggtcaatcag 900 aggattcatc agccggtcca agctctggct gtgggcgtag ctgctgtgga aaggcacgtc 960 ctcgaaggtg taagtaaact ggaagttgtt gccggttctc agcatctgcg aaggaaagta 1020 ttccaggcag tagaaggagg agcgtcccac ggcctgacta ccgttgttga gtgttaggta 1080 gccgtactgg ggaatcatga acacgtccgc cgggaacgga ggcaggcagc cctggtgggc 1140 agagccgaga acgtacggca gctggtactc cgagtccgta aacacctgga tggtgctggt 1200 gaggttattg gcgatggtct tggtgccttc attctgcgtg acctccttga cctggatgtt 1260 gaagagcttg aagctgagtc tcttgggccg gaatccccag ttgttgttga tgagtcgctg 1320 ccagtcacgt ggtgaaaagt ggcagtggaa tctgttaaag tcaaaatacc cccagggggt 1380 gctgtagccg aagtaggtgt tgtcgttggt ggctcctccc gatgtcccgt tggagatttg 1440 cttgtagagg tggttgttgt aggtgggcag ggcccaggtt cgggtgctgg tggtgatgac 1500 tctgtcgccc agccatgtgg aatcgcaatg ccaatttccc gaggaactac ccactccgtc 1560 ggcgccttcg ttattgtctg ccattggtgc gccaccgcct gcagccattg tattaggtcc 1620 cacaccagag ggcgctgctg gaggttctcc gagaggttga gggtctggaa ctgactctga 1680 gtcgccagtc tgaccaaaat tgagtctttt tctggcgggc tgttggcctt tcttgccgat 1740 gcccgtagag gagtctggag aacgctgggg tgatggctct accggtctct tctttccagg 1800 agccgtctta gcgccttcct caaccagacc gagaggttcg agaacccgct tcttggcctg 1860 gaagactgct cgcccgaggt tgcccccaaa agacgtatct tcttgcagac gctcctgaaa 1920 ctcggcgtcg gcgtggttat accgcaggta cggattgtca cccgcctgca gctgctggtc 1980 gtaggccttg tcgtgctcga gggccgctgc gtccgccgcg ttgacgggct cccccttgtc 2040 gagtccgttg aagggtccga ggtacttgta gccaggaagc accagacccc ggccgtcgtc 2100 ctgcttttgc tggttggctt tgggcttcgg ggctccaggt ttcagcgccc accactcgcg 2160 aatgccctca gagaggttgt cctcgagcca atctggaaga taaccatcgg cagccat 2217 <210> 37 <211> 6983 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 37 ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080 aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200 agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260 ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320 cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380 cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440 actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500 cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560 tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620 gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680 tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740 tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800 tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860 aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920 acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980 ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160 accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460 tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520 cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580 tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640 ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700 tttattgatt aacaagcaat tacagattac gagtcaggta tctggtgcca atggggcggg 2760 gttcactata tacaccttca gtattaacag caaattcaac attattagac ttgtaatagt 2820 tggaagtgta ctggatctcc gggttccagc gcttgctgtt ttccttctgc agctcccact 2880 cgatctccac gctgacttgg ccagtagaat actgggtgat gaaagagttc agcttgtcct 2940 tgttgaaggc cgttggagga tccgcaggta caggtgtgtt tttgatgagg atctgaggag 3000 gcgggtgctt cattccaaac cctcccatca gcggagaagg gtgaaagttg ccgtccgtgt 3060 gaggaatttt ggcccaaatg ggtccttgca ggtacacatc tctgtcctgc caaaccatac 3120 ccggaagtat tccttggttt tgaacccagc cggtctgcgc ctgtgcttgg gcactctggt 3180 ggtttgtggc cacttgtcca taggactccg ttgctaccgg gttagtagtt ttaatttctt 3240 cttcgttggt tatcatgact ttgtccgcat ccacgttgtc tcttccagtt ccttgtttgc 3300 caaaaattaa agatccagac aaaggaaaga aacggtcctc tccttctttg tggctggcca 3360 tagcaggtcc aggattcatc aagctattac gtccattgag agcccaagaa gaagctccag 3420 gccaagcaaa ttcgctgttg ttgttttgag tcacagtggt tgagacacgt tgttgtcggt 3480 agctgggtcc aggtatgtag tttcttccct ggacagccat gttgctgggt ccggccacac 3540 tgaattttag cgtttgttga ttctgtccag aaccgttaat agtctttgag agatagtaca 3600 agtattggtc gatgagtgga ttcattagtc ggtccaggct ttggctgtga gcgtagctgc 3660 tatggaaagg tacgttctca aactcgtagc tgaactggaa gttgttaccc gttcttagca 3720 tttgcgacgg gaaatattcc aggcagtaaa aggacgaacg acccacggcc tggcttccat 3780 cattaagcgt cagatacccg tactgaggaa tcatgaaaac gtccgctggg aacggcggga 3840 ggcagccctc gtgagccgac ccgagcacgt acgggagctg atagtctgag tccgtgaaga 3900 cctggaccgt gctggtaagg ttattggcga tggtcttgac tccattgttg tccgtaacct 3960 ctttgacctg aatgttgaag agcttgaagt tgagtcgctt aggccggaat ccccagttgt 4020 tgttgatgag tcgctgccag tcacgtggtg agaagtggca gtggaatctg ttgaagtcaa 4080 aataccccca gggggtgctg tagccgaagt aggcgttgtc atttgaagat cctccagatg 4140 tgctgttgga gatttgcttg tagaggtgat tgttgtaggt gggcagggcc caggttcggg 4200 tgctggtggt gatgactctg tcccccagcc attgggaatc gcaatgccaa tttcccgagg 4260 aactacccac tccatcggca ccttcgttat tgtctgccac tggtgcgcca ccacctgaag 4320 ccattgtaag agatcccaca cctgaggggg ctgcgggagg ttctccgatt ggttgagggt 4380 ctgggactga ctctgtgtcg ccagtctgac cgaaattgag tctcttttta gcgggctgtg 4440 cacccgattt gccaataccc gcggaggagt ccggttcctg aggagactgc tctacaggcc 4500 tcttctttcc aggagccgtc ttagccgctt cctcaaccag accaagaggt tcaagaagcc 4560 tctttttggc ctggaagact gctcgcccga ggttgccccc aaaagacgta tcttctttga 4620 gccgctcctg gaactcggcg tcggcgtggt tgtacttgag gtacgggttg tctccggcct 4680 tgagctgctg gtcgtaggcc ttgtcgtgct cgagggccgc cgcgtctgct gcgttgaccg 4740 gctccccctt gtcgagtccg ttgccgggtc caaggtattt gtaacccgga agcacaagac 4800 ctcgagcgtt gtcttgatgt tgttgatttg ccttgggttg aggggctcca ggtttcaaag 4860 cccaccactc gcgaattcct tcactaaggt tgtcctcgag ccaatctgga agataaccat 4920 cggcagccat acctgattta aatcatttat tgttcaaaga tgcagtcatc caaatccaca 4980 ttgaccagat cgcaggcagt gcaagcgtct ggcacctttc ccatgatatg atgaatgtag 5040 cacagtttct gatacgcctt tttgacgaca gaaacgggtt gagattctga cacgggaaag 5100 cactctaaac agtctttctg tccgtgagtg aagcagatat ttgaattctg attcattctc 5160 tcgcattgtc tgcagggaaa cagcatcaga ttcatgccca cgtgacgaga acatttgttt 5220 tggtacctgt ctgcgtagtt gatcgaagct tccgcgtctg acgtcgatgg ctgcgcaact 5280 gactcgcgca cccgtttggg ctcacttata tctgcgtcac tgggggcggg tcttttcttg 5340 gctccaccct ttttgacgta gaattcatgc tccacctcaa ccacgtgatc ctttgcccac 5400 cggaaaaagt ctttgacttc ctgcttggtg accttcccaa agtcatgatc cagacggcgg 5460 gtgagttcaa atttgaacat ccggtcttgc aacggctgct ggtgttcgaa ggtcgttgag 5520 ttcccgtcaa tcacggcgca catgttggtg ttggaggtga cgatcacggg agtcgggtct 5580 atctgggccg aggacttgca tttctggtcc acgcgcacct tgcttcctcc gagaatggct 5640 ttggccgact ccacgacctt ggcggtcatc ttcccctcct cccaccagat caccatcttg 5700 tcgacacagt cgttgaaggg aaagttctca ttggtccagt ttacgcaccc gtagaagggc 5760 acagtgtggg ctatggcctc cgcgatgttg gtcttcccgg tagttgcagg cccaaacagc 5820 cagatggtgt tcctcttgcc gaactttttc gtggcccatc ccagaaagac ggaagccgca 5880 tattggggat cgtacccgtt tagttccaaa attttataaa tccgattgct ggaaatgtcc 5940 tccacgggct gctggcccac caggtagtcg ggggcggttt tagtcaggct cataatcttt 6000 cccgcattgt ccaaggcagc cttgatttgg gaccgcgagt tggaggccgc attgaaggag 6060 atgtatgagg cctggtcctc ctggatccac tgcttctccg aggtaatccc cttgtccacg 6120 agccacccga ccagctccat gtacctggct gaagtttttg atctgatcac cggcgcatca 6180 gaattgggat tctgattctc tttgttctgc tcctgcgtct gcgacacgtg cgtcagatgc 6240 tgcgccacca accgtttacg ctccgtgaga ttcaaacagg cgcttaaata ctgttccata 6300 ttagtccacg cccactggag ctcaggctgg gttttgggga gcaagtaatt ggggatgtag 6360 cactcatcca ccaccttgtt cccgcctccg gcgccatttc tggtctttgt gaccgcgaac 6420 cagtttggca aagtcggctc gatcccgcgg taaattctct gaatcagttt ttcgcgaatc 6480 tgactcagga aacgtcccaa aaccatggat ttcaccccgg tggtttccac gagcacgtgc 6540 atgtggaagt agctctctcc cttctcaaat tgcacaaaga aaagggcctc cggggcctta 6600 ctcacacggc gccattccgt cagaaagtcg cgctgcagct tctcggccac ggtcaggggt 6660 gcctgctcaa tcagattcag atccatgtca gaatctggcg gcaactccca ttccttctcg 6720 gccacccagt tcacaaagct gtcagaaatg ccgggcagat gctcgtcaag gtcgctgggg 6780 accttaatca caatctcgta aaaccccggc atggcggctg cgcgttcaaa cctcccgctt 6840 caaaatggag accctgcgtg ctcactcggg cttaaatacc cagcgtgacc acatggtgtc 6900 gcaaaatgtc gcaaaacact cacgtgacct ctaatacagg acctccctaa ccctatgacg 6960 taattcacgt cacgactcca cca 6983 <210> 38 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 38 caacatacga gccggaagca taaagtgtaa a 31 <210> 39 <211> 5334 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 ggtacccaac tccatgctca acagtcccca ggtacagccc accctgcgtc gcaaccagga 60 acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120 taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctagagacac 180 tttcaataaa ggcaaatgct tttatttgta cactctcggg tgattattta cccccaccct 240 tgccgtctgc gccgtttaaa aatcaaaggg gttctgccgc gcatcgctat gcgccactgg 300 cagggacacg ttgcgatact ggtgtttagt gctccactta aactcaggca caaccatccg 360 cggcagctcg gtgaagtttt cactccacag gctgcgcacc atcaccaacg cgtttagcag 420 gtcgggcgcc gatatcttga agtcgcagtt ggggcctccg ccctgcgcgc gcgagttgcg 480 atacacaggg ttgcagcact ggaacactat cagcgccggg tggtgcacgc tggccagcac 540 gctcttgtcg gagatcagat ccgcgtccag gtcctccgcg ttgctcaggg cgaacggagt 600 caactttggt agctgccttc ccaaaaaggg cgcgtgccca ggctttgagt tgcactcgca 660 ccgtagtggc atcaaaaggt gaccgtgccc ggtctgggcg ttaggataca gcgcctgcat 720 aaaagccttg atctgcttaa aagccacctg agcctttgcg ccttcagaga agaacatgcc 780 gcaagacttg ccggaaaact gattggccgg acaggccgcg tcgtgcacgc agcaccttgc 840 gtcggtgttg gagatctgca ccacatttcg gccccaccgg ttcttcacga tcttggcctt 900 gctagactgc tccttcagcg cgcgctgccc gttttcgctc gtcacatcca tttcaatcac 960 gtgctcctta tttatcataa tgcttccgtg tagacactta agctcgcctt cgatctcagc 1020 gcagcggtgc agccacaacg cgcagcccgt gggctcgtga tgcttgtagg tcacctctgc 1080 aaacgactgc aggtacgcct gcaggaatcg ccccatcatc gtcacaaagg tcttgttgct 1140 ggtgaaggtc agctgcaacc cgcggtgctc ctcgttcagc caggtcttgc atacggccgc 1200 cagagcttcc acttggtcag gcagtagttt gaagttcgcc tttagatcgt tatccacgtg 1260 gtacttgtcc atcagcgcgc gcgcagcctc catgcccttc tcccacgcag acacgatcgg 1320 cacactcagc gggttcatca ccgtaatttc actttccgct tcgctgggct cttcctcttc 1380 ctcttgcgtc cgcataccac gcgccactgg gtcgtcttca ttcagccgcc gcactgtgcg 1440 cttacctcct ttgccatgct tgattagcac cggtgggttg ctgaaaccca ccatttgtag 1500 cgccacatct tctctttctt cctcgctgtc cacgattacc tctggtgatg gcgggcgctc 1560 gggcttggga gaagggcgct tctttttctt cttgggcgca atggccaaat ccgccgccga 1620 ggtcgatggc cgcgggctgg gtgtgcgcgg caccagcgcg tcttgtgatg agtcttcctc 1680 gtcctcggac tcgatacgcc gcctcatccg cttttttggg ggcgcccggg gaggcggcgg 1740 cgacggggac ggggacgaca cgtcctccat ggttggggga cgtcgcgccg caccgcgtcc 1800 gcgctcgggg gtggtttcgc gctgctcctc ttcccgactg gccatttcct tctcctatag 1860 gcagaaaaag atcatggagt cagtcgagaa gaaggacagc ctaaccgccc cctctgagtt 1920 cgccaccacc gcctccaccg atgccgccaa cgcgcctacc accttccccg tcgaggcacc 1980 cccgcttgag gaggaggaag tgattatcga gcaggaccca ggttttgtaa gcgaagacga 2040 cgaggaccgc tcagtaccaa cagaggataa aaagcaagac caggacaacg cagaggcaaa 2100 cgaggaacaa gtcgggcggg gggacgaaag gcatggcgac tacctagatg tgggagacga 2160 cgtgctgttg aagcatctgc agcgccagtg cgccattatc tgcgacgcgt tgcaagagcg 2220 cagcgatgtg cccctcgcca tagcggatgt cagccttgcc tacgaacgcc acctattctc 2280 accgcgcgta ccccccaaac gccaagaaaa cggcacatgc gagcccaacc cgcgcctcaa 2340 cttctacccc gtatttgccg tgccagaggt gcttgccacc tatcacatct ttttccaaaa 2400 ctgcaagata cccctatcct gccgtgccaa ccgcagccga gcggacaagc agctggcctt 2460 gcggcagggc gctgtcatac ctgatatcgc ctcgctcaac gaagtgccaa aaatctttga 2520 gggtcttgga cgcgacgaga agcgcgcggc aaacgctctg caacaggaaa acagcgaaaa 2580 tgaaagtcac tctggagtgt tggtggaact cgagggtgac aacgcgcgcc tagccgtact 2640 aaaacgcagc atcgaggtca cccactttgc ctacccggca cttaacctac cccccaaggt 2700 catgagcaca gtcatgagtg agctgatcgt gcgccgtgcg cagcccctgg agagggatgc 2760 aaatttgcaa gaacaaacag aggagggcct acccgcagtt ggcgacgagc agctagcgcg 2820 ctggcttcaa acgcgcgagc ctgccgactt ggaggagcga cgcaaactaa tgatggccgc 2880 agtgctcgtt accgtggagc ttgagtgcat gcagcggttc tttgctgacc cggagatgca 2940 gcgcaagcta gaggaaacat tgcactacac ctttcgacag ggctacgtac gccaggcctg 3000 caagatctcc aacgtggagc tctgcaacct ggtctcctac cttggaattt tgcacgaaaa 3060 ccgccttggg caaaacgtgc ttcattccac gctcaagggc gaggcgcgcc gcgactacgt 3120 ccgcgactgc gtttacttat ttctatgcta cacctggcag acggccatgg gcgtttggca 3180 gcagtgcttg gaggagtgca acctcaagga gctgcagaaa ctgctaaagc aaaacttgaa 3240 ggacctatgg acggccttca acgagcgctc cgtggccgcg cacctggcgg acatcatttt 3300 ccccgaacgc ctgcttaaaa ccctgcaaca gggtctgcca gacttcacca gtcaaagcat 3360 gttgcagaac tttaggaact ttatcctaga gcgctcagga atcttgcccg ccacctgctg 3420 tgcacttcct agcgactttg tgcccattaa gtaccgcgaa tgccctccgc cgctttgggg 3480 ccactgctac cttctgcagc tagccaacta ccttgcctac cactctgaca taatggaaga 3540 cgtgagcggt gacggtctac tggagtgtca ctgtcgctgc aacctatgca ccccgcaccg 3600 ctccctggtt tgcaattcgc agctgcttaa cgaaagtcaa attatcggta cctttgagct 3660 gcagggtccc tcgcctgacg aaaagtccgc ggctccgggg ttgaaactca ctccggggct 3720 gtggacgtcg gcttaccttc gcaaatttgt acctgaggac taccacgccc acgagattag 3780 gttctacgaa gaccaatccc gcccgccaaa tgcggagctt accgcctgcg tcattaccca 3840 gggccacatt cttggccaat tgcaagccat caacaaagcc cgccaagagt ttctgctacg 3900 aaagggacgg ggggtttact tggaccccca gtccggcgag gagctcaacc caatcccccc 3960 gccgccgcag ccctatcagc agcagccgcg ggcccttgct tcccaggatg gcacccaaaa 4020 agaagctgca gctgccgccg ccacccacgg acgaggagga atactgggac agtcaggcag 4080 aggaggtttt ggacgaggag gaggaggaca tgatggaaga ctgggagagc ctagacgagg 4140 aagcttccga ggtcgaagag gtgtcagacg aaacaccgtc accctcggtc gcattcccct 4200 cgccggcgcc ccagaaatcg gcaaccggtt ccagcatggc tacaacctcc gctcctcagg 4260 cgccgccggc actgcccgtt cgccgaccca accgtagatg ggacaccact ggaaccaggg 4320 ccggtaagtc caagcagccg ccgccgttag cccaagagca acaacagcgc caaggctacc 4380 gctcatggcg cgggcacaag aacgccatag ttgcttgctt gcaagactgt gggggcaaca 4440 tctccttcgc ccgccgcttt cttctctacc atcacggcgt ggccttcccc cgtaacatcc 4500 tgcattacta ccgtcatctc tacagcccat actgcaccgg cggcagcggc agcggcagca 4560 acagcagcgg ccacacagaa gcaaaggcga ccggatagca agactctgac aaagcccaag 4620 aaatccacag cggcggcagc agcaggagga ggagcgctgc gtctggcgcc caacgaaccc 4680 gtatcgaccc gcgagcttag aaacaggatt tttcccactc tgtatgctat atttcaacag 4740 agcaggggcc aagaacaaga gctgaaaata aaaaacaggt ctctgcgatc cctcacccgc 4800 agctgcctgt atcacaaaag cgaagatcag cttcggcgca cgctggaaga cgcggaggct 4860 ctcttcagta aatactgcgc gctgactctt aaggactagt ttcgcgccct ttctcaaatt 4920 taagcgcgaa aactacgtca tctccagcgg ccacacccgg cgccagcacc tgtcgtcagc 4980 gccattatga gcaaggaaat tcccacgccc tacatgtgga gttaccagcc acaaatggga 5040 cttgcggctg gagctgccca agactactca acccgaataa actacatgag cgcgggaccc 5100 cacatgatat cccgggtcaa cggaatccgc gcccaccgaa accgaattct cttggaacag 5160 gcggctatta ccaccacacc tcgtaataac cttaatcccc gtagttggcc cgctgccctg 5220 gtgtaccagg aaagtcccgc tcccaccact gtggtacttc ccagagacgc ccaggccgaa 5280 gttcagatga ctaactcagg ggcgcagctt gcgggcggct ttcgtcacag ggtg 5334 <210> 40 <211> 3201 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 40 tacactaaac ggtacacagg aaacaggaga cacaactcca agtgcatact ctatgtcatt 60 ttcatgggac tggtctggcc acaactacat taatgaaata tttgccacat cctcttacac 120 tttttcatac attgcccaag aataaagaat cgtttgtgtt atgtttcaac gtgtttattt 180 ttcaattgca gaaaatttca agtcattttt cattcagtag tatagcccca ccaccacata 240 gcttatacag atcaccgtac cttaatcaaa ctcacagaac cctagtattc aacctgccac 300 ctccctccca acacacagag tacacagtcc tttctccccg gctggcctta aaaagcatca 360 tatcatgggt aacagacata ttcttaggtg ttatattcca cacggtttcc tgtcgagcca 420 aacgctcatc agtgatatta ataaactccc cgggcagctc acttaagttc atgtcgctgt 480 ccagctgctg agccacaggc tgctgtccaa cttgcggttg cttaacgggc ggcgaaggag 540 aagtccacgc ctacatgggg gtagagtcat aatcgtgcat caggataggg cggtggtgct 600 gcagcagcgc gcgaataaac tgctgccgcc gccgctccgt cctgcaggaa tacaacatgg 660 cagtggtctc ctcagcgatg attcgcaccg cccgcagcat aaggcgcctt gtcctccggg 720 cacagcagcg caccctgatc tcacttaaat cagcacagta actgcagcac agcaccacaa 780 tattgttcaa aatcccacag tgcaaggcgc tgtatccaaa gctcatggcg gggaccacag 840 aacccacgtg gccatcatac cacaagcgca ggtagattaa gtggcgaccc ctcataaaca 900 cgctggacat aaacattacc tcttttggca tgttgtaatt caccacctcc cggtaccata 960 taaacctctg attaaacatg gcgccatcca ccaccatcct aaaccagctg gccaaaacct 1020 gcccgccggc tatacactgc agggaaccgg gactggaaca atgacagtgg agagcccagg 1080 actcgtaacc atggatcatc atgctcgtca tgatatcaat gttggcacaa cacaggcaca 1140 cgtgcataca cttcctcagg attacaagct cctcccgcgt tagaaccata tcccagggaa 1200 caacccattc ctgaatcagc gtaaatccca cactgcaggg aagacctcgc acgtaactca 1260 cgttgtgcat tgtcaaagtg ttacattcgg gcagcagcgg atgatcctcc agtatggtag 1320 cgcgggtttc tgtctcaaaa ggaggtagac gatccctact gtacggagtg cgccgagaca 1380 accgagatcg tgttggtcgt agtgtcatgc caaatggaac gccggacgta gtcatatttc 1440 ctgaagcaaa accaggtgcg ggcgtgacaa acagatctgc gtctccggtc tcgccgctta 1500 gatcgctctg tgtagtagtt gtagtatatc cactctctca aagcatccag gcgccccctg 1560 gcttcgggtt ctatgtaaac tccttcatgc gccgctgccc tgataacatc caccaccgca 1620 gaataagcca cacccagcca acctacacat tcgttctgcg agtcacacac gggaggagcg 1680 ggaagagctg gaagaaccat gttttttttt ttattccaaa agattatcca aaacctcaaa 1740 atgaagatct attaagtgaa cgcgctcccc tccggtggcg tggtcaaact ctacagccaa 1800 agaacagata atggcatttg taagatgttg cacaatggct tccaaaaggc aaacggccct 1860 cacgtccaag tggacgtaaa ggctaaaccc ttcagggtga atctcctcta taaacattcc 1920 agcaccttca accatgccca aataattctc atctcgccac cttctcaata tatctctaag 1980 caaatcccga atattaagtc cggccattgt aaaaatctgc tccagagcgc cctccacctt 2040 cagcctcaag cagcgaatca tgattgcaaa aattcaggtt cctcacagac ctgtataaga 2100 ttcaaaagcg gaacattaac aaaaataccg cgatcccgta ggtcccttcg cagggccagc 2160 tgaacataat cgtgcaggtc tgcacggacc agcgcggcca cttccccgcc aggaaccatg 2220 acaaaagaac ccacactgat tatgacacgc atactcggag ctatgctaac cagcgtagcc 2280 ccgatgtaag cttgttgcat gggcggcgat ataaaatgca aggtgctgct caaaaaatca 2340 ggcaaagcct cgcgcaaaaa agaaagcaca tcgtagtcat gctcatgcag ataaaggcag 2400 gtaagctccg gaaccaccac agaaaaagac accatttttc tctcaaacat gtctgcgggt 2460 ttctgcataa acacaaaata aaataacaaa aaaacattta aacattagaa gcctgtctta 2520 caacaggaaa aacaaccctt ataagcataa gacggactac ggccatgccg gcgtgaccgt 2580 aaaaaaactg gtcaccgtga ttaaaaagca ccaccgacag ctcctcggtc atgtccggag 2640 tcataatgta agactcggta aacacatcag gttgattcac atcggtcagt gctaaaaagc 2700 gaccgaaata gcccggggga atacataccc gcaggcgtag agacaacatt acagccccca 2760 taggaggtat aacaaaatta ataggagaga aaaacacata aacacctgaa aaaccctcct 2820 gcctaggcaa aatagcaccc tcccgctcca gaacaacata cagcgcttcc acagcggcag 2880 ccataacagt cagccttacc agtaaaaaag aaaacctatt aaaaaaacac cactcgacac 2940 ggcaccagct caatcagtca cagtgtaaaa aagggccaag tgcagagcga gtatatatag 3000 gactaaaaaa tgacgtaacg gttaaagtcc acaaaaaaca cccagaaaac cgcacgcgaa 3060 cctacgccca gaaacgaaag ccaaaaaacc cacaacttcc tcaaatcgtc acttccgttt 3120 tcccacgtta cgtaacttcc cattttaaga aaactacaat tcccaacaca tacaagttac 3180 tccgccctaa aacctacgtc a 3201 <210> 41 <211> 6896 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 41 ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080 aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200 agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260 ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320 cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380 cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440 actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500 cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560 tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620 gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680 tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740 tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800 tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860 aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920 acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980 ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160 accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460 tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520 cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580 tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640 ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700 tttattgatt aacaagcaat tacagattac gagtcaggta tctggtgcca atggggcggg 2760 gttcactata tacaccttca gtattaacag caaattcaac attattagac ttgtaatagt 2820 tggaagtgta ctggatctcc gggttccagc gcttgctgtt ttccttctgc agctcccact 2880 cgatctccac gctgacttgg ccagtagaat actgggtgat gaaagagttc agcttgtcct 2940 tgttgaaggc cgttggagga tccgcaggta caggtgtgtt tttgatgagg atctgaggag 3000 gcgggtgctt cattccaaac cctcccatca gcggagaagg gtgaaagttg ccgtccgtgt 3060 gaggaatttt ggcccaaatg ggtccttgca ggtacacatc tctgtcctgc caaaccatac 3120 ccggaagtat tccttggttt tgaacccagc cggtctgcgc ctgtgcttgg gcactctggt 3180 ggtttgtggc cacttgtcca taggactccg ttgctaccgg gttagtagtt ttaatttctt 3240 cttcgttggt tatcatgact ttgtccgcat ccacgttgtc tcttccagtt ccttgtttgc 3300 caaaaattaa agatccagac aaaggaaaga aacggtcctc tccttctttg tggctggcca 3360 tagcaggtcc aggattcatc aagctattac gtccattgag agcccaagaa gaagctccag 3420 gccaagcaaa ttcgctgttg ttgttttgag tcacagtggt tgagacacgt tgttgtcggt 3480 agctgggtcc aggtatgtag tttcttccct ggacagccat gttgctgggt ccggccacac 3540 tgaattttag cgtttgttga ttctgtccag aaccgttaat agtctttgag agatagtaca 3600 agtattggtc gatgagtgga ttcattagtc ggtccaggct ttggctgtga gcgtagctgc 3660 tatggaaagg tacgttctca aactcgtagc tgaactggaa gttgttaccc gttcttagca 3720 tttgcgacgg gaaatattcc aggcagtaaa aggacgaacg acccacggcc tggcttccat 3780 cattaagcgt cagatacccg tactgaggaa tcatgaaaac gtccgctggg aacggcggga 3840 ggcagccctc gtgagccgac ccgagcacgt acgggagctg atagtctgag tccgtgaaga 3900 cctggaccgt gctggtaagg ttattggcga tggtcttgac tccattgttg tccgtaacct 3960 ctttgacctg aatgttgaag agcttgaagt tgagtcgctt aggccggaat ccccagttgt 4020 tgttgatgag tcgctgccag tcacgtggtg agaagtggca gtggaatctg ttgaagtcaa 4080 aataccccca gggggtgctg tagccgaagt aggcgttgtc atttgaagat cctccagatg 4140 tgctgttgga gatttgcttg tagaggtgat tgttgtaggt gggcagggcc caggttcggg 4200 tgctggtggt gatgactctg tcccccagcc attgggaatc gcaatgccaa tttcccgagg 4260 aactacccac tccatcggca ccttcgttat tgtctgccac tggtgcgcca ccacctgaag 4320 ccattgtaag agatcccaca cctgaggggg ctgcgggagg ttctccgatt ggttgagggt 4380 ctgggactga ctctgtgtcg ccagtctgac cgaaattgag tctcttttta gcgggctgtg 4440 cacccgattt gccaataccc gcggaggagt ccggttcctg aggagactgc tctacaggcc 4500 tcttctttcc aggagccgtc ttagccgctt cctcaaccag accaagaggt tcaagaagcc 4560 tctttttggc ctggaagact gctcgcccga ggttgccccc aaaagacgta tcttctttga 4620 gccgctcctg gaactcggcg tcggcgtggt tgtacttgag gtacgggttg tctccggcct 4680 tgagctgctg gtcgtaggcc ttgtcgtgct cgagggccgc cgcgtctgct gcgttgaccg 4740 gctccccctt gtcgagtccg ttgccgggtc caaggtattt gtaacccgga agcacaagac 4800 ctcgagcgtt gtcttgatgt tgttgatttg ccttgggttg aggggctcca ggtttcaaag 4860 cccaccactc gcgaattcct tcactaaggt tgtcctcgag ccaatctgga agataaccat 4920 cggcagccat acctgattta aatcatttat tgttcaaaga tgcagtcatc caaatccaca 4980 ttgaccagat cgcaggcagt gcaagcgtct ggcacctttc ccatgatatg atgaatgtag 5040 cacagtttct gatacgcctt tttgacgaca gaaacgggtt gagattctga cacgggaaag 5100 cactctaaac agtctttctg tccgtgagtg aagcagatat ttgaattctg attcattctc 5160 tcgcattgtc tgcagggaaa cagcatcaga ttcatgccca cgtgacgaga acatttgttt 5220 tggtacctgt ctgcgtagtt gatcgaagct tccgcgtctg acgtcgatgg ctgcgcaact 5280 gactcgcgca cccgtttggg ctcacttata tctgcgtcac tgggggcggg tcttttcttg 5340 gctccaccct ttttgacgta gaattcatgc tccacctcaa ccacgtgatc ctttgcccac 5400 cggaaaaagt ctttgacttc ctgcttggtg accttcccaa agtcatgatc cagacggcgg 5460 gtgagttcaa atttgaacat ccggtcttgc aacggctgct ggtgttcgaa ggtcgttgag 5520 ttcccgtcaa tcacggcgca catgttggtg ttggaggtga cgatcacggg agtcgggtct 5580 atctgggccg aggacttgca tttctggtcc acgcgcacct tgcttcctcc gagaatggct 5640 ttggccgact ccacgacctt ggcggtcatc ttcccctcct cccaccagat caccatcttg 5700 tcgacacagt cgttgaaggg aaagttctca ttggtccagt ttacgcaccc gtagaagggc 5760 acagtgtggg ctatggcctc cgcgatgttg gtcttcccgg tagttgcagg cccaaacagc 5820 cagatggtgt tcctcttgcc gaactttttc gtggcccatc ccagaaagac ggaagccgca 5880 tattggggat cgtacccgtt tagttccaaa attttataaa tccgattgct ggaaatgtcc 5940 tccacgggct gctggcccac caggtagtcg ggggcggttt tagtcaggct cataatcttt 6000 cccgcattgt ccaaggcagc cttgatttgg gaccgcgagt tggaggccgc attgaaggag 6060 atgtatgagg cctggtcctc ctggatccac tgcttctccg aggtaatccc cttgtccacg 6120 agccacccga ccagctccat gtacctggct gaagtttttg atctgatcac cggcgcatca 6180 gaattgggat tctgattctc tttgttctgc tcctgcgtct gcgacacgtg cgtcagatgc 6240 tgcgccacca accgtttacg ctccgtgaga ttcaaacagg cgcttaaata ctgttccata 6300 ttagtccacg cccactggag ctcaggctgg gttttgggga gcaagtaatt ggggatgtag 6360 cactcatcca ccaccttgtt cccgcctccg gcgccatttc tggtctttgt gaccgcgaac 6420 cagtttggca aagtcggctc gatcccgcgg taaattctct gaatcagttt ttcgcgaatc 6480 tgactcagga aacgtcccaa aaccatggat ttcaccccgg tggtttccac gagcacgtgc 6540 atgtggaagt agctctctcc cttctcaaat tgcacaaaga aaagggcctc cggggcctta 6600 ctcacacggc gccattccgt cagaaagtcg cgctgcagct tctcggccac ggtcaggggt 6660 gcctgctcaa tcagattcag atccatgtca gaatctggcg gcaactccca ttccttctcg 6720 gccacccagt tcacaaagct gtcagaaatg ccgggcagat gctcgtcaag gtcgctgggg 6780 accttaatca caatctcgta aaaccccggc atggcggctg cgcagatcag aagttcctat 6840 actttctaga gaataggaac ttcggaatag gaacttctga tcttccgggg gatcca 6896 <210> 42 <211> 8469 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (4155)..(4254) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (4155)..(4254) <223> This region may encompass 60-100 nucleotides <400> 42 tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 60 actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt aacaagggtg aacactatcc 120 catatcacca gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg 180 cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 240 aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 300 aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 360 atttttttct ccattttttt ttcctccttt agaaaaactc atcgagcatc aaatgaaact 420 gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 480 aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 540 ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 600 caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 660 tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 720 caaccaaacc gttattcatt cgtgattgcg cctgagcgag gcgaaatacg cgatcgctgt 780 taaaaggaca attacaaaca ggaatcgagt gcaaccggcg caggaacact gccagcgcat 840 caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaacgct gtttttccgg 900 ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 960 gaagtggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1020 caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1080 gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1140 cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcattt 1200 ttttttcctc ctttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 1260 tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 1320 accatctggc cccagcgctg cgatgatacc gcgagaacca cgctcaccgg ctccggattt 1380 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 1440 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 1500 tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg gtgtcacgct cgtcgtttgg 1560 tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 1620 gtgcacgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 1680 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 1740 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 1800 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 1860 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 1920 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 1980 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 2040 atattcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 2100 tacatatttg aatgtattta gaaaaataaa caaatagggg tcagtgttac aaccaattaa 2160 ccaattctga acattatcgc gagcccattt atacctgaat atggctcata acaccccttg 2220 tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 2280 acgccgtagc gccgatggta gtgtggggac tccccatgcg agagtaggga actgccaggc 2340 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgcccgggc taattgaggg 2400 gtgtcgccct tattcgactc ggggctcgag cagcagctgc gcgctcgctc gctcactgag 2460 gccgcccggg caaagcccgg gcgtcgggcg acctttggtc gcccggcctc agtgagcgag 2520 cgagcgcgca gagagggagt ggggttttaa ttaaacgcgt ttacataact tacggtaaat 2580 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 2640 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggacta tttacggtaa 2700 actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 2760 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 2820 acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 2880 tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 2940 gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 3000 aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataggc 3060 gcgccgaact gaaaaaccag aaagttaact ggtaagttta gtctttttgt cttttatttc 3120 aggtcccgga tccggtggtg gtgcaaatca aagaactgct cctcagtgga tgttgccttt 3180 acttctaggc ctgtacggaa gtgttacttc tgctctaaaa gctcctgcag ggaattcgcc 3240 accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg 3300 gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc 3360 tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt gccctggccc 3420 accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc cgaccacatg 3480 aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc 3540 ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc 3600 ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg 3660 cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga caagcagaag 3720 aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag cgtgcagctc 3780 gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac 3840 cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg cgatcacatg 3900 gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag 3960 taatagacta gtgtcgacag atcttttaaa aaacctccca cacaattgtt gttgttaact 4020 tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 4080 aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 4140 atgtctgttt aaacnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4200 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnatttaa 4260 ataggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 4320 ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 4380 gcgagcgcgc agagagtata catcgatgtg agttcgcggg tggctggggg gccctgggct 4440 gcgaccgccc ccgaaccgcg tctacgagcc ttgcgggctc cgggtctttg cagtcgtatg 4500 ggggcagggt agctgttccc cgcaaggaga gctcaaggtc agcgctcgga cctggcggag 4560 ccccgcaccc aggctgtggc gccctgtgca gctccgccct tgcggcgcca tctgcccgga 4620 gcctccttcc cctagtcccc agaaacagga ggtccctact cccgcccgag atcccgaccc 4680 ggacccctag gtgggggacg ctttctttcc tttcgcgctc tgcggggtca cgtgtcgcag 4740 aggagcccct cccccacggc ctccggcacc gcaggccccg ggatgctagt gcgcagcggg 4800 tgcatccctg tccggatgct gcgcctgcgg tagagcggcc gccatgttgc aaccgggaag 4860 gaaatgaatg ggcagccgtt aggaaagcct gccggtgact aaccctgcgc tcctgcctcg 4920 atgggtggag tcgcgtgtgg cggggaagtc aggtggagcg aggctagctg gcccgatttc 4980 tcctccgggt gatgcttttc ctagattatt ctctggtaaa tcaaagaagt gggtttatgg 5040 aggtcctctt gtgtcccctc cccgcagagg tgtggtggct gtggcatggt gccaagccgg 5100 gagaagctga gtcatgggta gttggaaaag gacatttcca ccgcaaaatg gcccctctgg 5160 tggtggcccc ttcctgcagc gccggctcac ctcacggccc cgcccttccc ctgccagcct 5220 agcgttgacc cgaccccaaa ggccaggctg taaatgtcac cgggaggatt gggtgtctgg 5280 gcgcctcggg gaacctgccc ttctccccat tccgtcttcc ggaaaccaga tctcccaccg 5340 caccctggtc tgaggttaaa tatagctgct gacctttctg tagctggggg cctgggctgg 5400 ggctctctcc catcccttct ccccacacac atgcacttac ctgtgctccc actcctgatt 5460 tctggaaaag agctaggaag gacaggcaac ttggcaaatc aaagccctgg gactaggggg 5520 ttaaaataca gcttcccctc ttcccacccg ccccagtctc tgtccctttt gtaggaggga 5580 cttagagaag gggtgggctt gccctgtcca gttaatttct gacctttact cctgcccttt 5640 gagtttgatg atgctgagtg tacaagcgtt ttctccctaa agggtgcagc tgagctaggc 5700 agcagcaagc attcctgggg tggcatagtg gggtggtgaa taccatgtac aaagcttgtg 5760 cccagactgt gggtggcagt gccccacatg gccgcttctc ctggaagggc ttcgtatgac 5820 tgggggtgtt gggcagccct ggagccttca gttgcagcca tgccttaagc caggccagcc 5880 tggcagggaa gctcaaggga gataaaattc aacctcttgg gccctcctgg gggtaaggag 5940 atgctgcatt cgccctctta atggggaggt ggcctagggc tgctcacata ttctggagga 6000 gcctcccctc ctcatgcctt cttgcctctt gtctcttagg catgcaaaag agtcgaataa 6060 gggcgacaca aaatttattc taaatgcata ataaatactg ataacatctt atagtttgta 6120 ttatattttg tattatcgtt gacatgtata attttgatat caaaaactga ttttcccttt 6180 attattttcg agatttattt tcttaattct ctttaacaaa ctagaaatat tgtatataca 6240 aaaaatcata aataatagat gaatagttta attataggtg ttcatcaatc gaaaaagcaa 6300 cgtatcttat ttaaagtgcg ttgctttttt ctcatttata aggttaaata attctcatat 6360 atcaagcaaa gtgacaggcg cccttaaata ttctgacaaa tgctctttcc ctaaactccc 6420 cccataaaaa aacccgccga agcgggtttt tacgttattt gcggattaac gattactcgt 6480 tatcagaacc gcccaggggg cccgagctta agactggccg tcgttttaca acacagaaag 6540 agtttgtaga aacgcaaaaa ggccatccgt caggggcctt ctgcttagtt tgatgcctgg 6600 cagttcccta ctctcgcctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 6660 gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 6720 ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 6780 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 6840 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 6900 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 6960 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 7020 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 7080 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 7140 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 7200 gttcttgaag tggtgggcta actacggcta cactagaaga acagtatttg gtatctgcgc 7260 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 7320 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 7380 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgacgcgcg 7440 cgtaactcac gttaagggat tttggtcatg agcttgcgcc gtcccgtcaa gtcagcgtaa 7500 tgctctgctt aggtggcggt acttgggtcg atatcaaagt gcatcacttc ttcccgtatg 7560 cccaactttg tatagagagc cactgcggga tcgtcaccgt aatctgcttg cacgtagatc 7620 acataagcac caagcgcgtt ggcctcatgc ttgaggagat tgatgagcgc ggtggcaatg 7680 ccctgcctcc ggtgctcgcc ggagactgcg agatcataga tatagatctc actacgcggc 7740 tgctcaaact tgggcagaac gtaagccgcg agagcgccaa caaccgcttc ttggtcgaag 7800 gcagcaagcg cgatgaatgt cttactacgg agcaagttcc cgaggtaatc ggagtccggc 7860 tgatgttggg agtaggtggc tacgtcaccg aactcacgac cgaaaagatc aagagcagcc 7920 cgcatggatt tgacttggtc agggccgagc ctacatgtgc gaatgatgcc catacttgag 7980 ccacctaact ttgttttagg gcgactgccc tgctgcgtaa catcgttgct gctccataac 8040 atcaaacatc gacccacggc gtaacgcgct tgctgcttgg atgcccgagg catagactgt 8100 acaaaaaaac agtcataaca agccatgaaa accgccactg cgccgttacc accgctgcgt 8160 tcggtcaagg ttctggacca gttgcgtgag cgcatttttt tttcctcctc ggcgtttacg 8220 ccccgccctg ccactcatcg cagtactgtt gtaattcatt aagcattctg ccgacatgga 8280 agccatcaca gacggcatga tgaacctgaa tcgccagcgg catcagcacc ttgtcgcctt 8340 gcgtataata tttgcccata gtgaaaacgg gggcgaagaa gttgtccata ttggccacgt 8400 ttaaatcaaa actggtgaaa ctcacccagg gattggcgct gacgaaaaac atattctcaa 8460 taaaccctt 8469 <210> 43 <211> 116 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 43 cagcagctgc gcgctcgctc gctcactgag gccgcccggg caaagcccgg gcgtcgggcg 60 acctttggtc gcccggcctc agtgagcgag cgagcgcgca gagagggagt ggggtt 116 <210> 44 <211> 534 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 44 ttaggtggcg gtacttgggt cgatatcaaa gtgcatcact tcttcccgta tgcccaactt 60 tgtatagaga gccactgcgg gatcgtcacc gtaatctgct tgcacgtaga tcacataagc 120 accaagcgcg ttggcctcat gcttgaggag attgatgagc gcggtggcaa tgccctgcct 180 ccggtgctcg ccggagactg cgagatcata gatatagatc tcactacgcg gctgctcaaa 240 cttgggcaga acgtaagccg cgagagcgcc aacaaccgct tcttggtcga aggcagcaag 300 cgcgatgaat gtcttactac ggagcaagtt cccgaggtaa tcggagtccg gctgatgttg 360 ggagtaggtg gctacgtcac cgaactcacg accgaaaaga tcaagagcag cccgcatgga 420 tttgacttgg tcagggccga gcctacatgt gcgaatgatg cccatacttg agccacctaa 480 ctttgtttta gggcgactgc cctgctgcgt aacatcgttg ctgctccata acat 534 <210> 45 <211> 11635 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60 acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120 taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180 ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240 cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300 ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360 cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420 aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480 cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540 acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600 gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660 caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720 atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780 ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840 gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900 ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960 acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020 gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080 gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140 ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200 gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260 tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320 ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380 tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440 cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500 agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560 tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620 gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680 tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740 ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800 ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860 aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920 ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980 cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040 gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100 aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160 gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220 cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280 tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340 aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400 aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460 ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520 gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580 aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640 ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700 gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760 gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820 cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880 gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940 cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000 tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060 aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120 gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180 cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240 aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300 ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360 atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420 tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480 ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540 gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600 cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660 ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720 ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780 aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840 cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900 cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960 ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020 gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080 agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140 ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200 ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260 gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320 taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380 gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440 cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500 ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560 cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620 ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680 cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740 ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800 gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860 tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920 cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980 ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040 cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100 tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160 ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220 accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280 agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcgcccg 5340 ggcgttttag ggcggagtaa cttgcatgta ttgggaattg tagttttttt aaaatgggaa 5400 gtgacgtatc gtgggaaaac ggaagtgaag atttgaggaa gttgtgggtt ttttggcttt 5460 cgtttctggg cgtaggttcg cgtgcggttt tctgggtgtt ttttgtggac tttaaccgtt 5520 acgtcatttt ttagtcctat atatactcgc tctgtacttg gcccttttta cactgtgact 5580 gattgagctg gtgccgtgtc gagtggtgtt ttttaatagg tttttttact ggtaaggctg 5640 actgttatgg ctgccgctgt ggaagcgctg tatgttgttc tggagcggga gggtgctatt 5700 ttgcctaggc aggagggttt ttcaggtgtt tatgtgtttt tctctcctat taattttgtt 5760 atacctccta tgggggctgt aatgttgtct ctacgcctgc gggtatgtat tcccccgggc 5820 tatttcggtc gctttttagc actgaccgat gttaaccaac ctgatgtgtt taccgagtct 5880 tacattatga ctccggacat gaccgaggaa ctgtcggtgg tgctttttaa tcacggtgac 5940 cagttttttt acggtcacgc cggcatggcc gtagtccgtc ttatgcttat aagggttgtt 6000 tttcctgttg taagacaggc ttctaatgtt taaatgtttt tttttttgtt attttatttt 6060 gtgtttaatg caggaacccg cagacatgtt tgagagaaaa atggtgtctt tttctgtggt 6120 ggttccggaa cttacctgcc tttatctgca tgagcatgac tacgatgtgc ttgctttttt 6180 gcgcgaggct ttgcctgatt ttttgagcag caccttgcat tttatatcgc cgcccatgca 6240 acaagcttac ataggggcta cgctggttag catagctccg agtatgcgtg tcataatcag 6300 tgtgggttct tttgtcatgg ttcctggcgg ggaagtggcc gcgctggtcc gtgcagacct 6360 gcacgattat gttcagctgg ccctgcgaag ggacctacgg gatcgcggta tttttgttaa 6420 tgttccgctt ttgaatctta tacaggtctg tgaggaacct gaatttttgc aatcatgatt 6480 cgctgcttga ggctgaaggt ggagggcgct ctggagcaga tttttacaat ggccggactt 6540 aatattcggg atttgcttag agacatattg ataaggtggc gagatgaaaa ttatttgggc 6600 atggttgaag gtgctggaat gtttatagag gagattcacc ctgaagggtt tagcctttac 6660 gtccacttgg acgtgagggc agtttgcctt ttggaagcca ttgtgcaaca tcttacaaat 6720 gccattatct gttctttggc tgtagagttt gaccacgcca ccggagggga gcgcgttcac 6780 ttaatagatc ttcattttga ggttttggat aatcttttgg aataaaaaaa aaaaaacatg 6840 gttcttccag ctcttcccgc tcctcccgtg tgtgactcgc agaacgaatg tgtaggttgg 6900 ctgggtgtgg cttattctgc ggtggtggat gttatcaggg cagcggcgca tgaaggagtt 6960 tacatagaac ccgaagccag ggggcgcctg gatgctttga gagagtggat atactacaac 7020 tactacacag agcgagctaa gcgacgagac cggagacgca gatctgtttg tcacgcccgc 7080 acctggtttt gcttcaggaa atatgactac gtccggcgtt ccatttggca tgacactacg 7140 accaacacga tctcggttgt ctcggcgcac tccgtacagt agggatcgcc tacctccttt 7200 tgagacagag acccgcgcta ccatactgga ggatcatccg ctgctgcccg aatgtaacac 7260 tttgacaatg cacaacgtga gttacgtgcg aggtcttccc tgcagtgtgg gatttacgct 7320 gattcaggaa tgggttgttc cctgggatat ggttctgacg cgggaggagc ttgtaatcct 7380 gaggaagtgt atgcacgtgt gcctgtgttg tgccaacatt gatatcatga cgagcatgat 7440 gatccatggt tacgagtcct gggctctcca ctgtcattgt tccagtcccg gttccctgca 7500 gtgcatagcc ggcgggcagg ttttggccag ctggtttagg atggtggtgg atggcgccat 7560 gtttaatcag aggtttatat ggtaccggga ggtggtgaat tacaacatgc caaaagaggt 7620 aatgtttatg tccagcgtgt ttatgagggg tcgccactta atctacctgc gcttgtggta 7680 tgatggccac gtgggttctg tggtccccgc catgagcttt ggatacagcg ccttgcactg 7740 tgggattttg aacaatattg tggtgctgtg ctgcagttac tgtgctgatt taagtgagat 7800 cagggtgcgc tgctgtgccc ggaggacaag gcgtctcatg ctgcgggcgg tgcgaatcat 7860 cgctgaggag accactgcca tgttgtattc ctgcaggacg gagcggcggc ggcagcagtt 7920 tattcgcgcg ctgctgcagc accaccgccc tatcctgatg cacgattatg actctacccc 7980 catgtaggcg tggacttccc cttcgccgcc cgttgagcaa ccgcaagttg gacagcagcc 8040 tgtggctcag cagctggaca gcgacatgaa cttaagcgag ctgcccgggg agtttattaa 8100 tatcactgat gagcgtttgg ctcgacagga aaccgtgtgg aatataacac ctaagaatat 8160 gtctgttacc catgatatga tgctttttaa ggccagccgg ggagaaagga ctgtgtactc 8220 tgtgtgttgg gagggaggtg gcaggttgaa tactagggtt ctgtgagttt gattaaggta 8280 cggtgatcaa tataagctat gtggtggtgg ggctatacta ctgaatgaaa aatgacttga 8340 aattttctgc aattgaaaaa taaacacgtt gaaacataac atgcaacagg ttcacgattc 8400 tttattcctg ggcaatgtag gagaaggtgt aagagttggt agcaaaagtt tcagtggtgt 8460 attttccact ttcccaggac catgtaaaag acatagagta agtgcttacc tcgctagttt 8520 ctgtggattc actagaatcg atgtaggatg ttgcccctcc tgacgcggta ggagaagggg 8580 agggtgccct gcatgtctgc cgctgctctt gctcttgccg ctgctgagga ggggggcgca 8640 tctgccgcag caccggatgc atctgggaaa agcaaaaaag gggctcgtcc ctgtttccgg 8700 aggaatttgc aagcggggtc ttgcatgacg gggaggcaaa cccccgttcg ccgcagtccg 8760 gccggcccga gactcgaacc gggggtcctg cgactcaacc cttggaaaat aaccctccgg 8820 ctacagggag cgagccactt aatgctttcg ctttccagcc taaccgctta cgccgcgcgc 8880 ggccagtggc caaaaaagct agcgcagcag ccgccgcgcc tggaaggaag ccaaaaggag 8940 cgctcccccg ttgtctgacg tcgcacacct gggttcgaca cgcgggcggt aaccgcatgg 9000 atcacggcgg acggccggat ccggggttcg aaccccggtc gtccgccatg atacccttgc 9060 gaatttatcc accagaccac ggaagagtgc ccgcttacag gctctccttt tgcacggtct 9120 agagcgtcaa cgactgcgca cgcctcaccg gccagagcgt cccgaccatg gagcactttt 9180 tgccgctgcg caacatctgg aaccgcgtcc gcgactttcc gcgcgcctcc accaccgccg 9240 ccggcatcac ctggatgtcc aggtacatct acggattacg tcgacgttta aaccatatga 9300 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 9360 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 9420 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 9480 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 9540 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 9600 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 9660 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 9720 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 9780 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 9840 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 9900 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 9960 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 10020 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 10080 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 10140 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 10200 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 10260 gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 10320 cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 10380 gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 10440 gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 10500 ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 10560 tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 10620 ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 10680 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 10740 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 10800 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 10860 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 10920 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 10980 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 11040 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 11100 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 11160 aaagtgccac ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt 11220 aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag 11280 aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 11340 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 11400 aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 11460 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 11520 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 11580 gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgatg gatcc 11635 <210> 46 <211> 5336 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 46 ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60 acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120 taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180 ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240 cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300 ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360 cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420 aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480 cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540 acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600 gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660 caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720 atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780 ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840 gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900 ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960 acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020 gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080 gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140 ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200 gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260 tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320 ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380 tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440 cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500 agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560 tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620 gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680 tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740 ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800 ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860 aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920 ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980 cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040 gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100 aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160 gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220 cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280 tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340 aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400 aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460 ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520 gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580 aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640 ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700 gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760 gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820 cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880 gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940 cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000 tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060 aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120 gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180 cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240 aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300 ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360 atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420 tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480 ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540 gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600 cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660 ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720 ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780 aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840 cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900 cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960 ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020 gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080 agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140 ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200 ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260 gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320 taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380 gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440 cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500 ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560 cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620 ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680 cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740 ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800 gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860 tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920 cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980 ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040 cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100 tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160 ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220 accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280 agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcg 5336 <210> 47 <211> 3201 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 47 cccgggcgtt ttagggcgga gtaacttgca tgtattggga attgtagttt ttttaaaatg 60 ggaagtgacg tatcgtggga aaacggaagt gaagatttga ggaagttgtg ggttttttgg 120 ctttcgtttc tgggcgtagg ttcgcgtgcg gttttctggg tgttttttgt ggactttaac 180 cgttacgtca ttttttagtc ctatatatac tcgctctgta cttggccctt tttacactgt 240 gactgattga gctggtgccg tgtcgagtgg tgttttttaa taggtttttt tactggtaag 300 gctgactgtt atggctgccg ctgtggaagc gctgtatgtt gttctggagc gggagggtgc 360 tattttgcct aggcaggagg gtttttcagg tgtttatgtg tttttctctc ctattaattt 420 tgttatacct cctatggggg ctgtaatgtt gtctctacgc ctgcgggtat gtattccccc 480 gggctatttc ggtcgctttt tagcactgac cgatgttaac caacctgatg tgtttaccga 540 gtcttacatt atgactccgg acatgaccga ggaactgtcg gtggtgcttt ttaatcacgg 600 tgaccagttt ttttacggtc acgccggcat ggccgtagtc cgtcttatgc ttataagggt 660 tgtttttcct gttgtaagac aggcttctaa tgtttaaatg tttttttttt tgttatttta 720 ttttgtgttt aatgcaggaa cccgcagaca tgtttgagag aaaaatggtg tctttttctg 780 tggtggttcc ggaacttacc tgcctttatc tgcatgagca tgactacgat gtgcttgctt 840 ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata tcgccgccca 900 tgcaacaagc ttacataggg gctacgctgg ttagcatagc tccgagtatg cgtgtcataa 960 tcagtgtggg ttcttttgtc atggttcctg gcggggaagt ggccgcgctg gtccgtgcag 1020 acctgcacga ttatgttcag ctggccctgc gaagggacct acgggatcgc ggtatttttg 1080 ttaatgttcc gcttttgaat cttatacagg tctgtgagga acctgaattt ttgcaatcat 1140 gattcgctgc ttgaggctga aggtggaggg cgctctggag cagattttta caatggccgg 1200 acttaatatt cgggatttgc ttagagacat attgataagg tggcgagatg aaaattattt 1260 gggcatggtt gaaggtgctg gaatgtttat agaggagatt caccctgaag ggtttagcct 1320 ttacgtccac ttggacgtga gggcagtttg ccttttggaa gccattgtgc aacatcttac 1380 aaatgccatt atctgttctt tggctgtaga gtttgaccac gccaccggag gggagcgcgt 1440 tcacttaata gatcttcatt ttgaggtttt ggataatctt ttggaataaa aaaaaaaaaa 1500 catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560 ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620 agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680 caactactac acagagcgag ctaagcgacg agaccggaga cgcagatctg tttgtcacgc 1740 ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800 tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgcctacctc 1860 cttttgagac agagacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920 acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980 cgctgattca ggaatgggtt gttccctggg atatggttct gacgcgggag gagcttgtaa 2040 tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100 tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160 tgcagtgcat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220 ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280 aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340 ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400 actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460 agatcagggt gcgctgctgt gcccggagga caaggcgtct catgctgcgg gcggtgcgaa 2520 tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580 agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640 cccccatgta ggcgtggact tccccttcgc cgcccgttga gcaaccgcaa gttggacagc 2700 agcctgtggc tcagcagctg gacagcgaca tgaacttaag cgagctgccc ggggagttta 2760 ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820 atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880 actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940 ggtacggtga tcaatataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000 ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacatgcaa caggttcacg 3060 attctttatt cctgggcaat gtaggagaag gtgtaagagt tggtagcaaa agtttcagtg 3120 gtgtattttc cactttccca ggaccatgta aaagacatag agtaagtgct tacctcgcta 3180 gtttctgtgg attcactaga a 3201 <210> 48 <211> 743 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 48 tcgatgtagg atgttgcccc tcctgacgcg gtaggagaag gggagggtgc cctgcatgtc 60 tgccgctgct cttgctcttg ccgctgctga ggaggggggc gcatctgccg cagcaccgga 120 tgcatctggg aaaagcaaaa aaggggctcg tccctgtttc cggaggaatt tgcaagcggg 180 gtcttgcatg acggggaggc aaacccccgt tcgccgcagt ccggccggcc cgagactcga 240 accgggggtc ctgcgactca acccttggaa aataaccctc cggctacagg gagcgagcca 300 cttaatgctt tcgctttcca gcctaaccgc ttacgccgcg cgcggccagt ggccaaaaaa 360 gctagcgcag cagccgccgc gcctggaagg aagccaaaag gagcgctccc ccgttgtctg 420 acgtcgcaca cctgggttcg acacgcgggc ggtaaccgca tggatcacgg cggacggccg 480 gatccggggt tcgaaccccg gtcgtccgcc atgataccct tgcgaattta tccaccagac 540 cacggaagag tgcccgctta caggctctcc ttttgcacgg tctagagcgt caacgactgc 600 gcacgcctca ccggccagag cgtcccgacc atggagcact ttttgccgct gcgcaacatc 660 tggaaccgcg tccgcgactt tccgcgcgcc tccaccaccg ccgccggcat cacctggatg 720 tccaggtaca tctacggatt acg 743 <210> 49 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 49 aaggggctcg tccctgtttc cggaggaatt tgcaagcggg gtcttgcatg acggggaggc 60 aaacccccgt tcgccgcagt ccggccggcc cgagactcga accgggggtc ctgcgactca 120 acccttggaa aataaccctc cggctacagg gagcgagcca 160 <210> 50 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 50 aaaggagcgc tcccccgttg tctgacgtcg cacacctggg ttcgacacgc gggcggtaac 60 cgcatggatc acggcggacg gccggatccg gggttcgaac cccggtcgtc cgccatgata 120 cccttgcgaa tttatccacc agaccacgga agagtgcccg ct 162 <210> 51 <211> 1590 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 51 ttaaaaatca aaggggttct gccgcgcatc gctatgcgcc actggcaggg acacgttgcg 60 atactggtgt ttagtgctcc acttaaactc aggcacaacc atccgcggca gctcggtgaa 120 gttttcactc cacaggctgc gcaccatcac caacgcgttt agcaggtcgg gcgccgatat 180 cttgaagtcg cagttggggc ctccgccctg cgcgcgcgag ttgcgataca cagggttgca 240 gcactggaac actatcagcg ccgggtggtg cacgctggcc agcacgctct tgtcggagat 300 cagatccgcg tccaggtcct ccgcgttgct cagggcgaac ggagtcaact ttggtagctg 360 ccttcccaaa aagggtgcat gcccaggctt tgagttgcac tcgcaccgta gtggcatcag 420 aaggtgaccg tgcccggtct gggcgttagg atacagcgcc tgcatgaaag ccttgatctg 480 cttaaaagcc acctgagcct ttgcgccttc agagaagaac atgccgcaag acttgccgga 540 aaactgattg gccggacagg ccgcgtcatg cacgcagcac cttgcgtcgg tgttggagat 600 ctgcaccaca tttcggcccc accggttctt cacgatcttg gccttgctag actgctcctt 660 cagcgcgcgc tgcccgtttt cgctcgtcac atccatttca atcacgtgct ccttatttat 720 cataatgctc ccgtgtagac acttaagctc gccttcgatc tcagcgcagc ggtgcagcca 780 caacgcgcag cccgtgggct cgtggtgctt gtaggttacc tctgcaaacg actgcaggta 840 cgcctgcagg aatcgcccca tcatcgtcac aaaggtcttg ttgctggtga aggtcagctg 900 caacccgcgg tgctcctcgt ttagccaggt cttgcatacg gccgccagag cttccacttg 960 gtcaggcagt agcttgaagt ttgcctttag atcgttatcc acgtggtact tgtccatcaa 1020 cgcgcgcgca gcctccatgc ccttctccca cgcagacacg atcggcaggc tcagcgggtt 1080 tatcaccgtg ctttcacttt ccgcttcact ggactcttcc ttttcctctt gcgtccgcat 1140 accccgcgcc actgggtcgt cttcattcag ccgccgcacc gtgcgcttac ctcccttgcc 1200 gtgcttgatt agcaccggtg ggttgctgaa acccaccatt tgtagcgcca catcttctct 1260 ttcttcctcg ctgtccacga tcacctctgg ggatggcggg cgctcgggct tgggagaggg 1320 gcgcttcttt ttctttttgg acgcaatggc caaatccgcc gtcgaggtcg atggccgcgg 1380 gctgggtgtg cgcggcacca gcgcatcttg tgacgagtct tcttcgtcct cggactcgag 1440 acgccgcctc agccgctttt ttgggggcgc gcggggaggc ggcggcgacg gcgacgggga 1500 cgacacgtcc tccatggttg gtggacgtcg cgccgcaccg cgtccgcgct cgggggtggt 1560 ttcgcgctgc tcctcttccc gactggccat 1590 <210> 52 <211> 2446 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 52 ttccttctcc tataggcaga aaaagatcat ggagtcagtc gagaaggagg acagcctaac 60 cgcccccttt gagttcgcca ccaccgcctc caccgatgcc gccaacgcgc ctaccacctt 120 ccccgtcgag gcacccccgc ttgaggagga ggaagtgatt atcgagcagg acccaggttt 180 tgtaagcgaa gacgacgagg atcgctcagt accaacagag gataaaaagc aagaccagga 240 cgacgcagag gcaaacgagg aacaagtcgg gcggggggac caaaggcatg gcgactacct 300 agatgtggga gacgacgtgc tgttgaagca tctgcagcgc cagtgcgcca ttatctgcga 360 cgcgttgcaa gagcgcagcg atgtgcccct cgccatagcg gatgtcagcc ttgcctacga 420 acgccacctg ttctcaccgc gcgtaccccc caaacgccaa gaaaacggca catgcgagcc 480 caacccgcgc ctcaacttct accccgtatt tgccgtgcca gaggtgcttg ccacctatca 540 catctttttc caaaactgca agatacccct atcctgccgt gccaaccgca gccgagcgga 600 caagcagctg gccttgcggc agggcgctgt catacctgat atcgcctcgc tcgacgaagt 660 gccaaaaatc tttgagggtc ttggacgcga cgagaaacgc gcggcaaacg ctctgcaaca 720 agaaaacagc gaaaatgaaa gtcactgtgg agtgctggtg gaacttgagg gtgacaacgc 780 gcgcctagcc gtgctgaaac gcagcatcga ggtcacccac tttgcctacc cggcacttaa 840 cctacccccc aaggttatga gcacagtcat gagcgagctg atcgtgcgcc gtgcacgacc 900 cctggagagg gatgcaaact tgcaagaaca aaccgaggag ggcctacccg cagttggcga 960 tgagcagctg gcgcgctggc ttgagacgcg cgagcctgcc gacttggagg agcgacgcaa 1020 gctaatgatg gccgcagtgc ttgttaccgt ggagcttgag tgcatgcagc ggttctttgc 1080 tgacccggag atgcagcgca agctagagga aacgttgcac tacacctttc gccagggcta 1140 cgtgcgccag gcctgcaaaa tttccaacgt ggagctctgc aacctggtct cctaccttgg 1200 aattttgcac gaaaaccgcc tcgggcaaaa cgtgcttcat tccacgctca agggcgaggc 1260 gcgccgcgac tacgtccgcg actgcgttta cttatttctg tgctacacct ggcaaacggc 1320 catgggcgtg tggcagcaat gcctggagga gcgcaaccta aaggagctgc agaagctgct 1380 aaagcaaaac ttgaaggacc tatggacggc cttcaacgag cgctccgtgg ccgcgcacct 1440 ggcggacatt atcttccccg aacgcctgct taaaaccctg caacagggtc tgccagactt 1500 caccagtcaa agcatgttgc aaaactttag gaactttatc ctagagcgtt caggaattct 1560 gcccgccacc tgctgtgcgc ttcctagcga ctttgtgccc attaagtacc gtgaatgccc 1620 tccgccgctt tggggtcact gctaccttct gcagctagcc aactaccttg cctaccactc 1680 cgacatcatg gaagacgtga gcggtgacgg cctactggag tgtcactgtc gctgcaacct 1740 atgcaccccg caccgctccc tggtctgcaa ttcgcaactg cttagcgaaa gtcaaattat 1800 cggtaccttt gagctgcagg gtccctcgcc tgacgaaaag tccgcggctc cggggttgaa 1860 actcactccg gggctgtgga cgtcggctta ccttcgcaaa tttgtacctg aggactacca 1920 cgcccacgag attaggttct acgaagacca atcccgcccg ccaaatgcgg agcttaccgc 1980 ctgcgtcatt acccagggcc acatccttgg ccaattgcaa gccatcaaca aagcccgcca 2040 agagtttctg ctacgaaagg gacggggggt ttacctggac ccccagtccg gcgaggagct 2100 caacccaatc cccccgccgc cgcagcccta tcagcagccg cgggcccttg cttcccagga 2160 tggcacccaa aaagaagctg cagctgccgc cgccgccacc cacggacgag gaggaatact 2220 gggacagtca ggcagaggag gttttggacg aggaggagga gatgatggaa gactgggaca 2280 gcctagacga agcttccgag gccgaagagg tgtcagacga aacaccgtca ccctcggtcg 2340 cattcccctc gccggcgccc cagaaattgg caaccgttcc cagcatcgct acaacctccg 2400 ctcctcaggc gccgccggca ctgcctgttc gccgacccaa ccgtag 2446 <210> 53 <211> 375 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 gcccctactg caccggcggc agcggcagcg gcagcaacag cagcggtcac acagaagcaa 60 aggcgaccgg atagcaagac tctgacaaag cccaagaaat ccacagcggc ggcagcagca 120 ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat cgacccgcga gcttagaaat 180 aggatttttc ccactctgta tgctatattt caacaaagca ggggccaaga acaagagctg 240 aaaataaaaa acaggtctct gcgctccctc acccgcagct gcctgtatca caaaagcgaa 300 gatcagcttc ggcgcacgct ggaagacgcg gaggctctct tcagcaaata ctgcgcgctg 360 actcttaagg actag 375 <210> 54 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 54 atgagcaagg aaattcccac gccctacatg tggagttacc agccacaaat gggacttgcg 60 gctggagctg cccaagacta ctcaacccga ataaactaca tgagcgcggg accccacatg 120 atatcccggg tcaacggaat ccgcgcccac cgaaaccgaa ttctcctcga acaggcggct 180 attaccacca cacctcgtaa taaccttaat ccccgtagtt ggcccgctgc cctggtgtac 240 caggaaagtc ccgctcccac cactgtggta cttcccagag acgcccaggc cgaagttcag 300 atgactaact caggggcgca gcttgcgggc ggctttcgtc acagggtgcg gtcg 354 <210> 55 <211> 1164 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 55 atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60 cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120 atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180 tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240 tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300 ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360 gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420 ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480 taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540 atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600 gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660 gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720 aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780 ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840 caccgcccta tcctgatgca cgattatgac tctaccccca tgtaggcgtg gacttcccct 900 tcgccgcccg ttgagcaacc gcaagttgga cagcagcctg tggctcagca gctggacagc 960 gacatgaact taagcgagct gcccggggag tttattaata tcactgatga gcgtttggct 1020 cgacaggaaa ccgtgtggaa tataacacct aagaatatgt ctgttaccca tgatatgatg 1080 ctttttaagg ccagccgggg agaaaggact gtgtactctg tgtgttggga gggaggtggc 1140 aggttgaata ctagggttct gtga 1164 <210> 56 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 56 atggttcttc cagctcttcc cgctcctccc gtgtgtgact cgcagaacga atgtgtaggt 60 tggctgggtg tggcttattc tgcggtggtg gatgttatca gggcagcggc gcatgaagga 120 gtttacatag aacccgaagc cagggggcgc ctggatgctt tgagagagtg gatatactac 180 aactactaca cagagcgagc taagcgacga gaccggagac gcagatctgt ttgtcacgcc 240 cgcacctggt tttgcttcag gaaatatgac tacgtccggc gttccatttg gcatgacact 300 acgaccaaca cgatctcggt tgtctcggcg cactccgtac agtag 345 <210> 57 <211> 319 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 57 atgattcgct gcttgaggct gaaggtggag ggcgctctgg agcagatttt tacaatggcc 60 ggacttaata ttcgggattt gcttagagac atattgataa ggtggcgaga tgaaaattat 120 ttgggcatgg ttgaaggtgc tggaatgttt atagaggaga ttcaccctga agggtttagc 180 ctttacgtcc acttggacgt gagggcagtt tgccttttgg aagccattgt gcaacatctt 240 acaaatgcca ttatctgttc tttggctgta gagtttgacc acgccaccgg aggggagcgc 300 gttcacttaa tagatcttc 319 <210> 58 <211> 411 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 58 atgcaggaac ccgcagacat gtttgagaga aaaatggtgt ctttttctgt ggtggttccg 60 gaacttacct gcctttatct gcatgagcat gactacgatg tgcttgcttt tttgcgcgag 120 gctttgcctg attttttgag cagcaccttg cattttatat cgccgcccat gcaacaagct 180 tacatagggg ctacgctggt tagcatagct ccgagtatgc gtgtcataat cagtgtgggt 240 tcttttgtca tggttcctgg cggggaagtg gccgcgctgg tccgtgcaga cctgcacgat 300 tatgttcagc tggccctgcg aagggaccta cgggatcgcg gtatttttgt taatgttccg 360 cttttgaatc ttatacaggt ctgtgaggaa cctgaatttt tgcaatcatg a 411 <210> 59 <211> 7327 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 59 gcgcgccgat atcgttaacg ccccgcgccg gccgctctag aactagtgga tcccccggaa 60 gatcagaagt tcctattccg aagttcctat tctctagaaa gtataggaac ttctgatctg 120 cgcagccgcc atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga 180 gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 240 gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 300 gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 360 tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 420 caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 480 tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 540 cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 600 gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 660 cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 720 gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 780 atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 840 ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 900 caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 960 taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 1020 gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 1080 gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1140 taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1200 aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1260 ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1320 caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1380 cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1440 ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1500 ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1560 ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1620 cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1680 gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1740 cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1800 aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1860 tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1920 gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1980 catctttgaa caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt 2040 ggctcgagga cactctctct gaaggaataa gacagtggtg gaagctcaaa cctggcccac 2100 caccaccaaa gcccgcagag cggcataagg acgacagcag gggtcttgtg cttcctgggt 2160 acaagtacct cggacccttc aacggactcg acaagggaga gccggtcaac gaggcagacg 2220 ccgcggccct cgagcacgac aaagcctacg accggcagct cgacagcgga gacaacccgt 2280 acctcaagta caaccacgcc gacgcggagt ttcaggagcg ccttaaagaa gatacgtctt 2340 ttgggggcaa cctcggacga gcagtcttcc aggcgaaaaa gagggttctt gaacctctgg 2400 gcctggttga ggaacctgtt aagacggctc cgggaaaaaa gaggccggta gagcactctc 2460 ctgtggagcc agactcctcc tcgggaaccg gaaaggcggg ccagcagcct gcaagaaaaa 2520 gattgaattt tggtcagact ggagacgcag actcagtacc tgacccccag cctctcggac 2580 agccaccagc agccccctct ggtctgggaa ctaatacgat ggctacaggc agtggcgcac 2640 caatggcaga caataacgag ggcgccgacg gagtgggtaa ttcctcggga aattggcatt 2700 gcgattccac atggatgggc gacagagtca tcaccaccag cacccgaacc tgggccctgc 2760 ccacctacaa caaccacctc tacaaacaaa tttccagcca atcaggagcc tcgaacgaca 2820 atcactactt tggctacagc accccttggg ggtattttga cttcaacaga ttccactgcc 2880 acttttcacc acgtgactgg caaagactca tcaacaacaa ctggggattc cgacccaaga 2940 gactcaactt caagctcttt aacattcaag tcaaagaggt cacgcagaat gacggtacga 3000 cgacgattgc caataacctt accagcacgg ttcaggtgtt tactgactcg gagtaccagc 3060 tcccgtacgt cctcggctcg gcgcatcaag gatgcctccc gccgttccca gcagacgtct 3120 tcatggtgcc acagtatgga tacctcaccc tgaacaacgg gagtcaggca gtaggacgct 3180 cttcatttta ctgcctggag tactttcctt ctcagatgct gcgtaccgga aacaacttta 3240 ccttcagcta cacttttgag gacgttcctt tccacagcag ctacgctcac agccagagtc 3300 tggaccgtct catgaatcct ctcatcgacc agtacctgta ttacttgagc agaacaaaca 3360 ctccaagtgg aaccaccacg cagtcaaggc ttcagttttc tcaggccgga gcgagtgaca 3420 ttcgggacca gtctaggaac tggcttcctg gaccctgtta ccgccagcag cgagtatcaa 3480 agacatctgc ggataacaac aacagtgaat actcgtggac tggagctacc aagtaccacc 3540 tcaatggcag agactctctg gtgaatccgg gcccggccat ggcaagccac aaggacgatg 3600 aagaaaagtt ttttcctcag agcggggttc tcatctttgg gaagcaaggc tcagagaaaa 3660 caaatgtgga cattgaaaag gtcatgatta cagacgaaga ggaaatcagg acaaccaatc 3720 ccgtggctac ggagcagtat ggttctgtat ctaccaacct ccagagaggc aacagacaag 3780 cagctaccgc agatgtcaac acacaaggcg ttcttccagg catggtctgg caggacagag 3840 atgtgtacct tcaggggccc atctgggcaa agattccaca cacggacgga cattttcacc 3900 cctctcccct catgggtgga ttcggactta aacaccctcc tccacagatt ctcatcaaga 3960 acaccccggt acctgcgaat ccttcgacca ccttcagtgc ggcaaagttt gcttccttca 4020 tcacacagta ctccacggga caggtcagcg tggagatcga gtgggagctg cagaaggaaa 4080 acagcaaacg ctggaatccc gaaattcagt acacttccaa ctacaacaag tctgttaatg 4140 tggactttac tgtggacact aatggcgtgt attcagagcc tcgccccatt ggcaccagat 4200 acctgactcg taatctgtaa ttgcttgtta atcaataaac cgtttaattc gtttcagttg 4260 aactttggtc tctgcgtatt tctttcttat ctagtttcca tggctacgta gataagtagc 4320 atggcgggtt aatcattaac tacagcccgg gcgtttaaac agcgggcgga ggggtggagt 4380 cgtgacgtga attacgtcat agggttaggg aggtcctgta ttagaggtca cgtgagtgtt 4440 ttgcgacatt ttgcgacacc atgtggtctc gctggggggg ggggcccgag tgagcacgca 4500 gggtctccat tttgaagcgg gaggtttgaa cgagcgctgg cgcgctcact ggccgtcgtt 4560 ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 4620 ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 4680 ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 4740 taaatttttg ttaaatcagc tcattttttt aaccaatagg ccgaaatcgg caaaatccct 4800 tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg gaacaagagt 4860 ccactattaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 4920 gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 4980 taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 5040 tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 5100 cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 5160 caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 5220 attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 5280 aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 5340 tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 5400 agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 5460 gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 5520 cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 5580 agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 5640 taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 5700 tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 5760 taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 5820 acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 5880 ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 5940 cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 6000 agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 6060 tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 6120 agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 6180 tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 6240 ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 6300 tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 6360 aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 6420 tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt 6480 agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 6540 taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 6600 caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 6660 agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 6720 aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 6780 gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 6840 tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 6900 gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 6960 ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 7020 ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 7080 aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 7140 aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 7200 atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 7260 tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 7320 acgccaa 7327 <210> 60 <211> 6902 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 60 ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080 aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200 agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260 ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320 cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380 cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440 actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500 cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560 tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620 gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680 tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740 tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800 tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860 aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920 acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980 ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160 accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460 tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520 cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580 tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640 ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700 tttattgatt aacaagcaat tacagattac gggtgaggta acgggtgcca atggggcggg 2760 gttcagagta cacgccttct gtattaacag caaagtccac acttgtagat ttgtagtagt 2820 tggaggtgta ctggatctcg gggttccagc gcttgctgtt ttccttctgc agctcccatt 2880 caatttccac gctgacctgt ccggtgctgt attgcgtgat gaaagagttc agctttgact 2940 ggttgaaggt ggtcggagga tccgcaggta caggcgtgtt cttgatcagg atctgaggcg 3000 gaggatgttt caggccaaag ccgcccatca gcggagacgg gtggaagttg ccgtccgtgt 3060 gaggaatctt ggcccagatg ggaccctgca ggtacacgtc ccggttctgc cagaccatac 3120 cgggtaaggc cccctggctg ttgacagttc caatttgagg agccgtgttt tgctgctgca 3180 agttatctgc cacgataccg tattcctctg tagccacagg gttagtggtt ttgatttctt 3240 cctcgctggt gagcatgaca tcgctgtaat ccgcattgtc tctggcagca ttttgtttgc 3300 caaaaatcag gatcccgtta ctgggaaaaa aacgctcctc gtcgtctttg tgtgttgcca 3360 tagcgatgcc aggattagcc aatgaatttc ttccattcag atggtatttg gtcccagcag 3420 tccaggcaaa gttgctattg ttgttttgcc cggttgtcgt tgagacgcgt tgttggcggt 3480 aacagggtcc tggcagccag ttctttgcct gattggccat tgtattaggc ccaccttggc 3540 tgaagcccag agtctgcgta tttgccgtgc ctcctgttgt ttgagtccga gacaagtagt 3600 acaggtactg gtcaatcaga ggattcatca gccggtccaa gctctggctg tgggcgtagc 3660 tgctgtggaa aggcacgtcc tcgaaggtgt aagtaaactg gaagttgttg ccggttctca 3720 gcatctgcga aggaaagtat tccaggcagt agaaggagga gcgtcccacg gcctgactac 3780 cgttgttgag tgttaggtag ccgtactggg gaatcatgaa cacgtccgcc gggaacggag 3840 gcaggcagcc ctggtgggca gagccgagaa cgtacggcag ctggtactcc gagtccgtaa 3900 acacctggat ggtgctggtg aggttattgg cgatggtctt ggtgccttca ttctgcgtga 3960 cctccttgac ctggatgttg aagagcttga agctgagtct cttgggccgg aatccccagt 4020 tgttgttgat gagtcgctgc cagtcacgtg gtgaaaagtg gcagtggaat ctgttaaagt 4080 caaaataccc ccagggggtg ctgtagccga agtaggtgtt gtcgttggtg gctcctcccg 4140 atgtcccgtt ggagatttgc ttgtagaggt ggttgttgta ggtgggcagg gcccaggttc 4200 gggtgctggt ggtgatgact ctgtcgccca gccatgtgga atcgcaatgc caatttcccg 4260 aggaactacc cactccgtcg gcgccttcgt tattgtctgc cattggtgcg ccaccgcctg 4320 cagccattgt attaggtccc acaccagagg gcgctgctgg aggttctccg agaggttgag 4380 ggtctggaac tgactctgag tcgccagtct gaccaaaatt gagtcttttt ctggcgggct 4440 gttggccttt cttgccgatg cccgtagagg agtctggaga acgctggggt gatggctcta 4500 ccggtctctt ctttccagga gccgtcttag cgccttcctc aaccagaccg agaggttcga 4560 gaacccgctt cttggcctgg aagactgctc gcccgaggtt gcccccaaaa gacgtatctt 4620 cttgcagacg ctcctgaaac tcggcgtcgg cgtggttata ccgcaggtac ggattgtcac 4680 ccgcctgcag ctgctggtcg taggccttgt cgtgctcgag ggccgctgcg tccgccgcgt 4740 tgacgggctc ccccttgtcg agtccgttga agggtccgag gtacttgtag ccaggaagca 4800 ccagaccccg gccgtcgtcc tgcttttgct ggttggcttt gggcttcggg gctccaggtt 4860 tcagcgccca ccactcgcga atgccctcag agaggttgtc ctcgagccaa tctggaagat 4920 aaccatcggc agccatacct gatttaaatc atttattgtt caaagatgca gtcatccaaa 4980 tccacattga ccagatcgca ggcagtgcaa gcgtctggca cctttcccat gatatgatga 5040 atgtagcaca gtttctgata cgcctttttg acgacagaaa cgggttgaga ttctgacacg 5100 ggaaagcact ctaaacagtc tttctgtccg tgagtgaagc agatatttga attctgattc 5160 attctctcgc attgtctgca gggaaacagc atcagattca tgcccacgtg acgagaacat 5220 ttgttttggt acctgtctgc gtagttgatc gaagcttccg cgtctgacgt cgatggctgc 5280 gcaactgact cgcgcacccg tttgggctca cttatatctg cgtcactggg ggcgggtctt 5340 ttcttggctc cacccttttt gacgtagaat tcatgctcca cctcaaccac gtgatccttt 5400 gcccaccgga aaaagtcttt gacttcctgc ttggtgacct tcccaaagtc atgatccaga 5460 cggcgggtga gttcaaattt gaacatccgg tcttgcaacg gctgctggtg ttcgaaggtc 5520 gttgagttcc cgtcaatcac ggcgcacatg ttggtgttgg aggtgacgat cacgggagtc 5580 gggtctatct gggccgagga cttgcatttc tggtccacgc gcaccttgct tcctccgaga 5640 atggctttgg ccgactccac gaccttggcg gtcatcttcc cctcctccca ccagatcacc 5700 atcttgtcga cacagtcgtt gaagggaaag ttctcattgg tccagtttac gcacccgtag 5760 aagggcacag tgtgggctat ggcctccgcg atgttggtct tcccggtagt tgcaggccca 5820 aacagccaga tggtgttcct cttgccgaac tttttcgtgg cccatcccag aaagacggaa 5880 gccgcatatt ggggatcgta cccgtttagt tccaaaattt tataaatccg attgctggaa 5940 atgtcctcca cgggctgctg gcccaccagg tagtcggggg cggttttagt caggctcata 6000 atctttcccg cattgtccaa ggcagccttg atttgggacc gcgagttgga ggccgcattg 6060 aaggagatgt atgaggcctg gtcctcctgg atccactgct tctccgaggt aatccccttg 6120 tccacgagcc acccgaccag ctccatgtac ctggctgaag tttttgatct gatcaccggc 6180 gcatcagaat tgggattctg attctctttg ttctgctcct gcgtctgcga cacgtgcgtc 6240 agatgctgcg ccaccaaccg tttacgctcc gtgagattca aacaggcgct taaatactgt 6300 tccatattag tccacgccca ctggagctca ggctgggttt tggggagcaa gtaattgggg 6360 atgtagcact catccaccac cttgttcccg cctccggcgc catttctggt ctttgtgacc 6420 gcgaaccagt ttggcaaagt cggctcgatc ccgcggtaaa ttctctgaat cagtttttcg 6480 cgaatctgac tcaggaaacg tcccaaaacc atggatttca ccccggtggt ttccacgagc 6540 acgtgcatgt ggaagtagct ctctcccttc tcaaattgca caaagaaaag ggcctccggg 6600 gccttactca cacggcgcca ttccgtcaga aagtcgcgct gcagcttctc ggccacggtc 6660 aggggtgcct gctcaatcag attcagatcc atgtcagaat ctggcggcaa ctcccattcc 6720 ttctcggcca cccagttcac aaagctgtca gaaatgccgg gcagatgctc gtcaaggtcg 6780 ctggggacct taatcacaat ctcgtaaaac cccggcatgg cggctgcgca gatcagaagt 6840 tcctatactt tctagagaat aggaacttcg gaataggaac ttctgatctt ccgggggatc 6900 ca 6902 <210> 61 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 61 ttagaccgtg ccatggctag ttgggtacca ggtcacccgt gctcgacttc cggtcttcat 60 ggagaactgg tgaccggtaa ccgaccgtaa gattgggaat 100 <210> 62 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 62 tgtcaagaat acgatcggaa aggactcgac aattgatggg cctgtagcgc caacgttgta 60 ctttatccaa ggtgagctca ggagtgttat cataaatacg 100 <210> 63 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 63 tctcctgttc atccgacaac cacactccct agttcaggga ggtcactcga gttagagctg 60 aaaccccact agctcacgct cgttatcaac ccgggtaagt 100 <210> 64 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 64 gtggctcctt taaggtctcg cctgttcgat tgttcgtcgc tgccgcggat cagcaaagtt 60 gcttccgtcc taattcggcc taaggatccg ctagtgcgcg 100 <210> 65 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 65 actgcgcttc tgtggctcct gaacaacgca aagcttcggt cgcctagtcc agtggatggg 60 ccaaggacaa ttgcagtgct tatctccact gctgaaaccc 100 <210> 66 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 66 gtgaaagatg aggagtgagt ttacgcactc acgaagccct aattacccga gtatcgtaag 60 ccaatatcgt agcccagttc ctgtacaggg tcgcgtataa 100 <210> 67 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 67 acgatttccg tcgttcatat gagccaccag gcttgtctct tcgcgcaatt tgacacgcaa 60 cacccgctgc cattccgagg tcgttagggc ttttggattt 100 <210> 68 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 68 aacctatttg attgtacagc gtgagtacga agcgaatagg ctagtaacac tgccctatgc 60 aaagacgcct tggttgattc tagagctggg attggtacga 100 <210> 69 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 69 tgaggtcatc tccttttcat ccgtgtccta acgcttcgat ccttctgcag gctcctctta 60 tggatgtttt atcaccctgt cgagcgtgca cgatggtgga 100 <210> 70 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 70 gaactccgcg tgcagcgcgg agttgacacg gaaggccagg gagccaattt ccactgtcct 60 gagctagacc ccttgatagc acttgctgtg catggttgct 100 <210> 71 <211> 10150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (5875)..(5974) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (5875)..(5974) <223> This region may encompass 60-100 nucleotides <400> 71 tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 60 actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt aacaagggtg aacactatcc 120 catatcacca gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg 180 cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 240 aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 300 aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 360 atttttttct ccattttttt ttcctccttt agaaaaactc atcgagcatc aaatgaaact 420 gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 480 aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 540 ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 600 caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 660 tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 720 caaccaaacc gttattcatt cgtgattgcg cctgagcgag gcgaaatacg cgatcgctgt 780 taaaaggaca attacaaaca ggaatcgagt gcaaccggcg caggaacact gccagcgcat 840 caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaacgct gtttttccgg 900 ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 960 gaagtggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1020 caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1080 gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1140 cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcattt 1200 ttttttcctc ctttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 1260 tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 1320 accatctggc cccagcgctg cgatgatacc gcgagaacca cgctcaccgg ctccggattt 1380 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 1440 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 1500 tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg gtgtcacgct cgtcgtttgg 1560 tatggcttca ttcagctccg gttcccaacg atcaaggcga gattcttcct ttttcaatat 1620 tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 1680 aaaaataaac aaataggggt cagtgttaca accaattaac caattctgaa cattatcgcg 1740 agcccattta tacctgaata tggctcataa caccccttgt ttgcctggcg gcagtagcgc 1800 ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag 1860 tgtggggact ccccatgcga gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc 1920 agtcgaaaga ctgggccttt cgcccgggct aattgagggg tgtcgccctt attcgactcg 1980 gggctcgagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc cgggcgtcgg 2040 gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 2100 tccatcacta ggggttcctt taattaaacg cgtttacata acttacggta aatggcccgc 2160 ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 2220 taacgccaat agggactttc cattgacgtc aatgggtgga ctatttacgg taaactgccc 2280 acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg 2340 gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc 2400 agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca 2460 atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca 2520 atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg 2580 ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata ggcgcgccga 2640 actgaaaaac cagaaagtta actggtaagt ttagtctttt tgtcttttat ttcaggtccc 2700 ggatccggtg gtggtgcaaa tcaaagaact gctcctcagt ggatgttgcc tttacttcta 2760 ggcctgtacg gaagtgttac ttctgctcta aaagctcctg cagggaattc gccaccatgg 2820 tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 2880 acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 2940 agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 3000 tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 3060 acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 3120 aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 3180 accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 3240 tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 3300 tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 3360 actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 3420 tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 3480 tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac aagtaataga 3540 ctagtgcccc tctccctccc ccccccctaa cgttactggc cgaagccgct tggaataagg 3600 ccggtgtgcg tttgtctata tgttattttc caccatattg ccgtcttttg gcaatgtgag 3660 ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt cccctctcgc 3720 caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg aagcttcttg 3780 aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac ctggcgacag 3840 gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg cacaacccca 3900 gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctcacct caagcgtatt 3960 caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg atctggggcc 4020 tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aacgtctagg ccccccgaac 4080 cacggggacg tggttttcct ttgaaaaaca cgatgataat accggtgcca ccatgctgct 4140 gctgctgctg ctgctgggcc tgaggctaca gctctccctg ggcatcatcc cagttgagga 4200 ggagaacccg gacttctgga accgcgaggc agccgaggcc ctgggtgccg ccaagaagct 4260 gcagcctgca cagacagccg ccaagaacct catcatcttc ctgggcgatg ggatgggggt 4320 gtctacggtg acagctgcca ggatcctaaa agggcagaag aaggacaaac tggggcctga 4380 gatacccctg gccatggacc gcttcccata tgtggctctg tccaagacat acaatgtaga 4440 caaacatgtg ccagacagtg gagccacagc cacggcctac ctgtgcgggg tcaagggcaa 4500 cttccagacc attggcttga gtgcagccgc ccgctttaac cagtgcaaca cgacacgcgg 4560 caacgaggtc atctccgtga tgaatcgggc caagaaagca gggaagtcag tgggagtggt 4620 aaccaccaca cgagtgcagc acgcctcgcc agccggcacc tacgcccaca cggtgaaccg 4680 caactggtac tcggacgccg acgtgcctgc ctcggcccgc caggaggggt gccaggacat 4740 cgctacgcag ctcatctcca acatggacat tgacgtgatc ctaggtggag gccgaaagta 4800 catgtttcgc atgggaaccc cagaccctga gtacccagat gactacagcc aaggtgggac 4860 caggctggac gggaagaatc tggtgcagga atggctggcg aagcgccagg gtgcccggta 4920 tgtgtggaac cgcactgagc tcatgcaggc ttccctggac ccgtctgtga cccatctcat 4980 gggtctcttt gagcctggag acatgaaata cgagatccac cgagactcca cactggaccc 5040 ctccctgatg gagatgacag aggctgccct gcgcctgctg agcaggaacc cccgcggctt 5100 cttcctcttc gtggagggtg gtcgcatcga ccatggtcat catgaaagca gggcttaccg 5160 ggcactgact gagacgatca tgttcgacga cgccattgag agggcgggcc agctcaccag 5220 cgaggaggac acgctgagcc tcgtcactgc cgaccactcc cacgtcttct ccttcggagg 5280 ctaccccctg cgagggagct ccatcttcgg gctggcccct ggcaaggccc gggacaggaa 5340 ggcctacacg gtcctcctat acggaaacgg tccaggctat gtgctcaagg acggcgcccg 5400 gccggatgtt accgagagcg agagcgggag ccccgagtat cggcagcagt cagcagtgcc 5460 cctggacgaa gagacccacg caggcgagga cgtggcggtg ttcgcgcgcg gcccgcaggc 5520 gcacctggtt cacggcgtgc aggagcagac cttcatagcg cacgtcatgg ccttcgccgc 5580 ctgcctggag ccctacaccg cctgcgacct ggcgcccccc gccggcacca ccgacgccgc 5640 gcacccgggt tactctagag tcggggcggc cggccgcttc gagcagacat gagtcgacag 5700 atcttttaaa aaacctccca cacaattgtt gttgttaact tgtttattgc agcttataat 5760 ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 5820 tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgttt aaacnnnnnn 5880 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5940 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnatttaa ataggaaccc ctagtgatgg 6000 agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 6060 cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agagagtata 6120 catcgatgtg agttcgcggg tggctggggg gccctgggct gcgaccgccc ccgaaccgcg 6180 tctacgagcc ttgcgggctc cgggtctttg cagtcgtatg ggggcagggt agctgttccc 6240 cgcaaggaga gctcaaggtc agcgctcgga cctggcggag ccccgcaccc aggctgtggc 6300 gccctgtgca gctccgccct tgcggcgcca tctgcccgga gcctccttcc cctagtcccc 6360 agaaacagga ggtccctact cccgcccgag atcccgaccc ggacccctag gtgggggacg 6420 ctttctttcc tttcgcgctc tgcggggtca cgtgtcgcag aggagcccct cccccacggc 6480 ctccggcacc gcaggccccg ggatgctagt gcgcagcggg tgcatccctg tccggatgct 6540 gcgcctgcgg tagagcggcc gccatgttgc aaccgggaag gaaatgaatg ggcagccgtt 6600 aggaaagcct gccggtgact aaccctgcgc tcctgcctcg atgggtggag tcgcgtgtgg 6660 cggggaagtc aggtggagcg aggctagctg gcccgatttc tcctccgggt gatgcttttc 6720 ctagattatt ctctggtaaa tcaaagaagt gggtttatgg aggtcctctt gtgtcccctc 6780 cccgcagagg tgtggtggct gtggcatggt gccaagccgg gagaagctga gtcatgggta 6840 gttggaaaag gacatttcca ccgcaaaatg gcccctctgg tggtggcccc ttcctgcagc 6900 gccggctcac ctcacggccc cgcccttccc ctgccagcct agcgttgacc cgaccccaaa 6960 ggccaggctg taaatgtcac cgggaggatt gggtgtctgg gcgcctcggg gaacctgccc 7020 ttctccccat tccgtcttcc ggaaaccaga tctcccaccg caccctggtc tgaggttaaa 7080 tatagctgct gacctttctg tagctggggg cctgggctgg ggctctctcc catcccttct 7140 ccccacacac atgcacttac ctgtgctccc actcctgatt tctggaaaag agctaggaag 7200 gacaggcaac ttggcaaatc aaagccctgg gactaggggg ttaaaataca gcttcccctc 7260 ttcccacccg ccccagtctc tgtccctttt gtaggaggga cttagagaag gggtgggctt 7320 gccctgtcca gttaatttct gacctttact cctgcccttt gagtttgatg atgctgagtg 7380 tacaagcgtt ttctccctaa agggtgcagc tgagctaggc agcagcaagc attcctgggg 7440 tggcatagtg gggtggtgaa taccatgtac aaagcttgtg cccagactgt gggtggcagt 7500 gccccacatg gccgcttctc ctggaagggc ttcgtatgac tgggggtgtt gggcagccct 7560 ggagccttca gttgcagcca tgccttaagc caggccagcc tggcagggaa gctcaaggga 7620 gataaaattc aacctcttgg gccctcctgg gggtaaggag atgctgcatt cgccctctta 7680 atggggaggt ggcctagggc tgctcacata ttctggagga gcctcccctc ctcatgcctt 7740 cttgcctctt gtctcttagg catgcaaaag agtcgaataa gggcgacaca aaatttattc 7800 taaatgcata ataaatactg ataacatctt atagtttgta ttatattttg tattatcgtt 7860 gacatgtata attttgatat caaaaactga ttttcccttt attattttcg agatttattt 7920 tcttaattct ctttaacaaa ctagaaatat tgtatataca aaaaatcata aataatagat 7980 gaatagttta attataggtg ttcatcaatc gaaaaagcaa cgtatcttat ttaaagtgcg 8040 ttgctttttt ctcatttata aggttaaata attctcatat atcaagcaaa gtgacaggcg 8100 cccttaaata ttctgacaaa tgctctttcc ctaaactccc cccataaaaa aacccgccga 8160 agcgggtttt tacgttattt gcggattaac gattactcgt tatcagaacc gcccaggggg 8220 cccgagctta agactggccg tcgttttaca acacagaaag agtttgtaga aacgcaaaaa 8280 ggccatccgt caggggcctt ctgcttagtt tgatgcctgg cagttcccta ctctcgcctt 8340 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 8400 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 8460 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 8520 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 8580 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 8640 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 8700 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 8760 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 8820 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 8880 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtgggcta 8940 actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 9000 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 9060 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 9120 tcttttctac ggggtctgac gctcagtgga acgacgcgcg cgtaactcac gttaagggat 9180 tttggtcatg agcttgcgcc gtcccgtcaa gtcagcgtaa tgctacactt cttcccgtat 9240 gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt gcacgtagat 9300 ttataaagca ccaagcgcgt tggcctttag cttgaggaga ttgatgagcg cggtggcaat 9360 gccctgcctc cggtgctcgc cggagactgc gagatttaag atatagatct cactacgcgg 9420 ctgctcaaac ttgggcagaa cgtaagccgc gagagcgcca acaaccgctt cttggtcgaa 9480 ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat cggagtccgg 9540 ctgatgttgg gagtaggtgg ctacgtcacc gaactcacga ccgaaaagat caagagcagc 9600 ccgttaggat ttgacttggt cagggccgag cctattagtg cgaatgatgc cttaacttga 9660 gccacctaac tttgttttag ggcgactgcc ctgctgcgta attacgttgc tgctcttaaa 9720 ttacaaacat cgacccacgg cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg 9780 tacaaaaaaa cagtcataac aagccatgaa aaccgccact gcgccgttac caccgctgcg 9840 ttcggtcaag gttctggacc agttgcgtga gcgcattttt ttttcctcct cggcgtttac 9900 gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg 9960 aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct 10020 tgcgtataat atttgcccat agtgaaaacg ggggcgaaga agttgtccat attggccacg 10080 tttaaatcaa aactggtgaa actcacccag ggattggcgc tgacgaaaaa catattctca 10140 ataaaccctt 10150 <210> 72 <211> 498 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 72 cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caccgtaatc 60 tgcttgcacg tagatttata aagcaccaag cgcgttggcc tttagcttga ggagattgat 120 gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat ttaagatata 180 gatctcacta cgcggctgct caaacttggg cagaacgtaa gccgcgagag cgccaacaac 240 cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca agttcccgag 300 gtaatcggag tccggctgat gttgggagta ggtggctacg tcaccgaact cacgaccgaa 360 aagatcaaga gcagcccgtt aggatttgac ttggtcaggg ccgagcctat tagtgcgaat 420 gatgccttaa cttgagccac ctaactttgt tttagggcga ctgccctgct gcgtaattac 480 gttgctgctc ttaaatta 498 <210> 73 <211> 7989 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (3714)..(3813) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (3714)..(3813) <223> This region may encompass 60-100 nucleotides <400> 73 tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 60 actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt aacaagggtg aacactatcc 120 catatcacca gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg 180 cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 240 aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 300 aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 360 atttttttct ccattttttt ttcctccttt agaaaaactc atcgagcatc aaatgaaact 420 gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 480 aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 540 ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 600 caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 660 tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 720 caaccaaacc gttattcatt cgtgattgcg cctgagcgag gcgaaatacg cgatcgctgt 780 taaaaggaca attacaaaca ggaatcgagt gcaaccggcg caggaacact gccagcgcat 840 caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaacgct gtttttccgg 900 ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 960 gaagtggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1020 caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1080 gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1140 cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcattt 1200 ttttttcctc ctttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 1260 tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 1320 accatctggc cccagcgctg cgatgatacc gcgagaacca cgctcaccgg ctccggattt 1380 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 1440 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 1500 tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg gtgtcacgct cgtcgtttgg 1560 tatggcttca ttcagctccg gttcccaacg atcaaggcga gattcttcct ttttcaatat 1620 tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 1680 aaaaataaac aaataggggt cagtgttaca accaattaac caattctgaa cattatcgcg 1740 agcccattta tacctgaata tggctcataa caccccttgt ttgcctggcg gcagtagcgc 1800 ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag 1860 tgtggggact ccccatgcga gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc 1920 agtcgaaaga ctgggccttt cgcccgggct aattgagggg tgtcgccctt attcgactcg 1980 gggctcgagc agcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 2040 cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 2100 gggttttaat taaacgcgtt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 2160 aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 2220 actttccatt gacgtcaatg ggtggactat ttacggtaaa ctgcccactt ggcagtacat 2280 caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 2340 tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 2400 ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 2460 cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 2520 tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 2580 atgggcggta ggcgtgtacg gtgggaggtc tatataggcg cgccgaactg aaaaaccaga 2640 aagttaactg gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg 2700 tgcaaatcaa agaactgctc ctcagtggat gttgccttta cttctaggcc tgtacggaag 2760 tgttacttct gctctaaaag ctcctgcagg gaattcgcca ccatggtgag caagggcgag 2820 gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 2880 aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 2940 ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 3000 tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 3060 tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 3120 tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 3180 aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 3240 aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 3300 aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 3360 acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 3420 gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 3480 gccgccggga tcactctcgg catggacgag ctgtacaagt aatagactag tgtcgacaga 3540 tcttttaaaa aacctcccac acaattgttg ttgttaactt gtttattgca gcttataatg 3600 gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 3660 ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgttta aacnnnnnnn 3720 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnatttaaa taggaacccc tagtgatgga 3840 gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 3900 ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagtatac 3960 atcgatgtga gttcgcgggt ggctgggggg ccctgggctg cgaccgcccc cgaaccgcgt 4020 ctacgagcct tgcgggctcc gggtctttgc agtcgtatgg gggcagggta gctgttcccc 4080 gcaaggagag ctcaaggtca gcgctcggac ctggcggagc cccgcaccca ggctgtggcg 4140 ccctgtgcag ctccgccctt gcggcgccat ctgcccggag cctccttccc ctagtcccca 4200 gaaacaggag gtccctactc ccgcccgaga tcccgacccg gacccctagg tgggggacgc 4260 tttctttcct ttcgcgctct gcggggtcac gtgtcgcaga ggagcccctc ccccacggcc 4320 tccggcaccg caggccccgg gatgctagtg cgcagcgggt gcatccctgt ccggatgctg 4380 cgcctgcggt agagcggccg ccatgttgca accgggaagg aaatgaatgg gcagccgtta 4440 ggaaagcctg ccggtgacta accctgcgct cctgcctcga tgggtggagt cgcgtgtggc 4500 ggggaagtca ggtggagcga ggctagctgg cccgatttct cctccgggtg atgcttttcc 4560 tagattattc tctggtaaat caaagaagtg ggtttatgga ggtcctcttg tgtcccctcc 4620 ccgcagaggt gtggtggctg tggcatggtg ccaagccggg agaagctgag tcatgggtag 4680 ttggaaaagg acatttccac cgcaaaatgg cccctctggt ggtggcccct tcctgcagcg 4740 ccggctcacc tcacggcccc gcccttcccc tgccagccta gcgttgaccc gaccccaaag 4800 gccaggctgt aaatgtcacc gggaggattg ggtgtctggg cgcctcgggg aacctgccct 4860 tctccccatt ccgtcttccg gaaaccagat ctcccaccgc accctggtct gaggttaaat 4920 atagctgctg acctttctgt agctgggggc ctgggctggg gctctctccc atcccttctc 4980 cccacacaca tgcacttacc tgtgctccca ctcctgattt ctggaaaaga gctaggaagg 5040 acaggcaact tggcaaatca aagccctggg actagggggt taaaatacag cttcccctct 5100 tcccacccgc cccagtctct gtcccttttg taggagggac ttagagaagg ggtgggcttg 5160 ccctgtccag ttaatttctg acctttactc ctgccctttg agtttgatga tgctgagtgt 5220 acaagcgttt tctccctaaa gggtgcagct gagctaggca gcagcaagca ttcctggggt 5280 ggcatagtgg ggtggtgaat accatgtaca aagcttgtgc ccagactgtg ggtggcagtg 5340 ccccacatgg ccgcttctcc tggaagggct tcgtatgact gggggtgttg ggcagccctg 5400 gagccttcag ttgcagccat gccttaagcc aggccagcct ggcagggaag ctcaagggag 5460 ataaaattca acctcttggg ccctcctggg ggtaaggaga tgctgcattc gccctcttaa 5520 tggggaggtg gcctagggct gctcacatat tctggaggag cctcccctcc tcatgccttc 5580 ttgcctcttg tctcttaggc atgcaaaaga gtcgaataag ggcgacacaa aatttattct 5640 aaatgcataa taaatactga taacatctta tagtttgtat tatattttgt attatcgttg 5700 acatgtataa ttttgatatc aaaaactgat tttcccttta ttattttcga gatttatttt 5760 cttaattctc tttaacaaac tagaaatatt gtatatacaa aaaatcataa ataatagatg 5820 aatagtttaa ttataggtgt tcatcaatcg aaaaagcaac gtatcttatt taaagtgcgt 5880 tgcttttttc tcatttataa ggttaaataa ttctcatata tcaagcaaag tgacaggcgc 5940 ccttaaatat tctgacaaat gctctttccc taaactcccc ccataaaaaa acccgccgaa 6000 gcgggttttt acgttatttg cggattaacg attactcgtt atcagaaccg cccagggggc 6060 ccgagcttaa gactggccgt cgttttacaa cacagaaaga gtttgtagaa acgcaaaaag 6120 gccatccgtc aggggccttc tgcttagttt gatgcctggc agttccctac tctcgccttc 6180 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 6240 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 6300 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 6360 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 6420 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 6480 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 6540 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 6600 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 6660 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 6720 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtgggctaa 6780 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 6840 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 6900 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 6960 cttttctacg gggtctgacg ctcagtggaa cgacgcgcgc gtaactcacg ttaagggatt 7020 ttggtcatga gcttgcgccg tcccgtcaag tcagcgtaat gctacacttc ttcccgtatg 7080 cccaactttg tatagagagc cactgcggga tcgtcaccgt aatctgcttg cacgtagatt 7140 tataaagcac caagcgcgtt ggcctttagc ttgaggagat tgatgagcgc ggtggcaatg 7200 ccctgcctcc ggtgctcgcc ggagactgcg agatttaaga tatagatctc actacgcggc 7260 tgctcaaact tgggcagaac gtaagccgcg agagcgccaa caaccgcttc ttggtcgaag 7320 gcagcaagcg cgatgaatgt cttactacgg agcaagttcc cgaggtaatc ggagtccggc 7380 tgatgttggg agtaggtggc tacgtcaccg aactcacgac cgaaaagatc aagagcagcc 7440 cgttaggatt tgacttggtc agggccgagc ctattagtgc gaatgatgcc ttaacttgag 7500 ccacctaact ttgttttagg gcgactgccc tgctgcgtaa ttacgttgct gctcttaaat 7560 tacaaacatc gacccacggc gtaacgcgct tgctgcttgg atgcccgagg catagactgt 7620 acaaaaaaac agtcataaca agccatgaaa accgccactg cgccgttacc accgctgcgt 7680 tcggtcaagg ttctggacca gttgcgtgag cgcatttttt tttcctcctc ggcgtttacg 7740 ccccgccctg ccactcatcg cagtactgtt gtaattcatt aagcattctg ccgacatgga 7800 agccatcaca gacggcatga tgaacctgaa tcgccagcgg catcagcacc ttgtcgcctt 7860 gcgtataata tttgcccata gtgaaaacgg gggcgaagaa gttgtccata ttggccacgt 7920 ttaaatcaaa actggtgaaa ctcacccagg gattggcgct gacgaaaaac atattctcaa 7980 taaaccctt 7989 <210> 74 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic Peptide <220> <221> MISC_FEATURE <222> (1)..(3) <223> This region may or may not be present <400> 74 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 75 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(3) <223> This region may or may not be present <400> 75 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 76 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(3) <223> This region may or may not be present <400> 76 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro 20 <210> 77 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(3) <223> This region may or may not be present <400> 77 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 1 5 10 15 Gly Asp Val Glu Ser Asn Pro Gly Pro 20 25

Claims (51)

  1. 하기를 포함하는, 재조합 아데노-연관 바이러스 벡터 (rAAV) 생산을 위한 플라스미드 시스템:
    (i) 5' 및 3' AAV 역위 말단 반복부 (ITR)에 의해 플랭킹된 적어도 하나의 이종 핵산 및 ITR 외부의 스터퍼 서열을 포함하는 트랜스진-함유 플라스미드;
    (ii) AAV 복제 (Rep) 및 캡시드 (Cap) 유전자 서열을 포함하는 플라스미드; 및
    (iii) 아데노바이러스 (Ad) 헬퍼 플라스미드.
  2. 제1항에 있어서, 스터퍼 서열이 트랜스진-함유 플라스미드 백본의 크기를 증가시켜 트랜스진-함유 플라스미드가 rAAV 캡시드에 패키징되지 않도록 하는 것인 플라스미드 시스템.
  3. 제1항 또는 제2항에 있어서, 트랜스진-함유 플라스미드의 백본이 야생형 AAV 게놈보다 더 큰 것인 플라스미드 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열, 코딩 서열 또는 이들의 임의의 조합이 없는 것인 플라스미드 시스템.
  5. 제4항에 있어서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열 및 코딩 서열이 없는 것인 플라스미드 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 스터퍼 서열이 인간 게놈에서 발견되는 불활성 인트론 DNA 서열을 포함하는 것인 플라스미드 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 스터퍼 서열이 1000 내지 5000개 뉴클레오티드 길이의 핵산 서열 또는 1000 내지 2000개 뉴클레오티드 길이의 핵산 서열을 포함하는 것인 플라스미드 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 스터퍼 서열이 GAPDH 인트론 2, 단편, 또는 그의 돌연변이체를 포함하는 것인 플라스미드 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 스터퍼 서열이 서열식별번호: 9와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하는 것인 플라스미드 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 스터퍼 서열이 서열식별번호: 9와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산으로 이루어지는 것인 플라스미드 시스템.
  11. 제1항 내지 제8항 중 어느 한 항에 있어서, 스터퍼 서열이 서열식별번호: 9 또는 그의 단편을 포함하는 것인 플라스미드 시스템.
  12. 제1항 내지 제8항 중 어느 한 항에 있어서, 스터퍼 서열이 서열식별번호: 9 또는 그의 단편으로 이루어지는 것인 플라스미드 시스템.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 도 3a와 동일한 순서의 구조를 갖는 플라스미드를 포함하며, 여기서 eGFP 및 SEAP 트랜스진이 적어도 하나의 이종 핵산으로 대체될 수 있는 것인 플라스미드 시스템.
  14. 제1항 내지 제12항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 도 3b와 동일한 순서의 구조를 갖는 플라스미드를 포함하며, 여기서 eGFP 트랜스진이 적어도 하나의 이종 핵산으로 대체될 수 있는 것인 플라스미드 시스템.
  15. 제1항 내지 제12항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 5'에서 3' 방향으로 서열식별번호: 2, 4, 적어도 하나의 이종 핵산, 8, 3, 및 스터퍼 서열의 핵산 서열을 포함하며, 여기서 각 핵산 서열이 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩하는 것인 플라스미드 시스템.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 발현 카세트 외부에 그러나 5' ITR과 3' ITR 사이에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
  17. 제1항 내지 제15항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 i) 3' ITR의 상류 및 폴리A 서열의 하류 또는 ii) 3' ITR의 상류 및 적어도 하나의 이종 핵산의 하류; 또는 iii) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열에 대한 프로모터의 상류; 또는 v) 5' ITR의 하류 및 3' ITR의 상류에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
  18. 제1항 내지 제15항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 i) 서열식별번호: 3의 상류 및 서열식별번호: 8의 하류 또는 ii) 서열식별번호: 3의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 서열식별번호: 2의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 서열식별번호: 2의 하류 및 서열식별번호: 4의 상류; 또는 v) 서열식별번호: 2의 하류 및 서열식별번호: 3의 상류에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
  19. 제1항 내지 제12항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 5'에서 3' 방향으로 서열식별번호: 43, 4, 적어도 하나의 이종 핵산 서열, 8, 3, 및 스터퍼 서열의 핵산 서열을 포함하며, 여기서 각 핵산 서열이 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩하는 것인 플라스미드 시스템.
  20. 제19항에 있어서, 트랜스진-함유 플라스미드가 발현 카세트 외부에 그러나 5' ITR과 3' ITR 사이에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
  21. 제19항 또는 제20항에 있어서, 트랜스진-함유 플라스미드가 i) 3' ITR의 상류 및 폴리A 서열의 하류 또는 ii) 3' ITR의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열에 대한 프로모터의 상류; 또는 v) 5' ITR의 하류 및 3' ITR의 상류에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
  22. 제19항 또는 제20항에 있어서, 트랜스진-함유 플라스미드가 i) 서열식별번호: 3의 상류 및 서열식별번호: 8의 하류 또는 ii) 서열식별번호: 3의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 서열식별번호: 43의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 서열식별번호: 43의 하류 및 서열식별번호: 4의 상류; 또는 v) 서열식별번호: 43의 하류 및 서열식별번호: 3의 상류에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, AAV Rep 유전자 서열이 AAV 혈청형 2, 5, 8, 9, 또는 이들의 하이브리드로부터 유래된 것인 플라스미드 시스템.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, AAV Cap 유전자 서열이 AAV 혈청형 2, 5, 8, 9, 또는 이들의 하이브리드로부터 유래된 것인 플라스미드 시스템.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, Rep 및 Cap 유전자 서열을 포함하는 플라스미드가 프로모터를 추가로 포함하는 것인 플라스미드 시스템.
  26. 제25항에 있어서, 프로모터가 AAV 프로모터인 플라스미드 시스템.
  27. 제26항에 있어서, 프로모터가 AAV P5 프로모터인 플라스미드 시스템.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, Ad 헬퍼 플라스미드가 E1a, E1b, E2a, E4orf6, 또는 VA RNA로부터 선택된 하나 이상의 아데노바이러스 유전자를 포함하는 것인 플라스미드 시스템.
  29. 제28항에 있어서, Ad 헬퍼 플라스미드가 5'에서 3' 방향으로 서열식별번호: 18, 17, 16 및 20의 핵산 서열을 포함하며, 여기서 각 핵산 서열이 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있는 것인 플라스미드 시스템.
  30. 제28항에 있어서, Ad 헬퍼 플라스미드가 5'에서 3' 방향으로 서열식별번호: 21, 16, 39, 40, 22, 23 및 20의 핵산 서열을 포함하며, 여기서 각 핵산 서열이 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩하는 것인 플라스미드 시스템.
  31. 제1항 내지 제28항 중 어느 한 항에 있어서, Ad 헬퍼 플라스미드가 도 5의 어느 하나의 구축물과 동일한 순서의 구조를 포함하는 것인 플라스미드 시스템.
  32. 제1항 내지 제28항 중 어느 한 항에 있어서, Ad 헬퍼 플라스미드가 서열식별번호: 14와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하는 것인 플라스미드 시스템.
  33. 제1항 내지 제28항 중 어느 한 항에 있어서, Ad 헬퍼 플라스미드가 서열식별번호: 15와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하는 것인 플라스미드 시스템.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 이종 핵산 서열이 펩티드, 폴리펩티드 또는 단백질을 코딩하는 관심 이종 유전자인 플라스미드 시스템.
  35. 제34항에 있어서, 펩티드, 폴리펩티드 또는 단백질이 효소, 항체, MHC 분자, T-세포 수용체, B-세포 수용체, 압타머, 아비머, 수용체-결합 리간드, 표적화 펩티드, 치료제, 또는 유전자 편집 분자인 플라스미드 시스템.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 이종 핵산이 핵산 서열, 예컨대 안티센스, siRNA, shRNA, miRNA, EGS, gRNA, sgRNA, 리보자임 또는 압타머인 플라스미드 시스템.
  37. 제1항 내지 제36항 중 어느 한 항의 플라스미드 시스템을 포함하는 숙주 세포.
  38. 제37항의 숙주 세포에 의해 생산된 재조합 아데노-연관 바이러스 벡터 (rAAV).
  39. 트랜스진-함유 플라스미드 내의 이종 핵산 서열의 핵산 서열로부터 상류 또는 하류에 약 60개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이의 핵산 태그 서열을 포함하며, 여기서 핵산 태그 서열은 적어도 2개의 상이한 유형의 AAV 벡터 사이에서 범용 벡터 게놈 역가측정을 허용하기 위해 적어도 2개의 상이한 트랜스진-함유 플라스미드에서 사용될 수 있는 것인, 범용 벡터 역가측정을 허용하는 DNA 역가 태그.
  40. 제39항에 있어서, 핵산 태그 서열이 약 100개 뉴클레오티드 길이인 DNA 역가 태그.
  41. 제39항 또는 제40항에 있어서, 핵산 태그 서열이 트랜스진-함유 플라스미드의 3' ITR 서열로부터 상류에 있지만 트랜스진-함유 플라스미드의 발현 카세트 내에 없는 것인 DNA 역가 태그.
  42. 제39항 또는 제40항에 있어서, 핵산 태그 서열이 트랜스진-함유 플라스미드의 5' ITR 서열로부터 하류에 있지만 트랜스진-함유 플라스미드의 발현 카세트 내에 없는 것인 DNA 역가 태그.
  43. 제39항 내지 제42항 중 어느 한 항에 있어서, DNA 역가 태그가 서열식별번호: 61-70의 핵산 서열 중 어느 하나를 포함하는 것인 DNA 역가 태그.
  44. 재조합 아데노-연관 바이러스 벡터 (rAAV)를 생산하는 방법으로서, 제1항 내지 제36항 중 어느 한 항의 플라스미드 시스템으로 세포를 형질도입하고, rAAV를 단리하는 것을 포함하는 방법.
  45. 제44항의 방법에 의해 생산된 재조합 아데노-연관 바이러스 벡터 (rAAV).
  46. 제1항 내지 제36항 중 어느 한 항의 플라스미드 시스템을 포함하는 조성물.
  47. 제38항 또는 제45항의 rAAV를 포함하는 제약 조성물.
  48. 제38항 또는 제45항의 rAAV를 대상체에게 투여하며, 그에 의해 핵산 서열을 세포로 전달하는 것을 포함하는, 핵산 서열을 대상체의 세포로 전달하거나 또는 전이시키는 방법.
  49. 제48항에 있어서, 대상체의 세포가 배양 중이거나 또는 대상체에 존재하는 것인 방법.
  50. 제38항 또는 제45항에 따른 rAAV를 질환 또는 장애의 치료 또는 예방을 필요로 하는 대상체에게 투여하는 것을 포함하는, 대상체에서 질환 또는 장애를 치료하거나 또는 예방하는 방법.
  51. 제38항 또는 제45항에 따른 rAAV와 숙주 세포를 접촉시키는 것을 포함하는, 숙주 세포를 형질도입하는 방법.
KR1020217014276A 2018-10-25 2019-10-24 Aav 삼중-플라스미드 시스템 KR20210086645A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862750603P 2018-10-25 2018-10-25
US62/750,603 2018-10-25
PCT/US2019/057916 WO2020086881A1 (en) 2018-10-25 2019-10-24 Aav triple-plasmid system

Publications (1)

Publication Number Publication Date
KR20210086645A true KR20210086645A (ko) 2021-07-08

Family

ID=70331899

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217014276A KR20210086645A (ko) 2018-10-25 2019-10-24 Aav 삼중-플라스미드 시스템

Country Status (10)

Country Link
US (1) US20210275614A1 (ko)
EP (1) EP3870148A4 (ko)
JP (1) JP2022511348A (ko)
KR (1) KR20210086645A (ko)
CN (1) CN112888426A (ko)
AU (1) AU2019363593A1 (ko)
CA (1) CA3112883A1 (ko)
IL (1) IL281909A (ko)
TW (1) TW202029957A (ko)
WO (1) WO2020086881A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11926842B2 (en) * 2021-02-02 2024-03-12 University Of Massachusetts Use of inverted terminal repeats (ITRS) from adeno-associated virus serotypes 8 and RH.39 in gene therapy vectors
CA3217226A1 (en) * 2021-04-21 2022-10-27 Asimov Inc. Stable production systems for adeno-associated virus production
JP2024519175A (ja) * 2021-05-27 2024-05-08 ニューラクル ジェネティクス インコーポレイテッド 新規なデュアルヘルパープラスミド
CN114196705A (zh) * 2021-12-07 2022-03-18 中国科学院深圳先进技术研究院 一种重组腺相关病毒包装质粒、重组腺相关病毒及其应用
WO2023102736A1 (zh) * 2021-12-07 2023-06-15 中国科学院深圳先进技术研究院 一种重组腺相关病毒包装质粒、重组腺相关病毒及其应用
WO2023220502A1 (en) * 2022-05-12 2023-11-16 AAVnerGene Inc. Compositions and methods for recombinant parvovirus production
WO2024046403A1 (zh) * 2022-08-31 2024-03-07 江苏金斯瑞蓬勃生物科技有限公司 能够提高腺相关病毒滴度的腺相关病毒结构质粒
CN117660534B (zh) * 2023-12-13 2024-05-07 广州派真生物技术有限公司 一种降低重组腺相关病毒中宿主细胞dna残留的辅助质粒及应用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2369985A1 (en) * 2002-01-18 2003-07-18 Duke University Generation of recombinant adeno-associated viral vectors by a complete adenovirus-mediated approach
US9163259B2 (en) * 2012-05-04 2015-10-20 Novartis Ag Viral vectors for the treatment of retinal dystrophy
CA2904156C (en) * 2013-03-15 2023-01-10 The Children's Hospital Of Philadelphia Vectors comprising stuffer/filler polynucleotide sequences and methods of use
US11078464B2 (en) * 2013-08-30 2021-08-03 Amgen Inc. High titer recombinant AAV vector production in adherent and suspension cells
KR102245861B1 (ko) * 2013-11-29 2021-04-28 다카라 바이오 가부시키가이샤 아데노 수반 바이러스의 정량 방법
WO2016074016A1 (en) * 2014-11-10 2016-05-19 Murdoch Childrens Research Institute Vectors and methods for targeted integration in loci comprising constitutively expressed genes
EP3265571B1 (en) * 2015-03-03 2022-04-13 Fondazione Telethon Multiple vector system and uses thereof
WO2016196507A1 (en) * 2015-05-29 2016-12-08 University Of Iowa Research Foundation Methods of delivery of transgenes for treating brain diseases
CN113056561A (zh) * 2018-04-05 2021-06-29 牛津大学科技创新有限公司 用于治疗黄斑营养不良的组合物和方法

Also Published As

Publication number Publication date
WO2020086881A1 (en) 2020-04-30
US20210275614A1 (en) 2021-09-09
AU2019363593A1 (en) 2021-04-29
TW202029957A (zh) 2020-08-16
JP2022511348A (ja) 2022-01-31
EP3870148A1 (en) 2021-09-01
IL281909A (en) 2021-05-31
EP3870148A4 (en) 2022-11-09
CN112888426A (zh) 2021-06-01
CA3112883A1 (en) 2020-04-30

Similar Documents

Publication Publication Date Title
AU2020260491B2 (en) Gene therapies for lysosomal disorders
AU2020205228B2 (en) Gene therapies for lysosomal disorders
KR20210086645A (ko) Aav 삼중-플라스미드 시스템
AU2020260476B2 (en) Gene therapies for lysosomal disorders
US6156567A (en) Truncated transcriptionally active cytomegalovirus promoters
US6090393A (en) Recombinant canine adenoviruses, method for making and uses thereof
KR102446169B1 (ko) 리소좀 저장 장애의 치료를 위한 아데노연관 바이러스 벡터
KR20230091894A (ko) 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물
CN113005123A (zh) 用于神经变性疾病的基因疗法
KR20220006527A (ko) 리소좀 장애에 대한 유전자 요법
BRPI0708344A2 (pt) vetores adenovirais quiméricos
KR20180069081A (ko) 심장 이상 및 기타 병리 이상의 치료를 위한 복수의 생물학적으로 활성화된 폴리펩티드를 단일 벡터로부터 발현하기 위한 조성물 및 방법
US20030157688A1 (en) Adenovirus vectors, packaging cell lines, compositions, and methods for preparation and use
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
CA2359795A1 (en) Adenovirus vectors, packaging cell lines, compositions, and methods for preparation and use
KR20080030956A (ko) 개선된 조절 발현 체계를 사용한 질병의 치료
KR20220161297A (ko) 신규 세포주
KR20230051529A (ko) 리소좀 장애에 대한 유전자 요법
KR20230066360A (ko) 신경퇴행성 장애를 위한 유전자 요법
KR20220112283A (ko) Hunter 질환 치료용 아데노-연합된 바이러스 벡터
KR101153845B1 (ko) Kras G12V RNA를 특이적으로 인지할 수 있는 트랜스-스플라이싱 그룹 I 리보자임
KR20150021839A (ko) 암특이적 유전자를 표적하는 트랜스-스플라이싱 라이보자임의 조절 유도체를 포함하는 재조합 아데노바이러스 및 이의 용도
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법
KR20240036508A (ko) 아데노바이러스성 헬퍼 플라스미드
CN117480257A (zh) 用于高水平rAAV生产的系统

Legal Events

Date Code Title Description
A201 Request for examination