KR20230002611A - 세포 분류기 회로 및 그의 사용 방법 - Google Patents

세포 분류기 회로 및 그의 사용 방법 Download PDF

Info

Publication number
KR20230002611A
KR20230002611A KR1020227039223A KR20227039223A KR20230002611A KR 20230002611 A KR20230002611 A KR 20230002611A KR 1020227039223 A KR1020227039223 A KR 1020227039223A KR 20227039223 A KR20227039223 A KR 20227039223A KR 20230002611 A KR20230002611 A KR 20230002611A
Authority
KR
South Korea
Prior art keywords
target site
leu
mir
asp
ala
Prior art date
Application number
KR1020227039223A
Other languages
English (en)
Inventor
바르톨로메오 안젤리치
야코브 베넨손
Original Assignee
아이드제노시쉐 테크니쉐 훽슐레 쥐리히
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아이드제노시쉐 테크니쉐 훽슐레 쥐리히 filed Critical 아이드제노시쉐 테크니쉐 훽슐레 쥐리히
Publication of KR20230002611A publication Critical patent/KR20230002611A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • A61K45/06Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/10Production naturally occurring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/20Vector systems having a special element relevant for transcription transcription of more than one cistron
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Virology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Epidemiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Steroid Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본원에 개시되는 것은 정밀한 생체내 세포 표적화를 위한 고도로 콤팩트한 다중-입력 유전자 논리 게이트를 코딩하는 인접 DNA 서열, 및 생체내 전달 및 이러한 인접 DNA 서열의 조합을 사용하여 질환을 치료하는 방법이다.

Description

세포 분류기 회로 및 그의 사용 방법
본원에 개시되는 것은 정밀한 생체내 세포 표적화를 위한 고도로 콤팩트한 다중-입력 유전자 논리 게이트를 코딩하는 인접 DNA 서열, 및 생체내 전달 및 이러한 인접 DNA 서열의 조합을 사용하여 질환을 치료하는 방법이다.
유전자 요법이 유전자 질환 및 암의 차세대 치료 옵션으로 부상하고 있다. 그러나, 현재의 유전자 요법 벡터는 낮은 효능, 높은 독성, 그리고 치료를 선도하기에는 긴 개발 일정으로 어려움을 겪고 있다. 이들 결점의 한 가지 이유는 (i) 의도하지 않은 세포 유형 및 조직에서의 유전자 발현 또는 (ii) 불충분하거나 너무 높은 것 중 어느 하나인 투여량의 유전자 발현으로 이어지는, 유전자 요법 벡터에서의 치료 유전자 발현의 견고한 제어의 불충분성이다. 달리 말하면, 유전자 산물 투여량 (즉, 세포당 단백질 분자의 수) 및 세포 유형-제한 발현 양쪽 면에서의 유전자 발현의 정밀한 제어가 유전자 요법에 공공연한 과제로 남아 있다.
생체분자 컴퓨팅 및 합성 생물학에서의 연구는 (i) 분자 질환 지표의 다중-입력 센싱; (ii) 치료 반응의 강도를 결정하는 분자 수준 계산; 및 (iii) 고도로 정밀하고 조화된 방식으로의 계내에서의 요법의 강화에 기반한 새로운 유형의 치료 접근법을 가능하게 하기 위해 오래도록 추구되었다. 본원에 기재되는 것은 다수의 세포 입력의 복잡한 논리적 통합을 통한 이질적 세포 유형의 정밀한 확인을 가능하게 하는 세포 분류기 유전자 회로이다. 또한 본원에 기재되는 것은 질환을 치료하기 위해 분류기 유전자 회로를 사용하는 방법이다. 암은 건강한 세포와의 종양 유사성, 종양 이질성, 및 1차 및 2차 로커스 둘 다에서의 그의 전파로 인하여 세포 분류기 접근법으로부터 가장 이익을 얻을 질환의 부류로 간주되었다. 본원에 기재된 연구는 정밀한 세포 표적화를 위한 다중-입력 유전자 회로가 차세대의 유전자 요법을 위한 이상적인 방안이라는 개념을 지지한다.
따라서, 일부 측면에서 본 개시내용은 인접 폴리핵산 분자에 관한 것이다. 일부 실시양태에서, 인접 폴리핵산 분자는 a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) 표 1에 열거된 miRNA에 대한 표적 부위 또는 이들의 조합을 포함하는 것인 제1 카세트; 및 b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며; 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 RNA는 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제1 RNA는 3' UTR을 포함하며, 여기서 3' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제1 RNA는 5' UTR을 포함하며, 여기서 5' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제2 RNA는 표 1에 열거된 마이크로RNA에 대한 표적 부위 또는 이들의 조합을 추가로 포함한다.
일부 실시양태에서, 여기서 제2 RNA는 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 추가로 포함한다.
일부 실시양태에서, 제2 RNA는 3' UTR을 포함하며, 여기서 3' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제2 RNA는 5' UTR을 포함하며, 여기서 5' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제1 카세트의 적어도 하나의 miRNA 표적 부위 및 제2 카세트의 적어도 하나의 miRNA 표적 부위는 동일한 핵산 서열이거나 또는 동일한 miRNA에 의해 조절되는 상이한 서열이다.
일부 실시양태에서, 제1 RNA 및 제2 RNA는 각각 let-7c 표적 부위를 포함한다.
일부 실시양태에서, 전사활성인자 반응 요소는 표 3에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제2 RNA의 발현은 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 전사 인자 반응 요소는 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 전사활성인자는 독립적으로 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 RNA의 발현은 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 전사 인자 반응 요소는 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 전사활성인자는 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 카세트 및/또는 제2 카세트는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 표 5에 열거된 핵산 서열 또는 이들의 조합을 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소는 동일한 핵산 서열로 이루어진다.
일부 실시양태에서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소는 상이한 핵산 서열로 이루어진다.
일부 실시양태에서, 제1 카세트 및/또는 제2 카세트는 2개 이상의 전사 인자 반응 요소를 포함한다.
일부 실시양태에서, 제1 카세트 및/또는 제2 카세트는 2개의 상이한 전사 인자 반응 요소를 포함한다.
일부 실시양태에서, 제1 카세트의 상류 조절 구성요소는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 제2 카세트의 상류 조절 구성요소는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 제1 카세트 및 제2 카세트는 수렴형 배향으로 존재한다. 일부 실시양태에서, 제1 카세트 및 제2 카세트는 발산형 배향으로 존재한다. 일부 실시양태에서, 제1 카세트 및 제2 카세트는 머리-대-꼬리 배향으로 존재한다.
일부 실시양태에서, 제1 카세트 및/또는 제2 카세트는 인슐레이터에 의해 플랭킹된다.
일부 실시양태에서, 제2 카세트의 전사활성인자는 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16, 또는 NarLc-RelA이다.
일부 실시양태에서, 제2 카세트의 전사활성인자는 표 2에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 출력은 단백질 또는 RNA 분자이다. 일부 실시양태에서, 출력은 치료제이다. 일부 실시양태에서, 출력은 형광 단백질, 세포독소, 전구약물 활성화를 촉매하는 효소, 면역조정 단백질 및/또는 RNA, DNA-변형 인자, 세포-표면 수용체, 유전자 발현-조절 인자, 키나제, 후성적 변형인자, 및/또는 벡터 복제에 필요한 인자, 및/또는 병원체의 항원 폴리펩티드를 코딩하는 서열이다. 일부 실시양태에서, 출력은 인간 심플렉스 헤르페스 바이러스 1로부터의 티미딘 키나제 효소 (HSV-TK)이다. 일부 실시양태에서, 상기 면역조정 단백질 및/또는 RNA는 시토카인 또는 콜로니 자극 인자이다. 일부 실시양태에서, DNA-변형 인자는 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소이다. 일부 실시양태에서, DNA-변형 효소는 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas DNA 변형 시스템의 단백질 구성요소이다. 일부 실시양태에서, 유전자 발현-조절 인자는 유전자 발현을 조절할 수 있는 단백질, 또는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소이다.
일부 실시양태에서, 인접 폴리핵산 분자는 표 6에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 (i) 출력의 핵산 서열; (ii) 전사활성인자의 핵산 서열; 및 (iii) 표 1에 열거된 miRNA에 대한 표적 부위 또는 이들의 조합을 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 RNA는 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, RNA는 출력 및 전사활성인자의 핵산 서열들을 분리하는 폴리시스트론성 발현 요소의 핵산 서열을 추가로 포함한다.
일부 실시양태에서, RNA는 3' UTR을 포함하며, 여기서 3' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, RNA는 5' UTR을 포함하며, 여기서 5' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, RNA는 let-7c 표적 부위를 포함한다.
일부 실시양태에서, 전사활성인자 반응 요소는 표 3에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 전사활성인자는 독립적으로 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, RNA의 발현은 전사활성인자 반응 요소 및 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 전사 인자 반응 요소는 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 전사활성인자는 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 카세트는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 표 5에 열거된 핵산 서열 또는 이들의 조합을 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력 및 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, (i)에서의 상류 조절 구성요소는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 적어도 하나의 카세트의 전사활성인자는 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16, 또는 NarLc-RelA이다.
일부 실시양태에서, 출력은 단백질 또는 RNA 분자이다. 일부 실시양태에서, 출력은 치료 단백질 또는 RNA 분자이다. 일부 실시양태에서, 출력은 형광 단백질, 세포독소, 전구약물 활성화를 촉매하는 효소, 면역조정 단백질 및/또는 RNA, DNA-변형 인자, 세포-표면 수용체, 유전자 발현-조절 인자, 키나제, 후성적 변형인자, 및/또는 벡터 복제에 필요한 인자, 및/또는 병원체의 항원 폴리펩티드를 코딩하는 서열이다. 일부 실시양태에서, 출력은 인간 심플렉스 헤르페스 바이러스 1로부터의 티미딘 키나제 효소 (HSV-TK)이다. 일부 실시양태에서, 면역조정 단백질 및/또는 RNA는 시토카인 또는 콜로니 자극 인자이다. 일부 실시양태에서, DNA-변형 인자는 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소이다. 일부 실시양태에서, DNA-변형 효소는 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas 시스템의 단백질 구성요소이다. 일부 실시양태에서, 유전자 발현-조절 인자는 유전자 발현을 조절할 수 있는 단백질, 또는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소이다.
다른 측면에서, 본 개시내용은 본원에 기재된 인접 폴리핵산을 포함하는 벡터에 관한 것이다.
다른 측면에서, 본 개시내용은 본원에 기재된 인접 폴리핵산을 포함하는 조작된 바이러스 게놈에 관한 것이다. 일부 실시양태에서, 조작된 바이러스 게놈은 아데노-연관 바이러스 (AAV) 게놈, 렌티바이러스 게놈, 아데노바이러스 게놈, 헤르페스 심플렉스 바이러스 (HSV) 게놈, 백시니아 바이러스 게놈, 폭스바이러스 게놈, 뉴캐슬병 바이러스 (NDV) 게놈, 콕사키바이러스 게놈, 레오바이러스 게놈, 홍역 바이러스 게놈, 소포성 구내염 바이러스 (VSV) 게놈, 파르보바이러스 게놈, 세네카 밸리 바이러스 게놈, 마라바 바이러스 게놈, 또는 감기 바이러스 게놈으로부터 유래된다.
다른 측면에서, 본 개시내용은 본원에 개시된 조작된 바이러스 게놈을 포함하는 비리온에 관한 것이다. 일부 실시양태에서, 비리온은 AAV-DJ, AAV8, AAV6, 또는 AAV-B1 캡시드를 포함한다.
다른 측면에서, 본 개시내용은 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 관한 것이다. 일부 실시양태에서, 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법은 세포의 집단을 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온과 접촉시키는 것을 포함하며, 여기서 세포의 집단은 적어도 하나의 표적 세포 유형 및 하나 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준 및/또는 활성에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준 및/또는 활성은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절된다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함한다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 이 프로모터 단편을 추가로 포함한다.
다른 측면에서, 본 개시내용은 질환 또는 병태를 진단하는 방법에 관한 것이다. 일부 실시양태에서, 질환 또는 병태를 진단하는 방법은 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하며, 여기서 출력의 수준은 질환 및 또는 병태의 존재 또는 부재를 지시한다.
일부 실시양태에서, 질환은 암이다. 일부 실시양태에서, 암은 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종이다.
다른 측면에서, 본 개시내용은 질환 또는 병태를 치료하는 방법에 관한 것이다. 일부 실시양태에서, 질환 또는 병태를 치료하는 방법은 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함한다.
일부 실시양태에서, 방법은 전구약물을 투여하는 것을 추가로 포함하며, 임의적으로 여기서 전구약물은 간시클로비르이고, 여기서 임의적으로 인접 폴리핵산 분자는 표 6에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 질환은 암이다. 일부 실시양태에서, 암은 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종이다.
일부 측면에서, 본 개시내용은 세포-특이적 이벤트를 자극하는 방법에 사용하기 위한 방법에 관한 것이다. 일부 실시양태에서, 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 사용하기 위한 조성물은 세포의 집단을 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온과 접촉시키는 것을 포함하며, 여기서 세포의 집단은 적어도 하나의 표적 세포 유형 및 하나 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준 및/또는 활성에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준 및/또는 활성은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절된다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함한다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 이 프로모터 단편을 추가로 포함한다.
다른 측면에서, 본 개시내용은 질환 또는 병태를 진단하는 방법에 사용하기 위한 조성물에 관한 것이다. 일부 실시양태에서, 질환 또는 병태를 진단하는 방법에 사용하기 위한 조성물은 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하며, 여기서 출력의 수준은 질환 및 또는 병태의 존재 또는 부재를 지시한다.
일부 실시양태에서, 질환은 암이다. 일부 실시양태에서, 암은 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종이다.
다른 측면에서, 본 개시내용은 질환 또는 병태를 치료하는 방법에 사용하기 위한 조성물에 관한 것이다. 일부 실시양태에서, 질환 또는 병태를 치료하는 방법에 사용하기 위한 조성물은 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함한다.
일부 실시양태에서, 방법은 전구약물을 투여하는 것을 추가로 포함하며, 임의적으로 여기서 전구약물은 간시클로비르이고, 임의적으로 여기서 인접 폴리핵산 분자는 표 6에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 질환은 암이다. 일부 실시양태에서, 암은 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종이다.
다른 측면에서, 본 개시내용은 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 관한 것이다. 일부 실시양태에서, 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법은 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하며, 여기서: a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 비-표적 세포의 적어도 하위세트, 예컨대 적어도 2개 및 임의적으로 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; b) 인접 폴리핵산 분자는 (i) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하며, 여기서 제1 RNA는 출력의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하는 것인 제1 카세트; 및 (ii) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며; 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키고; 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절된다. 일부 실시양태에서, 인접 폴리핵산 분자는 표 6에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법은 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하며, 여기서: a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 비-표적 세포의 적어도 하위세트, 예컨대 적어도 2개 및 임의적으로 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; b) 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 mRNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 출력의 핵산 서열; 전사활성인자의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키고; 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절된다.
일부 실시양태에서, 인접 폴리핵산 분자를 포함하는 조성물은 인접 폴리핵산을 포함하는 벡터, 인접 폴리핵산을 포함하는 조작된 바이러스 게놈, 또는 폴리핵산을 포함하는 비리온을 포함한다.
일부 실시양태에서, 내인성 miRNA는 표 1에 열거된 miRNA 또는 표 1에 열거된 miRNA의 조합으로부터 선택된다. 일부 실시양태에서, 내인성 miRNA는 let-7c, let-7a, let-7b, let-7d, let-7e, let-7f, let-7g, let-7i, miR-22, miR-26b, miR-122, miR-208a, miR-208b, miR-1, miR-217, miR-216a, 또는 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함한다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 이 프로모터 단편을 추가로 포함한다.
일부 실시양태에서, 표적 세포는 종양 세포이고, 세포-특이적 이벤트는 종양 세포 사멸이다. 일부 실시양태에서, 종양 세포 사멸은 활성화 수용체 리간드, 특이적 항원, 자극 시토카인 또는 이들의 임의의 조합의 발현을 통한 면역 표적화에 의해 매개된다.
일부 실시양태에서, 표적 세포는 노화 세포이고, 세포-특이적 이벤트는 노화 세포 사멸이다.
일부 실시양태에서, 방법은 세포의 집단을 출력에 의해 치료제 또는 독성 화합물로 대사되는 전구약물 또는 비-독성 전구체 화합물과 접촉시키는 것을 추가로 포함한다.
일부 실시양태에서, 출력 발현은, 비-표적 세포가 출력 발현의 결여로 인하여 그리고 무관하며 비특이적인 세포 사멸-유도 작용제의 존재 하에서 제거되는 동안, 표적 세포 집단의 생존을 보장한다.
일부 실시양태에서, 표적 세포는 관심의 특정한 표현형을 포함하며, 그에 따라 출력 발현은 이 특정한 표현형의 세포에 제한된다.
일부 실시양태에서, 표적 세포는 선택되는 세포 유형이고, 세포-특이적 이벤트는 자연적으로는 선택되는 세포 유형에서는 부재하거나 불활성인 유전자의 발현을 통한 신규 기능의 코딩이다.
일부 실시양태에서, 세포의 집단은 다세포 유기체를 포함한다. 일부 실시양태에서, 다세포 유기체는 동물이다. 일부 실시양태에서, 동물은 인간이다.
일부 실시양태에서, 세포의 집단은 생체외에서 접촉된다. 일부 실시양태에서, 세포의 집단은 생체내에서 접촉된다.
다른 측면에서, 본 개시내용은 인접 폴리핵산 분자에 관한 것이다. 일부 실시양태에서, 인접 폴리핵산 분자는 a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) miRNA에 대한 표적 부위를 포함하며, 여기서 상기 miRNA는 포유동물의 적어도 2개의 상이한 건강한 조직에서 고도로 발현되고/거나 활성이고, 표적 세포의 하나 이상의 유형에서 낮은 수준으로 발현되는 것인 제1 카세트; b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며, 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
하기하는 도면은 본 명세서의 일부를 형성하는 것으로서, 본원에 제시된 구체적인 실시양태에 대한 상세한 설명과 함께 해당 도면 중 하나 이상을 참조하면 더 잘 이해될 수 있는 본 개시내용의 특정 측면을 추가로 설명하기 위하여 포함된다. 도면에 예시되어 있는 데이터가 어떠한 방식으로도 본 개시내용의 범주를 제한하는 것은 아니라는 것이 이해되어야 한다.
도 1a-1n. 바이러스 벡터에 대한 다중-플라스미드 회로 아키텍처의 번역. 도 1a. 유전자 배열의 개략도. 발산형 (상부) 및 수렴형 (하부) 배열을 생성하였으며; 2개의 변이체를 보조 전사활성인자 PIT의 상이한 변이체를 사용하여 각각에 대해 생성하였다 (발산형: D-P2: PIT=PIT::RelA; D-PV: PIT=PIT::VPI6; 수렴형: C-P2: PIT=PIT::RelA; C-PV: PIT=PIT::VPI6). 도 1b. HeLa 세포에서의 일시적 형질감염 및 이소성 입력 발현을 사용한 백본 DNA 성능의 시험. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2, D-P2, C-PV, D-PV. 도 1c. HuH-7 및 HeLa 세포에서의 내인성 입력에 대한 구축물의 반응의 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2, D-P2, C-PV, D-PV. 도 1d. miR-424 표적 서열을 사용하여 예시된 강건한 오프 스위치로서 miRNA 표적을 혼입하는 구축물의 개략도. 발산형 (상부) 및 수렴형 (하부) 배열을 생성하였으며; 2개의 변이체를 보조 전사활성인자 PIT의 상이한 변이체를 사용하여 각각에 대해 생성하였다 (발산형: D-P2: PIT=PIT::RelA-T424; D-PV: PIT=PIT::VPI6-T424; 수렴형: C-P2: PIT=PIT::RelA-T424; C-PV: PIT=PIT::VPI6-T424). 도 1e. TF 입력의 이소성 발현을 통한 HeLa 세포에서의 논리 프로그램의 AND-게이트 구성요소의 확인. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2-T424, D-P2-T424, C-PV-T424, D-PV-T424. 도 1f. HuH-7 및 HeLa 세포에서의 내인성 전사 입력에 대한 회로 반응의 평가. 막대의 순서는 도 1e와 동일하다. 도 1g. 이소성 입력 전달을 사용한 HeLa 세포에서의 발산형 배향 상에 코딩된 3-입력 프로그램의 완전한 평가. 모든 입력의 부재 하에서의 발현의 결여 및 miR-424가 음성 조절인자라는 사실을 고려하여, miR-424만이 존재하는 입력 조합은 자명한 무용으로 인하여 평가되지 않았다. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: D-P2-T424, D-PV-T424. 도 1h. 유도 TF 입력의 존재 하에서의 miRNA 스위치의 기능성. 회로 출력은 miR-424 모방체의 이소성 형질감염을 갖는 및 갖지 않는 HuH-7 세포에서 시험된다 (X 축 아래에 지시됨). 막대의 순서는 도 1g와 동일하다. 도 1i. 내인적으로 발현된 유도 TF 입력의 존재 하에서의 그들의 억제성에 관한 miR-126 표적을 갖는 회로의 평가. 막대의 순서는 도 1g와 동일하다. 도 1j. 2개의 HCC 세포주 및 음성 대조군으로서 HeLa 세포로의 세포 분류 성능에 대한 miRNA 표적 효과의 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: D-P2, D-PV, D-P2-T424, D-PV-T424, C-PV-T126, D-PV-T126. 도 1k. HCC 세포주 HepG2 및 HuH-7에서의 DJ-위형화된 AAV 벡터 내로 패키징된 혼입된 miRNA 센서를 갖는 및 갖지 않는 회로 패널의 평가. HeLa 및 HCT-116 세포주는 카운터 샘플로서 사용된다. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: CMV, D-P2, D-PV, D-P2-T424, D-PV-T424, C-PV-T126, D-PV-T126. 도 1l. 건강한 1차 간세포를 HCC 세포주로부터 구별하는 그들의 능력에 대한 miRNA의 패널의 시험관내 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: TFF5, T424, T126, T122. 도 1m-1n. 상이한 miRNA 표적 배열 및 출력 억제의 규모에 대한 그들의 영향의 탐구. 도 1m. 상이한 구축물 및 그들의 약칭 표기의 개략도. 도 1n. HepG2 세포 (miR-122 발현 없음) 및 HuH-7 세포 (중간 수준의 miR-122 발현)에서 생성된 출력. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: HepG2, Huh-7. 약어: ITR: AAV2의 내부 말단 반복부; pA: SV40 폴리아데닐화 신호 (수렴형 배향), 발산형 배향으로 mCherry 다음 hGH 및 PIT 유전자 다음 SV40 pA; Cherry: mCherry 형광 단백질을 코딩하는 서열; TATA: 최소 TATA 박스 (Angelici et al., 2016); HNF1 RE: HNF1A 및 HNF1B에 결합하는 반응 요소; PIT RE: PIT::RelA 및 PIT::VP16 전사활성인자에 결합하는 반응 요소; SOX RE: SOX9 및 SOX10 전사 인자, 및 가능하게는 SOX 패밀리 SOX1-SOX15, SOX17, SOX18, SOX21, SOX30, 및 SRY로부터의 다른 전사 인자에 결합하는 DNA 서열; PIT: PIT:RelA 또는 PIT::VP16 융합물 중 어느 하나를 나타내는 프리스티노마이신-유도성 전사활성인자 (Fussenegger et al., 2000). 차트 디자인: 출력 mCherry의 정규화된 발현은 Y 축 상에 제시된다.
도 2a-2f. HCC의 동소성 마우스 모델에서의 특이성 및 효능의 파일럿 평가. 도 2a. DJ-위형화된 바이러스 벡터 내로 패키징된 선택된 회로의 세포 분류 능력의 시험관내 확인. 도 2b. 구성적 대조군 벡터에 비해 HSV-TK 출력을 갖는 회로에 의한 시험관내 세포 제거. 여기서 채용된 회로의 개략도는 막대 차트 위에 제시된다. 모든 세포주 또는 1차 간세포에 대해, 간시클로비르에 대한 용량-반응 (X 축)은 구성적 HSV-TK 벡터, 회로의 존재 하에서, 및 GCV 단독으로 측정된다. 세포 생존율 MTS 판독은 Y 축 상에 제시된다. 도 2c. 패널에서 지시된 바와 같은, 파일럿 실험 (n=2)의 상이한 실험 부문에 대해 제시된 종양-보유 마우스에서의 종양 부담의 진행. 도 2d. 발광에 의해 정량화된 종결 시의 간에서의 종양 부담, 좌측의 화상은 간의 중첩 (그레이스케일) 및 생물발광 신호이다. 도 2e. 종결 후 간에서의 종양 부담의 정량적 분석. 도 2f. 접종 바로 후의 종양 부담 및 종결 시의 종양 부담 사이의 상관관계. 치료 부문으로부터의 2마리의 마우스는 2개의 적색 점에 의해 나타내어진다.
도 3a-3f. 종양-표적화 프로그램을 위한 선택적이고 폭넓게 적용가능한 miRNA 입력의 확인. 도 3a. 건강한 간에서의 그들의 높은 발현 및 HCC 샘플에서의 낮은 발현에 기반한 miRNA 후보의 세포 프로파일링 및 순위화의 개략도. 도 3b. 미리 선택된 miRNA 입력의 기능적 확인의 개략도. 리포터 바이러스 벡터는 모든 입력에 대해 생성되고, 모든 벡터는 입력의 생물학적 활성을 평가하기 위해 모든 관심의 샘플에 (하나씩) 전달된다. 도 3c. 2개의 HCC 세포주 및 1차 건강한 간세포에서의 miRNA 패널의 기능적 평가의 결과. 낮은 리포터 발현은 높은 miRNA 활성에 상응한다. FF5는 대조군 표적이다. 도 3d. NGS 프로파일링 실험 (Dastor et al., 2018)에서 확인된 miRNA 발현 카운트 및 선택된 miRNA 센서의 기능적 반응 사이의 상관관계. 추세선은 리프레서 힐(Hill) 함수에 피팅된다. 도 3e. 전신 전달 후 상이한 마우스 기관에서의 miRNA 리포터 벡터의 패널의 정량화된 발현. 동일한 기관에서의 상이한 리포터의 발현 (차트 위에 지시됨)은 함께 그룹핑된다. 막대 음영은 어느 기관에서 리포터가 문헌 분석 및 프로파일링 데이터에 기반하여 반응할 것으로 예상되었는지를 지시한다. 값은 TFF5 표적을 보유하는 대조군 벡터에 대해 정규화되며; 그것으로, 이 표적은 생체내에서 난해한 입력에 반응하고 있으며 많은 리포터는 1 초과의 출력 값을 초래함이 명백하다. 도 3f. 다양한 기관에서의 리포터 발현의 대표적 화상. 리포터의 명칭은 좌측에 지시된다. Cerulean 패널은 구성적 mCerulean 내부 대조군의 발현을 제시한다. Cherry 패널은 지시된 miRNA 표적이 제공된 mCherry 리포터의 잔류 발현을 제시한다.
도 4a-4c. 시험관내에서의 회로 특이성의 확인. 도 4a. 회로의 작용의 메커니즘을 평가하는데 사용된 대조군 구축물의 패널. 약어는 도 1a, 1d 및 1m에서와 동일하다. 도 4b. 10개의 세포주 및 1차 간세포에서의 내인성 입력에 대한 C.TF-AND 하위-회로 반응의 맵핑. 모든 세포주에 대해, 이들 세포에서 구성적 출력에 대해 정규화된 SOX9/10 및 HNF1A/B에 대한 피드백-증폭된 센서의 로그-변환된 출력이 각각 X 및 Y 축 상에 제시된다. C.TF-AND 회로의 출력은 Z 축 상에 제시된다. 도 4c. 10개의 세포주 및 1차 간세포에서의 HCC.V2 회로 반응의 맵핑. C.TF-AND 회로의 로그-변환된 출력 및 로그-변환된 C.let-7c 리포터 회로 반응 규모가 축 X 및 Y 상에 플롯팅되는 반면, 모든 세포주에서의 완전한 회로의 출력은 축 Z 상에 제시된다. 주어진 세포 유형에 대한 모든 값은 그 세포 유형에서의 구성적 발현에 대해 정규화된다.
도 5a-5d. 회로 표적화 특이성의 생체내 특징규명. 도 5a. 다양한 기관에서의 B1-위형화된 AAV 벡터를 사용하여 수득된, 선택된 하위-프로그램, 대조군 벡터, 전체 프로그램, 및 배경의 출력. 값은 정량적 화상 분석에 의해 수득된다. 도 5b. 지시된 바와 같은 상이한 벡터로부터의 mCherry의 발현을 제시하는, 상이한 기관을 나타내는 조직 슬라이스의 화상. 위상 화상 및 mCherry 채널이 제시된다. 2개의 상이한 노출을 사용하여 mCherry 변화의 큰 동적 범위를 반영하는 췌장 슬라이스를 나타낸다. 도 5c. 종양에서의 및 HepG2-종양 보유 마우스의 기관에서의 HCC.V2 회로로부터의 mCherry 출력의 발현. 종양은 mCitrine으로 안정하게 형질도입되고, 황색 형광 채널에서 제시하고 있다. 도 5d. 화상 프로세싱을 사용하여 수득된 종양-보유 마우스의 종양 및 다양한 기관에서의 mCherry 발현의 정량적 분석.
도 6a-6b. 2개의 HCC 세포주 및 1차 간세포에서의 회로 및 대조군의 시험관내 효능. 도 6a. 임의의 AAV 벡터의 부재 하에서의 (정사각형), 구성적 HSV-TK 발현 카세트 (삼각형) 또는 완전한 회로 (원)의 존재 하에서의 GCV에 대한 용량-반응. MTS 검정을 사용하여 측정된 세포 생존율은 Y 축 상에 제시된다. 회로 및 그들의 ID의 개략적 제시는 상부에 제시된다. 도 6b. 구성적 HSV-TK 카세트 및 2개의 상이한 종양 표적화 프로그램의 상이한 벡터 투여량에 대한 HuH-7 세포주의 민감도. 상부 차트, 2개의 회로 변이체 사이의 비교; 하부, 구성적 벡터 및 제2 회로 변이체 사이의 비교.
도 7a-7f. 동소성 마우스 모델에서의 HCC-표적화 회로의 효능. 도 7a. 종양 확립 및 치료 요법의 개략도. 도 7b. 다양한 실험 부문에서의 시간 경과에 따른 종양 부담. 생체내 전신 생물발광을 통해 측정된 종양 부담은 시간 경과에 따라 화상화된다. 각각의 동물에 대해, 부담은 GCV 주사 요법을 개시하기 전의 날에서의 부담에 대해 정규화된다. 도 7c. GCV 주사 요법을 개시하기 전의 날에서의 종양 부담에 대해 정규화된, 주요 실험 부문에서의 개별적 동물에 대한 종양 부담 발달을 제시하는 스파이더 플롯. 도 7d. 다수의 실험 부문으로부터의 개별적 동물의 전신 발광의 대표적 화상. 도 7e. 다수의 실험 부문에 대한 개별적 간의 화상 및 종결 시의 전체-기관 생물발광에 의해 측정된 간에서의 종양 부담. 도 7f. 도 7e에서의 종양 부담의 정량화.
도 8a-8c. AAV-B1 종양 형질도입의 생체내 평가. 도 8a. 대조군 벡터, C.TF-AND 하위프로그램 및 DJ-위형화된 AAV 벡터에서 패키징된 전체 프로그램의 출력은 간 및 HepG2-종양에서의 B1-위형화된 AAV 벡터에서 패키징된 전체 회로의 출력과 비교된다. 종양은 mCitrine으로 안정하게 형질도입되고, 황색 형광 채널에서 제시하고 있다. 도 8b. AAV-DJ 및 AAV-B1 전달 시 종양에서의 HCC.V2 유도된 출력 수준 (mCherry)의 정량화. 값은 정량적 화상 분석에 의해 수득된다. 도 8c. 큰 종양 결절의 코어 섹션에서의 B1-위형화된 AAV에 의해 전달된 HCC.V2 회로로부터의 출력.
도 9a-9b. 다수의 간 보호 miRNA를 조합하는 최적화된 회로의 합리적인 디자인. 도 9a. 강한 miR-let7c 및 약한 miR-122 억제를 조합하는 후보 회로 (HCC.V3)의 개략도. 강한 miR-let7c 억제는 HCC.V2에 기재된 표적 배열구조를 사용함으로써 수득된다. miR-122에 의해 유발된 억제 강도는 miRNA 표적의 수, 배열 또는 서열을 다양화함으로써 조정될 수 있다. HCC.V1에 비해 miR-122 억제 수준을 감소시키는 3가지 상이한 전략이 제시된다: (i) 회로의 전사활성인자 분지 상에서만 완벽한 miR-122 표적 (T-122*)의 사용; (ii) 불완전한 상보성을 갖는 miR-122 표적 (T-122*)을 사용한 전사활성인자 및 출력의 이중 억제; 또는 (iii) 전사활성인자를 억제하는 완벽한 표적 및 출력을 억제하는 불완전한 miRNA 표적에 의존하는 혼합된 접근법. HCC 세포주 (특히 HUH-7)의 패널에서의 발현의 소실을 최소화하면서 간 주에서의 억제를 최대화하는 후보가 선택된다. 각각의 후보는 위치화 변이체에 비해 둘 다의 가능한 miRNA 표적에서 시험된다. 도 9b. miR-122에 의해 조절되는 내인성 유전자 (P4HA1)의 보존된 UTR 영역으로부터 유래된 불완전한 miR-122 표적 (T-122*)의 예 (서열식별번호(SEQ ID NO): 305 및 306, 각각 상부 및 하부). 불완전한 상보성을 갖는 표적은 내인성 유전자에서 발생하는 서열을 사용함으로써 또는 miRNA 시드 서열을 플랭킹하는 영역에서 무작위 돌연변이를 도입함으로써 수득된다. 둘 다의 접근법은 상이한 용량-반응 프로파일을 갖는 표적의 선택을 생성하는데 사용될 것이다.
분자 컴퓨팅 (Benenson, 2012) 및 합성 생물학 (Weber and Fussenegger, 2012)의 약속 중 하나는 질환-관련 신호를 복잡한 방식으로 및 실시간으로 감지하고 그에 반응하여 정밀하고 "주문형" 치료 작용을 초래하는 "스마트한" 요법의 합리적인 디자인이었다 (Benenson et al., 2004). 이 약속을 이행하기 위해, 3가지 별개의 과제가 다루어진다. 첫째로, 치료적으로 관련된 감지-계산-반응 캐스케이드를 위한 청사진을 디자인하기 위해 질환 메커니즘이 충분히 이해된다. 특히, 관련된 입력이 확인되고, 가장 효율적이고 가장 적은 독성 반응을 초래할 프로그램이 바람직하게 결정된다. 둘째로, 이들 치료 캐스케이드를 실행할 수 있는 강건한 합성 생물학 플랫폼이 존재하거나, 또는 상기 목적을 위해 데 노보 개발된다. 셋째로, 이들 플랫폼은 임상적으로 관련된 치료 양상에 적응된다. 후자 중에서, 세포 및 유전자 요법은 이들 양상 둘 다가 조작된 유전자 탑재물의 혼입을 가능하게 하고, 종종 이를 요구한다는 사실을 고려하여, 합성 유전자 회로의 임상적 번역에 가장 적합한 것으로 확인되었다.
모든 3가지 과제를 다루는 것은 번역 설정에서의 접근법을 개발하기 위한 잠재적인 의학적 징후의 분야를 좁힌다. 한 가지 연구는 세포-기반 이식물에 초점을 맞추었는데, 여기서 유전자 변형된 세포는 혈액 순환에서 특정한 질환-관련 신호를 감지하고, 이에 반응하여 치료 특성을 갖는 분자 작용제를 분비할 수 있다. 이 연구에서, 세포 이식물은 유기체 질환 상태를 감지하고, 이에 반응하여 전체 유기체에 영향을 미치는 요법을 생성하는 감시병 및 "공장"으로서 역할을 한다 (Auslander et al., 2014; Tastanova et al., 2018; Ye et al., 2017). 두번째 연구는 CAR-T 세포 요법 접근법에 대해 수립되었고, 다중-입력 조합적 감지 특성을 갖는 이들 세포를 증대시켜 표면 항원의 조합을 발현하는 암 세포에 대한 그들의 특이성을 개선시키고, 온-표적, 오프-종양 효과를 감소시켰다 (Cho et al., 2018; Kloss et al., 2013; Roybal et al., 2016; Zah et al., 2016).
유전자 요법의 분야에서 합성 생물학 적용은 또한 동물 질환 모델에서 초기 성공을 제시하였다. 난소암 세포를 다루고 이들 세포에서 면역조정인자를 발현하는 렌티바이러스 벡터의 세트, 및 조작된 T-세포를 조합하는 혼성 접근법은 복강으로의 난소 전이의 마우스 모델에서 효능을 나타내었다. 세포 표적화는 그의 조합이 종양 특이적인 것으로 나타난 2개의 프로모터 사이의 miRNA 스폰지-가능화된 AND 게이트로서 실행되었다 (Nissim et al., 2017). 또 다른 최근의 연구에서, 종양용해성 아데노바이러스는 그의 생활 주기의 다중-입력 논리적 제어에 기반하여 복제하도록 조작되었고, 피하 종양 내로의 종양내 주사 시 효능을 나타내었다 (Huang et al., 2019).
유전자 및 세포 요법에 대한 합성 유전자 회로의 주요 부가 가치는 치료 반응을 "프로그래밍"하는, 즉, 치료 작용의 특이성, 시기, 및 투여량을 미리 결정된 방식으로, 잠재적으로 동적 방식으로 및 다양한 피드백 조절 모티프와 조합으로 조절하는 정교한 접근법으로부터 발생한다 (Angelici et al., 2016; Xie et al., 2011). 그러나, 그의 발현을 조절하는 유전자 회로를 갖는 알려진 치료 트랜스진을 제공하는 것은 그의 캡시드를 통해 어느 정도의 기관 또는 세포 유형 특이성을 추가로 갖는 바이러스 벡터 내로 패키징된 구성적으로-유도된 또는 조직-특이적 프로모터-유도된 치료 유전자를 종종 사용하는 보다 확립된 접근법보다 반드시 더 낫다고 할 수 없다 (Al-Zaidy et al., 2019; Landegger et al., 2017; Scholl et al., 2016). 대안적으로, 바이러스 벡터는 관심의 조직 또는 기관 내로 직접적으로 주사되어 (Juttner et al., 2019; Nelson et al., 2016), 특이적으로 다루어질 필요가 있는 세포 유형의 다양성을 감소시킨다. 사실, 이 접근법에 기반하여 조작된 임상적으로 승인된 CAR-T 세포 (June et al., 2018) 및 많은 유전자 요법 (Keeler and Flotte, 2019)을 포함하는 대다수의 승인된 요법은 만족할 만한 효능 및 안전성 프로파일을 나타낸다. 따라서, 이 이점을 입증하는 것은 합성 생물학 커뮤니티에게 부담이다.
암은 합성 생물학에 의해 공급된 요법으로부터 이익을 얻을 엄청난 잠재성을 갖는 질환이다. 심지어 좁게 정의된 암은 환자 그룹 사이 및 심지어 동일한 환자에서의 개별적 종양 사이 둘 다에서 이질성 질환이다 (Dagogo-Jack and Shaw, 2018). 환자에서의 종양은 종종 원발성 및 전이성 로커스 사이에 확산되어, 종양내 주사를 사례의 하위세트에 대해서만 가능하게 만든다. 마지막으로, 항-종양 요법은 매우 독성이며, 이는 비-종양 세포에서의 그들의 활성화가 종종 극적인 유해 효과를 초래할 것임을 의미한다. 함께, 종양의 확산된 집단을 다루기 위해 전신적으로 작용제를 전달할 필요와 조합되어 복잡한 이질적 세포 집단을 정밀하게 다루어야 할 필요는 합성 생물학 접근법의 사용이 유익할 수 있음을 시사한다.
본원에 개시되는 것은 통상적으로 사용되는 유전자 요법 바이러스 및 비-바이러스 벡터와 혼화성인 분류기 유전자 회로를 코딩하는 인접 폴리핵산 분자이다. 또한 본원에 개시되는 것은 세포의 집단에서 출력 (즉, 관심의 유전자)의 발현에 대한 복잡한 다중-입력 제어를 실행하는 방법이다. 이들 방법은 질환, 예컨대 암 (예를 들어, 간세포 암종 (HCC))의 진단 및 치료를 위한 유전자 요법을 포함한다.
I. 인접 폴리핵산 분자의 조성
일부 측면에서, 본 개시내용은 유전자 회로를 포함하는 인접 폴리핵산 분자에 관한 것이다. 본원에 사용된 바와 같이, "인접 폴리핵산 분자"라는 용어는 단일 연속 핵산 분자 (즉, 단일-가닥 폴리핵산 분자) 또는 2개의 상보적인 연속 핵산 분자 (즉, 2개의 상보적인 가닥을 포함하는 이중-가닥 폴리핵산 분자)를 지칭한다. 일부 실시양태에서, 인접 폴리핵산은 RNA (예를 들어, 단일-가닥 또는 이중-가닥)이다. 일부 실시양태에서, 인접 폴리핵산은 DNA (예를 들어, 단일-가닥 또는 이중-가닥)이다. 일부 실시양태에서, 인접 폴리핵산은 DNA:RNA 혼성체이다.
본원에 기재된 인접 폴리핵산은 코딩된 하나 이상의 발현 카세트인 유전자 회로를 포함한다. 본원에 사용된 바와 같이, "발현 카세트" 및 "카세트"라는 용어는 상호교환가능하게 사용되며, (i) RNA를 코딩하는 (예를 들어, 출력 및/또는 전사활성인자의 핵산 서열을 포함하는) 핵산 서열; 및 (ii) RNA의 발현 수준을 조절하는 핵산 서열 (예를 들어, 전사활성인자 반응 요소, 전사 인자 반응 요소, 최소 프로모터, 및/또는 프로모터 요소)을 포함하는 폴리핵산을 지칭한다.
일부 실시양태에서, 인접 폴리핵산 분자는 단일 카세트로 이루어진 유전자 회로를 포함한다. 다른 실시양태에서, 인접 폴리핵산 분자는 2개 이상의 카세트를 포함하는 유전자 회로를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 2개 이상의 카세트를 포함하고, 적어도 2개의 카세트는 발산형 배향으로 존재한다. 본원에 사용된 바와 같이, "발산형 배향"이라는 용어는 하기인 배열구조를 지칭한다: (i) 제1 카세트 및 제2 카세트의 전사가 인접 폴리핵산 분자의 상이한 가닥 상에서 진행되며, (ii) 제1 카세트의 전사는 제2 카세트로부터 멀리 지향되고, 제2 카세트의 전사는 제1 카세트로부터 멀리 지향됨. 도 1a (상부 개략도)는 다양한 발산형 배열구조의 예를 제공한다.
일부 실시양태에서, 인접 폴리핵산 분자는 2개 이상의 카세트를 포함하고, 적어도 2개의 카세트는 수렴형 배향으로 존재한다. 본원에 사용된 바와 같이, "수렴형 배향"이라는 용어는 하기인 배열구조를 지칭한다: (i) 제1 카세트 및 제2 카세트의 전사가 인접 폴리핵산 분자의 상이한 가닥 상에서 진행되며, (ii) 제1 카세트의 전사는 제2 카세트를 향해 지향되고, 제2 카세트의 전사는 제1 카세트를 향해 지향됨. 일부 실시양태에서, 2개의 수렴형 카세트는 폴리아데닐화 서열을 공유한다. 도 1a (하부 개략도)는 다양한 수렴형 배열구조의 예를 제공한다.
일부 실시양태에서, 인접 폴리핵산 분자는 2개 이상의 카세트를 포함하고, 적어도 2개의 카세트는 머리-대-꼬리 배향으로 존재한다. 본원에 사용된 바와 같이, "머리-대-꼬리"라는 용어는 하기인 배열구조를 지칭한다: (i) 제1 카세트 및 제2 카세트의 전사 또는 번역이 인접 폴리핵산 분자의 동일한 가닥 상에서 진행되며, (ii) 제1 카세트의 전사 또는 번역은 제2 카세트를 향해 지향되고, 제2 카세트의 전사 또는 번역은 제1 카세트로부터 멀리 지향됨 (5'...→...→...3').
일부 실시양태에서, 2개의 카세트는 1개 이상의 인슐레이터에 의해 분리된다. 인슐레이터는 인슐레이터-결합 단백질에 의해 결합되는 경우 조절 구성요소 또는 반응 구성요소를 다른 인접 조절 요소의 효과로부터 차단하는 핵산 서열이다. 예를 들어, 인접 폴리핵산 분자의 카세트를 플랭킹하는 것은 각각의 카세트를 다른 카세트의 조절 요소의 효과로부터 차단할 수 있다. 인슐레이터의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있다.
본원에 기재된 유전자 회로는 출력 분자 (즉, 관심의 유전자)의 발현 수준을 조절하는 하나 이상의 메커니즘을 이용한다. 따라서, 본원에 기재된 인접 폴리핵산의 각각은 출력의 핵산 서열을 포함하는 RNA를 코딩하는 카세트를 포함한다. 예시적인 출력 분자는 하기에 제공된다. 출력의 핵산 서열을 포함하는 RNA는 전사활성인자 반응 요소 (및, 임의적으로, RNA의 발현을 조절하는 하나 이상의 추가의 핵산 서열, 예컨대 전사 인자 반응 요소, 최소 프로모터, 및/또는 프로모터 요소)에 작동가능하게 연결된다.
출력 분자 (즉, 관심의 유전자)의 발현 수준을 조절하기 위해, 본원에 기재된 인접 폴리핵산의 각각은 (i) 전사활성인자의 핵산 서열을 포함하는 RNA (예를 들어, mRNA)를 코딩하는 카세트; 및 (ii) miRNA 표적 부위를 포함하는 RNA를 코딩하는 카세트를 추가로 포함한다. 예시적인 전사활성인자 및 miRNA 표적 부위는 하기에 제공된다.
전사활성인자의 핵산 서열을 포함하는 RNA (예를 들어, mRNA)를 코딩하는 카세트는 RNA의 발현을 조절하는 핵산 서열 (예를 들어, 전사활성인자 반응 요소, 전사 인자 반응 요소, 최소 프로모터, 및/또는 프로모터 및/또는 인핸서 요소)에 작동가능하게 연결될 수 있다. 일부 실시양태에서, 전사활성인자의 핵산 서열을 포함하는 RNA를 코딩하는 카세트는 출력의 핵산 서열을 포함하는 RNA를 코딩하는 동일한 카세트이다 (즉, 단일 RNA가 전사활성인자 및 출력 둘 다의 핵산 서열을 포함함).
miRNA 표적 부위를 포함하는 RNA를 코딩하는 카세트는 출력의 핵산 서열을 포함하는 RNA를 코딩하는 동일한 카세트일 수 있다 (즉, 출력의 핵산 서열을 포함하는 RNA가 miRNA 표적 부위를 추가로 포함함). 대안적으로 또는 추가로, miRNA 표적 부위를 포함하는 RNA를 코딩하는 카세트는 전사활성인자의 핵산 서열을 포함하는 RNA를 코딩하는 동일한 카세트일 수 있다 (즉, 전사활성인자의 핵산 서열이 miRNA 표적 부위를 추가로 포함함).
일부 실시양태에서, 카세트에 의해 코딩되는 RNA의 핵산 서열은 폴리아데닐화 서열을 추가로 포함한다. 일부 실시양태에서, 폴리아데닐화 서열은 포유동물 세포에서의 전사 종결 및 폴리아데닐화에 적합하다.
(i) MiRNA 표적 부위
본원에 기재된 인접 폴리핵산의 각각은 miRNA 표적 부위를 포함하는 RNA (예를 들어, 출력을 코딩하는 핵산 서열을 포함하는 RNA 및/또는 전사활성인자의 핵산 서열을 포함하는 RNA)를 코딩하는 하나 이상의 카세트를 포함한다. MiRNA는 번역 억제, mRNA 절단, 및 탈아데닐화를 포함하는 이들이 다양한 방식으로 결합하는 RNA의 수준을 하향조절하는 전형적으로 길이가 21-25개의 뉴클레오티드인 작은 비-코딩 RNA의 부류이다. 본원에 사용된 바와 같이, "miRNA 표적 부위"라는 용어는 miRNA에 상보적이고 그에 의해 조절되는 서열을 지칭한다. miRNA 표적 부위는 miRNA 표적 부위에 결합하여 그를 조절하는 miRNA와 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 상보성을 가질 수 있다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 또는 적어도 20개의 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 2-3, 2-4, 2-5, 2-6, 2-7, 2-8, 2-9, 2-10, 3-4, 3-5, 3-6, 3-7, 3-8, 3-9, 3-10, 4-5, 4-6, 4-7, 4-8, 4-9, 4-10, 5-6, 5-7, 5-8, 5-9, 5-10, 6-7, 6-8, 6-9, 6-10, 7-8, 7-9, 7-10, 8-9, 8-10, 또는 9-10개의 miRNA 표적 부위를 포함한다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 다수의 miRNA 표적 부위를 포함하고, miRNA 표적 부위의 각각은 동일한 서열을 갖거나, 또는 동일한 miRNA에 의해 조절되는 상이한 핵산 서열을 포함한다. 다른 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별개의 miRNA 표적 부위를 포함하는 별개의 miRNA에 의해 조절되는 2개 이상의 miRNA 표적 부위 (즉, 별개의 miRNA 표적 부위)를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 별개의 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 2-3, 2-4, 2-5, 2-6, 2-7, 2-8, 2-9, 2-10, 3-4, 3-5, 3-6, 3-7, 3-8, 3-9, 3-10, 4-5, 4-6, 4-7, 4-8, 4-9, 4-10, 5-6, 5-7, 5-8, 5-9, 5-10, 6-7, 6-8, 6-9, 6-10, 7-8, 7-9, 7-10, 8-9, 8-10, 또는 9-10개의 별개의 miRNA 표적 부위를 포함한다.
본원에 기재된 카세트에 의해 코딩되는 RNA의 miRNA 표적 부위는 RNA의 서열 내의 어디에나 위치할 수 있다. 예를 들어, 일부 실시양태에서 본원에 기재된 카세트에 의해 코딩되는 RNA는 3' UTR을 포함하고, 3' UTR은 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 인트론을 포함하고, 인트론은 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 5' UTR을 포함하고, 5' UTR은 miRNA 표적 부위를 포함한다.
예시적인 miRNA 및 miRNA 표적 부위는 표 1에 열거된다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 표 1에 열거된 miRNA에 대한 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 표 1에 열거된 miRNA에 상응하는 다수의 miRNA 표적 부위 (예를 들어, let-7c 표적 부위 및 miR-122 표적 부위를 포함하는 조합)를 포함한다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 표 1에 열거된 miRNA 표적 부위와 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 표 1에 열거된 miRNA 표적 부위와 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 다수의 miRNA 표적 부위를 포함한다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 let-7a 표적 부위, let-7b 표적 부위, let-7c 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합 (예를 들어, let7c 표적 부위 및 miR-122 표적 부위의 조합)을 포함한다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 let-7c 표적 부위 (즉, hsa-let-7c에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 let-7c 표적 부위는 핵산 서열 AACCATACAACCTACTACCTCA (서열식별번호: 42)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-22 표적 부위 (즉, miR-22에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-22 표적 부위는 핵산 서열 ACAGTTCTTCAACTGGCAGCTT (서열식별번호: 43)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-26b 표적 부위 (즉, miR-26b에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-26b 표적 부위는 핵산 서열 ACCTATCCTGAATTACTTGAA (서열식별번호: 44)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-126-5p 표적 부위 (즉, miR-126-5p에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-126-5p 표적 부위는 핵산 서열 CGTGTTCACAGCGGACCTTGAT (서열식별번호: 45)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-424 표적 부위 (즉, miR-424에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-424 표적 부위는 핵산 서열 GTCCAAAACATGAATTGCTGCT (서열식별번호: 48)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-122 표적 부위 (즉, miR-122에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-122 표적 부위는 핵산 서열 CAAACACCATTGTCACACTCCA (서열식별번호: 46)로 이루어진다.
표 1. 예시적인 miRNA 및 예시적인 miRNA 표적 부위.
Figure pct00001
Figure pct00002
일부 실시양태에서, 본원에 기재된 인접 폴리핵산은 단일 카세트로 이루어지며, 여기서 단일 카세트는 (출력의 핵산 서열 및 전사활성인자의 핵산 서열을 포함하는 것에 추가로) miRNA 표적 부위를 포함하는 RNA를 코딩한다.
다른 실시양태에서, 인접 폴리핵산은 2개 이상의 카세트를 포함하며, 이 중 적어도 하나는 miRNA 표적 부위를 포함하는 RNA를 코딩한다.
일부 실시양태에서, 인접 폴리핵산 분자의 다수의 카세트는 적어도 하나의 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 인접 폴리핵산의 각각의 miRNA 표적 부위는 유일한 것이다 (즉, 인접 폴리핵산은 miRNA 표적의 1개의 카피만을 포함함). 일부 실시양태에서, 인접 폴리핵산 분자는 동일한 핵산 서열인 적어도 하나의 miRNA 표적 부위를 각각 포함하는 적어도 2개의 카세트를 포함한다. 일부 실시양태에서, 인접 폴리핵산 분자는 적어도 하나의 miRNA 표적 부위를 각각 포함하는 적어도 2개의 카세트를 포함하며, 여기서 각각의 카세트의 적어도 하나의 miRNA 표적 부위는 동일한 miRNA에 의해 조절되는 상이한 핵산 서열을 포함한다. 예를 들어, 제1 카세트는 miRNA 표적 부위 X를 포함할 수 있고, 제2 카세트는 miRNA 표적 부위 Y를 포함할 수 있고, miRNA Z는 표적 부위 X 및 표적 부위 Y를 조절한다.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산의 miRNA 표적 부위를 조절하는 miRNA (즉, 적어도 하나의 miRNA)는 출력 발현이 낮아야 하는 (예를 들어, 다세포 유기체, 예컨대 포유동물의) 적어도 하나의 세포 유형에서 고도로 발현되고/거나 활성이다. miRNA는 본원에 기재된 바와 같이, 출력 발현이 상기 조직 세포 유형에서 참조 인접 폴리핵산 (즉, miRNA에 의해 조절되는 miRNA 표적 부위(들)를 결여하지만, 그렇지 않다면 동일한 핵산 서열을 함유함)의 출력 발현의 수준에 비해 적어도 50% 감소되는 경우, 고도로 발현되고/거나 활성이다. 일부 실시양태에서, 출력은 참조 인접 폴리핵산에 비해 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.9% 감소된다.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산의 miRNA 표적 부위를 조절하는 miRNA (즉, 적어도 하나의 miRNA)는 출력 발현이 낮아야 하는 (예를 들어, 다세포 유기체, 예컨대 포유동물의) 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 500, 적어도 1000개의 세포 유형에서 고도로 발현되고/거나 활성이다.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산의 miRNA 표적을 조절하는 miRNA (즉, 적어도 하나의 miRNA)는 출력 발현이 높아야 하는 (예를 들어, 다세포 유기체, 예컨대 포유동물의) 적어도 하나의 표적 세포 유형에서 낮은 발현을 갖고/거나 불활성이다. miRNA는 출력 발현이 상기 표적 세포 유형에서 참조 인접 폴리핵산 (즉, miRNA에 의해 조절되는 miRNA 표적 부위(들)를 결여하지만, 그렇지 않다면 동일한 핵산 서열을 함유함)의 출력 발현의 수준에 비해 40% 미만 감소되는 경우, 본원에 기재된 바와 같이 낮은 발현을 갖고/거나 불활성이다. 일부 실시양태에서, 출력은 참조 인접 폴리핵산에 비해 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 또는 1% 미만 감소된다. 일부 실시양태에서, miRNA 표적을 포함하는 인접 폴리핵산 및 참조 연속 폴리핵산 분자로부터의 출력 발현의 수준 사이에 통계적 차이가 없다.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산의 miRNA 표적 부위를 조절하는 miRNA (즉, 적어도 하나의 miRNA)는 출력 발현이 높아야 하는 (예를 들어, 다세포 유기체, 예컨대 포유동물의) 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 500, 적어도 1000개의 표적 세포 유형에서 낮은 수준으로 발현되고/거나 불활성이다.
(ii) 예시적인 전사활성인자
본원에 기재된 인접 폴리핵산의 각각은 전사활성인자의 핵산 서열을 포함하는 RNA (예를 들어, mRNA)를 코딩하는 카세트를 포함한다. 일부 실시양태에서, 인접 폴리핵산은 단일 전사활성인자의 핵산 서열을 포함한다. 다른 실시양태에서, 인접 폴리핵산은 다수의 전사활성인자 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 전사활성인자)의 핵산 서열을 포함한다.
본원에 사용된 바와 같이, "전사활성인자" 또는 "전사활성인자 단백질"이라는 용어는 출력 (즉, 관심의 유전자)의 발현을 전사활성화시키며 출력 (즉, 관심의 유전자)을 코딩하는 핵산에 작동가능하게 연결된 전사활성인자 반응 요소에 결합하는, 인접 폴리핵산 분자 상에 코딩되는 단백질을 지칭한다. 일부 실시양태에서, 전사활성인자는 독립적으로 (즉, 임의의 추가의 인자의 부재 하에서) 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다. 다른 실시양태에서, 전사활성인자는 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 전사활성인자 단백질은 DNA-결합 도메인을 포함한다. 일부 실시양태에서, DNA-결합 도메인은 자연-발생 서열과 구별되는 DNA 서열에 결합하도록 조작된다 (즉, 자연-발생이 아님). DNA-결합 도메인의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, 아연-핑거 기술 또는 TALEN 기술을 사용하여 유도되거나, 또는 박테리아로부터의 2-구성요소 신호전달 경로의 돌연변이 반응 조절인자로부터 유래하는 DNA-결합 도메인이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, DNA-결합 도메인은 포유동물 단백질로부터 유래된다. 다른 실시양태에서, DNA 결합 도메인은 비-포유동물 단백질로부터 유래된다. 예를 들어, 일부 실시양태에서, DNA-결합 도메인은 박테리아, 효모, 또는 식물에서 기원하는 단백질로부터 유래된다. 일부 실시양태에서, DNA-결합 도메인은 전사활성인자 반응 요소를 표적화하기 위한 추가의 구성요소 (예를 들어, 단백질 또는 RNA)를 필요로 한다. 예를 들어, 일부 실시양태에서, DNA-결합 도메인은 전사활성인자 반응 요소를 표적화하기 위한 가이드 RNA의 추가의 구성요소를 필요로 하는 CRISPR/Cas 단백질 (예를 들어, Cas1, Cas2, Cas3, Cas5, Cas4, Cas6, Cas7, Cas8a, Cas8b, Cas8c, Cas9, Cas10, Cas10d, Cse1, Cse2, Csy1, Csy2, Csy3, Csm2, Cmr5, Csx10, Csx11, Csf1, Cpf1, C2c1, C2c2, C2c3)의 것이다.
일부 실시양태에서, 전사활성인자 단백질은 자연-발생 전사 인자로부터 유래되며, 여기서 자연-발생 전사 인자의 DNA-결합 도메인이 돌연변이되어 야생형 전사 인자에 비해 변경된 DNA 결합 특이성을 초래한다. 일부 실시양태에서, 전사활성인자는 자연-발생 전사 인자이다.
일부 실시양태에서, 전사활성인자 단백질은 전사활성화 도메인을 추가로 포함한다 (즉, DNA 결합 도메인 및 전사활성화 도메인을 포함하는 융합 단백질). 본원에 사용된 바와 같이, "전사활성화 도메인"이라는 용어는 최소 프로모터로 전사 기구를 동원하는 기능을 하는 단백질 도메인을 지칭한다. 일부 실시양태에서, 전사활성화 도메인은 독립적으로는 유전자 활성화를 촉발시키지 않는다. 일부 실시양태에서, 전사활성화 도메인은 자연-발생이다. 다른 실시양태에서, 전사활성화 도메인은 조작된다. 전사활성화 도메인의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, RelA 전사활성화 도메인, VP16, VP48 및 VP64가 포함되나, 이에 제한되는 것은 아니다.
예시적인 전사활성인자는 표 2에 열거된다. 일부 실시양태에서, 적어도 하나의 카세트의 전사활성인자는 표 2에 열거된 전사활성인자 또는 표 2에 열거된 하나 이상의 전사활성인자와 그의 아미노산 서열의 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일성을 갖는 전사활성인자이다. 일부 실시양태에서, 본원에 기재된 인접 폴리핵산 분자는 표 2에 열거된 전사활성인자의 조합 또는 표 2에 열거된 하나 이상의 전사활성인자와 그의 아미노산 서열의 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일성을 갖는 전사활성인자의 조합을 코딩한다.
일부 실시양태에서, 적어도 하나의 카세트의 전사활성인자는 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16 또는 NarLc-RelA이다. 예를 들어, 문헌 [Angelici B. et al., Cell Rep. 2016 Aug 30; 16(9): 2525-2537]을 참조한다.
표 2. 예시적인 전사활성인자. DNA 서열은 나타내어진 단백질 서열을 코딩할 수 있는 예일 뿐이며; 축중성 코돈으로 인하여, DNA 서열의 매우 많은 세트는 동일한 단백질 서열을 코딩할 수 있다. 전사활성인자 도메인, 예컨대 RelA 및 VP16은 가능한 전사활성인자 도메인 (TAD)의 예일 뿐이다. "VP16 TAD"는 헤르페스 심플렉스 바이러스의 VP16 유전자로부터 유래된 전사활성인자 도메인을 나타내며; 다수의 도메인 및 그들의 조합 및 그들의 돌연변이체는 DNA 결합 도메인에 융합되는 경우 전사활성인자 도메인으로서 역할을 할 수 있다. 전사활성인자의 DNA 결합 도메인 (DBD)은, 전장 단백질로부터 유래되는 경우, 이러한 도메인의 예일 뿐이며; 이들은 그들의 전장 단백질 전구체로부터 보다 많은 아미노산을 포함하도록 추가로 감소되거나 증가될 수 있다. 원핵생물 2 구성요소 신호전달 시스템의 반응 조절인자로부터 유래된 DBD는 이. 콜라이(E. coli)에서의 그들의 단백질 서열에 기반하여 제시되지만, 다른 원핵생물 균주 및 종으로부터의 이들 유전자의 이종상동체는 또한 사용될 수 있다. 추가로, 이. 콜라이에서 이종상동체를 갖지 않는 2-구성요소 신호전달 경로로부터의 반응 조절인자의 DNA 결합 도메인은 또한 동일한 목적을 위해 사용될 수 있다. M (밑줄표시됨)은 그들의 번역을 가능하게 하는 다양한 DBD 앞에 도입된 시작 코돈을 나타낸다. "::"는 DBD 및 TAD 사이의 융합점을 나타낸다.
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
(iii) 예시적인 출력 분자
본원에 기재된 인접 폴리핵산의 각각은 출력 (즉, 관심의 유전자)의 핵산 서열을 포함하는 RNA (예를 들어, mRNA)를 코딩하는 카세트를 포함한다. 일부 실시양태에서, 인접 폴리핵산은 단일 출력의 핵산 서열을 포함한다. 다른 실시양태에서, 인접 폴리핵산은 다수의 출력 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 출력)의 핵산 서열을 포함한다.
일부 실시양태에서, 출력은 RNA 분자이다. 일부 실시양태에서, RNA 분자는 단백질을 코딩하는 mRNA이다. 일부 실시양태에서, 출력은 비-코딩 RNA 분자이다. 비-코딩 RNA 분자의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, 전달 RNA (tRNA), 리보솜 RNA (rRNA), miRNA, siRNA, piRNA, snoRNA, snRNA, exRNA, scaRNA, 및 긴 ncRNA가 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 출력은 치료 분자 (즉, 질환의 치료에 관련됨), 예컨대 치료 단백질 또는 RNA 분자이다. 치료 분자의 예에 대해서는 항체 (예를 들어, 모노클로날 또는 폴리클로날; 키메라; 인간화; 항체 단편 및 항체 유도체 (이중특이적, 삼중특이적, scFv, 및 Fab)를 포함함), 효소, 호르몬, 염증 분자, 항-염증 분자, 면역조정 분자, 항암 분자, 짧은-헤어핀 RNA, 짧은 간섭 RNA 및 miRNA가 포함되나, 이에 제한되는 것은 아니다. 치료 분자의 상기 부류의 구체적인 예에 대해서는 관련 기술분야에 알려져 있으며, 이들 중 임의의 것은 본 개시내용에 따라 사용될 수 있다.
일부 실시양태에서, 출력은 병원체로부터 유래되고 신체에서 생성되는 경우 면역 반응을 유발하는 것으로 알려진 항원 단백질, 단백질 도메인, 또는 펩티드를 코딩한다.
일부 실시양태에서, 출력은 검출가능한 단백질, 예컨대 형광 단백질이다.
일부 실시양태에서, 출력은 세포독소이다. 본원에 사용된 바와 같이, "세포독소"라는 용어는 세포에 대해 독성인 물질을 지칭한다. 예를 들어, 일부 실시양태에서, 출력은 세포독성 단백질이다. 세포독성 단백질의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, 그라눌리신, 퍼포린/그란자임 B, 및 Fas/Fas 리간드가 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 출력은 전구약물의 활성화를 촉매하는 효소이다. 전구약물 활성화를 촉매하는 효소의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, 카르복실에스테라제, 아세틸콜린에스테라제, 부티릴콜린에스테라제, 파락소나제, 매트릭스 메탈로프로테이나제, 알칼리성 포스파타제, β-글루쿠로니다제, 발라시클로비라제, 전립선-특이적 항원, 퓨린-뉴클레오시드 포스포릴라제, 카르복시펩티다제, 아미다제, β-락타마제, β-갈락토시다제, 및 시토신 데아미나제가 포함되나, 이에 제한되는 것은 아니다. 예를 들어, 문헌 [Yang Y. et al., Enzyme-mediated hydrolytic activation of prodrugs. Acta. Pharmaceutica. Sinica B. 2011 Oct; 1(3): 143-159]을 참조한다. 마찬가지로, 다양한 전구약물이 관련 기술분야의 통상의 기술자에게 알려져 있으며, 아시클로비르, 알로퓨리나올, 아지도티미딘, 밤부테롤, 베캄피실린, 카페세타빈, 캅토프릴, 카르바마제핀, 카리소프로돌, 시클로포스파미드, 디에틸스틸베스트롤 디포스페이트, 디피베프린, 에날라프릴, 팜시클로비르, 플루다라빈 트리포스페이트, 플루오로우라실, 포스마프레나비르, 포스펜토인, 푸르술티아민, 가바펜틴 엔카르빌, 간시클로비르, 겜시타빈, 히드라지드 MAO 억제제, 레플루노미드, 레보도파, 메탄아민, 메르캅토퓨린, 미토마이신, 몰시도민, 나부메톤, 올살라진, 오메프라졸, 팔리페리돈, 페나세틴, 피밤피실린, 프리미돈, 프로구아닐, 실로시빈, 라미프릴, S-메틸도파, 심바스타틴, 술파살라진, 술린닥, 테가푸르, 테르페나딘, 발라시클로비르, 발간시클로비르 및 지도부딘이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 출력은 HSV-TK, 즉, 인간 알파헤르페스바이러스 1 (HHV-1), 유니프롯(UniProt)KB - Q9QNF7 (KITH_HHV1)로부터의 티미딘 키나제이다.
일부 실시양태에서, 출력은 면역조정 단백질 및/또는 RNA이다. 본원에 사용된 바와 같이, "면역조정 단백질" (또는 면역조정 RNA)이라는 용어는 면역 시스템 구성요소의 활성화를 유도하고/거나 활성을 증가시킴으로써 면역 시스템을 조정하는 (자극하거나 (즉, 면역자극 단백질 또는 RNA) 억제하는 (즉, 면역억제 단백질 또는 RNA)) 단백질 (또는 RNA)을 지칭한다. 다양한 면역조정 단백질은 관련 기술분야의 통상의 기술자에게 알려져 있다. 예를 들어, 문헌 [Shahbazi S. and Bolhassani A. Immunostimulants: Types and Funtions. J. Med. Microbiol. Infec. Dis. 2016; 4(3-4): 45-51]을 참조한다. 일부 실시양태에서, 면역조정 단백질은 시토카인 또는 케모카인 (예를 들어, IL-2, IL-5, IL-6, IL-10, IL-12, IL-13, IL-15, IL-18, CCR3, CXCR3, CXCR4, 및 CCR10) 또는 콜로니 자극 인자이다.
일부 실시양태에서, 출력은 DNA-변형 인자이다. 본원에 사용된 바와 같이, "DNA-변형 인자"라는 용어는 (예를 들어, 재조합 또는 돌연변이의 도입을 유도함으로써) DNA의 구조를 변경하고/거나 DNA의 서열을 변경하는 인자를 지칭한다. 일부 실시양태에서, 상기 DNA-변형 인자는 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소이다. 일부 실시양태에서, DNA-변형 효소는 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas DNA 변형 시스템의 단백질 구성요소이다.
일부 실시양태에서, 출력은 세포-표면 수용체이다. 일부 실시양태에서, 출력은 키나제이다.
일부 실시양태에서, 출력은 유전자 발현-조절 인자이다. 본원에 사용된 바와 같이, "유전자 발현-조절 인자"라는 용어는 존재할 경우 적어도 하나의 유전자의 전사를 증가시키거나 감소시키는 임의의 인자를 지칭한다. 일부 실시양태에서, 유전자 발현-조절 인자는 단백질이다. 일부 실시양태에서, 유전자 발현-조절 인자는 RNA이다. 일부 실시양태에서, 유전자 발현-조절 인자는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소이다.
일부 실시양태에서, 출력은 후성적 변형인자이다. 본원에 사용된 바와 같이, "후성적 변형인자"라는 용어는 후성적 변형을 증가시키거나, 감소시키거나, 또는 변경하는 인자 (예를 들어, 단백질 또는 RNA)를 지칭한다. 후성적 변형인자의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, DNA 메틸화 및 히스톤 변형이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 출력은 벡터 복제에 필요한 인자이다. 벡터 복제에 필요한 인자의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있다.
(iv) 조절 구성요소
RNA (예를 들어, 출력 및/또는 전사활성인자의 핵산 서열을 포함함)를 코딩하는 카세트는 조절 구성요소를 추가로 포함할 수 있다. 본원에 기재된 바와 같이, 조절 구성요소는 RNA의 발현을 제어하는 (즉, 그의 증가된 또는 감소된 발현을 조절하는) 핵산 서열이다. 예를 들어, 일부 실시양태에서, 본원에 기재된 카세트는 전사활성인자 반응 요소, 전사 인자 반응 요소, 최소 프로모터, 및/또는 프로모터 요소에 작동가능하게 연결된 RNA를 코딩할 수 있다. 조절 구성요소는 그것이 핵산 서열에 관하여 정확한 기능적 위치 및 배향으로 존재하며, 그에 따라 그것이 전사 개시 및/또는 그 서열의 발현을 조절하는 (또는 유도하는) 경우 RNA를 코딩하는 핵산에 "작동가능하게 연결된다."
일부 실시양태에서, 조절 구성요소는 전사활성인자 반응 요소를 포함한다. "전사활성인자 반응 요소"는 전사활성인자 단백질이 결합 및 인식하는 최소 DNA 서열을 포함할 수 있다. 일부 실시양태에서, 전사활성인자 반응 요소는 전사활성인자 단백질이 결합 및 인식하는 최소 DNA 서열의 1개 초과의 카피 (즉, 반복체)를 포함한다. 일부 실시양태에서, 전사활성인자 반응 요소는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 전사활성인자 단백질이 결합 및 인식하는 최소 DNA 서열 반복체를 포함한다. 일부 실시양태에서, 상기 반복체는 탠덤 반복체이다. 일부 실시양태에서, 전사활성인자 반응 요소는 최소 DNA 서열의 조합을 포함한다. 일부 실시양태에서, 최소 DNA 서열은 스페이서 서열에 의해 점재된다. 일부 실시양태에서, 스페이서 서열은 길이가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 20개 초과의 뉴클레오티드이다.
일부 실시양태에서, 전사활성인자 반응 요소는 최소 DNA 서열로부터의 편차를 포함하거나, 또는 추가의 DNA 서열에 의해 플랭킹되지만, 여전히 전사활성인자 단백질에 결합할 수 있다. 일부 실시양태에서, 상이한 전사활성인자 반응 요소는 나란히 놓일 수 있지만, 모두는 동일한 전사활성인자 단백질에 결합할 수 있다.
예시적인 전사활성인자 반응 요소는 표 3에 열거된다. 일부 실시양태에서, 전사활성인자 반응 요소는 표 3에 열거된 핵산 서열 또는 표 3에 열거된 핵산 서열과 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 핵산 서열로 이루어진다.
표 3. 예시적인 전사활성인자 반응 요소. "::"는 전사활성인자 도메인 (TAD) 및 DNA 결합 도메인 (DBD) 사이의 융합점을 나타낸다. TAD 및 DBD의 서열의 약칭 표기는 표 2에 상응한다. DNA 서열은 하기 명명법을 사용한다: W= A 또는 T; S = C 또는 G; K = A 또는 C; M = G 또는 T; Y = A 또는 G; R = C 또는 T; V = C,G, 또는 T; H = A, G 또는 T; D = A, C 또는 T; B = A, C, 또는 G; N = A,C,G, 또는 T. 대문자는 강한 보존을 나타내고; 소문자 기호는 약한 보존을 나타낸다.
Figure pct00014
Figure pct00015
Figure pct00016
일부 실시양태에서, 조절 구성요소는 전사 인자 반응 요소를 포함한다. "전사 인자 반응 요소"라는 용어는 전사인자가 결합 및 인식하는 DNA 서열을 지칭한다. 본원에 사용된 바와 같이, "전사 인자"라는 용어는 유전자 전사를 조정하는 인접 폴리핵산 상에 코딩되어 있지 않은 단백질을 지칭한다. 일부 실시양태에서, 전사 인자는 전사 활성인자이다 (즉, 전사를 증가시킴). 다른 실시양태에서, 전사 인자는 전사 억제인자이다 (즉, 전사를 억제함). 일부 실시양태에서, 전사 인자는 세포의 내인성 전사 인자이다.
일부 실시양태에서, 전사 인자 반응 요소는 하기 전사 인자 중 하나 이상에 의해 직접적으로 결합되거나, 또는 간접적으로 영향을 받도록 조작된다: ABL1, CEBPA, ERCC3, HIST1H2BE, MDM4, PAX7, SMARCA4, TFPT, AFF1, CHD1, ERCC6, HIST1H2BG, MED12, PAX8, SMARCB1, THRAP3, AFF3, CHD2, ERF, HLF, MEF2B, PBX1, SMARCD1, TLX1, AFF4, CHD4, ERG, HMGA1, MEF2C, PEG3, SMARCE1, TLX3, APC, CHD5, ESPL1, HMGA2, MEN1, PER1, SMURF2, TNFAIP3, AR, CHD7, ESR1, HOXA11, MITF, PHF3, SOX2, SOX4, TP53, ARID1A, CIC, ETS1, HOXA13, MKL1, PHF6, SOX5, TRIM24, ARID1B, CIITA, ETV1, HOXA7, MLLT1, PHOX2B, SOX9, TRIM33, ARID3B, CNOT3, ETV4, HOXA9, MLLT10, PLAG1, SRCAP, TRIP11,ARID5B, CREB1, ETV5, HOXC11, MLLT3, PML, SS18L1, TRPS1, ARNT, CREB3L1, ETV6, HOXC13, MLLT6, PMS1, SSB, TRRAP, ARNT2, CREBBP, EWSR1, HOXD11, MYB, PNN, SSX1, TSC22D1, ASB15, CRTC1, EYA4, HOXD13, MYBL1, MYBL2, POU2AF1, SSX2, TSHZ3, ASXL1, CSDE1, EZH2, ID3, MYC, POU2F2, SSX4, VHL, ATF1, CTCF, FEV, IRF2, MYCN, POU5F1, STAT3, WHSC1, ATF7IP, CTNNB1, FLI1, IRF4, MYOD1, PPARG, STAT4, WHSC1L1, ATM, DACH1, FOXA1, IRF6, NCOA1, PRDM1, STAT5B, WT1, ATRX, DACH2, FOXE1, IRF8, NCOA2, PRDM16, STAT6, WWP1, BAZ2B, DAXX, FOXL2, IRX6, NCOA4, PRDM9, SUFU, WWTR1, BCL11A, DDB2, FOXP1, JUN, NCOR1, PRRX1, SUZ12, XBP1, BCL11B, DDIT3, FOXQ1, KHDRBS2, NCOR2, PSIP1, TAF1, XPC, BCL3, DDX5, FUBP1, KHSRP, NEUROG2, RARA, TAF15, ZBTB16, BCL6, DEK, FUS, KLF2, NFE2L2, RB1, TAL1, ZBTB20, BCLAF1, DIP2C, FXR1, KLF4, NFE2L3, RBM15, TAL2, ZFP36L1, BCOR, DNMT1, GATA1, KLF5, NFIB, RBMX, TBX18, ZFX, BRCA1, DNMT3A, GATA2, KLF6, NFKB2, REL, TBX22, ZHX2, BRCA2, DOT1L, GATA3, LDB1, NFKBIA, RUNX1, TBX3, ZIC3, BRD7, EED, GLI3, LMO1, NONO, RUNX1T1, TCEA1, ZIM2, BRD8, EGR2, GTF2I, LMO2, NOTCH2, RXRA, TCEB1, ZNF208, BRIP1, ELAVL2, HDAC9, LMX1A, NOTCH3, SALL3, TCERG1, ZNF226, BRPF3, ELF3, HEY1, LYL1, NPM1, SATB2, TCF12, ZNF331, BTG1, ELF4, HIST1H1B, LZTR1, NR3C2, SETBP1, TCF3, ZNF384, BTG2, ELK4, HIST1H1C, MAF, NR4A3, SFPQ, TCF7L2, ZNF469, CBFA2T3, ELL, HIST1H1D, MAFA, NSD1, SIN3A, TFAP2D, ZNF595, CBFB, EP300, HIST1H1E, MAFB, OLIG2, SMAD2, TFDP1, ZNF638, CDX2, EPC1, HIST1H2BC, MAML1, PAX3, SMAD4, TFE3, CDX4, ERCC2, HIST1H2BD, MAX, PAX5, SMARCA1, 및 TFEB.
"전사 인자 반응 요소"는 전사 인자가 결합 및 인식하는 최소 DNA 서열을 포함할 수 있다. 일부 실시양태에서, 전사 인자 반응 요소는 전사 인자가 결합 및 인식하는 최소 DNA 서열의 1개 초과의 카피 (즉, 반복체)를 포함한다. 일부 실시양태에서, 전사 인자 반응 요소는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 전사 인자가 결합 및 인식하는 최소 DNA 서열의 반복체를 포함한다. 일부 실시양태에서, 상기 반복체는 탠덤 반복체이다. 일부 실시양태에서, 전사 인자 반응 요소는 최소 DNA 서열의 조합을 포함한다. 일부 실시양태에서, 최소 DNA 서열은 스페이서 서열에 의해 점재된다. 일부 실시양태에서, 스페이서 서열은 길이가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 20개 초과의 뉴클레오티드이다. 일부 실시양태에서, 전사활성인자 반응 요소는 최소 DNA 서열로부터의 편차를 포함하거나, 또는 추가의 DNA 서열에 의해 플랭킹되지만, 여전히 전사활성인자 단백질에 결합할 수 있다. 일부 실시양태에서, 상이한 전사활성인자 반응 요소는 나란히 놓일 수 있지만, 모두는 동일한 전사활성인자 단백질에 결합할 수 있다.
일부 실시양태에서, 전사 인자 반응 요소는 유일한 것이다 (즉, 인접 폴리핵산은 전사 인자 반응 요소의 1개의 카피만을 포함함). 다른 실시양태에서, 전사 인자 반응 요소는 유일하지 않다. 일부 실시양태에서, 전사 인자 반응 요소에 결합하는 전사 인자는 그것이 작동가능하게 연결된 RNA의 발현을 활성화시킨다. 다른 실시양태에서, 전사 인자 반응 요소에 결합하는 전사 인자는 그것이 작동가능하게 연결된 RNA의 발현을 억제한다.
일부 실시양태에서, 조절 구성요소는 각각 상이한 전사 인자에 의해 결합된 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 상이한 전사 인자 반응 요소를 포함한다. 일부 실시양태에서, 조절 구성요소는 각각 상이한 전사 인자에 의해 결합된 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 전사 인자 반응 요소를 포함한다.
예시적인 전사 인자 반응 요소는 표 4에 열거된다. 일부 실시양태에서, 전사 인자 반응 요소는 표 4에 열거된 핵산 서열 또는 표 4에 열거된 핵산 서열과 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 핵산 서열로 이루어진다.
표 4. 예시적인 전사 인자 반응 요소.
Figure pct00017
Figure pct00018
Figure pct00019
일부 실시양태에서, 조절 구성요소는 프로모터 요소 (또는 프로모터 단편)를 포함한다. 예시적인 프로모터 요소는 표 5에 열거된다. 일부 실시양태에서, 프로모터 요소는 표 5에 열거된 핵산 서열 또는 표 5에 열거된 핵산 서열과 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 핵산 서열로 이루어진다.
표 5. 예시적인 프로모터 요소.
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
일부 실시양태에서, 프로모터 요소는 전사 인자 반응 요소 및 최소 프로모터를 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다. 일부 실시양태에서, 포유동물 프로모터 또는 프로모터 단편은 유일한 것이다 (즉, 인접 폴리핵산이 포유동물 프로모터 또는 프로모터 단편의 1개의 카피만을 포함함). 다른 실시양태에서, 포유동물 프로모터 또는 프로모터 단편은 유일하지 않다.
일부 실시양태에서, 조절 구성요소는 최소 프로모터를 포함한다. 본원에 사용된 바와 같이, "최소 프로모터"라는 용어는 출력의 발현을 개시하는데 필요하나 충분하지는 않은 핵산 서열을 지칭한다. 일부 실시양태에서, 최소 프로모터는 자연 발생이다. 다른 실시양태에서, 최소 프로모터는 예컨대 자연 발생 서열을 변경하고/거나 단축하는 것, 자연 발생 서열을 조합하는 것, 또는 자연 발생 서열을 비-자연 발생 서열과 조합하는 것에 의해 조작되는데; 각각의 경우 조작되는 최소 프로모터는 비-자연 발생 서열이다. 일부 실시양태에서, 최소 프로모터는 바이러스 또는 비-바이러스 공급원으로부터 조작된다. 최소 프로모터의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있다.
일부 실시양태에서, 조절 구성요소는 전사활성인자 반응 요소, 전사 인자 반응 요소, 및 최소 프로모터를 포함한다. 관련 기술분야의 통상의 기술자는 이들 요소가 다양한 배열구조로 배향될 수 있음을 인식할 것이다. 예를 들어, 전사활성인자 반응 요소는 프로모터 요소 및/또는 전사 인자 반응 요소에 대해 5' 또는 3'일 수 있고; 전사 인자 반응 요소는 프로모터 요소 및/또는 전사활성인자 반응 요소에 대해 5' 또는 3'일 수 있고; 프로모터 요소는 전사 인자 반응 요소 및/또는 전사활성인자 반응 요소에 대해 5' 또는 3'일 수 있다.
일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 전사활성인자 반응 요소, 전사 인자 반응 요소, 및 최소 프로모터를 포함한다. 일부 실시양태에서, 조절 구성요소는 5'에서 3'으로: 전사 인자 반응 요소, 전사활성인자 반응 요소, 및 최소 프로모터를 포함한다.
일부 실시양태에서, 카세트의 조절 구성요소는 전사활성인자 반응 요소 및 프로모터 요소를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 전사활성인자 반응 요소 및 프로모터 요소를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 전사활성인자 반응 요소, 프로모터 요소 및 최소 프로모터를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 전사활성인자 반응 요소, 프로모터 요소 및 최소 프로모터를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 프로모터 요소 및 전사활성인자 반응 요소를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 프로모터 요소, 전사활성인자 반응 요소 및 최소 프로모터를 포함한다. 일부 실시양태에서, 상기 프로모터 요소는 포유동물 프로모터이다. 일부 실시양태에서, 프로모터 요소는 프로모터 단편이다.
(v) 예시적인 인접 폴리핵산
일부 실시양태에서, 인접 폴리핵산 분자는 단일 카세트를 갖는 유전자 회로를 포함한다. 예를 들어, 일부 실시양태에서, 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 (i) 출력의 핵산 서열; (ii) 전사활성인자의 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, mRNA는 폴리시스트론성 발현 요소의 핵산 서열을 추가로 포함한다. 본원에 사용된 바와 같이, "폴리시스트론성 반응 요소"라는 용어는 단일 mRNA로부터의 2개 이상의 단백질의 생성을 촉진하는 핵산 서열을 지칭한다. 폴리시스트론성 반응 요소는 내부 인식 서열 (IRES) 또는 2A 펩티드를 코딩하는 폴리핵산을 포함할 수 있다. 예를 들어, 문헌 [Liu et al., Systematic comparison of 2A peptides for cloning multi-genes in a polycistronic vector. Sci. Rep. 2017 May 19; 7(1): 2193]을 참조한다. 일부 실시양태에서, 폴리시스트론성 발현 요소는 출력 및 전사활성인자의 핵산 서열들을 분리한다.
일부 실시양태에서, mRNA는 3' UTR을 포함하며, 여기서 3' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, mRNA는 5' UTR을 포함하며, 여기서 5' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력 및 전사활성인자를 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사 인자 반응 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력 및 전사활성인자를 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자 및 출력을 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사 인자 반응 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자 및 출력을 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 프로모터 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자 및 출력을 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 프로모터 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자 및 출력을 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 다수의 카세트를 갖는 유전자 회로를 포함한다. 예를 들어, 일부 실시양태에서, 인접 폴리핵산 분자는 a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 것인 제1 카세트; 및 b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며; 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 RNA는 3' UTR을 포함하고, 3' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, 제1 RNA는 5' UTR을 포함하고, 5' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다.
일부 실시양태에서, 제2 RNA는 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, 제2 RNA는 3' UTR을 포함하고, 3' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, 제2 RNA는 5' UTR을 포함하고, 5' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, 제1 카세트의 적어도 하나의 miRNA 표적 부위 및 제2 카세트의 적어도 하나의 miRNA 표적 부위는 동일한 핵산 서열이거나 또는 동일한 miRNA에 의해 조절되는 상이한 서열이다.
일부 실시양태에서, 제1 RNA는 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 제2 RNA는 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소는 동일한 핵산 서열로 이루어진다. 일부 실시양태에서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소는 상이한 핵산 서열로 이루어진다. 일부 실시양태에서, 제1 카세트 또는 제2 카세트 중 어느 하나 또는 둘 다는 적어도 2개, 적어도 3개...의 유형의 전사 인자 반응 요소를 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 프로모터 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 프로모터 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트의 상류 조절 구성요소는 전사 인자 반응 요소에 추가로 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 전사 인자 반응 요소를 대체한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 제1 카세트 및 제2 카세트는 수렴형 배향으로 존재한다. 일부 실시양태에서, 제1 카세트 및 제2 카세트는 발산형 배향으로 존재한다. 일부 실시양태에서, 제1 카세트 및 제2 카세트는 머리-대-꼬리 배향으로 존재한다.
제1 및/또는 제2 카세트는 하나 이상의 인슐레이터 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 인슐레이터)에 의해 플랭킹될 수 있다. 예를 들어, 일부 실시양태에서, 제1 카세트 또는 제2 카세트는 인슐레이터에 의해 플랭킹된다. 일부 실시양태에서, 제1 카세트 및 제2 카세트 둘 다는 인슐레이터에 의해 플랭킹된다. 일부 실시양태에서, 제1 카세트 또는 제2 카세트는 인슐레이터에 의해 둘 다의 측 상에 플랭킹된다.
예시적인 인접 폴리핵산은 표 6에 열거된다. 일부 실시양태에서, 인접 폴리핵산은 표 6에 열거된 핵산 서열 또는 표 6에 열거된 핵산 서열과 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 핵산 서열을 포함한다.
표 6. 예시적인 인접 폴리핵산.
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
Figure pct00065
Figure pct00066
Figure pct00067
Figure pct00068
Figure pct00069
Figure pct00070
Figure pct00071
Figure pct00072
Figure pct00073
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
Figure pct00078
Figure pct00079
Figure pct00080
Figure pct00081
Figure pct00082
Figure pct00083
Figure pct00084
II. 다른 조성물
다른 측면에서, 본 개시내용은 벡터의 조성물에 관한 것이다. 일부 실시양태에서, 벡터는 상기 기재된 인접 폴리핵산 분자를 포함한다.
다른 측면에서, 본 개시내용은 조작된 바이러스 게놈의 조성물에 관한 것이다. 일부 실시양태에서, 바이러스 게놈은 상기 기재된 인접 폴리핵산 분자를 포함한다. 일부 실시양태에서, 바이러스 게놈은 아데노-연관 바이러스 (AAV) 게놈, 렌티바이러스 게놈, 아데노바이러스 게놈, 헤르페스 심플렉스 바이러스 (HSV) 게놈, 백시니아 바이러스 게놈, 폭스바이러스 게놈, 뉴캐슬병 바이러스 (NDV) 게놈, 콕사키바이러스 게놈, 레오바이러스 게놈, 홍역 바이러스 게놈, 소포성 구내염 바이러스 (VSV) 게놈, 파르보바이러스 게놈, 세네카 밸리 바이러스 게놈, 마라바 바이러스 게놈, 또는 감기 바이러스 게놈이다.
다른 측면에서, 본 개시내용은 비리온의 조성물에 관한 것이다. 본원에 사용된 바와 같이, "비리온"이라는 용어는 숙주 세포의 외부에 있는 (예를 들어, DNA/RNA 게놈 및 캡시드 단백질을 포함하는) 바이러스의 감염성 형태를 지칭한다. 일부 실시양태에서, 비리온은 상기 기재된 조작된 바이러스 게놈을 포함한다. 일부 실시양태에서, 비리온은 AAV-DJ 캡시드 단백질을 포함한다. 일부 실시양태에서, 비리온은 AAV-B1 캡시드 단백질, AAV8 캡시드 단백질, 또는 AAV6 캡시드 단백질을 포함한다.
다른 측면에서, 본 개시내용은 상기 기재된 인접 폴리핵산 분자, 상기 기재된 벡터, 상기 기재된 조작된 바이러스 게놈, 또는 상기 기재된 비리온을 포함하는 조성물에 관한 것이다. 일부 실시양태에서, 조성물은 제약상-허용되는 부형제 또는 완충제를 추가로 포함하는 치료 조성물이다. 예시적인 제약 부형제 및 완충제에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있다.
III. 세포-특이적 이벤트를 자극하는 방법
다른 측면에서, 본 개시내용은 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 관한 것이다. 일부 실시양태에서, 세포-특이적 이벤트를 자극하는 방법은 세포의 집단을 상기 기재된 인접 폴리핵산 분자, 상기 기재된 벡터, 상기 기재된 조작된 바이러스 게놈, 또는 상기 기재된 비리온과 접촉시키는 것을 포함하며, 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서 발현되는 출력의 수준을 통해 유발된다.
일부 실시양태에서, 세포의 집단은 적어도 하나의 표적 세포 및 적어도 하나의 비-표적 세포를 포함한다. 표적 세포 및 비-표적 세포 유형은 적어도 하나의 내인성 전사 인자의 수준 및/또는 적어도 하나의 내인성 프로모터 또는 그의 단편 및/또는 적어도 하나의 내인성 miRNA의 발현 강도에 있어서 상이하다. 일부 실시양태에서, 출력의 발현 수준은 표적 세포 및 비-표적 세포 사이에 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 500, 적어도 1,000, 또는 적어도 10,000배 상이하다.
일부 실시양태에서, 방법은 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하며, 여기서: a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA (예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 20개의 내인성 miRNA)의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고 (예를 들어, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 50배, 적어도 100배, 적어도 1000배 더 높고); b) 인접 폴리핵산 분자는 (i) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하며, 여기서 제1 RNA는 출력의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하는 것인 제1 카세트; 및 (ii) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며; 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 방법은 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하며, 여기서: a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA (예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 20개의 내인성 miRNA)의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고 (예를 들어, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 50배, 적어도 100배, 적어도 1000배 더 높고); b) 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 mRNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 출력의 핵산 서열; 전사활성인자의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 전사 인자 (예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 20개의 내인성 전사 인자)의 수준에 있어서 상이하며, 여기서 인접 핵산 분자는 내인성 전사 인자(들)에 상응하는 하나 이상의 전사 인자 반응 요소를 추가로 포함한다.
일부 실시양태에서, 숙주 세포를 상기 기재된 인접 폴리핵산 분자 또는 상기 기재된 벡터와 접촉시키는 것은 비-바이러스 전달 방법을 통해 일어난다. 예로는 형질감염 (예를 들어, DEAE 덱스트란-매개 형질감염, CaPO4-매개 형질감염, 지질-매개 흡수, PEI-매개 흡수, 및 레이저 형질감염), 형질전환 (예를 들어, 칼슘 클로라이드, 전기천공 및 열-충격), 유전자 전달, 및 입자 충격이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 세포의 집단은 생체외에서 접촉된다 (즉, 세포의 집단이 유기체로부터 단리되고, 세포의 집단이 유기체의 외부에서 접촉됨). 일부 실시양태에서, 세포의 집단은 생체내에서 접촉된다.
본원에 사용된 바와 같이, "내인성"이라는 용어는 - 세포의 맥락에서 - 그의 자연 상태에 있는 세포 내에서 발견되는 인자 (예를 들어, 단백질 또는 RNA)를 지칭한다. 일부 실시양태에서, 내인성 전사 인자는 적어도 하나의 카세트의 조절 구성요소 (예를 들어, 전사 인자 반응 요소)의 프로모터 요소에 결합하여 그를 활성화시킬 수 있다. 일부 실시양태에서, 내인성 miRNA는 적어도 하나의 카세트의 조절 구성요소 또는 반응 구성요소의 miRNA 표적 부위에 상보적일 수 있다.
일부 실시양태에서, "전사활성인자" 및 상응하는 "전사활성인자 반응 요소"는 전사활성인자가 "전사활성인자 반응 요소"에 특이적으로 결합하기는 하나 세포 내에 자연적으로 존재하는 반응 요소에는 가능한 한 적게 결합하게 되도록 선택될 것이다. 일부 실시양태에서, 전사활성인자 단백질의 DNA 결합 도메인은 세포에 존재하는 고유한 조절 서열에는 효율적으로 결합하지 않을 것이며, 따라서 과도한 부작용을 촉발시키지 않을 것이다.
일부 실시양태에서, 표적 세포 및 비-표적 세포는 상이한 세포 유형이다.
일부 실시양태에서, 표적 세포는 암성 세포이고, 비-표적 세포는 비-암성 세포이다. 일부 실시양태에서, 표적 세포는 암성 간세포 암종 세포 또는 담관암종 세포일 수 있고, 비-표적 세포는 간세포, 포식작용적 쿠퍼 세포, 성상 세포, 굴모양 내피 세포를 포함하는 실질 및 비-실질 간 세포일 수 있다.
일부 실시양태에서, 표적 세포는 간세포이고, 비-표적 세포는 비-간세포 (예를 들어, 근세포)이다. 다른 실시양태에서, 표적 세포 및 비-표적 세포는 동일한 세포-유형의 것이나 (예를 들어, 둘 다가 간세포임), 그럼에도 불구하고 적어도 하나의 내인성 전사 인자 및/또는 적어도 하나의 내인성 miRNA의 수준에 있어서 상이하다. 예를 들어, 표적 세포는 노화 근육 세포일 수 있고, 비-표적 세포는 비-노화 근육 세포일 수 있다.
일부 실시양태에서, 표적 세포는 종양 세포이고, 세포-특이적 이벤트는 세포 사멸이다. 일부 실시양태에서, 표적 세포는 노화 세포이고, 세포-특이적 이벤트는 세포 사멸이다. 일부 실시양태에서, 세포 사멸은 활성화 수용체 리간드, 특이적 항원, 자극 시토카인, 또는 이들의 임의의 조합의 발현을 통한 면역 표적화에 의해 매개된다. 일부 실시양태에서, 방법은 세포의 집단을 출력에 의해 치료제 또는 독성 화합물로 대사되는 전구약물 또는 비-독성 전구체 화합물과 접촉시키는 것을 추가로 포함한다.
일부 실시양태에서, 표적 세포는 동일한 유형의 야생형 세포 (예를 들어, 건강한 및/또는 비-질환에 걸린)에 비해 인자를 차등적으로 발현하고, 세포-특이적 이벤트는 인자의 발현 수준을 조정하는 것이다.
일부 실시양태에서, 출력 발현은, 비-표적 세포가 출력 발현의 결여로 인하여 그리고 세포 사멸-유도 작용제의 존재 하에서 제거되는 동안, 표적 세포 집단의 생존을 보장한다. 다른 실시양태에서, 출력은 표적 세포가 출력 발현으로 인하여 그리고 세포 사멸-유도제의 존재 하에서 제거되는 동안, 비-표적 세포 집단의 생존을 보장한다.
일부 실시양태에서, 표적 세포는 관심의 특정한 표현형을 포함하며, 그에 따라 출력 발현은 이 특정한 표현형의 세포에 제한된다.
일부 실시양태에서, 표적 세포는 선택되는 세포 유형이고, 세포-특이적 이벤트는 자연적으로는 선택되는 세포 유형에서는 부재하거나 불활성인 유전자의 발현을 통한 신규 기능의 코딩이다.
일부 실시양태에서, 세포의 집단은 다세포 유기체를 포함한다. 일부 실시양태에서, 다세포 유기체는 동물이다. 일부 실시양태에서, 동물은 인간이다.
IV. 질환 또는 병태를 진단하고/거나 치료하는 방법
일부 측면에서, 본 개시내용은 질환 또는 병태의 하나 이상의 징후 또는 증상을 나타내는 대상체에서 질환 또는 병태 (예를 들어, 암)를 진단하는 방법에 관한 것이다. 본원에 사용된 바와 같이, "진단하다"라는 용어는 질환 또는 병태의 성질 및/또는 원인을 확인하거나 결정하는 과정을 지칭한다. 일부 실시양태에서, 방법은 상기 기재된 인접 폴리핵산 분자, 상기 기재된 벡터, 상기 기재된 조작된 바이러스 게놈, 또는 상기 기재된 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하며, 여기서 출력의 수준은 질환 또는 병태의 존재 또는 부재를 지시한다.
일부 측면에서, 본 개시내용은 질환 또는 병태 (예를 들어, 암)를 치료하는 방법에 관한 것이다. 본원에 사용된 바와 같이, "치료하다"라는 용어는 질환 또는 병태와 연관된 하나 이상의 증상의 악화를 예방하는 활동 및/또는 질환 또는 병태와 연관된 하나 이상의 증상을 완화시키는 활동을 지칭한다. 일부 실시양태에서, 방법은 상기 기재된 인접 폴리핵산 분자, 상기 기재된 벡터, 상기 기재된 조작된 바이러스 게놈, 또는 상기 기재된 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함한다.
질환 또는 병태를 치료하는 것에 관한 일부 실시양태에서, 투여의 방법은 상기 기재된 벡터의 정맥내 전달을 포함한다. 일부 실시양태에서, 투여의 방법은 상기 기재된 벡터의 정맥내 전달의 하나 초과의 활동을 포함한다. 일부 실시양태에서, 투여의 방법은 하나 이상의 투여로 상기 기재된 벡터의 종양내 전달을 포함한다. 일부 실시양태에서, 투여의 방법은 하나 이상의 투여로 상기 기재된 벡터의 경동맥 전달을 포함한다. 일부 실시양태에서, 투여의 방법은 근육내 전달, 비내 전달, 망막하 전달, 또는 경구 전달을 포함한다.
일부 실시양태에서, 질환을 치료하는 방법은 하나 이상의 투여로 전구약물의 투여를 추가로 포함한다. 일부 실시양태에서, 전구약물의 전달은 정맥내, 경동맥, 또는 복강내이다. 일부 실시양태에서, 전구약물은 간시클로비르이다.
일부 실시양태에서, 질환을 치료하는 방법은 또 다른 요법, 예컨대 소분자, 생물제제, 모노클로날 항체, 또 다른 유전자 요법 산물, 또는 세포-기반 치료 산물의 투여를 추가로 포함한다.
일부 실시양태에서, 질환 또는 병태는 암이다. 본원에 기재된 방법에 의해 치료될 수 있는 예시적인 암에는 간세포 암종 (HCC), 전이성 결장직장암 (mCRC), 간으로 전이된 임의의 다른 암, 폐암, 유방암, 망막모세포종, 및 교모세포종이 포함되나, 이에 제한되는 것은 아니다.
본원에 기재된 방법에 의해 치료될 수 있는 예시적인 암에는 간세포 암종 (HCC), 전이성 결장직장암 (mCRC), 폐암, 유방암, 망막모세포종, 교모세포종이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 암은 간세포 암종 (HCC))이다. 사실, HCC에 대한 치료 옵션은 제한되므로 (Llovet and Lencioni, 2020), 돌파구를 위한 신규 양상을 탐구할 긴급한 필요가 생기게 한다. 본원에 기재된 방법은 현재의 HCC 치료 방법론을 상당히 진전시킨다.
실시예
실시예 1. 다중화 진단 회로는 유전자 요법 벡터로 번역한다.
다수의 해체된 구성요소 (즉, 플라스미드당 하나의 유전자 및 세포주의 일시적 형질감염에서 특징규명됨)로부터 함께 놓인 논리 게이트가 치료적으로 관련된 벡터 내로 피팅되도록 재-조작되고 동물 질환 모델에서 치료 후보로서 연구될 수 있는지 여부를 평가하기 위한 실험을 디자인하였다. 전사 인자 (TF) SOX9/10 및 HNF1A/B에 대한 센서의 이들 센서의 활성 사이의 AND 논리를 실행하는 다중-플라스미드 시스템에 의한 통합은 HuH-7 세포 내로 일시적으로 형질감염되는 경우 강한 반응을 유발하였음이 이전에 제시되었다 (Angelici et al., 2016). SOX9는 진행성 HCC와 연관된 예후적 마커이다 (Richtig et al., 2017). 흥미롭게도, SOX9 반응 요소는 그의 과발현이 악성 HCC 표현형과 연관되는 또 다른 TF인 SOX4에 의해 결합될 가능성이 있다 (Liao et al., 2008; Uhlen et al., 2017). HNF1A 및 HNF1B는 알려진 간 하우스키핑 인자이지만 (Harries et al., 2009); 이들은 또한 GI 관의 다른 기관에서 발현된다.
이전에 기재된 다중-플라스미드 시스템이 인접 DNA 카세트에 적응되고 결국 바이러스 벡터에서 패키징될 수 있는지 여부를 판단하기 위한 실험을 디자인하였다. 이를 위해, SOX9/10-유도된 PIT-기반 활성인자 (PIT::RelA 또는 PIT::VP16) (Fussenegger et al., 2000), 뿐만 아니라 PIT 및 HNF1A/B에 의해 상승작용적으로 유도된 형광 출력 단백질을 포함하는 다중-플라스미드 설정 (Angelici et al., 2016)에서 논리 "SOX9/10 AND HNF1A/B"를 실행하는 것으로 제시된 회로 구성요소를 발산형 또는 수렴형 배향 중 어느 하나의 아데노-연관 바이러스 (AAV) 전달 벡터에서 ITR 사이에 클로닝하였다 (도 1a). 생성된 플라스미드를 HEK293 세포 내로 일시적으로 형질감염시키고, TF 입력 SOX10 및 HNF1A를 TRE-유도된 플라스미드로부터 이소적으로 발현하여 이 게이트에 대한 모든 4개의 논리 입력 조합을 생성하였다. 흥미롭게도, 추세는 모든 4개의 경우에 보존되었지만, 상이한 변이체는 둘 다의 입력이 존재하는 경우 그들의 절대 ON 수준에 있어서 현저하게 상이하다 (도 1b). 동일한 구축물을 또한 HuH-7 및 HeLa 세포 내로 형질감염시켰으며, 여기서 SOX9/10 및 HNF1A/B의 내인성 발현은 전자에서는 회로를 유도하고, 후자에서는 이를 활성화시키지 않을 것으로 예상된다. 이 경우, 차이는 덜 현저하지만, 발산형 배향은 다소 더 높은 출력을 생성하였다.
AND 게이트 전략은 목적하는 세포 유형에서 출력을 활성화시키는 방식이며, 이 활성화의 증대는 요법의 맥락에서 추가의 안전성 층을 포함할 NOT 게이트와 등가의 의도적인 "오프" 스위치의 혼입에 의해 디자인된다. 이를 위해, 마이크로RNA 표적을 출력 유전자의 3'-UTR에, 뿐만 아니라 PIT-유래 구성요소의 3'-UTR에 혼입시켰다. miR-424, miR-126 및 miR-122를 포함하는 특이적 입력의 선택을 이전에 수행된 프로파일링 (Dastor et al., 2018)에 기반하여 행하였다. miR-424 표적은 초기에 도입되었으며, 4개의 생성된 구축물 (도 1d)을 HEK 세포 (도 1e)에서 및 HuH-7 및 HeLa 세포에서 내인성 입력의 존재 하에서 (도 1f) 이소성 TF 조합에 대한 그들의 반응에 대해 다시 시험하였다. 성능에 있어서 현저하고 일관된 차이가 관찰되었다. 수렴형 구축물은 HEK 세포에서 이소성 입력에 반응하는데 실패하였으며, 발산형의 것에 비해 HuH-7 세포에서 크게 감소된 강도로 반응하였다. 이 사실은 유전자 요법 전달 벡터와 혼화성인 인접 백본 상에 통합된 이질적인 플라스미드 및 회로 상에 운반되는 회로로부터의 전이의 복잡성을 강조한다. 다음으로, 2개의 발산형 카세트는 TF 및 miR-424 모방체 입력 둘 다를 포함하는 보다 광범위한 논리 특징규명을 겪었다. 둘 다의 구축물은 예상된 바와 같이 반응하여, 논리 "SOX10 AND HNF1A AND NOT(miR-424)"를 실행하였다 (도 1g). 높은 miR-424 발현이 또한 내인성 TF 입력을 갖는 출력 활성화를 무효화함을 확인하기 위해, miR-424 모방체를 HuH-7 세포 내로 형질감염시켰으며, 출력 발현을 거의 배경 수준으로 끄는 것으로 밝혀졌다 (도 1h). 다음으로, miR-424 표적을 miR-126 표적으로 대체하였다. 구축물의 새로운 세트를 외인성 miR-126에 대한 그의 반응에 관하여 HuH-7 세포에서만 시험하였으며, 결과는 miR-424와 유사하고 예상과 일치하였다 (도 1i). 이 디자인 단계를 결론내리기 위해, miR-424 또는 miR-126 표적을 갖는, miRNA 표적을 갖지 않는 발산형 구축물을 HCC 세포주 HuH-7 및 HepG2를 HeLa 세포로부터 구별하는 그들의 능력에 대해 평가하였다 (도 1j).
다음 단계는 바이러스 벡터 내로의 카세트의 혼입 및 전임상 번역 전에 논리 성능에 관한 그들의 평가이다. AAV-전달된 게놈은 인간 세포에서 연쇄체를 형성하고 (Duan et al., 2003), 이는 AAV 게놈을 코딩하지만 AAV 캡시드의 도움으로 패키징 및 전달되지 않는 DNA 카세트에 비해 복잡성의 추가의 층을 포함할 것임이 알려져 있다. 이를 위해, ITR-플랭킹된 게놈을 사용하고, 소량의 DJ-위형화된 (Grimm et al., 2008) AAV 벡터를 제조하였다. 벡터를 사용하여 2개의 HCC 세포주, HepG2 및 HuH-7, 및 2개의 비-HCC 세포주, HeLa 및 HCT-116을 형질도입하였다. 결과는 표적 세포에서 높은 발현 및 비-표적 세포에서 매우 낮은 발현을 제시하였다 (도 1k). 일부 추가의 효과, 예를 들어 miRNA 표적을 갖지 않는 벡터에 비해 HuH-7 세포에서 T424 표적을 보유하는 벡터로 수득된 출력 발현의 감소가 명백하며, 이는 네이키드 DNA 카세트로 관찰된 감소보다 훨씬 더 강하다.
2개의 miRNA 표적 (T424 또는 T126) 중 어느 것이 생체내에서 더 양호할 것인지 예비 정보를 얻기 위해, 이들 중 어느 것이 핵심적인 보호 기능을 수행할 (즉, HCC 세포 및 건강한 간세포 사이의 식별을 가능하게 할) 것인지를 평가하기 위한 실험을 디자인하였다. 1차 마우스 간세포를 시험관내 배양을 위해 단리하였다. 1차 간세포 및 HCC 세포를 miR-424, miR-126 뿐만 아니라 miR-122에 대한 AAV-DJ 패키징된 유전자 리포터 (Dastor et al., 2018), 즉, 생체내에서 간에서 유전자 발현을 효과적으로 끄는 것으로 제시되었고 (Dastor et al., 2018; Della Peruta et al., 2015), HCC 종양의 하위세트에서 하향조절되는 것으로 알려진 (Coulouarn et al., 2009) 공지된 간 miRNA로 형질도입하였다. 이 시험의 결과 (도 1l)는 놀랍게도, 간에서 miR-424 및 miR-126의 높은 발현 카운트가 간세포에서 높은 생물학적 넉-다운 활성으로 번역되지 않았음을 제시한다. miR-122만이 일관되게 활성이었다. miR-122는 HepG2 세포주에서 불활성이었지만, 이는 HuH-7 세포주에서 부분적 활성을 나타내었으며, 이는 이 miRNA 표적의 포함이 HCC 종양의 하위세트에 대해 유익할 것이지만, 이들 모두에 대해 그렇지는 않음을 시사한다. 이 사실에도 불구하고, 회로를 파일럿 실험 설정에서 그의 특이성 및 항종양 잠재성에 대해 miR-122로 추가로 조사하였다. 상이한 miRNA 표적 배열의 영향을 또한 시험하여 그들의 수가 얼마나 miRNA 입력의 존재 하에서 전체 출력 억제에 영향을 미치는지 평가하였다. 4개의 상이한 카세트를 시험하였으며, 표적의 수를 증가시키고, 출력 및 PIT 3'-UTR 둘 다에서 표적을 정치하는 것은 억제를 증가시킴이 밝혀졌다 (도 1m-1n). 이는 2가지 방식으로 사용될 수 있는 또 다른 마디를 제공한다: 비-표적 세포에서 출력의 넉다운을 증가시키지만, 또한 miRNA 입력의 부분적 수준을 발현하는 표적 세포에서 넉다운을 감소시키는 것.
실시예 2. 번역 맥락에서의 제1 HCC-표적화 회로 변이체의 초기 평가.
리포터 조사에 기반하여, miR-122 표적을 보유하는 회로 변이체를 구축하였다. PIT::VP16 활성인자 변이체를 그의 보다 낮은 DNA 탑재물 및 출력 유전자에 대한 증가된 이용가능한 풋프린트로 인하여 사용하였다. mCherry 출력을 갖는 회로, 더빙된 HCC.V1-mCherry를 DJ-위형화된 AAV 벡터 내로 패키징하고, HCC 세포주를 1차 뮤린 간세포로부터 식별하는 그의 능력에 있어서 재-시험하였다. 데이터는 전체 회로가 1차 간세포에 비해 HepG2 및 Hep3B 세포주에서 고도로 특이적 발현을 생성하는 반면, HuH-7에서 회로는 이들 세포주에서 miR-122의 중간 활성으로 인하여 감소된 출력을 생성함을 강조한다 (도 2a). 따라서, 이 종양-표적화 프로그램을 NSG 마우스에서 HepG2 세포를 채용하는 동소성 이종이식편 종양 모델의 맥락에서 파일럿 실험에서 평가하였다. 종양 확립 및 추적의 목적을 위해, HepG2 세포를 mCitrine 형광 단백질 및 반딧불이 루시페라제 유전자를 코딩하는 렌티바이러스 벡터로 안정하게 변형시키고, 균질한 mCitrine 발현에 대해 분류하였다. 종양을 1M HepG2-LC 세포의 비장 주사 및 후속 비장 절제에 의해 확립하였다.
생체내 실험 전에, 또 다른 음성 대조군 세포주로서 1차 간세포, HepG2 세포 및 HeLa 세포를 비교하는 시험관내 효능 시험을 수행하였다. HSV-TK 출력 유전자 및 더빙된 AAV-DJ-HCC.V1-HSV-TK를 보유하는 벡터는 현저한 구경꾼 효과를 갖는 세포독성을 유발하기 위해 전구약물로서 GCV를 요구한다 (Freeman et al., 1993). 데이터 (도 2b)는 사실, HepG2 세포는 회로 뿐만 아니라 대조군 구성적 벡터에 의해 선택적으로 제거된 반면, 1차 간세포 및 HeLa 세포는 구성적 벡터에 의해 제거되었지만, 회로-보유 벡터에 의해서는 영향을 받지 않았음을 제시하였다. 특히, 회로는 HepG2 세포를 구성적 대조군보다 더 잘 제거하였으며, 이는 비-맞춤 구성적 벡터에 비해 맞춤 TF 논리에 의해 유도된 높은 출력 발현의 중요성을 강조한다.
생체내에서 항종양 효능을 판단하기 위해, AAV-DJ-HCC.V1-HSV-TK를 3일 떨어진 2회의 연속적 주사에서 HepG2 종양 보유 마우스에게 전달하였다. 4개의 실험 그룹 (이 파일럿에서 n=2)은 GCV 요법과 조합으로 AAV-DJ-HCC.V1-HSV-TK (치료 부문), GCV를 갖지 않는 동일한 벡터 단독, GCV 요법으로 보충된 모의 주사, 및 모의 PBS 주사 및 GCV 없음을 포함하였다. 처리된 동물에서의 종양 진행의 라이브 영상화 (도 2c), 및 생물발광을 사용한 간에서의 총 종양 부담의 사후 분석 (도 2d-2e)은 HSV-TK 출력 및 GCV 요법과 조합으로 전체 회로 프로그램을 보유하는 유전자 요법 벡터가 강한 항종양 활성을 가지며, 이는 임의의 대조군 부문에서는 부재함을 명백하게 입증하였다. PBS 대조군 부문에서의 동물 중 하나에서의 낮은 종양 부담은 초기의 빈약한 종양 이식으로부터 초래되었고 (도 2f), 일반적으로 모든 3개의 대조군 부문은 동일하게 거동하여, 초기 부담에 비례하는 최종 종양 부담을 초래하였으며, 이는 종양 성장이 동일한 역학에 의해 지배되었음을 의미한다. 파일럿의 치료 부문에서의 동물은 자명한 이상치이며, 이는 치료가 종양 부담을 감소시키는데 효율적이었다는 또 다른 증거를 제공한다.
실시예 3. 보다 높은 특이성 및 보다 폭넓은 범위를 갖는 종양-표적화 프로그램의 조작.
파일럿 실험의 결과에 의해 고무되어, 종양 표적화 프로그램을 변형시키고 병행하여 시험관내에서 및 생체내에서 회로 작용의 메커니즘의 보다 철저한 평가를 수행하는 것을 추구하였다. SOX9/10 및 HNF1A/B 입력의 조합은 발현을 간 및 간 종양에 제한하는 양호한 시작점인 것으로 가설화되었지만, 생체내에서 miR-122 활성에 대한 이전의 데이터는 그의 활성이 간에 제한되었음을 제시하였고 (Dastor et al., 2018), 따라서 모든 다른 기관에 대해 회로의 TF-단독 구성요소에 의존해야 할 것이었는데, 이는 폭넓은 기관 특이성을 갖는 벡터 캡시드가 사용될 경우 문제가 될 수 있다. 추가로, miR-122는 일부 HCC 하위유형으로부터 건강한 간세포를 분리하는 양호한 분류 마커이지만, 이는 보편적인 HCC 특색은 아니다. 따라서, 검색은 간 대 간 종양의 보다 폭넓은 분류 능력을 가능하게 할 뿐만 아니라 추가의 기관을 보호할 수 있는 miRNA 입력에 초점을 맞추었다. 이 검색에 대한 기원점은 1) 이전에 수득된 miRNA 프로파일링 데이터세트 (Dastor et al., 2018) 및 2) 상이한 기관에서의 고도로-발현된 마이크로RNA에 대한 광범위한 문헌 분석이었다. HuH-7 세포 및 건강한 간세포를 보다 앞선 실험에서 프로파일링하였으며, 간세포에서 고도로 발현되지만 HuH-7 세포에서는 하향조절된 miRNA를 확인하기 위한 시도가 먼저 이루어졌다 (도 3a). NGS 프로파일링 데이터세트에서의 카운트 비에 기반하여 선택된 miRNA 세트는 miR-122 (참조물로서), miR-424, miR-126-5p, miR-22, miR-26b 및 let-7c를 포함하였다. 양방향성 miRNA 리포터 (Dastor et al., 2018)를 구축하고, AAV-DJ 벡터 내로 패키징하여, 시험관내에서 1차 간세포에 대한 높은 전달 효율을 보장하였다 (도 3b). miRNA 후보의 생물학적 활성을 HuH-7, HepG2, 및 1차 단리된 뮤린 간세포에서 측정하였다. 시험된 miRNA 중에서, let-7c는 가장 높은 차등적 활성을 나타내었으며; 더욱이, 이는 HuH-7 및 HepG2 세포 둘 다에서 하향조절되었다 (도 3c). 흥미롭게도, NGS 카운트를 생물학적 활성과 비교하는 소급적 분석 (도 3d)은 매우 표면적인 상관관계만을 제시하며, 이는 후보 입력의 기능적 시험의 중요성을 강조한다.
문헌 검색 및 잠재적 기관-보호 miRNA에 대한 프로파일링 데이터세트의 조사는 miRNA의 세트를 초래하였다: miR-424 (신장 및 다른 기관), miR-208a 및 miR-208 (심장), miR-216A, miR-217, 및 miR-375 (췌장). 시험관내 스크리닝 작전에 기반하여 발견된 간 보호르 위한 후보인 Let-7c는 이 목록에 첨가되었다. 이들 miRNA의 각각에 대해, 양방향성 리포터를 조작하고, 그의 폭넓은 생체분포로 인하여 선택된 B1-위형화된 AAV 벡터 (Choudhury et al., 2016)에서 패키징하였다. 짐작건대 중성 miRNA 표적 ("TFF5")을 보유하는 대조군 벡터를 제조하였다. (그러나, 데이터가 밝혀낸 바와 같이, 이 표적은 적어도 일부 기관에서 miRNA 입력에 대해 반응하고 있었음.) 벡터를 건강한 마우스 내로 전신적으로 주사하고, 리포터 발현을 주사 후 3주에 다양한 기관에서 평가하였다. 강한 생체분포가 간, 췌장, 심장 및 신장에서 발견되었으며, 분석은 이들 기관에 초점이 맞추어졌다. Let-7c는 생체내에서 건강한 간-특이적 입력으로서 잠재성을 나타낸 세트로부터의 유일한 miRNA였다. 생체내에서 췌장에서, miR-217 및 miR-375 둘 다는 문헌으로부터 예상된 바와 같은 활성을 나타내었지만; let-7c는 가장 강한 반응을 가졌다. 심장에서, miR-208a 및 miR-208b는 사전 데이터와 일치하는 활성을 나타내었지만, 다시 let-7c는 가장 강한 반응을 가졌다. 마지막으로, miR-424는 예상된 바와 같이 신장에서 활성이었지만, 이 기관에서 또한 let-7c는 가장 강한 효과를 제공하였다 (도 3ef).
요약하면, 시험관내 및 생체내 데이터의 조합은 이 연구의 목적을 위해, let-7c가 한꺼번에 및 동시에 다수의 기관에 대한 보호적 miRNA 입력의 역할을 하고, 종양 연구에 사용된 둘 다의 HCC 세포주에서 강하게 하향조절되는 "보편적인" 입력으로서 역할을 할 수 있음을 제시하였다. 따라서, 회로의 다음 반복, 더빙된 HCC.V2는 프로그램 "SOX9/10 AND HNF1A/B AND NOT(let-7c)"를 실행한다.
실시예 4. 시험관내에서의 및 생체내에서의 작용의 메커니즘.
시험관내에서의 세포 형질도입을 위한 효율적인 비히클로서 AAV-DJ 캡시드, 및 생체내에서의 폭넓은 생체분포를 갖는 캡시드로서 AAV-B1을 사용하여, AAV-패키징된 회로의 광범위한 기계론적 연구를 수행하였다. 연구에서 보다 먼저, 논리 프로그램을 분석하고, 회로-운반 플라스미드 DNA를 임의의 입력을 발현하지 않는 배경 세포주 내로 형질감염시키고; 이어서 결과를 예상과 비교하는 모든 가능한 입력 조합의 체계적 이소성 발현에 의해 확인하였다. 바이러스 벡터의 경우, 이 전략은 더 이상 유효하지 않은데, 이는 회로 자체가 AAV 형질도입을 통해 전달되는 경우 개별적 이소성 입력을 공동-전달하는 것이 거의 불가능하기 때문이다. 사실, 보다 흥미로운 질문은 어떻게 벡터가 내인적으로 발현된 입력에 반응하는가 하는 것인데, 이는 요법의 맥락에서 세포 분류가 내인성 입력에 의존하고, 그에 적당하게 반응해야 하기 때문이다. 따라서, 메커니즘의 증거는 세포 유형에서의 전체 회로의 출력이 이들 세포에서의 개별적 회로 입력의 활성 및 회로의 논리 프로그램과 일치하는지 여부의 질문을 포함한다.
따라서, 개별적 유전자 센서를 생성하고, 모든 회로 입력 (SOX9/10 및 HNF1A/B 피드백-증폭된 센서에 대해 각각 AAV-DJ.C.SOX-FB.mCherry 및 AAV-DJ.C.HNF1-FB.mCherry); let-7c 센서 (AAV-DJ.C.let-7c.mCherry); AND 게이트만을 실행하는 부분적 회로 (AAV-DJ.C.TF-AND.mCherry); 전체 회로 (AAV-DJ.HCC.V2.mCherry); 및 참조물로서 역할을 하는 구성적 리포터 (AAV-DJ.C.CMV.mCherry)에 대해 AAV-DJ 내로 패키징하였다 (도 4a). 이들 구축물의 출력을 10개의 세포주 및 1차 간세포에서 측정하였다. 결과 (도 4b-4c)는 다중 입력 회로의 반응이 개별적 입력의 발현과 일치함을 제시하며, 이는 작용의 메커니즘이 플라스미드-기반 및 바이러스 벡터-패키징된 시스템 사이에 보존됨을 확인시켜 준다. SOX9/10 및 HNF1A/B에 대한 둘 다의 개별적 센서의 강한 반응은 TF-AND 게이트의 높은 반응을 촉발시키는데 필요하고; TF-AND 게이트의 강한 반응 및 let-7c 센서의 반응의 결여는 완전한 프로그램의 높은 출력을 달성하는데 요구된다.
생체내 특징규명을 위해, 각각 구성적 대조군 AAV-B1.C.CMV.mCherry, TF-단독 AND 게이트 AAV-B1.C.TF-AND.mCherry, let-7c 리포터 AAV-B1.C.let-7c.mCherry, 및 전체 회로 AAV-B1.HCC.V2.mCherry를 패키징하고, 출력으로서 mCherry를 발현하는 B1-위형화된 벡터를 마우스 꼬리 정맥 내로 전신적으로 주사하고, mCherry 발현을 주사 후 3주에 다양한 기관에서 평가하였다. 발현을 신선한 기관 슬라이스에서 화상 프로세싱에 의해 정량화하였다. 결과 (도 5a-5b)는 다수의 입력의 복잡한 상승작용적 작용 및 상이한 기관에서의 그들의 다양한 역할을 강조한다. 간에서, AND-게이트는 구성적 대조군에 비해 양성 세포의 수의 감소를 초래하였지만, 양성 발현을 나타낸 세포 상의 상승된 발현을 초래하였다. let-7c 리포터는 대조군에 비해 감소된 발현을 나타내었지만, 잔류 발현은 명백하게 배경 초과였다. 완전한 회로는 배경으로부터 사실상 구별불가능한 발현을 초래하였다. 췌장에서, AND 게이트-제어된 발현 및 let-7c 제어된 발현은 출력 발현의 큰 감소를 발생시켰지만, 각각의 경우 발현은 배경 초과였다. 간에서와 같이, 완전한 표적화 프로그램은 배경 초과의 임의의 검출가능한 발현을 생성하지 않았다. 심장에서, AND 게이트 또는 let-7c 중 어느 하나는 그 자신 상의, 및 완전한 회로에서 조합되는 경우 배경-수준 발현을 제공하였다. 신장에서, AND 게이트도 let-7c 조절도 발현을 배경으로 하향시키지 않은 반면, 완전한 프로그램은 그러하다는 점에서, 상황은 췌장과 유사하다. 요약하면, 데이터세트는 다중-입력 논리 회로가 생체내에서 건강한 기관으로부터의 고도로 효율적인 탈-표적화를 달성하는데 요구된다는 가설을 강하게 지지하며; 논리 프로그램 "SOX9/10 AND HNF1A/B AND NOT(let-7c)"에 의해 추상화된 바와 같이, 다수의 입력의 상승작용적 효과가 4가지 경우 중 3가지에서 명백하다. 이어서 동일한 프로그램이 생체내에서 종양을 효율적으로 표적화할 수 있는지를 결정하기 위한 실험을 디자인하고, mCherry 출력을 갖는 B1-유형 AAV-B1.HCC.V2.mCherry 회로를 종양-보유 NSG 마우스에게 주사하였다. 데이터 (도 5c)는 도 5a-5b에서의 데이터와 일치하게, 사실, 종양은 생체내에서 특이적으로 및 효율적으로 표적화되는 반면, 다른 기관은 출력을 발현하지 않음을 제시한다.
실시예 5. 시험관내에서의 및 생체내에서의 항종양 효능.
회로 프로그램은 생체내에서 우수한 종양-특이적 발현 및 주요 기관으로부터의 탈-표적화를 제시하였기 때문에, 그의 항종양 활성의 상세한 평가를 기준점 항종양 작동인자로서 전구약물 간시클로비르와 조합으로 HSV-TK 효소를 사용하여 수행하였다. 회로는 더빙된 HCC.V2-HSV-TK였다. 시험을 파일럿 실험 (도 2)과 유사하지만, 보다 큰 동물 그룹 및 연장된 수의 실험 부문을 갖는 라인에 따라 수행하였다. 구성적 대조군 및 완전한 회로를 포함하는 DJ-위형화된 벡터를 제조하고, 간시클로비르에 대한 그들의 용량-반응을 HuH-7, HepG2, 및 HeLa 세포주에서 및 시험관내에서 배양된 1차 간세포에서 평가하였다. 예상된 바와 같이, Huh-7 및 HepG2 세포는 구성적 벡터 및 회로 AAV-DJ.HCC.V2-HSV-TK에 의해 동등하게 표적화된 반면, HeLa 음성 대조군 세포 및 1차 간세포 둘 다는 구성적 벡터에 대해 민감하였지만 완전히 제공된 회로에 의해서는 제거되지 않았다 (도 6a). 추가로, AAV-DJ.HCC.V2-HSV-TK는 HuH-7 세포에서, 이들 세포에서 하향조절되지 않는 let-7c 센서의 사용으로 인하여 AAV-DJ.HCC.V1-HSV-TK보다 더 강력하다. 그러나, AAV-DJ.HCC.V1-HSV-TK는 miR-122에 의한 불완전한 셧-다운으로 인하여 HuH-7 세포에서 여 전히 활성이었다 (도 6b).
다음으로, 회로를 갖는 DJ-위형화된 AAV 벡터를 HepG2-LC 종양-보유 마우스에게 전신적으로 전달하였다 (도 7a). 간시클로비르를 갖지 않는 실험 부문은 모의 주사 (염수); TF-AND 프로그램을 코딩하는 벡터 AAV-DJ.C.TF-AND-HSV-TK; 및 전체 회로 AAV-DJ.HCC.V2-HSV-TK를 코딩하는 벡터를 포함하였다. 간시클로비르를 갖는 부문은 벡터 또는 모의의 꼬리 정맥 전달, 이어서 간시클로비르 주사의 요법에 관하여 상기 부분을 반영하였으며; 즉: 모의 주사 + GCV; AND-게이트 회로 + GCV; 및 완전한 회로 + GCV를 포함하였다. 동물 (부문 당 n=4)을 생체내 생물발광을 사용하여 그들의 종양 부담에 대해, 및 점수 시트 기준을 사용하여 그들의 안녕에 대해 추적하였다. 데이터 (도 7b-7f)는 HSV-TK 출력이 제공되고 GCV 요법으로 보충된 전체 HCC.V2-HSV-TK 프로그램을 갖는 벡터로 처리된 마우스가 강건하고 재현가능한 봉쇄 및 이어서 그들의 종양 부담의 퇴행을 나타내는 반면, GCV를 갖지 않는 대조군 그룹, 또는 GCV로만 주사된 그룹은 시간 경과에 따라 지수적인 종양 부담 증가를 나타냄을 지시한다. HSV-TK 출력을 갖는 AND 게이트를 코딩하는 벡터, AAV-DJ-C.TF-AND-HSV-TK는 AAV-DJ.HCC.V2-HSV-TK에 비해 유사한 항종양 효과를 나타내었지만, 또한 강한 유해 효과를 촉발시켰으며, 따라서 이 부문에서의 동물은 예정된 완결 전에 안락사되어야 했다. 한편, 완전한 AAV-DJ.HCC.V2-HSV-TK 회로로 처리된 부문은 자명한 유해 효과 없이 종양 부담의 연장된 감소를 나타내었다. 이들 결과는 생체내에서의 표적화 특이성 (도 5a-5d) 및 생체내에서의 유해 효과의 규모 사이의 긴밀한 연관을 명백하게 예시한다. 따라서, 장래에 형광 출력 발현으로부터 판단된 바와 같은 종양의 외부의 출력 발현의 존재는 기능적 출력을 갖는 그들의 독성에 대해 평가될 필요가 없는 사전-스크리닝 단계를 구성할 것이다.
실시예 6. AAV-B1 및 AAV-DJ 위형 회로 유도된 HCC 표적화의 생체내 비교.
B1-유형 AAV 캡시드에 대해 관찰된 폭넓은 향성 및 강한 생체내 형질도입 및 유전자 발현을 HCC.V2 프로그램의 제어 하에 놓음으로 달성된 광범위한 다중-기관 탈표적화를 고려하여, 생성된 B1-유형 AAV-B1.HCC.V2 회로는 선택성을 손상시키지 않으면서 높은 종양 형질도입을 생성할 수 있다고 판단되었다. 이 가능성을 조사하기 위해, AAV-B1.HCC.V2-mCherry 전체 회로 출력이 이전의 효능 연구에 사용된 DJ 캡시드 대신 B1 캡시드를 사용하여 전달되는 경우 회로 출력 (mCherry)을 비교하였다. 데이터 (도 8a)는 동일한 투여량으로 투여되는 경우, B1 유형 회로가 이웃하는 간 조직에 대한 그의 선택성을 유지하면서 모든 DJ 변이체 (AAV-DJ.HCC.V2.mCherry, TF-단독 AND 게이트 AAV-DJ.C.TF-AND.mCherry 또는 AAV-DJ.C.CMV.mCherry)의 종양 발현 수준을 크게 능가함을 제시한다. 종양내 출력 발현은 약 40배 더 높았으며 (도 8b), 심지어 큰 종양 결절의 코어 섹션에서도 강한 형광을 초래하였다. 종양 침투와 조합된 강한 선택적 발현은 HCC 유전자 요법에 대한 유망한 후보로서 B1-유형 캡시드에 결합된 회로 표적화를 시사한다.
실시예 7. miR-let-7c 및 miR-122의 조합.
시험관내 효능 데이터는 HCC.V1이 심지어 높은 투여량에서도 간세포를 완전히 보호하는 반면 (도 2b), 동일한 프로그램은 HCC.V2와 비교할 경우 HUH-7 세포 살해 효율의 부분적 감소만을 나타내며 (도 5b), 높은 바이러스 투여량에 대해 거의 필적하는 성능을 초래함을 제시한다. 이 차이는 HUH-7 세포에 비해 간세포에서 관찰된 보다 견고한 유전자 억제와 일치한다 (도 2a).
본원에서 확립된 바와 같이, miR-122 표적의 수 및 배열의 변화는 억제 강도를 조정하여 상이한 miR-122 수준을 갖는 세포주에서 상이한 발현 수준을 초래하는데 사용될 수 있다 (도 1m). 표적 수, 배열의 변화를 통한, 또는 불완전하게 상보적인 표적의 사용을 통한 miR-122 억제 효율의 감소는 간 탈표적화의 부분적 감소의 위험에도, (심지어 보다 낮은 바이러스 투여량에서도) HUH-7에서의 회로 효능을 증가시키는데 사용될 수 있다고 가설화되었다.
이들 데이터로부터, 보다 약한 miR-122 억제를 갖는 HCC.V2로부터의 miR-Let7c 표적을 조합하는 HCC.V3 회로 (도 9a)는 HCC.V3 회로 및 HCC.V2 회로 둘 다를 능가할 것으로 예상된다. miR-122에 의해 유발된 억제 강도는 T-122 표적의 수 및 위치화를 변화시킴으로써, 불완전하게 상보적인 표적을 도입함으로써 또는 2가지 접근법의 조합에 의해 조정될 수 있다. 불완전하게 상보적인 표적은 miRNA 시드 서열을 플랭킹하는 서열에서 무작위 돌연변이를 도입함으로써 또는 miRNA에 의해 조절되는 유전자의 보존된 3' UTR로부터 유래된 miR-122 표적을 사용함으로써 수득될 수 있다 (도 9b). HCC 세포 (특히 HUH-7)에 대한 간 보호 및 효능의 목적하는 조합을 최대화하는 후보가 선택될 수 있다.
HCC.V3은 주요 기관 (Let-7c)으로부터의 일반화된 miRNA 탈표적화를 나타내고, HepG2 및 HUH-7 둘 다에서 그의 효능의 유의한 감소 없이 간에서 조합된 보호 (Let7c 및 miR-122)로부터 이익을 얻을 것으로 예상된다. 대부분의 바이러스 벡터에 대한 가장 높은 생체분포를 갖는 기관이므로, 가장 견고한 가능한 간 탈표적화를 달성하는 것은 특히 바람직하며, 치료 창의 추가의 증가를 초래할 수 있다.
실시예 8. 논의.
본 개시내용은 논리 유전자 회로 접근법의 임상적 번역에 대한 길을 제시한다. 3가지 기저의 기둥이 이러한 번역을 지지하는데 필요하며, 즉: (1) 질환의 분자 구성의 지식; (2) 이 지식을 이용하는 것을 가능하게 하는 플랫폼의 이용가능성; 및 (3) 이 플랫폼의 임상적으로 관련된 치료 양상으로의 번역가능성은 함께 모여 유망한 시험관내 및 생체내 효능 및 안전성 프로파일을 갖는 실행가능한 치료 후보를 전달한다. 본원에 기재된 광범위한 기계론적 특징규명은 그의 개별적 구성요소에 비해, 체계적인 절차에 따라 합리적인 상향식 방식으로 구축된 다중-입력 세포 분류기의 고유한 특성을 강조한다. 중요하게는, 리포터 출력에 의해 판단된 바와 같은 표적화 특이성은 생체내에서 효능 및 유해 효과 둘 다와 긴밀하게 상관됨이 본원에서 입증된다.
특이적 발현 및 치료 제어의 다른 양상, 예컨대 시기 및 투여량은 암에 대한 뿐만 아니라 다른 적응증에 대한 유전자 요법의 차기 첨단분야이다. 우선적 조직 표적화, 뿐만 아니라 특이적 조직 발현을 위한 프로모터 요소를 갖는 신규 캡시드의 개발에 많은 노력이 투자되었다. 특히, 둘 다의 연구는 큰 라이브러리의 광범위한 스크리닝에 의존하고, 이들은 성공을 보장하지 않으며; 더욱이, 특이성의 주장은 카운터 샘플의 큰 패널의 존재 하에서만 이루어질 수 있다. 인간 요법을 위해, 이들 샘플은 인간 기원의 것이어야 한다. 인간 조직의 큰 다양성으로 인하여, 캡시드 및/또는 프로모터 스크린에 대한 큰 라이브러리 크기에 중첩되어, 이 노력을 엄청나게 복잡하게 만들 것이다. 본원에 기재된 상향식 접근법은 다수의 개별적 입력으로부터 조합적 특이성을 생성하는 합리적인 디자인을 사용한다. 프로파일링에 의한 후보 입력 공간을 좁히는 것은 복잡한 프로그램의 조작을 합리적인 전방향 디자인 배경에 대한 이질적 세포 집단 (Huh-7 및 HepG2 세포의 본 발명자들의 예에서와 같이)을 다루는 것을 가능하게 한다. 이 접근법은 표적화된 캡시드 또는 특이적 프로모터의 사용을 배제하지 않는다: 이들은 필요에 따라 적용될 수 있다. 그러나, 파종성 질환, 예컨대 암에 대해, 폭넓은 향성 캡시드는 우선적일 수 있으며; 특이적 발현의 부담은 이어서 요법의 유전자 탑재물에서 코딩되는 분류된 프로그램으로 이동된다. 다른 경우, 캡시드 특이성 및 분류기 프로그램은 가장 양호한 목적하는 효과를 달성하기 위해 상승작용적으로 사용될 수 있다.
간에서의 큰 다초점성 종양의 효율적인 침투는 단일 전신 주사 후 생체내에서 달성되었으며 (도 5c-5d 및 도 8a-8c), 이는 심지어 단일 주사도 탑재물을 파종성 및 잘-혈관화된 종양, 예컨대 HCC에 전달할 수 있다는 강한 증거를 제공한다. 구경꾼 효과를 갖는 출력은 이어서 이들 종양을 효율적으로 치료할 수 있다.
실시예 9. 실시예 1-8에 대한 재료 및 방법.
세포주: HuH-7 세포를 일본 보건 과학 재단(Japan Health Sciences Foundation)의 보건 과학 연구 자원(Health Science Research Resources) 은행 (Cat-# JCRB0403)으로부터 구입하고, 37 ℃, 5% CO2에서 10% FBS (시그마-알드리치(Sigma-Aldrich), Cat #F9665 또는 라이프 테크놀로지스(Life technologies), Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM, 저 글루코스, 글루타맥스(GlutaMAX) (라이프 테크놀로지스, Cat #21885-025)에서 배양하였다. Hep G2 세포를 ATCC (Cat# HB-8065)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 RPMI (깁코(Gibco) A10491-01)에서 배양하였다. HeLa 세포를 ATCC (Cat # CCL-2)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM, 고 글루코스 (라이프 테크놀로지스, Cat #41966)에서 배양하였다. Hep3B 세포를 ATCC (Cat# HB-8064)로부터 구입하고, 37 ℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM, 저 글루코스, 글루타맥스 (라이프 테크놀로지스, Cat #21885-025)에서 배양하였다. HCT-116 세포를 도이체 잠룽 폰 미크로오르가니스멘 운드 첼쿨투렌(Deutsche Sammlung Von Microorganismen and Zellkulturen) (DMZ), DMZ No ACC-581로부터 구입하고, 37 ℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. SW-620 세포를 ATCC (Cat # CCL-227)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. LoVo 세포를 ATCC (Cat # CCL-229)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. A549 세포를 ATCC (Cat # CCL-185)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. SH4 세포를 ATCC (Cat # CCL-185)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. IGROV1 세포는 NCI-60 패널의 일부이며, NCI (NIH)에 의해 수득하였다. 세포를 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 RPMI (깁코 A10491-01)에서 배양하였다.
루시페라제 및 mCitrine 안정한 세포주 (HepG2 LC)의 생성: mCitrine 및 루시페라제를 안정하게 발현하는 HepG2 세포주 (HepG2 LC)를 AAVS 로커스의 TALEN 편집을 통해 생성하였다. 4x105개의 HepG2 세포를 6-웰 플레이트에 시딩하고, 24시간 후에 리포펙타민 2000을 갖는 총 2 μg DNA로 형질감염시켰다. 형질감염 믹스는 하기와 같이 구성되었다: EF1A 프로모터 (pIK014)의 제어 하에서 500 ng hAAVS1 1L TALEN (pIK11), 500 ng hAAVS1 1R TALEN (pIK12) 및 1 μg의 루시페라제 2A Citrine. 형질전환된 세포를 확장시키고, 일시적 형질감염으로부터 발생하는 발현을 희석하기 위해 3주 동안 배양에서 유지하였다. 3주 후, mCitrine+ 벌크 집단 (< 1%)을 BD FACS 아리아(Aria) III을 사용하여 분류하였다. 생성된 20,000개의 세포를 초기 회수를 촉진하기 위해 제1 주 동안 20% FBS로 보충된 RPMI에서 24-웰 플레이트에 시딩하였다. 세포를 2주 동안 배양하고 확장시켜 안정한 트랜스진 발현을 갖는 세포에 대해 선택하고 침묵인 경향이 있는 클론을 회피하였다. 단일 mCitrine+ 클론을 96-웰 플레이트에서 분류하고, 20% FBS로 보충된 RPMI에서 배양하고, 확장시켰다. 3개의 상이한 고 발현 클론을 선택하고, 가장 양호한 것을 연속적 실험에 사용하였다. 클론의 생물발광을 포톤이미저(PhotonIMAGER) RT (바이오스페이스 래보러토리즈(Biospace Laboratories))를 사용하여 5분 동안 측정하여 루시페라제 발현을 확인하였다.
바이러스 벡터 플라스미드 및 바이러스 생성: 단일-가닥 (ss) AAV 벡터를 이전에 기재된 바와 같이 생성하고 정제하였다 (Paterna 2004, Conway 1999). 간략하게, 시미안 바이러스 대형 T-항원 (293T)을 발현하는 인간 배아 신장 세포 (HEK293)를 폴리에틸렌이민 (PEI)-매개 AAV 벡터 플라스미드 (패키징될 AAV 벡터 게놈을 제공함), AAV 헬퍼 플라스미드 (관심의 AAV 혈청형의 AAV 혈청형 2 rep 단백질 및 cap 단백질을 제공함) 및 아데노바이러스 (AV) 헬퍼 플라스미드 pBS-E2A-VA-E4 (Glatzel 2000)로 1:1:1 몰 비로 공동형질감염시켰다. 형질감염 후 96 내지 120시간에 HEK293T 세포를 수집하고, 저속 원심분리 (1500g/4 ℃에서 15분)에 의해 그들의 상청액으로부터 분리하였다. 상청액 내로 방출된 AAV 벡터를 PEG 8000 용액 (최종: 8% v/v) 및 NaCl (최종: 0.5 M)을 첨가함으로써 4 ℃에서 밤새 PEG-침전시켰다. PEG-침전을 저속 원심분리 (3488g/4 ℃에서 60분)에 의해 완결하였다. 투명화된 상청액을 버리고, 펠릿화된 AAV 벡터를 AAV 현탁 완충제 (150 mM NaCl, 50 mM 트리스(Tris)-HCl, pH 8.5)에 재현탁시켰다. HEK293T 세포를 AAV 현탁 완충제에 재현탁시키고, 7 mL 연조직 균질화 CK14 튜브와 조합으로 베르틴 미닐리스 균질화기(Bertin's Minilys Homogenizer)에 의해 용해시켰다 (5000 rpm/RT에서 2회의 1분 사이클, -20 ℃에서 >4분 냉각에 의해 일시멈춤). 조 세포 용해물을 비트뉴클레아제(BitNuclease) 엔도뉴클레아제 (75 U/mL, 37 ℃에서 30 내지 90분)로 처리하고, 원심분리 (17000g/4 ℃에서 10분)에 의해 투명화하였다. PEG-펠릿화된 AAV 벡터를 투명화된 용해물과 합하고, 불연속적 밀도 아이오딕산올 (옵티프렙(OptiPrep), 액시스-쉴드(Axis-Shield)) 구배 (등밀도) 초원심분리 (365929g/15 ℃에서 2시간 15분)로 처리하였다. 이어서, 아이오딕산올을 비바스핀(Vivaspin) 20 한외여과 장치 (100000 MWCO, PES 막, 사르토리우스(Sartorius)) 및 1 mM MgCl2 및 2.5 mM KCl로 보충된 1x 포스페이트 완충 염수 (PBS)를 사용하여 제조업체의 지시서에 따라 투석여과 (한외여과)의 3 라운드에 의해 AAV 벡터 함유 분획으로부터 제거하였다. AAV 벡터를 저장하고, -80 ℃에서 분취하였다. 캡시드화된 바이러스 벡터 게놈 (vg)을 큐빗(Qubit) dsDNA HS 검정 키트와 조합으로 큐빗 3.0 형광계 (둘 다 라이프 테크놀로지스)를 사용하여 정량화하였다. 간략하게, 5 μL의 비희석된 (또는 1:10 희석된) AAV 벡터를 중복으로 제조하였다. 하나의 샘플을 열-변성시키고 (95 ℃에서 5분), 비처리된 및 열-변성된 샘플을 제조업체의 지시서에 따라 정량화하였다. 바이러스외 (비캡시드화된; 비처리된 샘플)를 총 바이러스내 및 바이러스외 (캡시드화된 및 비캡시드화된; 열-변성된 샘플)로부터 차감함으로써 바이러스내 (캡시드화된) vg/mL를 계산하였다.
생체내 주사를 위한 세포 제조: HepG2 LC 세포를 배양하고, T-75 또는 T-150 플라스크에서 70-80% 전면생장률까지 계대하였다. 생체내 주사를 위해 본 발명자들은 리포터 유전자의 침묵화를 최소화하기 위해 낮은 계대 수 (계대 12 이하)를 갖는 세포를 사용하였다. 성장 배지를 제거하고, PBS (T-75에 대해 10 ml 또는 T-150에 대해 20ml)로 세척하고, 세포를 트립신 (깁코, 25200056) (T-75에 대해 2ml 또는 T-150 플라스크에 대해 6ml)으로 37 ℃에서 5분 동안 해리함으로써 세포를 분리하였다. 세포 현탁액을 8 mL (T-75) 또는 24 ml (T-150)의 PBS로 희석하고, 피펫팅에 의해 부드럽게 재현탁시키고, 이어서 100 μm 필터를 사용하여 50ml 팔콘(Falcon) 튜브에서 여과하여 단일 세포 현탁액을 수득하였다. 추가의 PBS를 사용하여 필터 10ml (T-75) 또는 T-150에 대해 20 ml를 세척하고, 세포를 20 ml (T-75) 또는 50 ml (T-150)의 총 부피로 추가로 희석하였다. 세포 현탁액을 498 rpm에서 4 ℃에서 9분 동안 원심분리하였다. 세포 펠릿을 20 ml의 PBS로 세척하고, 498 rpm에서 4 ℃에서 6분 동안 2회 더 원심분리하여 트립신의 임의의 자취를 제거하였다. 실험에 필요한 세포의 수에 따라 절차를 하나 이상의 플라스크 및 튜브로 수행한다. 각각의 펠릿을 소량의 PBS (각각의 펠릿에 대해 250-300ul)에 재현탁시키고, 작은 분취물을 뉴바우어(Neubauer) 챔버 및 트리판 블루를 사용하여 살아 있는 세포의 수동 카운팅을 위해 희석한다 (1:50 및 1:100). 적어도 4개의 독립적 카운트를 세포 현탁액당 취하고, 평균 값을 사용하여 주사될 세포의 수를 결정하였다. 세포 현탁액을 현미경 하에서 육안으로 검사하여 큰 무리의 부재를 확인하였다. 마지막에 부피를 PBS로 약 2x 107개의 세포/mL로 조정하였다. 세포 현탁액을 수술의 지속기간 동안 얼음 상에서 유지하였으며, 높은 세포 농도를 고려하여 세포는 각각의 주사 전에 재현탁을 요구한다. 조작을 최소화하고 생존율을 개선시키기 위해, 세포를 다수의 스톡 (2-3개의 튜브)에서 나눈다. 본 발명자들은 세포 무리의 존재 및 잔류 트립신 또는 다른 세포-해리 시약의 존재 둘 다가 독성이며 잠재적으로 동물의 생명을 위협함을 주목한다.
이종이식편 마우스 간 마우스 모델: 모든 동물 절차는 스위스 연방법 및 아이드제노시쉐 테크니쉐 훽슐레(Eidgenossische Technische Hochschule)(ETH) 취리히의 기관 지침에 따라 수행하였으며, 바젤-슈타츠 주의 동물 윤리 위원회에 의해 승인되었다. 8 내지 10-주령 면역결핍성 NSG 마우스 (NOD.Cg-Prkdcscid Il2rgtm1Wjl /SzJ, 찰스 리버(Charles River), 독일 슐츠펠트)를 특이적-병원체-무함유 시설에서 하우징하였다. 인간 종양 세포로부터 유래된 마우스 간 종양을 생성하기 위해, NSG 마우스를 흡입용 이소플루란으로 마취시켰다. 무균 수술 기술을 사용하여, 1-1.5cm의 좌측 늑골하 절개를 행하고, 비장을 노출시켰다. 50μl PBS 중 105개의 HepG2 세포를 27-게이지 바늘을 사용하여 비장의 하엽 내로 주사하였다. 바늘의 제거 즉시, 비장의 하극을 결찰시켰다. 대다수의 세포가 콜로니화를 위해 간에 도달하기 위해 10-분 배수를 허용한 후, 주요 비장 혈관구조를 결찰시키고 비장을 제거하였다. 이어서 복부 절개를 봉합선으로 닫았다. 마우스에서의 종양 성장을 주당 2-3회 생물발광 영상화에 의해 모니터링하였다 (포톤이미저 RT, 바이오스페이스 랩).
리포터 AAV의 생체내 전달 및 형광 현미경검사 및 유동 세포계측법에 의한 유전자 발현 분석: 생체내에서 회로 출력 발현을 시각화하기 위해, mCherry 출력을 코딩하는 AAV의 2x1012개의 vg (바이러스 게놈) 또는 PBS를 종양 세포 이식 후 2주에 꼬리 정맥을 통해 단일 용량으로서 투여하였다. 3주 후, 마우스를 안락사시키고, 즉시 10 또는 25U/mL 헤파린 (시그마-알드리치)을 함유하는 50-70 mL HBSS로 경심장적으로 관류시켜 자가형광 적혈구를 제거하였다. 기관 및 조직 (간, 폐, 뇌, 췌장, 골격근, 심장 및 신장)을 수거하고, 신선한 조직 슬라이스를 제조하고, PBS에서 얼음 상에서 유지하였다. mCherry의 발현을 형광 현미경검사에 의해 즉시 분석하였다.
치료 AAV의 생체내 전달 및 전구약물 치료: 종양 세포 접종 후 2주에, 종양-보유 마우스를 먼저 생물발광 강도 (높음 대 낮음)에 의해 반영된 종양 부담에 기반하여 계층화하고, 이어서 그룹 중에서의 종양 부담 비교가능성을 보장하기 위해 다양한 치료 그룹으로 무작위화하였다. AAV-회로 구축물의 4x1012개의 vg (바이러스 게놈) 또는 PBS를 1주 떨어진 2회의 별개의 주사를 통해 정맥내로 투여하였다. 전구약물 GCV (50 mg/kg, 인비보젠(InvivoGen)) 또는 염수 처리를 제1 AAV 주사 후 제3일에 개시하고, 마우스를 2-주 지속기간 동안 일당 1회 복강내로 주사하였다. 종양 성장을 주당 2-3회 생물발광 영상화로 평가하였다. 마우스를 점수 시트로 모니터링하고, 종점이 달성된 경우 안락사시켰다. 모든 마우스는 14일의 전구약물 처리 후 종결되었다. 간을 종양 부담의 생체외 생물발광 영상화 분석을 위해 수거하였다. 종양 세포 접종 후 2주에, 종양-보유 마우스를 먼저 생물발광 강도 (높음 대 낮음)에 의해 반영된 종양 부담에 기반하여 계층화하고, 이어서 그룹 중에서의 종양 부담 비교가능성을 보장하기 위해 다양한 치료 그룹으로 무작위화하였다. AAV-회로 구축물의 4x1012개의 vg (바이러스 게놈) 또는 PBS를 1주 떨어진 2회의 별개의 주사를 통해 정맥내로 투여하였다. 전구약물 GCV (50 mg/kg, 인비보젠) 또는 염수 처리를 제1 AAV 주사 후 제3일에 개시하고, 마우스를 2-주 지속기간 동안 일당 1회 복강내로 주사하였다. 종양 성장을 주당 2-3회 생물발광 영상화로 평가하였다. 마우스를 점수 시트로 모니터링하고, 종점이 달성된 경우 안락사시켰다. 모든 마우스는 14일의 전구약물 처리 후 종결되었다. 간을 종양 부담의 생체외 생물발광 영상화 분석을 위해 수거하였다.
Figure pct00085
Figure pct00086
Figure pct00087
Figure pct00088
다른 실시양태
본 명세서에서 개시되는 모든 특색은 어떠한 조합으로도 조합될 수 있다. 본 명세서에서 개시되는 각각의 특색은 동일하거나, 등가이거나, 또는 유사한 목적에 기여하는 대안적인 특색에 의해 대체될 수 있다. 따라서, 명시적으로 달리 언급되지 않는 한, 개시되는 각각의 특색은 일반적인 일련의 등가이거나 유사한 특색의 예일 뿐이다.
관련 기술분야의 통상의 기술자라면, 상기 상세한 설명으로부터 본 개시내용의 본질적인 특징을 용이하게 확인할 수 있으며, 그의 취지 및 범주에서 벗어나지 않고도 다양한 용도 및 조건에 그를 적합화하기 위하여 개시내용의 다양한 변화 및 변형을 만들어 낼 수 있다. 따라서, 다른 실시양태가 또한 청구범위에 속하는 것이다.
등가물
본원에서 여러 발명 실시양태가 기재되고 예시되기는 하였지만, 관련 기술분야의 통상의 기술자라면, 본원에 기재된 기능을 수행하고/거나, 결과 및/또는 장점 중 하나 이상을 수득하기 위한 다양한 다른 수단 및/또는 구조를 용이하게 떠올리게 될 것이므로, 그와 같은 변이 및/또는 변형의 각각은 본원에 기재된 발명 실시양태의 범주에 속하는 것으로 간주된다. 더 일반적으로, 관련 기술분야의 통상의 기술자라면, 본원에 기재된 모든 파라미터, 치수, 재료 및 배열구조가 예시적인 것을 의미한다는 것, 그리고 실제 파라미터, 치수, 재료 및/또는 배열구조는 본 발명의 교시가 사용되는 구체적인 적용분야 또는 적용분야들에 따라 달라지게 된다는 것을 잘 알고 있을 것이다. 관련 기술분야의 통상의 기술자라면, 일상적인 것을 초과하지 않는 실험을 사용하여 본원에 기재된 구체적인 발명 실시양태의 많은 등가물을 인지하거나 확인할 수 있을 것이다. 따라서, 전기한 실시양태가 단지 예로서 제시되었다는 것, 그리고 첨부된 청구범위 및 그의 등가물의 범주 내에서 구체적으로 기재되고 청구된 것과 달리 발명 실시양태가 실시될 수 있다는 것이 이해되어야 한다. 본 개시내용의 발명 실시양태는 본원에 기재된 각각의 개별적 특색, 시스템, 물품, 재료, 키트 및/또는 방법에 관한 것이다. 추가로, 2종 이상의 그와 같은 특색, 시스템, 물품, 재료, 키트 및/또는 방법의 어떠한 조합도, 그와 같은 특색, 시스템, 물품, 재료, 키트 및/또는 방법이 상호 모순되지 않는다면, 본 개시내용의 발명의 범주 내에 포함된다.
본원에서 정의되어 사용되는 바와 같은 모든 정의는 사전상의 정의, 참조로 포함되는 문헌상의 정의 및/또는 정의되는 용어의 일반적인 의미에 우선하는 것으로 이해되어야 한다.
본원에 개시되는 모든 참고문헌, 특허 및 특허 출원은 각각이 인용되는 주제와 관련하여 참조로 포함되는 바, 일부 경우에서 이는 문헌 전체를 포괄할 수 있다.
본원의 명세서 및 청구범위에 사용된 바와 같이, 단수형은 분명하게 달리 표시되지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다.
본원의 명세서 및 청구범위에 사용된 바와 같이, "및/또는"이라는 어구는 그렇게 결합되는 요소 중 "어느 하나 또는 둘 다", 즉, 일부 경우에는 합동으로 존재하며 다른 경우에는 분리되어 존재하는 요소를 의미하는 것으로 이해되어야 한다. "및/또는"을 사용하여 열거되는 다수의 요소도 동일한 방식으로, 즉, 그렇게 결합되는 요소 중 "하나 이상"으로 해석되어야 한다. 임의적으로, 구체적으로 식별되는 요소와 관련되는지 또는 무관한지와 관계없이, "및/또는"이라는 문구에 의해 구체적으로 식별되는 요소 이외의 다른 요소가 존재할 수도 있다. 따라서, 비-제한적인 예로서, "포함하는"과 같은 개방형 언어와 함께 사용될 때의 "A 및/또는 B"라는 언급은 하나의 실시양태에서는 A 단독 (임의적으로는 B가 아닌 다른 요소 포함)을; 또 다른 실시양태에서는 B 단독 (임의적으로는 A가 아닌 다른 요소 포함)을; 또 다른 실시양태에서는 A 및 B 둘 다 (임의적으로는 다른 요소 포함)를 지칭할 수 있는 등이다.
본원의 명세서 및 청구범위에 사용된 바와 같이, "또는"은 상기에서 정의된 바와 같은 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 것으로, 즉, 적어도 하나의 포함으로는 물론, 수많은 요소 또는 목록 요소 중 하나 초과, 및 임의적으로 추가의 열거되지 않은 항목을 포함하는 것으로 해석되어야 한다. "중 오로지 하나" 또는 "중 정확하게 하나", 또는 청구범위에 사용될 때 "로 이루어진"과 같이 분명하게 달리 표시되는 용어만이 수많은 요소 또는 목록 요소 중 정확히 하나의 요소의 포함을 지칭할 것이다. 일반적으로, 본원에 사용된 바와 같이 "또는"이라는 용어는 "중 어느 하나", "중 하나", "중 오로지 하나" 또는 "중 정확히 하나"와 같이 배제성을 갖는 용어가 선행하는 경우, 오로지 포괄적인 대안 (즉, "하나 또는 다른 것, 그러나 둘 다는 아님")을 지시하는 것으로 해석되어야 한다. 청구범위에 사용될 때, "로 본질적으로 이루어진"은 특허법 분야에 사용된 바와 같은 그의 통상적인 의미를 가져야 한다.
본원의 명세서 및 청구범위에 사용된 바와 같이, 하나 이상의 요소의 목록에 대한 언급에서의 "적어도 하나"라는 구는 요소 목록의 요소 중 임의의 하나 이상으로부터 선택되는 적어도 하나의 요소를 의미하지만, 요소 목록 내에서 구체적으로 열거되는 각각의 모든 요소 중 적어도 하나를 반드시 포함하는 것은 아니며 요소 목록 중 요소의 임의의 조합을 배제하는 것은 아닌 것으로 이해되어야 한다. 이와 같은 정의는 또한 구체적으로 식별되는 요소와 관련되는지 또는 무관한지에 관계없이 "적어도 하나"라는 구가 지칭하는 요소 목록 내에서 구체적으로 식별되는 요소가 아닌 다른 요소가 임의적으로 존재할 수도 있다는 것을 가능하게 한다. 따라서, 비-제한적인 예로서, "A 및 B 중 적어도 하나" (또는 동등하게 "A 또는 B 중 적어도 하나", 또는 동등하게 "A 및/또는 B 중 적어도 하나")는 하나의 실시양태에서는 B가 존재하지 않는 (및 임의적으로 B가 아닌 다른 요소를 포함하는), 임의적으로 하나 초과를 포함한 적어도 하나의 A를; 또 다른 실시양태에서는 A가 존재하지 않는 (및 임의적으로 A가 아닌 다른 요소를 포함하는), 임의적으로 하나 초과를 포함한 적어도 하나의 B를; 또 다른 실시양태에서는 임의적으로 하나 초과를 포함한 적어도 하나의 A 및 임의적으로 하나 초과를 포함한 적어도 하나의 B (및 임의적으로 다른 요소 포함)를 지칭할 수 있는 등이다.
분명하게 달리 지시되지 않는 한, 하나를 초과하는 단계 또는 작용을 포함하는 본원에서 청구되는 임의의 방법에서, 방법 중 단계 또는 작용의 순서가 반드시 방법 중 단계 또는 작용이 언급되는 순서에 제한되는 것은 아니라는 것 역시 이해되어야 한다.
상기 명세서 뿐만 아니라 청구범위에서, "포함하는", "포함한", "보유하는", "갖는", "함유하는", "수반하는", "수용하는", "로 구성된" 등과 같은 모든 전이 구는 개방형인 것으로, 즉, 포함하나 그에 제한되지는 않음을 의미하는 것으로 이해되어야 한다. 미국 특허청 특허 심사 절차 매뉴얼(United States Patent Office Manual of Patent Examining Procedures) 섹션 2111.03에 제시되어 있는 바와 같이, "로 이루어진" 및 "로 본질적으로 이루어진"이라는 전이 구만이 각각 폐쇄형 또는 반-폐쇄형 전이 구일 수 있다. 개방형 전이 구 (예를 들어, "포함하는")를 사용하여 본 문서에서 기재된 실시양태가 대안적인 실시양태에서는 개방형 전이 구에 의해 기재된 특색"으로 이루어진" 및 그"로 본질적으로 이루어진" 것으로도 고려된다는 것이 이해되어야 한다. 예를 들어, 본 개시내용이 "A 및 B를 포함하는 조성물"을 기재하는 경우, 본 개시내용은 대안적인 실시양태인 "A 및 B로 이루어진 조성물" 및 "본질적으로 A 및 B로 이루어진 조성물"도 고려하는 것이다.
SEQUENCE LISTING <110> Eidgenossische Technische Hochschule Zurich <120> CELL CLASSIFIER CIRCUITS AND METHODS OF USE THEREOF <130> E0583.70001WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 63/009,736 <151> 2020-04-14 <160> 306 <170> PatentIn version 3.5 <210> 1 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 ugagguagua gguuguaugg uu 22 <210> 2 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 aagcugccag uugaagaacu gu 22 <210> 3 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 uucaaguaau ucaggauagg u 21 <210> 4 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 cauuauuacu uuugguacgc g 21 <210> 5 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 5 uggaguguga caaugguguu ug 22 <210> 6 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 cagcagcaau ucauguuuug ga 22 <210> 7 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 cagcagcaau ucauguuuug aa 22 <210> 8 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 auaagacgag caaaaagcuu gu 22 <210> 9 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 auaagacgaa caaaagguuu gu 22 <210> 10 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 uaaucucagc uggcaacugu ga 22 <210> 11 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 11 uacugcauca ggaacugacu gga 23 <210> 12 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 uacugcauca ggaacugauu gga 23 <210> 13 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 uuuguucguu cggcucgcgu ga 22 <210> 14 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 uaaggcacgc ggugaaugcc aa 22 <210> 15 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 uggaauguaa agaaguaugu au 22 <210> 16 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 uuuggucccc uucaaccagc ug 22 <210> 17 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 uuuggucccc uucaaccagc ua 22 <210> 18 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 ucuuugguua ucuagcugua uga 23 <210> 19 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 uccagcauca gugauuuugu ug 22 <210> 20 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 ugauugucca aacgcaauuc u 21 <210> 21 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 uuuugcaccu uuuggaguga a 21 <210> 22 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 auugacacuu cugugaguag a 21 <210> 23 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 uacugcagac aguggcaauc a 21 <210> 24 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 uggaagacua gugauuuugu uguu 24 <210> 25 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 uccuucauuc caccggaguc ug 22 <210> 26 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 uguaguguuu ccuacuuuau gga 23 <210> 27 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 acaguagucu gcacauuggu ua 22 <210> 28 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 uaacacuguc ugguaacgau gu 22 <210> 29 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 uaauacugcc ugguaaugau ga 22 <210> 30 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 cugaccuaug aauugacagc c 21 <210> 31 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 uguaacagca acuccaugug ga 22 <210> 32 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 uggcagugua uuguuagcug gu 22 <210> 33 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 ugagguagua gguuguauag uu 22 <210> 34 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 ugagguagua gguugugugg uu 22 <210> 35 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 agagguagua gguugcauag uu 22 <210> 36 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 ugagguagga gguuguauag uu 22 <210> 37 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 ugagguagua gauuguauag uu 22 <210> 38 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 ugagguagua guuuguacag uu 22 <210> 39 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 ugagguagua guuugugcug uu 22 <210> 40 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 ugagaugaag cacuguagcu c 21 <210> 41 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 ucagugcacu acagaacuuu gu 22 <210> 42 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 aaccatacaa cctactacct ca 22 <210> 43 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 acagttcttc aactggcagc tt 22 <210> 44 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 acctatcctg aattacttga a 21 <210> 45 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 cgcgtaccaa aagtaataat g 21 <210> 46 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 caaacaccat tgtcacactc ca 22 <210> 47 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 gtccaaaaca tgaattgctg ct 22 <210> 48 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 gtccaaaaca tgaattgctg ct 22 <210> 49 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 acaagctttt tgctcgtctt at 22 <210> 50 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 acaaaccttt tgttcgtctt at 22 <210> 51 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 tcacagttgc cagctgagat ta 22 <210> 52 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 tccagtcagt tcctgatgca gta 23 <210> 53 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 tccaatcagt tcctgatgca gta 23 <210> 54 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 tcacgcgagc cgaacgaaca aa 22 <210> 55 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 ttggcattca ccgcgtgcct ta 22 <210> 56 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 atacatactt ctttacattc ca 22 <210> 57 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 cagctggttg aaggggacca aa 22 <210> 58 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 tagctggttg aaggggacca aa 22 <210> 59 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 tcatacagct agataaccaa aga 23 <210> 60 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 tccagcatca gtgattttgt tg 22 <210> 61 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 tgattgtcca aacgcaattc t 21 <210> 62 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 ttcactccaa aaggtgcaaa a 21 <210> 63 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 attgacactt ctgtgagtag a 21 <210> 64 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 tactgcagac agtggcaatc a 21 <210> 65 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 aacaacaaaa tcactagtct tcca 24 <210> 66 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 cagactccgg tggaatgaag ga 22 <210> 67 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 tccataaagt aggaaacact aca 23 <210> 68 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 taaccaatgt gcagactact gt 22 <210> 69 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 acatcgttac cagacagtgt ta 22 <210> 70 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 tcatcattac caggcagtat ta 22 <210> 71 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 ggctgtcaat tcataggtca g 21 <210> 72 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 tccacatgga gttgctgtta ca 22 <210> 73 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 accagctaac aatacactgc ca 22 <210> 74 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 74 aactatacaa cctactacct ca 22 <210> 75 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 aaccacacaa cctactacct ca 22 <210> 76 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 aactatgcaa cctactacct ct 22 <210> 77 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 77 aactatacaa cctcctacct ca 22 <210> 78 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 aactatacaa tctactacct ca 22 <210> 79 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 aactgtacaa actactacct ca 22 <210> 80 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 aacagcacaa actactacct ca 22 <210> 81 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 gagctacagt gcttcatctc at 22 <210> 82 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 acaaagttct gtagtgcact ga 22 <210> 83 <211> 578 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 83 atgatgagtt tcccaccatg gtgtttcctt ctgggcagat cagccaggcc tcggccttgg 60 ccccggcccc tccccaagtc ctgccccagg ctccagcccc tgcccctgct ccagccatgg 120 tatcagctct ggcccaggcc ccagcccctg tcccagtcct agccccaggc cctcctcagg 180 ctgtggcccc acctgccccc aagcccaccc aggctgggga aggaacgctg tcagaggccc 240 tgctgcagct gcagtttgat gatgaagacc tgggggcctt gcttggcaac agcacagacc 300 cagctgtgtt cacagacctg gcatccgtcg acaactccga gtttcagcag ctgctgaacc 360 agggcatacc tgtggccccc cacacaactg agcccatgct gatggagtac cctgaggcta 420 taactcgcct agtgacaggg gcccagaggc cccccgaccc agctcctgct ccactggggg 480 ccccggggct ccccaatggc ctcctttcag gagatgaaga cttctcctcc attgcggaca 540 tggacttctc agccctgctg agtcagatca gctcctaa 578 <210> 84 <211> 192 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 84 His Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln 1 5 10 15 Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro 20 25 30 Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro 35 40 45 Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro 50 55 60 Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala 65 70 75 80 Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly 85 90 95 Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn 100 105 110 Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His 115 120 125 Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu 130 135 140 Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly 145 150 155 160 Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser 165 170 175 Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser 180 185 190 <210> 85 <211> 366 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 85 caggctgggg aaggaacgct gtcagaggcc ctgctgcagc tgcagtttga tgatgaagac 60 ctgggggcct tgcttggcaa cagcacagac ccagctgtgt tcacagacct ggcatccgtc 120 gacaactccg agtttcagca gctgctgaac cagggcatac ctgtggcccc ccacacaact 180 gagcccatgc tgatggagta ccctgaggct ataactcgcc tagtgacagg cgcacaacgc 240 ccacctgatc cggcaccagc accccttgga gctcccggtc tccccaatgg cctcctttca 300 ggagatgaag acttctcctc cattgcggac atggacttct cagccctgct gagtcagatc 360 agctcc 366 <210> 86 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 86 Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe 1 5 10 15 Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala 20 25 30 Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu 35 40 45 Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu 50 55 60 Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg 65 70 75 80 Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn 85 90 95 Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp 100 105 110 Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser 115 120 <210> 87 <211> 630 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 87 cccaagccag caccccagcc ctatcccttt acgtcatccc tgagcaccat caactatgat 60 gagtttccca ccatggtgtt tccttctggg cagatcagcc aggcctcggc cttggccccg 120 gcccctcccc aagtcctgcc ccaggctcca gcccctgccc ctgctccagc catggtatca 180 gctctggccc aggccccagc ccctgtccca gtcctagccc caggccctcc tcaggctgtg 240 gccccacctg cccccaagcc cacccaggct ggggaaggaa cgctgtcaga ggccctgctg 300 cagctgcagt ttgatgatga agacctgggg gccttgcttg gcaacagcac agacccagct 360 gtgttcacag acctggcatc cgtcgacaac tccgagtttc agcagctgct gaaccagggc 420 atacctgtgg ccccccacac aactgagccc atgctgatgg agtaccctga ggctataact 480 cgcctagtga caggggccca gaggcccccc gacccagctc ctgctccact gggggccccg 540 gggctcccca atggcctcct ttcaggagat gaagacttct cctccattgc ggacatggac 600 ttctcagccc tgctgagtca gatcagctcc 630 <210> 88 <211> 210 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 88 Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr 1 5 10 15 Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile 20 25 30 Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln 35 40 45 Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln 50 55 60 Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val 65 70 75 80 Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser 85 90 95 Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu 100 105 110 Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val 115 120 125 Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala 130 135 140 Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr 145 150 155 160 Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro 165 170 175 Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp 180 185 190 Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile 195 200 205 Ser Ser 210 <210> 89 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 89 gcccccccga ccgatgtcag cctgggggac gagctccact tagacggcga ggacgtggcg 60 atggcgcatg ccgacgcgct agacgatttc gatctggaca tgttggggga cggggattcc 120 ccgggtccgg gatttacccc ccacgactcc gccccctacg gcgctctgga tatggccgac 180 ttcgagtttg agcagatgtt taccgatgcc cttggaattg acgagtacgg tggg 234 <210> 90 <211> 78 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 90 Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly 1 5 10 15 Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu 20 25 30 Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His 35 40 45 Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu 50 55 60 Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly 65 70 75 <210> 91 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 91 ccggcagatg cccttgatga cttcgatttg gacatgctcc cagcggatgc cttggacgat 60 tttgatctcg atatgcttcc cgccgacgca ctcgatgatt tcgatctgga tatgctcccg 120 ggt 123 <210> 92 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 92 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp 1 5 10 15 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp 20 25 30 Asp Phe Asp Leu Asp Met Leu Pro Gly 35 40 <210> 93 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 93 ggtccggcag atgcccttga tgacttcgat ttggacatgc tcccagcgga tgccttggac 60 gattttgatc tcgatatgct tcccgccgac gcactcgatg atttcgatct ggatatgctc 120 ccgggt 126 <210> 94 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 94 Gly Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala 1 5 10 15 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu 20 25 30 Asp Asp Phe Asp Leu Asp Met Leu Pro Gly 35 40 <210> 95 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 95 atgagtcgag gagaggtgcg catggcgaag gcagggcggg aggggccgcg ggacagcgtg 60 tggctgtcgg gggaggggcg gcgcggcggt cgccgtgggg ggcagccgtc cgggctcgac 120 cgggaccgga tcaccggggt caccgtccgg ctgctggaca cggagggcct gacggggttc 180 tcgatgcgcc gcctggccgc cgagctgaac gtcaccgcga tgtccgtgta ctggtacgtc 240 gacaccaagg accagttgct cgagctcgcc ctggacgccg tcttcggcga gctgcgccac 300 ccggacccgg acgccgggct cgactggcgc gaggaactgc gggccctggc ccgggagaac 360 cgggcgctgc tggtgcgcca cccctggtcg tcccggctgg tcggcaccta cctcaacatc 420 ggcccgcact cgctggcctt ctcccgcgcg gtgcagaacg tcgtgcgccg cagcgggctg 480 cccgcgcacc gcctgaccgg cgccatctcg gccgtcttcc agttcgtcta cggctacggc 540 accatcgagg gccgcttcct cgcccgggtg gcggacaccg ggctgagtcc ggaggagtac 600 ttccaggact cgatgaccgc ggtgaccgag gtgccggaca ccgcgggcgt catcgaggac 660 gcgcaggaca tcatggcggc ccggggcggc gacaccgtgg cggagatgct ggaccgggac 720 ttcgagttcg ccctcgacct gctcgtcgcg ggcatcgacg cgatggtcga acaggcctcc 780 gcgtacagcc gcgcgcatga tgagtttccc accatggtgt ttccttctgg gcagatcagc 840 caggcctcgg ccttggcccc ggcccctccc caagtcctgc cccaggctcc agcccctgcc 900 cctgctccag ccatggtatc agctctggcc caggccccag cccctgtccc agtcctagcc 960 ccaggccctc ctcaggctgt ggccccacct gcccccaagc ccacccaggc tggggaagga 1020 acgctgtcag aggccctgct gcagctgcag tttgatgatg aagacctggg ggccttgctt 1080 ggcaacagca cagacccagc tgtgttcaca gacctggcat ccgtcgacaa ctccgagttt 1140 cagcagctgc tgaaccaggg catacctgtg gccccccaca caactgagcc catgctgatg 1200 gagtaccctg aggctataac tcgcctagtg acaggggccc agaggccccc cgacccagct 1260 cctgctccac tgggggcccc ggggctcccc aatggcctcc tttcaggaga tgaagacttc 1320 tcctccattg cggacatgga cttctcagcc ctgctgagtc agatcagctc ctaa 1374 <210> 96 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 96 Met Ser Arg Gly Glu Val Arg Met Ala Lys Ala Gly Arg Glu Gly Pro 1 5 10 15 Arg Asp Ser Val Trp Leu Ser Gly Glu Gly Arg Arg Gly Gly Arg Arg 20 25 30 Gly Gly Gln Pro Ser Gly Leu Asp Arg Asp Arg Ile Thr Gly Val Thr 35 40 45 Val Arg Leu Leu Asp Thr Glu Gly Leu Thr Gly Phe Ser Met Arg Arg 50 55 60 Leu Ala Ala Glu Leu Asn Val Thr Ala Met Ser Val Tyr Trp Tyr Val 65 70 75 80 Asp Thr Lys Asp Gln Leu Leu Glu Leu Ala Leu Asp Ala Val Phe Gly 85 90 95 Glu Leu Arg His Pro Asp Pro Asp Ala Gly Leu Asp Trp Arg Glu Glu 100 105 110 Leu Arg Ala Leu Ala Arg Glu Asn Arg Ala Leu Leu Val Arg His Pro 115 120 125 Trp Ser Ser Arg Leu Val Gly Thr Tyr Leu Asn Ile Gly Pro His Ser 130 135 140 Leu Ala Phe Ser Arg Ala Val Gln Asn Val Val Arg Arg Ser Gly Leu 145 150 155 160 Pro Ala His Arg Leu Thr Gly Ala Ile Ser Ala Val Phe Gln Phe Val 165 170 175 Tyr Gly Tyr Gly Thr Ile Glu Gly Arg Phe Leu Ala Arg Val Ala Asp 180 185 190 Thr Gly Leu Ser Pro Glu Glu Tyr Phe Gln Asp Ser Met Thr Ala Val 195 200 205 Thr Glu Val Pro Asp Thr Ala Gly Val Ile Glu Asp Ala Gln Asp Ile 210 215 220 Met Ala Ala Arg Gly Gly Asp Thr Val Ala Glu Met Leu Asp Arg Asp 225 230 235 240 Phe Glu Phe Ala Leu Asp Leu Leu Val Ala Gly Ile Asp Ala Met Val 245 250 255 Glu Gln Ala Ser Ala Tyr Ser Arg Ala His Asp Glu Phe Pro Thr Met 260 265 270 Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala 275 280 285 Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala 290 295 300 Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala 305 310 315 320 Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln 325 330 335 Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp 340 345 350 Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val 355 360 365 Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu 370 375 380 Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met 385 390 395 400 Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro 405 410 415 Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly 420 425 430 Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe 435 440 445 Ser Ala Leu Leu Ser Gln Ile Ser Ser 450 455 <210> 97 <211> 1164 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 97 atgagtcgag gagaggtgcg catggcgaag gcagggcggg aggggccgcg ggacagcgtg 60 tggctgtcgg gggaggggcg gcgcggcggt cgccgtgggg ggcagccgtc cgggctcgac 120 cgggaccgga tcaccggggt caccgtccgg ctgctggaca cggagggcct gacggggttc 180 tcgatgcgcc gcctggccgc cgagctgaac gtcaccgcga tgtccgtgta ctggtacgtc 240 gacaccaagg accagttgct cgagctcgcc ctggacgccg tcttcggcga gctgcgccac 300 ccggacccgg acgccgggct cgactggcgc gaggaactgc gggccctggc ccgggagaac 360 cgggcgctgc tggtgcgcca cccctggtcg tcccggctgg tcggcaccta cctcaacatc 420 ggcccgcact cgctggcctt ctcccgcgcg gtgcagaacg tcgtgcgccg cagcgggctg 480 cccgcgcacc gcctgaccgg cgccatctcg gccgtcttcc agttcgtcta cggctacggc 540 accatcgagg gccgcttcct cgcccgggtg gcggacaccg ggctgagtcc ggaggagtac 600 ttccaggact cgatgaccgc ggtgaccgag gtgccggaca ccgcgggcgt catcgaggac 660 gcgcaggaca tcatggcggc ccggggcggc gacaccgtgg cggagatgct ggaccgggac 720 ttcgagttcg ccctcgacct gctcgtcgcg ggcatcgacg cgatggtcga acaggcctcc 780 gcgtacagcc gcgcgcgtac gaaaaacaat tacgggtcta ccatcgaggg cctgctcgat 840 ctcccggacg acgacgcccc cgaagaggcg gggctggcgg ctccgcgcct gtcctttctc 900 cccgcgggac acacgcgcag actgtcgacg gcccccccga ccgatgtcag cctgggggac 960 gagctccact tagacggcga ggacgtggcg atggcgcatg ccgacgcgct agacgatttc 1020 gatctggaca tgttggggga cggggattcc ccgggtccgg gatttacccc ccacgactcc 1080 gccccctacg gcgctctgga tatggccgac ttcgagtttg agcagatgtt taccgatgcc 1140 cttggaattg acgagtacgg tggg 1164 <210> 98 <211> 388 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 98 Met Ser Arg Gly Glu Val Arg Met Ala Lys Ala Gly Arg Glu Gly Pro 1 5 10 15 Arg Asp Ser Val Trp Leu Ser Gly Glu Gly Arg Arg Gly Gly Arg Arg 20 25 30 Gly Gly Gln Pro Ser Gly Leu Asp Arg Asp Arg Ile Thr Gly Val Thr 35 40 45 Val Arg Leu Leu Asp Thr Glu Gly Leu Thr Gly Phe Ser Met Arg Arg 50 55 60 Leu Ala Ala Glu Leu Asn Val Thr Ala Met Ser Val Tyr Trp Tyr Val 65 70 75 80 Asp Thr Lys Asp Gln Leu Leu Glu Leu Ala Leu Asp Ala Val Phe Gly 85 90 95 Glu Leu Arg His Pro Asp Pro Asp Ala Gly Leu Asp Trp Arg Glu Glu 100 105 110 Leu Arg Ala Leu Ala Arg Glu Asn Arg Ala Leu Leu Val Arg His Pro 115 120 125 Trp Ser Ser Arg Leu Val Gly Thr Tyr Leu Asn Ile Gly Pro His Ser 130 135 140 Leu Ala Phe Ser Arg Ala Val Gln Asn Val Val Arg Arg Ser Gly Leu 145 150 155 160 Pro Ala His Arg Leu Thr Gly Ala Ile Ser Ala Val Phe Gln Phe Val 165 170 175 Tyr Gly Tyr Gly Thr Ile Glu Gly Arg Phe Leu Ala Arg Val Ala Asp 180 185 190 Thr Gly Leu Ser Pro Glu Glu Tyr Phe Gln Asp Ser Met Thr Ala Val 195 200 205 Thr Glu Val Pro Asp Thr Ala Gly Val Ile Glu Asp Ala Gln Asp Ile 210 215 220 Met Ala Ala Arg Gly Gly Asp Thr Val Ala Glu Met Leu Asp Arg Asp 225 230 235 240 Phe Glu Phe Ala Leu Asp Leu Leu Val Ala Gly Ile Asp Ala Met Val 245 250 255 Glu Gln Ala Ser Ala Tyr Ser Arg Ala Arg Thr Lys Asn Asn Tyr Gly 260 265 270 Ser Thr Ile Glu Gly Leu Leu Asp Leu Pro Asp Asp Asp Ala Pro Glu 275 280 285 Glu Ala Gly Leu Ala Ala Pro Arg Leu Ser Phe Leu Pro Ala Gly His 290 295 300 Thr Arg Arg Leu Ser Thr Ala Pro Pro Thr Asp Val Ser Leu Gly Asp 305 310 315 320 Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala 325 330 335 Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly 340 345 350 Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met 355 360 365 Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp 370 375 380 Glu Tyr Gly Gly 385 <210> 99 <211> 1179 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 99 atgccccgcc ccaagctcaa gtccgatgac gaggtactcg aggccgccac cgtagtgctg 60 aagcgttgcg gtcccataga gttcacgctc agcggagtag caaaggaggt ggggctctcc 120 cgcgcagcgt taatccagcg cttcaccaac cgcgatacgc tgctggtgag gatgatggag 180 cgcggcgtcg agcaggtgcg gcattacctg aatgcgatac cgataggcgc agggccgcaa 240 gggctctggg aatttttgca ggtgctcgtt cggagcatga acactcgcaa cgacttctcg 300 gtgaactatc tcatctcctg gtacgagctc caggtgccgg agctacgcac gcttgcgatc 360 cagcggaacc gcgcggtggt ggaggggatc cgcaagcgac tgcccccagg tgctcctgcg 420 gcagctgagt tgctcctgca ctcggtcatc gctggcgcga cgatgcagtg ggccgtcgat 480 ccggatggtg agctagctga tcatgtgctg gctcagatcg ctgccatcct gtgtttaatg 540 tttcccgaac acgacgattt ccaactcctc caggcacatg cgtccgcgta cagccgcgcg 600 catgatgagt ttcccaccat ggtgtttcct tctgggcaga tcagccaggc ctcggccttg 660 gccccggccc ctccccaagt cctgccccag gctccagccc ctgcccctgc tccagccatg 720 gtatcagctc tggcccaggc cccagcccct gtcccagtcc tagccccagg ccctcctcag 780 gctgtggccc cacctgcccc caagcccacc caggctgggg aaggaacgct gtcagaggcc 840 ctgctgcagc tgcagtttga tgatgaagac ctgggggcct tgcttggcaa cagcacagac 900 ccagctgtgt tcacagacct ggcatccgtc gacaactccg agtttcagca gctgctgaac 960 cagggcatac ctgtggcccc ccacacaact gagcccatgc tgatggagta ccctgaggct 1020 ataactcgcc tagtgacagg ggcccagagg ccccccgacc cagctcctgc tccactgggg 1080 gccccggggc tccccaatgg cctcctttca ggagatgaag acttctcctc cattgcggac 1140 atggacttct cagccctgct gagtcagatc agctcctaa 1179 <210> 100 <211> 392 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 100 Met Pro Arg Pro Lys Leu Lys Ser Asp Asp Glu Val Leu Glu Ala Ala 1 5 10 15 Thr Val Val Leu Lys Arg Cys Gly Pro Ile Glu Phe Thr Leu Ser Gly 20 25 30 Val Ala Lys Glu Val Gly Leu Ser Arg Ala Ala Leu Ile Gln Arg Phe 35 40 45 Thr Asn Arg Asp Thr Leu Leu Val Arg Met Met Glu Arg Gly Val Glu 50 55 60 Gln Val Arg His Tyr Leu Asn Ala Ile Pro Ile Gly Ala Gly Pro Gln 65 70 75 80 Gly Leu Trp Glu Phe Leu Gln Val Leu Val Arg Ser Met Asn Thr Arg 85 90 95 Asn Asp Phe Ser Val Asn Tyr Leu Ile Ser Trp Tyr Glu Leu Gln Val 100 105 110 Pro Glu Leu Arg Thr Leu Ala Ile Gln Arg Asn Arg Ala Val Val Glu 115 120 125 Gly Ile Arg Lys Arg Leu Pro Pro Gly Ala Pro Ala Ala Ala Glu Leu 130 135 140 Leu Leu His Ser Val Ile Ala Gly Ala Thr Met Gln Trp Ala Val Asp 145 150 155 160 Pro Asp Gly Glu Leu Ala Asp His Val Leu Ala Gln Ile Ala Ala Ile 165 170 175 Leu Cys Leu Met Phe Pro Glu His Asp Asp Phe Gln Leu Leu Gln Ala 180 185 190 His Ala Ser Ala Tyr Ser Arg Ala His Asp Glu Phe Pro Thr Met Val 195 200 205 Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro 210 215 220 Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met 225 230 235 240 Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro 245 250 255 Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala 260 265 270 Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp 275 280 285 Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe 290 295 300 Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn 305 310 315 320 Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu 325 330 335 Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro 340 345 350 Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu 355 360 365 Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser 370 375 380 Ala Leu Leu Ser Gln Ile Ser Ser 385 390 <210> 101 <211> 969 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 101 atgccccgcc ccaagctcaa gtccgatgac gaggtactcg aggccgccac cgtagtgctg 60 aagcgttgcg gtcccataga gttcacgctc agcggagtag caaaggaggt ggggctctcc 120 cgcgcagcgt taatccagcg cttcaccaac cgcgatacgc tgctggtgag gatgatggag 180 cgcggcgtcg agcaggtgcg gcattacctg aatgcgatac cgataggcgc agggccgcaa 240 gggctctggg aatttttgca ggtgctcgtt cggagcatga acactcgcaa cgacttctcg 300 gtgaactatc tcatctcctg gtacgagctc caggtgccgg agctacgcac gcttgcgatc 360 cagcggaacc gcgcggtggt ggaggggatc cgcaagcgac tgcccccagg tgctcctgcg 420 gcagctgagt tgctcctgca ctcggtcatc gctggcgcga cgatgcagtg ggccgtcgat 480 ccggatggtg agctagctga tcatgtgctg gctcagatcg ctgccatcct gtgtttaatg 540 tttcccgaac acgacgattt ccaactcctc caggcacatg cgtccgcgta cagccgcgcg 600 cgtacgaaaa acaattacgg gtctaccatc gagggcctgc tcgatctccc ggacgacgac 660 gcccccgaag aggcggggct ggcggctccg cgcctgtcct ttctccccgc gggacacacg 720 cgcagactgt cgacggcccc cccgaccgat gtcagcctgg gggacgagct ccacttagac 780 ggcgaggacg tggcgatggc gcatgccgac gcgctagacg atttcgatct ggacatgttg 840 ggggacgggg attccccggg tccgggattt accccccacg actccgcccc ctacggcgct 900 ctggatatgg ccgacttcga gtttgagcag atgtttaccg atgcccttgg aattgacgag 960 tacggtggg 969 <210> 102 <211> 323 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 102 Met Pro Arg Pro Lys Leu Lys Ser Asp Asp Glu Val Leu Glu Ala Ala 1 5 10 15 Thr Val Val Leu Lys Arg Cys Gly Pro Ile Glu Phe Thr Leu Ser Gly 20 25 30 Val Ala Lys Glu Val Gly Leu Ser Arg Ala Ala Leu Ile Gln Arg Phe 35 40 45 Thr Asn Arg Asp Thr Leu Leu Val Arg Met Met Glu Arg Gly Val Glu 50 55 60 Gln Val Arg His Tyr Leu Asn Ala Ile Pro Ile Gly Ala Gly Pro Gln 65 70 75 80 Gly Leu Trp Glu Phe Leu Gln Val Leu Val Arg Ser Met Asn Thr Arg 85 90 95 Asn Asp Phe Ser Val Asn Tyr Leu Ile Ser Trp Tyr Glu Leu Gln Val 100 105 110 Pro Glu Leu Arg Thr Leu Ala Ile Gln Arg Asn Arg Ala Val Val Glu 115 120 125 Gly Ile Arg Lys Arg Leu Pro Pro Gly Ala Pro Ala Ala Ala Glu Leu 130 135 140 Leu Leu His Ser Val Ile Ala Gly Ala Thr Met Gln Trp Ala Val Asp 145 150 155 160 Pro Asp Gly Glu Leu Ala Asp His Val Leu Ala Gln Ile Ala Ala Ile 165 170 175 Leu Cys Leu Met Phe Pro Glu His Asp Asp Phe Gln Leu Leu Gln Ala 180 185 190 His Ala Ser Ala Tyr Ser Arg Ala Arg Thr Lys Asn Asn Tyr Gly Ser 195 200 205 Thr Ile Glu Gly Leu Leu Asp Leu Pro Asp Asp Asp Ala Pro Glu Glu 210 215 220 Ala Gly Leu Ala Ala Pro Arg Leu Ser Phe Leu Pro Ala Gly His Thr 225 230 235 240 Arg Arg Leu Ser Thr Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu 245 250 255 Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu 260 265 270 Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro 275 280 285 Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala 290 295 300 Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu 305 310 315 320 Tyr Gly Gly <210> 103 <211> 896 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (128)..(128) <223> n is a, c, g, or t <400> 103 atgaaagcgt taacggccag gcaacaagag gtgtttgatc tcatccgtga tcacatcagc 60 cagacaggta tgccgccgac gcgtgcggaa atcgcgcagc gtttggggtt ccgttcccca 120 aacgcggntg aagaacatct gaaggcgctg gcacgcaaag gcgttattga aattgtttcc 180 ggcgcatcac gcgggattcg tctgttgcag gaagaggaag aagggttgcc gctggtaggt 240 cgtgtggctg ccggtgaacc acttctggcg caacagcata ttgaaggtca ttatcaggtc 300 gatccttcct tattcaagcc gaatgctgat ttcctgctgc gcgtcagcgg gatgtcgatg 360 aaagatatcg gcattatgga tggtgacttg ctggcagtgc ataaaactca ggatgtacgt 420 aacggtcagg tcgttgtcgc acgtattgat gacgaagtta ccgttaagcg cctgaaaaaa 480 cagggcaata aagtcgaact gttgccagaa aatagcgagt ttaaaccaat tgtcgttgac 540 cttcgtcagc agagcttcac cattgaaggt ctggcggttg gggttattcg caacggcgac 600 tggctgtcta gctatcctta tgacgtgcct gactatgcca gcctgggagg atctagagcc 660 cccccgaccg atgtcagcct gggggacgag ctccacttag acggcgagga cgtggcgatg 720 gcgcatgccg acgcgctaga cgatttcgat ctggacatgt tgggggacgg ggattccccg 780 ggtccgggat ttacccccca cgactccgcc ccctacggcg ctctggatat ggccgacttc 840 gagtttgagc agatgtttac cgatgccctt ggaattgacg agtacggtgg gtagtg 896 <210> 104 <211> 296 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 104 Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg 1 5 10 15 Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala 20 25 30 Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Glu Glu His Leu Lys Ala 35 40 45 Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg Gly 50 55 60 Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly Arg 65 70 75 80 Val Ala Ala Gly Glu Pro Leu Leu Ala Gln Gln His Ile Glu Gly His 85 90 95 Tyr Gln Val Asp Pro Ser Leu Phe Lys Pro Asn Ala Asp Phe Leu Leu 100 105 110 Arg Val Ser Gly Met Ser Met Lys Asp Ile Gly Ile Met Asp Gly Asp 115 120 125 Leu Leu Ala Val His Lys Thr Gln Asp Val Arg Asn Gly Gln Val Val 130 135 140 Val Ala Arg Ile Asp Asp Glu Val Thr Val Lys Arg Leu Lys Lys Gln 145 150 155 160 Gly Asn Lys Val Glu Leu Leu Pro Glu Asn Ser Glu Phe Lys Pro Ile 165 170 175 Val Val Asp Leu Arg Gln Gln Ser Phe Thr Ile Glu Gly Leu Ala Val 180 185 190 Gly Val Ile Arg Asn Gly Asp Trp Leu Ser Ser Tyr Pro Tyr Asp Val 195 200 205 Pro Asp Tyr Ala Ser Leu Gly Gly Ser Arg Ala Pro Pro Thr Asp Val 210 215 220 Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala 225 230 235 240 His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly 245 250 255 Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly 260 265 270 Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala 275 280 285 Leu Gly Ile Asp Glu Tyr Gly Gly 290 295 <210> 105 <211> 339 <212> DNA <213> Escherichia coli <400> 105 atggctacga ccgagcggga cgtaaaccag cttactccga gagagaggga cattttgaag 60 ctgattgcgc aggggcttcc caataagatg attgccagac gccttgatat cacggaaagc 120 actgtgaaag tccacgtgaa acacatgctc aaaaagatga aactcaagtc ccgcgtggaa 180 gctgcggtct gggtacatca ggagcgaatc tttggtccgg cagatgccct tgatgacttc 240 gatttggaca tgctcccagc ggatgccttg gacgattttg atctcgatat gcttcccgcc 300 gacgcactcg atgatttcga tctggatatg ctcccgggt 339 <210> 106 <211> 113 <212> PRT <213> Escherichia coli <400> 106 Met Ala Thr Thr Glu Arg Asp Val Asn Gln Leu Thr Pro Arg Glu Arg 1 5 10 15 Asp Ile Leu Lys Leu Ile Ala Gln Gly Leu Pro Asn Lys Met Ile Ala 20 25 30 Arg Arg Leu Asp Ile Thr Glu Ser Thr Val Lys Val His Val Lys His 35 40 45 Met Leu Lys Lys Met Lys Leu Lys Ser Arg Val Glu Ala Ala Val Trp 50 55 60 Val His Gln Glu Arg Ile Phe Gly Pro Ala Asp Ala Leu Asp Asp Phe 65 70 75 80 Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp 85 90 95 Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro 100 105 110 Gly <210> 107 <211> 456 <212> DNA <213> Escherichia coli <400> 107 atggctacga ccgagcggga cgtaaaccag cttactccga gagagaggga cattttgaag 60 ctgattgcgc aggggcttcc caataagatg attgccagac gccttgatat cacggaaagc 120 actgtgaaag tccacgtgaa acacatgctc aaaaagatga aactcaagtc ccgcgtggaa 180 gctgcggtct gggtacatca ggagcgaatc tttgccagcg cccccccgac cgatgtcagc 240 ctgggggacg agctccactt agacggcgag gacgtggcga tggcgcatgc cgacgcgcta 300 gacgatttcg atctggacat gttgggggac ggggattccc cgggtccggg atttaccccc 360 cacgactccg ccccctacgg cgctctggat atggccgact tcgagtttga gcagatgttt 420 accgatgccc ttggaattga cgagtacggt gggtga 456 <210> 108 <211> 151 <212> PRT <213> Escherichia coli <400> 108 Met Ala Thr Thr Glu Arg Asp Val Asn Gln Leu Thr Pro Arg Glu Arg 1 5 10 15 Asp Ile Leu Lys Leu Ile Ala Gln Gly Leu Pro Asn Lys Met Ile Ala 20 25 30 Arg Arg Leu Asp Ile Thr Glu Ser Thr Val Lys Val His Val Lys His 35 40 45 Met Leu Lys Lys Met Lys Leu Lys Ser Arg Val Glu Ala Ala Val Trp 50 55 60 Val His Gln Glu Arg Ile Phe Ala Ser Ala Pro Pro Thr Asp Val Ser 65 70 75 80 Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His 85 90 95 Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp 100 105 110 Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala 115 120 125 Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu 130 135 140 Gly Ile Asp Glu Tyr Gly Gly 145 150 <210> 109 <211> 348 <212> DNA <213> Escherichia coli <400> 109 atggctacga ccgagcggga cgtaaaccag cttactccga gagagaggga cattttgaag 60 ctgattgcgc aggggcttcc caataagatg attgccagac gccttgatat cacggaaagc 120 actgtgaaag tccacgtgaa acacatgctc aaaaagatga aactcaagtc ccgcgtggaa 180 gctgcggtct gggtacatca ggagcgaatc tttgccagcg gtccggcaga tgcccttgat 240 gacttcgatt tggacatgct cccagcggat gccttggacg attttgatct cgatatgctt 300 cccgccgacg cactcgatga tttcgatctg gatatgctcc cgggttga 348 <210> 110 <211> 115 <212> PRT <213> Escherichia coli <400> 110 Met Ala Thr Thr Glu Arg Asp Val Asn Gln Leu Thr Pro Arg Glu Arg 1 5 10 15 Asp Ile Leu Lys Leu Ile Ala Gln Gly Leu Pro Asn Lys Met Ile Ala 20 25 30 Arg Arg Leu Asp Ile Thr Glu Ser Thr Val Lys Val His Val Lys His 35 40 45 Met Leu Lys Lys Met Lys Leu Lys Ser Arg Val Glu Ala Ala Val Trp 50 55 60 Val His Gln Glu Arg Ile Phe Ala Ser Gly Pro Ala Asp Ala Leu Asp 65 70 75 80 Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp 85 90 95 Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met 100 105 110 Leu Pro Gly 115 <210> 111 <211> 843 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 111 atgcaagaaa actacaagat tctcgtggtg gatgatgaca tgcgacttcg cgcattgctc 60 gaaagatatc tgaccgagca gggatttcaa gtgcgctccg tggccaatgc cgagcagatg 120 gataggctct tgacgaggga gtcgttccat ctgatggtgc tggaattgat gcttcccggt 180 gaggacggat tgtccatttg ccggagactt aggtcgcagt caaaccccat gccgatcatc 240 atggtcacag cgaagggaga ggaggtcgat agaattgtag gtcttgagat tggggcagac 300 gactacatcc ccaagccgtt caatccccgg gaacttcttg cgcgaatccg agccgtgctc 360 aggcgacagg ccaacgagct gcccggagct ccatcgcaag aggaagcggt catcgcgttc 420 gggaagttca agttgaacct cggcacgaga gagatgtttc gggaagatga acctatgccg 480 ctcacatcgg gggagtttgc ggtcttgaaa gcacttgtct cacacccgag agaacctctg 540 tcgcgggata aactcatgaa tctggcgaga ggcagagagt atagcgcgat ggaaaggtcc 600 atcgatgtcc agattagccg cctccgccgc atggtggagg aagatccagc ccaccctcgg 660 tacatccaga ctgtatgggg attggggtat gtgttcgtac cggatgggtc aaaagcagga 720 ccggcggacg cactggatga ctttgacttg gatatgctcc cagcggatgc gttggacgat 780 tttgaccttg acatgttgcc tgccgacgcg cttgacgact tcgacttgga catgctgccc 840 ggt 843 <210> 112 <211> 281 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 112 Met Gln Glu Asn Tyr Lys Ile Leu Val Val Asp Asp Asp Met Arg Leu 1 5 10 15 Arg Ala Leu Leu Glu Arg Tyr Leu Thr Glu Gln Gly Phe Gln Val Arg 20 25 30 Ser Val Ala Asn Ala Glu Gln Met Asp Arg Leu Leu Thr Arg Glu Ser 35 40 45 Phe His Leu Met Val Leu Glu Leu Met Leu Pro Gly Glu Asp Gly Leu 50 55 60 Ser Ile Cys Arg Arg Leu Arg Ser Gln Ser Asn Pro Met Pro Ile Ile 65 70 75 80 Met Val Thr Ala Lys Gly Glu Glu Val Asp Arg Ile Val Gly Leu Glu 85 90 95 Ile Gly Ala Asp Asp Tyr Ile Pro Lys Pro Phe Asn Pro Arg Glu Leu 100 105 110 Leu Ala Arg Ile Arg Ala Val Leu Arg Arg Gln Ala Asn Glu Leu Pro 115 120 125 Gly Ala Pro Ser Gln Glu Glu Ala Val Ile Ala Phe Gly Lys Phe Lys 130 135 140 Leu Asn Leu Gly Thr Arg Glu Met Phe Arg Glu Asp Glu Pro Met Pro 145 150 155 160 Leu Thr Ser Gly Glu Phe Ala Val Leu Lys Ala Leu Val Ser His Pro 165 170 175 Arg Glu Pro Leu Ser Arg Asp Lys Leu Met Asn Leu Ala Arg Gly Arg 180 185 190 Glu Tyr Ser Ala Met Glu Arg Ser Ile Asp Val Gln Ile Ser Arg Leu 195 200 205 Arg Arg Met Val Glu Glu Asp Pro Ala His Pro Arg Tyr Ile Gln Thr 210 215 220 Val Trp Gly Leu Gly Tyr Val Phe Val Pro Asp Gly Ser Lys Ala Gly 225 230 235 240 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp 245 250 255 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp 260 265 270 Asp Phe Asp Leu Asp Met Leu Pro Gly 275 280 <210> 113 <211> 141 <212> PRT <213> Escherichia coli <400> 113 Met Val Glu Ser Tyr Lys Phe Asn Gly Trp Glu Leu Asp Ile Asn Ser 1 5 10 15 Arg Ser Leu Ile Gly Pro Asp Gly Glu Gln Tyr Lys Leu Pro Arg Ser 20 25 30 Glu Phe Arg Ala Met Leu His Phe Cys Glu Asn Pro Gly Lys Ile Gln 35 40 45 Ser Arg Ala Glu Leu Leu Lys Lys Met Thr Gly Arg Glu Leu Lys Pro 50 55 60 His Asp Arg Thr Val Asp Val Thr Ile Arg Arg Ile Arg Lys His Phe 65 70 75 80 Glu Ser Thr Pro Asp Thr Pro Glu Ile Ile Ala Thr Ile His Gly Glu 85 90 95 Gly Tyr Arg Phe Cys Gly Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 100 105 110 Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 115 120 125 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 130 135 140 <210> 114 <211> 381 <212> PRT <213> Escherichia coli <400> 114 Met Gln Leu Gln Ser Met Lys Lys Glu Ile Arg His Leu His Gln Ala 1 5 10 15 Leu Ser Thr Ser Trp Gln Trp Gly His Ile Leu Thr Asn Ser Pro Ala 20 25 30 Met Met Asp Ile Cys Lys Asp Thr Ala Lys Ile Ala Leu Ser Gln Ala 35 40 45 Ser Val Leu Ile Ser Gly Glu Ser Gly Thr Gly Lys Glu Leu Ile Ala 50 55 60 Arg Ala Ile His Tyr Asn Ser Arg Arg Ala Lys Gly Pro Phe Ile Lys 65 70 75 80 Val Asn Cys Ala Ala Leu Pro Glu Ser Leu Leu Glu Ser Glu Leu Phe 85 90 95 Gly His Glu Lys Gly Ala Phe Thr Gly Ala Gln Thr Leu Arg Gln Gly 100 105 110 Leu Phe Glu Arg Ala Asn Glu Gly Thr Leu Leu Leu Asp Glu Ile Gly 115 120 125 Glu Met Pro Leu Val Leu Gln Ala Lys Leu Leu Arg Ile Leu Gln Glu 130 135 140 Arg Glu Phe Glu Arg Ile Gly Gly His Gln Thr Ile Lys Val Asp Ile 145 150 155 160 Arg Ile Ile Ala Ala Thr Asn Arg Asp Leu Gln Ala Met Val Lys Glu 165 170 175 Gly Thr Phe Arg Glu Asp Leu Phe Tyr Arg Leu Asn Val Ile His Leu 180 185 190 Ile Leu Pro Pro Leu Arg Asp Arg Arg Glu Asp Ile Ser Leu Leu Ala 195 200 205 Asn His Phe Leu Gln Lys Phe Ser Ser Glu Asn Gln Arg Asp Ile Ile 210 215 220 Asp Ile Asp Pro Met Ala Met Ser Leu Leu Thr Ala Trp Ser Trp Pro 225 230 235 240 Gly Asn Ile Arg Glu Leu Ser Asn Val Ile Glu Arg Ala Val Val Met 245 250 255 Asn Ser Gly Pro Ile Ile Phe Ser Glu Asp Leu Pro Pro Gln Ile Arg 260 265 270 Gln Pro Val Cys Asn Ala Gly Glu Val Lys Thr Ala Pro Val Gly Glu 275 280 285 Arg Asn Leu Lys Glu Glu Ile Lys Arg Val Glu Lys Arg Ile Ile Met 290 295 300 Glu Val Leu Glu Gln Gln Glu Gly Asn Arg Thr Arg Thr Ala Leu Met 305 310 315 320 Leu Gly Ile Ser Arg Arg Ala Leu Met Tyr Lys Leu Gln Glu Tyr Gly 325 330 335 Ile Asp Pro Ala Asp Val Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 340 345 350 Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 355 360 365 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 370 375 380 <210> 115 <211> 144 <212> PRT <213> Escherichia coli <400> 115 Met Gln Arg Glu Leu Gln Gln Gln Asp Ala Glu Ser Pro Leu Ile Ile 1 5 10 15 Asp Glu Gly Arg Phe Gln Ala Ser Trp Arg Gly Lys Met Leu Asp Leu 20 25 30 Thr Pro Ala Glu Phe Arg Leu Leu Lys Thr Leu Ser His Glu Pro Gly 35 40 45 Lys Val Phe Ser Arg Glu Gln Leu Leu Asn His Leu Tyr Asp Asp Tyr 50 55 60 Arg Val Val Thr Asp Arg Thr Ile Asp Ser His Ile Lys Asn Leu Arg 65 70 75 80 Arg Lys Leu Glu Ser Leu Asp Ala Glu Gln Ser Phe Ile Arg Ala Val 85 90 95 Tyr Gly Val Gly Tyr Arg Trp Glu Ala Pro Ala Asp Ala Leu Asp Asp 100 105 110 Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 115 120 125 Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 130 135 140 <210> 116 <211> 139 <212> PRT <213> Escherichia coli <400> 116 Met Glu Glu Val Ile Glu Met Gln Gly Leu Ser Leu Asp Pro Thr Ser 1 5 10 15 His Arg Val Met Ala Gly Glu Glu Pro Leu Glu Met Gly Pro Thr Glu 20 25 30 Phe Lys Leu Leu His Phe Phe Met Thr His Pro Glu Arg Val Tyr Ser 35 40 45 Arg Glu Gln Leu Leu Asn His Val Trp Gly Thr Asn Val Tyr Val Glu 50 55 60 Asp Arg Thr Val Asp Val His Ile Arg Arg Leu Arg Lys Ala Leu Glu 65 70 75 80 Pro Gly Gly His Asp Arg Met Val Gln Thr Val Arg Gly Thr Gly Tyr 85 90 95 Arg Phe Ser Thr Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met 100 105 110 Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala 115 120 125 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 130 135 <210> 117 <211> 127 <212> PRT <213> Escherichia coli <400> 117 Met Asn Gly Tyr Cys Tyr Phe Pro Phe Ser Leu Asn Arg Phe Val Gly 1 5 10 15 Ser Leu Thr Ser Asp Gln Gln Lys Leu Asp Ser Leu Ser Lys Gln Glu 20 25 30 Ile Ser Val Met Arg Tyr Ile Leu Asp Gly Lys Asp Asn Asn Asp Ile 35 40 45 Ala Glu Lys Met Phe Ile Ser Asn Lys Thr Val Ser Thr Tyr Lys Ser 50 55 60 Arg Leu Met Glu Lys Leu Glu Cys Lys Ser Leu Met Asp Leu Tyr Thr 65 70 75 80 Phe Ala Gln Arg Asn Lys Ile Gly Pro Ala Asp Ala Leu Asp Asp Phe 85 90 95 Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp 100 105 110 Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 115 120 125 <210> 118 <211> 390 <212> PRT <213> Escherichia coli <400> 118 Met Ser His Tyr Gln Glu Gln Gln Gln Pro Arg Asn Val Gln Leu Asn 1 5 10 15 Gly Pro Thr Thr Asp Ile Ile Gly Glu Ala Pro Ala Met Gln Asp Val 20 25 30 Phe Arg Ile Ile Gly Arg Leu Ser Arg Ser Ser Ile Ser Val Leu Ile 35 40 45 Asn Gly Glu Ser Gly Thr Gly Lys Glu Leu Val Ala His Ala Leu His 50 55 60 Arg His Ser Pro Arg Ala Lys Ala Pro Phe Ile Ala Leu Asn Met Ala 65 70 75 80 Ala Ile Pro Lys Asp Leu Ile Glu Ser Glu Leu Phe Gly His Glu Lys 85 90 95 Gly Ala Phe Thr Gly Ala Asn Thr Ile Arg Gln Gly Arg Phe Glu Gln 100 105 110 Ala Asp Gly Gly Thr Leu Phe Leu Asp Glu Ile Gly Asp Met Pro Leu 115 120 125 Asp Val Gln Thr Arg Leu Leu Arg Val Leu Ala Asp Gly Gln Phe Tyr 130 135 140 Arg Val Gly Gly Tyr Ala Pro Val Lys Val Asp Val Arg Ile Ile Ala 145 150 155 160 Ala Thr His Gln Asn Leu Glu Gln Arg Val Gln Glu Gly Lys Phe Arg 165 170 175 Glu Asp Leu Phe His Arg Leu Asn Val Ile Arg Val His Leu Pro Pro 180 185 190 Leu Arg Glu Arg Arg Glu Asp Ile Pro Arg Leu Ala Arg His Phe Leu 195 200 205 Gln Val Ala Ala Arg Glu Leu Gly Val Glu Ala Lys Leu Leu His Pro 210 215 220 Glu Thr Glu Ala Ala Leu Thr Arg Leu Ala Trp Pro Gly Asn Val Arg 225 230 235 240 Gln Leu Glu Asn Thr Cys Arg Trp Leu Thr Val Met Ala Ala Gly Gln 245 250 255 Glu Val Leu Ile Gln Asp Leu Pro Gly Glu Leu Phe Glu Ser Thr Val 260 265 270 Ala Glu Ser Thr Ser Gln Met Gln Pro Asp Ser Trp Ala Thr Leu Leu 275 280 285 Ala Gln Trp Ala Asp Arg Ala Leu Arg Ser Gly His Gln Asn Leu Leu 290 295 300 Ser Glu Ala Gln Pro Glu Leu Glu Arg Thr Leu Leu Thr Thr Ala Leu 305 310 315 320 Arg His Thr Gln Gly His Lys Gln Glu Ala Ala Arg Leu Leu Gly Trp 325 330 335 Gly Arg Asn Thr Leu Thr Arg Lys Leu Lys Glu Leu Gly Met Glu Pro 340 345 350 Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala 355 360 365 Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp 370 375 380 Phe Asp Leu Asp Met Leu 385 390 <210> 119 <211> 130 <212> PRT <213> Escherichia coli <400> 119 Met Gly Ser Lys Val Phe Ser Glu Arg Val Asn Gln Tyr Leu Arg Glu 1 5 10 15 Arg Glu Met Phe Gly Ala Glu Glu Asp Pro Phe Ser Val Leu Thr Glu 20 25 30 Arg Glu Leu Asp Val Leu His Glu Leu Ala Gln Gly Leu Ser Asn Lys 35 40 45 Gln Ile Ala Ser Val Leu Asn Ile Ser Glu Gln Thr Val Lys Val His 50 55 60 Ile Arg Asn Leu Leu Arg Lys Leu Asn Val Arg Ser Arg Val Ala Ala 65 70 75 80 Thr Ile Leu Phe Leu Gln Gln Arg Gly Ala Gln Pro Ala Asp Ala Leu 85 90 95 Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe 100 105 110 Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp 115 120 125 Met Leu 130 <210> 120 <211> 146 <212> PRT <213> Escherichia coli <400> 120 Met Arg Arg His Asn Asn Gln Gly Glu Ser Glu Leu Ile Val Gly Asn 1 5 10 15 Leu Thr Leu Asn Met Gly Arg Arg Gln Val Trp Met Gly Gly Glu Glu 20 25 30 Leu Ile Leu Thr Pro Lys Glu Tyr Ala Leu Leu Ser Arg Leu Met Leu 35 40 45 Lys Ala Gly Ser Pro Val His Arg Glu Ile Leu Tyr Asn Asp Ile Tyr 50 55 60 Asn Trp Asp Asn Glu Pro Ser Thr Asn Thr Leu Glu Val His Ile His 65 70 75 80 Asn Leu Arg Asp Lys Val Gly Lys Ala Arg Ile Arg Thr Val Arg Gly 85 90 95 Phe Gly Tyr Met Leu Val Ala Asn Glu Glu Asn Pro Ala Asp Ala Leu 100 105 110 Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe 115 120 125 Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp 130 135 140 Met Leu 145 <210> 121 <211> 163 <212> PRT <213> Escherichia coli <400> 121 Met Gln Glu Arg Ser Lys Gln Asp Val Ser Leu Leu Pro Glu Asn Gln 1 5 10 15 Gln Ala Leu Lys Phe Ile Pro Cys Thr Gly His Ser Arg Ile Tyr Leu 20 25 30 Leu Gln Met Lys Asp Val Ala Phe Val Ser Ser Arg Met Ser Gly Val 35 40 45 Tyr Val Thr Ser His Glu Gly Lys Glu Gly Phe Thr Glu Leu Thr Leu 50 55 60 Arg Thr Leu Glu Ser Arg Thr Pro Leu Leu Arg Cys His Arg Gln Tyr 65 70 75 80 Leu Val Asn Leu Ala His Leu Gln Glu Ile Arg Leu Glu Asp Asn Gly 85 90 95 Gln Ala Glu Leu Ile Leu Arg Asn Gly Leu Thr Val Pro Val Ser Arg 100 105 110 Arg Tyr Leu Lys Ser Leu Lys Glu Ala Ile Gly Leu Pro Ala Asp Ala 115 120 125 Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp 130 135 140 Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 145 150 155 160 Asp Met Leu <210> 122 <211> 157 <212> PRT <213> Escherichia coli <400> 122 Met Arg Arg Ser His Trp Ser Glu Gln Gln Gln Asn Asn Asp Asn Gly 1 5 10 15 Ser Pro Thr Leu Glu Val Asp Ala Leu Val Leu Asn Pro Gly Arg Gln 20 25 30 Glu Ala Ser Phe Asp Gly Gln Thr Leu Glu Leu Thr Gly Thr Glu Phe 35 40 45 Thr Leu Leu Tyr Leu Leu Ala Gln His Leu Gly Gln Val Val Ser Arg 50 55 60 Glu His Leu Ser Gln Glu Val Leu Gly Lys Arg Leu Thr Pro Phe Asp 65 70 75 80 Arg Ala Ile Asp Met His Ile Ser Asn Leu Arg Arg Lys Leu Pro Asp 85 90 95 Arg Lys Asp Gly His Pro Trp Phe Lys Thr Leu Arg Gly Arg Gly Tyr 100 105 110 Leu Met Val Ser Ala Ser Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 115 120 125 Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 130 135 140 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 145 150 155 <210> 123 <211> 150 <212> PRT <213> Escherichia coli <400> 123 Met Arg Arg Val Lys Lys Phe Ser Thr Pro Ser Pro Val Ile Arg Ile 1 5 10 15 Gly His Phe Glu Leu Asn Glu Pro Ala Ala Gln Ile Ser Trp Phe Asp 20 25 30 Thr Pro Leu Ala Leu Thr Arg Tyr Glu Phe Leu Leu Leu Lys Thr Leu 35 40 45 Leu Lys Ser Pro Gly Arg Val Trp Ser Arg Gln Gln Leu Met Asp Ser 50 55 60 Val Trp Glu Asp Ala Gln Asp Thr Tyr Asp Arg Thr Val Asp Thr His 65 70 75 80 Ile Lys Thr Leu Arg Ala Lys Leu Arg Ala Ile Asn Pro Asp Leu Ser 85 90 95 Pro Ile Asn Thr His Arg Gly Met Gly Tyr Ser Leu Arg Gly Leu Pro 100 105 110 Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala 115 120 125 Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp 130 135 140 Phe Asp Leu Asp Met Leu 145 150 <210> 124 <211> 151 <212> PRT <213> Escherichia coli <400> 124 Met Arg Arg Gly Ala Ala Val Ile Ile Glu Ser Gln Phe Gln Val Ala 1 5 10 15 Asp Leu Met Val Asp Leu Val Ser Arg Lys Val Thr Arg Ser Gly Thr 20 25 30 Arg Ile Thr Leu Thr Ser Lys Glu Phe Thr Leu Leu Glu Phe Phe Leu 35 40 45 Arg His Gln Gly Glu Val Leu Pro Arg Ser Leu Ile Ala Ser Gln Val 50 55 60 Trp Asp Met Asn Phe Asp Ser Asp Thr Asn Ala Ile Asp Val Ala Val 65 70 75 80 Lys Arg Leu Arg Gly Lys Ile Asp Asn Asp Phe Glu Pro Lys Leu Ile 85 90 95 Gln Thr Val Arg Gly Val Gly Tyr Met Leu Glu Val Pro Asp Gly Gln 100 105 110 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp 115 120 125 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp 130 135 140 Asp Phe Asp Leu Asp Met Leu 145 150 <210> 125 <211> 158 <212> PRT <213> Escherichia coli <400> 125 Met Gln Lys Lys Met Ala Leu Glu Lys His Gln Tyr Tyr Asp Gln Ala 1 5 10 15 Glu Leu Asp Gln Leu Ile His Gly Ser Ser Ser Asn Glu Gln Asp Pro 20 25 30 Arg Arg Leu Pro Lys Gly Leu Thr Pro Gln Thr Leu Arg Thr Leu Cys 35 40 45 Gln Trp Ile Asp Ala His Gln Asp Tyr Glu Phe Ser Thr Asp Glu Leu 50 55 60 Ala Asn Glu Val Asn Ile Ser Arg Val Ser Cys Arg Lys Tyr Leu Ile 65 70 75 80 Trp Leu Val Asn Cys His Ile Leu Phe Thr Ser Ile His Tyr Gly Val 85 90 95 Thr Gly Arg Pro Val Tyr Arg Tyr Arg Ile Gln Ala Glu His Tyr Ser 100 105 110 Leu Leu Lys Gln Tyr Cys Gln Pro Ala Asp Ala Leu Asp Asp Phe Asp 115 120 125 Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met 130 135 140 Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 145 150 155 <210> 126 <211> 144 <212> PRT <213> Escherichia coli <400> 126 Met Gln Arg Lys His Met Leu Glu Ser Ile Asp Ser Ala Ser Gln Lys 1 5 10 15 Gln Ile Asp Glu Met Phe Asn Ala Tyr Ala Arg Gly Glu Pro Lys Asp 20 25 30 Glu Leu Pro Thr Gly Ile Asp Pro Leu Thr Leu Asn Ala Val Arg Lys 35 40 45 Leu Phe Lys Glu Pro Gly Val Gln His Thr Ala Glu Thr Val Ala Gln 50 55 60 Ala Leu Thr Ile Ser Arg Thr Thr Ala Arg Arg Tyr Leu Glu Tyr Cys 65 70 75 80 Ala Ser Arg His Leu Ile Ile Ala Glu Ile Val His Gly Lys Val Gly 85 90 95 Arg Pro Gln Arg Ile Tyr His Ser Gly Pro Ala Asp Ala Leu Asp Asp 100 105 110 Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 115 120 125 Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 130 135 140 <210> 127 <211> 362 <212> PRT <213> Escherichia coli <400> 127 Met Gln Ser Ala Pro Ala Thr Asp Glu Arg Trp Arg Glu Ala Ile Val 1 5 10 15 Thr Arg Ser Pro Leu Met Leu Arg Leu Leu Glu Gln Ala Arg Leu Val 20 25 30 Ala Gln Ser Asp Val Ser Val Leu Ile Asn Gly Gln Ser Gly Thr Gly 35 40 45 Lys Glu Ile Phe Ala Gln Ala Ile His Asn Ala Ser Pro Arg Asn Ser 50 55 60 Lys Pro Phe Ile Ala Ile Asn Cys Gly Ala Leu Pro Glu Gln Leu Leu 65 70 75 80 Glu Ser Glu Leu Phe Gly His Ala Arg Gly Ala Phe Thr Gly Ala Val 85 90 95 Ser Asn Arg Glu Gly Leu Phe Gln Ala Ala Glu Gly Gly Thr Leu Phe 100 105 110 Leu Asp Glu Ile Gly Asp Met Pro Ala Pro Leu Gln Val Lys Leu Leu 115 120 125 Arg Val Leu Gln Glu Arg Lys Val Arg Pro Leu Gly Ser Asn Arg Asp 130 135 140 Ile Asp Ile Asn Val Arg Ile Ile Ser Ala Thr His Arg Asp Leu Pro 145 150 155 160 Lys Ala Met Ala Arg Gly Glu Phe Arg Glu Asp Leu Tyr Tyr Arg Leu 165 170 175 Asn Val Val Ser Leu Lys Ile Pro Ala Leu Ala Glu Arg Thr Glu Asp 180 185 190 Ile Pro Leu Leu Ala Asn His Leu Leu Arg Gln Ala Ala Glu Arg His 195 200 205 Lys Pro Phe Val Arg Ala Phe Ser Thr Asp Ala Met Lys Arg Leu Met 210 215 220 Thr Ala Ser Trp Pro Gly Asn Val Arg Gln Leu Val Asn Val Ile Glu 225 230 235 240 Gln Cys Val Ala Leu Thr Ser Ser Pro Val Ile Ser Asp Ala Leu Val 245 250 255 Glu Gln Ala Leu Glu Gly Glu Asn Thr Ala Leu Pro Thr Phe Val Glu 260 265 270 Ala Arg Asn Gln Phe Glu Leu Asn Tyr Leu Arg Lys Leu Leu Gln Ile 275 280 285 Thr Lys Gly Asn Val Thr His Ala Ala Arg Met Ala Gly Arg Asn Arg 290 295 300 Thr Glu Phe Tyr Lys Leu Leu Ser Arg His Glu Leu Asp Ala Asn Asp 305 310 315 320 Phe Lys Glu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 325 330 335 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp 340 345 350 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 355 360 <210> 128 <211> 147 <212> PRT <213> Escherichia coli <400> 128 Met Gln His His Ala Leu Asn Ser Thr Leu Glu Ile Ser Gly Leu Arg 1 5 10 15 Met Asp Ser Val Ser His Ser Val Ser Arg Asp Asn Ile Ser Ile Thr 20 25 30 Leu Thr Arg Lys Glu Phe Gln Leu Leu Trp Leu Leu Ala Ser Arg Ala 35 40 45 Gly Glu Ile Ile Pro Arg Thr Val Ile Ala Ser Glu Ile Trp Gly Ile 50 55 60 Asn Phe Asp Ser Asp Thr Asn Thr Val Asp Val Ala Ile Arg Arg Leu 65 70 75 80 Arg Ala Lys Val Asp Asp Pro Phe Pro Glu Lys Leu Ile Ala Thr Ile 85 90 95 Arg Gly Met Gly Tyr Ser Phe Val Ala Val Lys Lys Pro Ala Asp Ala 100 105 110 Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp 115 120 125 Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 130 135 140 Asp Met Leu 145 <210> 129 <211> 147 <212> PRT <213> Escherichia coli <400> 129 Met Arg Arg Asn Ser Gly Leu Ala Ser Gln Val Ile Ser Leu Pro Pro 1 5 10 15 Phe Gln Val Asp Leu Ser Arg Arg Glu Leu Ser Ile Asn Asp Glu Val 20 25 30 Ile Lys Leu Thr Ala Phe Glu Tyr Thr Ile Met Glu Thr Leu Ile Arg 35 40 45 Asn Asn Gly Lys Val Val Ser Lys Asp Ser Leu Met Leu Gln Leu Tyr 50 55 60 Pro Asp Ala Glu Leu Arg Glu Ser His Thr Ile Asp Val Leu Met Gly 65 70 75 80 Arg Leu Arg Lys Lys Ile Gln Ala Gln Tyr Pro Gln Glu Val Ile Thr 85 90 95 Thr Val Arg Gly Gln Gly Tyr Leu Phe Glu Leu Arg Pro Ala Asp Ala 100 105 110 Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp 115 120 125 Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 130 135 140 Asp Met Leu 145 <210> 130 <211> 142 <212> PRT <213> Escherichia coli <400> 130 Met Arg Thr Asn Gly Gln Ala Ser Asn Glu Leu Arg His Gly Asn Val 1 5 10 15 Met Leu Asp Pro Gly Lys Arg Ile Ala Thr Leu Ala Gly Glu Pro Leu 20 25 30 Thr Leu Lys Pro Lys Glu Phe Ala Leu Leu Glu Leu Leu Met Arg Asn 35 40 45 Ala Gly Arg Val Leu Ser Arg Lys Leu Ile Glu Glu Lys Leu Tyr Thr 50 55 60 Trp Asp Glu Glu Val Thr Ser Asn Ala Val Glu Val His Val His His 65 70 75 80 Leu Arg Arg Lys Leu Gly Ser Asp Phe Ile Arg Thr Val His Gly Ile 85 90 95 Gly Tyr Thr Leu Gly Glu Lys Pro Ala Asp Ala Leu Asp Asp Phe Asp 100 105 110 Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met 115 120 125 Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 130 135 140 <210> 131 <211> 131 <212> PRT <213> Escherichia coli <400> 131 Met Gly Lys Lys Phe Thr Pro Glu Ser Val Ser Arg Leu Leu Glu Lys 1 5 10 15 Ile Ser Ala Gly Gly Tyr Gly Asp Lys Arg Leu Ser Pro Lys Glu Ser 20 25 30 Glu Val Leu Arg Leu Phe Ala Glu Gly Phe Leu Val Thr Glu Ile Ala 35 40 45 Lys Lys Leu Asn Arg Ser Ile Lys Thr Ile Ser Ser Gln Lys Lys Ser 50 55 60 Ala Met Met Lys Leu Gly Val Glu Asn Asp Ile Ala Leu Leu Asn Tyr 65 70 75 80 Leu Ser Ser Val Thr Leu Ser Pro Ala Asp Lys Asp Pro Ala Asp Ala 85 90 95 Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp 100 105 110 Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 115 120 125 Asp Met Leu 130 <210> 132 <211> 163 <212> PRT <213> Escherichia coli <400> 132 Met Arg Gln Asn Glu Gln Ala Thr Leu Thr Lys Gly Leu Gln Glu Thr 1 5 10 15 Ser Leu Thr Pro Tyr Lys Ala Leu His Phe Gly Thr Leu Thr Ile Asp 20 25 30 Pro Ile Asn Arg Val Val Thr Leu Ala Asn Thr Glu Ile Ser Leu Ser 35 40 45 Thr Ala Asp Phe Glu Leu Leu Trp Glu Leu Ala Thr His Ala Gly Gln 50 55 60 Ile Met Asp Arg Asp Ala Leu Leu Lys Asn Leu Arg Gly Val Ser Tyr 65 70 75 80 Asp Gly Leu Asp Arg Ser Val Asp Val Ala Ile Ser Arg Leu Arg Lys 85 90 95 Lys Leu Leu Asp Asn Ala Ala Glu Pro Tyr Arg Ile Lys Thr Val Arg 100 105 110 Asn Lys Gly Tyr Leu Phe Ala Pro His Ala Trp Glu Pro Ala Asp Ala 115 120 125 Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp 130 135 140 Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 145 150 155 160 Asp Met Leu <210> 133 <211> 120 <212> PRT <213> Escherichia coli <400> 133 Met Thr Gly Gly Cys Tyr Leu Thr Pro Asp Ile Ala Ile Lys Leu Ala 1 5 10 15 Ser Gly Arg Gln Asp Pro Leu Thr Lys Arg Glu Arg Gln Val Ala Glu 20 25 30 Lys Leu Ala Gln Gly Met Ala Val Lys Glu Ile Ala Ala Glu Leu Gly 35 40 45 Leu Ser Pro Lys Thr Val His Val His Arg Ala Asn Leu Met Glu Lys 50 55 60 Leu Gly Val Ser Asn Asp Val Glu Leu Ala Arg Arg Met Phe Asp Gly 65 70 75 80 Trp Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala 85 90 95 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu 100 105 110 Asp Asp Phe Asp Leu Asp Met Leu 115 120 <210> 134 <211> 168 <212> PRT <213> Escherichia coli <400> 134 Met Ala Ala Trp Gln Gln Gln Gln Thr Ser Ser Thr Pro Ala Ala Thr 1 5 10 15 Val Thr Arg Glu Asn Asp Thr Ile Asn Leu Val Lys Asp Glu Arg Ile 20 25 30 Ile Val Thr Pro Ile Asn Asp Ile Tyr Tyr Ala Glu Ala His Glu Lys 35 40 45 Met Thr Phe Val Tyr Thr Arg Arg Glu Ser Tyr Val Met Pro Met Asn 50 55 60 Ile Thr Glu Phe Cys Ser Lys Leu Pro Pro Ser His Phe Phe Arg Cys 65 70 75 80 His Arg Ser Phe Cys Val Asn Leu Asn Lys Ile Arg Glu Ile Glu Pro 85 90 95 Trp Phe Asn Asn Thr Tyr Ile Leu Arg Leu Lys Asp Leu Asp Phe Glu 100 105 110 Val Pro Val Ser Arg Ser Lys Val Lys Glu Phe Arg Gln Leu Met His 115 120 125 Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala 130 135 140 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu 145 150 155 160 Asp Asp Phe Asp Leu Asp Met Leu 165 <210> 135 <211> 359 <212> PRT <213> Escherichia coli <400> 135 Met His Thr His Ser Ile Asp Ala Glu Thr Pro Ala Val Thr Ala Ser 1 5 10 15 Gln Phe Gly Met Val Gly Lys Ser Pro Ala Met Gln His Leu Leu Ser 20 25 30 Glu Ile Ala Leu Val Ala Pro Ser Glu Ala Thr Val Leu Ile His Gly 35 40 45 Asp Ser Gly Thr Gly Lys Glu Leu Val Ala Arg Ala Ile His Ala Ser 50 55 60 Ser Ala Arg Ser Glu Lys Pro Leu Val Thr Leu Asn Cys Ala Ala Leu 65 70 75 80 Asn Glu Ser Leu Leu Glu Ser Glu Leu Phe Gly His Glu Lys Gly Ala 85 90 95 Phe Thr Gly Ala Asp Lys Arg Arg Glu Gly Arg Phe Val Glu Ala Asp 100 105 110 Gly Gly Thr Leu Phe Leu Asp Glu Ile Gly Asp Ile Ser Pro Met Met 115 120 125 Gln Val Arg Leu Leu Arg Ala Ile Gln Glu Arg Glu Val Gln Arg Val 130 135 140 Gly Ser Asn Gln Ile Ile Ser Val Asp Val Arg Leu Ile Ala Ala Thr 145 150 155 160 His Arg Asp Leu Ala Ala Glu Val Asn Ala Gly Arg Phe Arg Gln Asp 165 170 175 Leu Tyr Tyr Arg Leu Asn Val Val Ala Ile Glu Val Pro Ser Leu Arg 180 185 190 Gln Arg Arg Glu Asp Ile Pro Leu Leu Ala Gly His Phe Leu Gln Arg 195 200 205 Phe Ala Glu Arg Asn Arg Lys Ala Val Lys Gly Phe Thr Pro Gln Ala 210 215 220 Met Asp Leu Leu Ile His Tyr Asp Trp Pro Gly Asn Ile Arg Glu Leu 225 230 235 240 Glu Asn Ala Val Glu Arg Ala Val Val Leu Leu Thr Gly Glu Tyr Ile 245 250 255 Ser Glu Arg Glu Leu Pro Leu Ala Ile Ala Ser Thr Pro Ile Pro Leu 260 265 270 Gly Gln Ser Gln Asp Ile Gln Pro Leu Val Glu Val Glu Lys Glu Val 275 280 285 Ile Leu Ala Ala Leu Glu Lys Thr Gly Gly Asn Lys Thr Glu Ala Ala 290 295 300 Arg Gln Leu Gly Ile Thr Arg Lys Thr Leu Leu Ala Lys Leu Ser Arg 305 310 315 320 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp 325 330 335 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp 340 345 350 Asp Phe Asp Leu Asp Met Leu 355 <210> 136 <211> 401 <212> PRT <213> Homo sapiens <400> 136 Met Ala His Val Ser Ser Glu Thr Gln Asp Val Ser Pro Lys Asp Glu 1 5 10 15 Leu Thr Ala Ser Glu Ala Ser Thr Arg Ser Pro Leu Cys Glu His Thr 20 25 30 Phe Pro Gly Asp Ser Asp Leu Arg Ser Met Ile Glu Glu His Ala Phe 35 40 45 Gln Val Leu Ser Gln Gly Ser Leu Leu Glu Ser Pro Ser Tyr Thr Val 50 55 60 Cys Val Ser Glu Pro Asp Lys Asp Asp Asp Phe Leu Ser Leu Asn Phe 65 70 75 80 Pro Arg Lys Leu Trp Lys Ile Val Glu Ser Asp Gln Phe Lys Ser Ile 85 90 95 Ser Trp Asp Glu Asn Gly Thr Cys Ile Val Ile Asn Glu Glu Leu Phe 100 105 110 Lys Lys Glu Ile Leu Glu Thr Lys Ala Pro Tyr Arg Ile Phe Gln Thr 115 120 125 Asp Ala Ile Lys Ser Phe Val Arg Gln Leu Asn Leu Tyr Gly Phe Ser 130 135 140 Lys Ile Gln Gln Asn Phe Gln Arg Ser Ala Phe Leu Ala Thr Phe Leu 145 150 155 160 Ser Glu Glu Lys Glu Ser Ser Val Leu Ser Lys Leu Lys Phe Tyr Tyr 165 170 175 Asn Pro Asn Phe Lys Arg Gly Tyr Pro Gln Leu Leu Val Arg Val Lys 180 185 190 Arg Arg Ile Gly Val Lys Asn Ala Ser Pro Ile Ser Thr Leu Phe Asn 195 200 205 Glu Asp Phe Asn Lys Lys His Phe Arg Ala Gly Ala Asn Met Glu Asn 210 215 220 His Asn Ser Ala Leu Ala Ala Glu Ala Ser Glu Glu Ser Leu Phe Ser 225 230 235 240 Ala Ser Lys Asn Leu Asn Met Pro Leu Thr Arg Glu Ser Ser Val Arg 245 250 255 Gln Ile Ile Ala Asn Ser Ser Val Pro Ile Arg Ser Gly Phe Pro Pro 260 265 270 Pro Ser Pro Ser Thr Ser Val Gly Pro Ser Glu Gln Ile Ala Thr Asp 275 280 285 Gln His Ala Ile Leu Asn Gln Leu Thr Thr Ile His Met His Ser His 290 295 300 Ser Thr Tyr Met Gln Ala Arg Gly His Ile Val Asn Phe Ile Thr Thr 305 310 315 320 Thr Thr Ser Gln Tyr His Ile Ile Ser Pro Leu Gln Asn Gly Tyr Phe 325 330 335 Gly Leu Thr Val Glu Pro Ser Ala Val Pro Thr Arg Tyr Pro Leu Val 340 345 350 Ser Val Asn Glu Ala Pro Tyr Arg Asn Met Leu Pro Ala Gly Asn Pro 355 360 365 Trp Leu Gln Met Pro Thr Ile Ala Asp Arg Ser Ala Ala Pro His Ser 370 375 380 Arg Leu Ala Leu Gln Pro Ser Pro Leu Asp Lys Tyr His Pro Asn Tyr 385 390 395 400 Asn <210> 137 <211> 272 <212> PRT <213> Homo sapiens <400> 137 Met Asn Ser Asp Ser Ser Ser Val Ser Ser Arg Ala Ser Ser Pro Asp 1 5 10 15 Met Asp Glu Met Tyr Leu Arg Asp His His His Arg His His His His 20 25 30 Gln Glu Ser Arg Leu Asn Ser Val Ser Ser Thr Gln Gly Asp Met Met 35 40 45 Gln Lys Met Pro Gly Glu Ser Leu Ser Arg Ala Gly Ala Lys Ala Ala 50 55 60 Gly Glu Ser Ser Lys Tyr Lys Ile Lys Lys Gln Leu Ser Glu Gln Asp 65 70 75 80 Leu Gln Gln Leu Arg Leu Lys Ile Asn Gly Arg Glu Arg Lys Arg Met 85 90 95 His Asp Leu Asn Leu Ala Met Asp Gly Leu Arg Glu Val Met Pro Tyr 100 105 110 Ala His Gly Pro Ser Val Arg Lys Leu Ser Lys Ile Ala Thr Leu Leu 115 120 125 Leu Ala Arg Asn Tyr Ile Leu Met Leu Thr Ser Ser Leu Glu Glu Met 130 135 140 Lys Arg Leu Val Gly Glu Ile Tyr Gly Gly His His Ser Ala Phe His 145 150 155 160 Cys Gly Thr Val Gly His Ser Ala Gly His Pro Ala His Ala Ala Asn 165 170 175 Ser Val His Pro Val His Pro Ile Leu Gly Gly Ala Leu Ser Ser Gly 180 185 190 Asn Ala Ser Ser Pro Leu Ser Ala Ala Ser Leu Pro Ala Ile Gly Thr 195 200 205 Ile Arg Pro Pro His Ser Leu Leu Lys Ala Pro Ser Thr Pro Pro Ala 210 215 220 Leu Gln Leu Gly Ser Gly Phe Gln His Trp Ala Gly Leu Pro Cys Pro 225 230 235 240 Cys Thr Ile Cys Gln Met Pro Pro Pro Pro His Leu Ser Ala Leu Ser 245 250 255 Thr Ala Asn Met Ala Arg Leu Ser Ala Glu Ser Lys Asp Leu Leu Lys 260 265 270 <210> 138 <211> 193 <212> PRT <213> Homo sapiens <400> 138 Met Asp Asn Leu Arg Glu Thr Phe Leu Ser Leu Glu Asp Gly Leu Gly 1 5 10 15 Ser Ser Asp Ser Pro Gly Leu Leu Ser Ser Trp Asp Trp Lys Asp Arg 20 25 30 Ala Gly Pro Phe Glu Leu Asn Gln Ala Ser Pro Ser Gln Ser Leu Ser 35 40 45 Pro Ala Pro Ser Leu Glu Ser Tyr Ser Ser Ser Pro Cys Pro Ala Val 50 55 60 Ala Gly Leu Pro Cys Glu His Gly Gly Ala Ser Ser Gly Gly Ser Glu 65 70 75 80 Gly Cys Ser Val Gly Gly Ala Ser Gly Leu Val Glu Val Asp Tyr Asn 85 90 95 Met Leu Ala Phe Gln Pro Thr His Leu Gln Gly Gly Gly Gly Pro Lys 100 105 110 Ala Gln Lys Gly Thr Lys Val Arg Met Ser Val Gln Arg Arg Arg Lys 115 120 125 Ala Ser Glu Arg Glu Lys Leu Arg Met Arg Thr Leu Ala Asp Ala Leu 130 135 140 His Thr Leu Arg Asn Tyr Leu Pro Pro Val Tyr Ser Gln Arg Gly Gln 145 150 155 160 Pro Leu Thr Lys Ile Gln Thr Leu Lys Tyr Thr Ile Lys Tyr Ile Gly 165 170 175 Glu Leu Thr Asp Leu Leu Asn Arg Gly Arg Glu Pro Arg Ala Gln Ser 180 185 190 Ala <210> 139 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 139 gaaatagcgc tgtacagcgt atgggaatct cttgtacggt gtacgagtat cttcccgtac 60 accgtac 67 <210> 140 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 140 catgtgattg aatataaccg acgtgactgt tacatttagg gg 42 <210> 141 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 141 tactgtatat atatacagta tactgtatat atatacagta 40 <210> 142 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 142 tacccctata ggggtatagc gccggctacc cctatagggg tat 43 <210> 143 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 143 tacccctata ggggtatagc gccggctacc cctatagggg tattacccct ataggggtat 60 agcgccggct acccctatag gggta 85 <210> 144 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 144 wakrrkta 8 <210> 145 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 145 atttacattt tgaaacatct a 21 <210> 146 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 146 wahatgwwac maarwdtww 19 <210> 147 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 147 atgttaataa 10 <210> 148 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 148 atgttaataa tatgtggcat aagcgttaaa tg 32 <210> 149 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 149 wamawwtwrt taama 15 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 150 gctatgcaga aatttgcaca 20 <210> 151 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 151 ttctycmyda tyksyks 17 <210> 152 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 152 tgtcataaaa ctgtcatatt ccttacatat aactgtca 38 <210> 153 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 153 ctgwcayaaa wctgwm 16 <210> 154 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 154 ttcttacgcc tgtaggatta gtaagaa 27 <210> 155 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 155 tkcytacamc tgtarga 17 <210> 156 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 156 tgcaccawww tggtgca 17 <210> 157 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 157 tgcmcyaaaa tsgtgca 17 <210> 158 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or t <400> 158 ntaccccta 9 <210> 159 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 159 mtacyyct 8 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (10)..(11) <223> n is a, c, g, or t <400> 160 cttaaggttn ncttaaggtt 20 <210> 161 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (2)..(2) <223> n is a, c, g, or t <220> <221> misc_feature <222> (4)..(4) <223> n is a, c, g, or t <220> <221> misc_feature <222> (10)..(10) <223> n is a, c, g, or t <400> 161 ancnctaaan t 11 <210> 162 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (6)..(10) <223> n is a, c, g, or t <400> 162 gtaaannnnn gtaaa 15 <210> 163 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 163 gtaaarmwry gwaar 15 <210> 164 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (6)..(11) <223> n is a, c, g, or t <400> 164 ttcacnnnnn nttcac 16 <210> 165 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (11)..(12) <223> n is a, c, g, or t <400> 165 aaaatgacaa nnttgtcatt ttt 23 <210> 166 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 166 tgattacaaa actttaaaaa gtgctg 26 <210> 167 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 167 tgattacaaa actttaaaaa gtgctgcata gcgccggccg cgcctgatta caaaacttta 60 aaaagtgctg 70 <210> 168 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 168 tgattacaaa actttaaaaa gtgctgtagc gccggctgat tacaaaactt taaaaagtgc 60 tg 62 <210> 169 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 169 tkwwttwaat twykwwa 17 <210> 170 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 170 gatctattct ttt 13 <210> 171 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 171 tatctttttt tat 13 <210> 172 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(14) <223> n is a, c, g, or t <400> 172 tgtcnnnnnn nnnngaca 18 <210> 173 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (9)..(9) <223> n is a, c, g, or t <400> 173 cattacaant tgtaatg 17 <210> 174 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (7)..(11) <223> n is a, c, g, or t <400> 174 catgaannnn ntgttta 17 <210> 175 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 175 wrtttaksww yygttta 17 <210> 176 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (7)..(11) <223> n is a, c, g, or t <400> 176 rttaamnnnn nrttaam 17 <210> 177 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 177 taagaatatt ccta 14 <210> 178 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 178 awymrgaykw wtyt 14 <210> 179 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(2) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7)..(12) <223> n is a, c, g, or t <220> <221> misc_feature <222> (17)..(18) <223> n is a, c, g, or t <400> 179 nntacannnn nntactnn 18 <210> 180 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 180 kwcwtwtvgt taca 14 <210> 181 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 181 ggcaaaacta agaaattttc caggttttgc c 31 <210> 182 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 182 ggcatttcat 10 <210> 183 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 183 gcgagtcaaa aaaactca 18 <210> 184 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (7)..(9) <223> n is a, c, g, or t <400> 184 ttcgaannnt tcgaa 15 <210> 185 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 185 rcrttcgaaa crttcgaww 19 <210> 186 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 186 rttcgaahsd ttcgaay 17 <210> 187 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 187 rcattcyaaa cattcyahw 19 <210> 188 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 188 rttcgaaysd ttcgaay 17 <210> 189 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 189 accatatgtt 10 <210> 190 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 190 rccatatgkt 10 <210> 191 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 191 avcakmtgtt 10 <210> 192 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 192 rccatatgkt 10 <210> 193 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 193 accatatgkt 10 <210> 194 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 194 amcakmtgtt 10 <210> 195 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 195 accatatgkt 10 <210> 196 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 196 amcatatgby 10 <210> 197 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 197 srccawwtgk ys 12 <210> 198 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 198 brccawwtgk yv 12 <210> 199 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 199 agatcaaagg gggta 15 <210> 200 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 200 agatcaaagg gggtaagatc aaagggggta agatcaaagg gggta 45 <210> 201 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 201 agatcaaagg gggtaagatc aaagggggta agatcaaagg gggtaagatc aaagggggta 60 agatcaaagg gggtaagatc aaagggggta 90 <210> 202 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 202 cgcgccgacc acgtggtcca 20 <210> 203 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 203 cgcgccgacc acgtggtcga ccacgtggtc ca 32 <210> 204 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 204 cgcgccgacc acgtggtcga ccacgtggtc gaccacgtgg tcca 44 <210> 205 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 205 gaccttgagt acgtgcgtct ctgcacgtat g 31 <210> 206 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 206 gaccttgagt acgtgcgtct ctgcacgtat ggaccttgag tacgtgcgtc tctgcacgta 60 tg 62 <210> 207 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 207 gaccttgagt acgtgcgtct ctgcacgtat ggaccttgag tacgtgcgtc tctgcacgta 60 tggaccttga gtacgtgcgt ctctgcacgt atg 93 <210> 208 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 208 tgtttattgt ttattgttta t 21 <210> 209 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 209 tgtttattgt ttattgttta ttgtttattg tttattgttt at 42 <210> 210 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 210 gcaaagcaaa cagcaaagca aacagcaaag caaaca 36 <210> 211 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 211 gcaaagcaaa cagcaaagca aacagcaaag caaacagcaa agcaaacagc aaagcaaaca 60 gcaaagcaaa ca 72 <210> 212 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 212 tgtttgcttt gctgtttgct ttgctgtttg ctttgc 36 <210> 213 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 213 tgtttgcttt gctgtttgct ttgctgtttg ctttgctgtt tgctttgctg tttgctttgc 60 tgtttgcttt gc 72 <210> 214 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 214 gaacacccag aacacccaga acacccagaa cacccagaac acccagaaca cccagaacac 60 ccagaacacc ca 72 <210> 215 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 215 gaacacccag aacacccaga acacccagaa cacccagaac acccagaaca ccca 54 <210> 216 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 216 agttaataat ttaac 15 <210> 217 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 217 agttaataat ttaacagtta ataatttaac 30 <210> 218 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 218 agttaataat ttaacagtta ataatttaac agttaataat ttaac 45 <210> 219 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 219 agttaataat ttaacagtta ataatttaac agttaataat ttaacagtta ataatttaac 60 <210> 220 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 220 ctacacaaag ccctctgtgt aagactacac aaagccctct gtgtaaga 48 <210> 221 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 221 ctacacaaag ccctctgtgt aagactacac aaagccctct gtgtaagact acacaaagcc 60 ctctgtgtaa ga 72 <210> 222 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 222 ctacacaaag ccctctttgt gagactacac aaagccctct ttgtgaga 48 <210> 223 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 223 ctacacaaag ccctctttgt gagactacac aaagccctct ttgtgagact acacaaagcc 60 ctctttgtga ga 72 <210> 224 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 224 ccattgttct ccattgttct ccattgttct 30 <210> 225 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 225 ccattgttct ccattgttct ccattgttct ccattgttct ccattgttct ccattgttct 60 <210> 226 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 226 aacaaagaac aaagaacaaa gaacaaag 28 <210> 227 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 227 aaccgttaaa cggttaaccg ttaaacggtt aaccgttaaa cggtt 45 <210> 228 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 228 agagatattt agtgaatcag caagtggaac caaaaagact tgaggactga ttggatgagg 60 agaggttag 69 <210> 229 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 229 agagatattt agtgaatcag caagtggaac caaaaagact tgaggactga ttggatgagg 60 agaggttaga gagatattta gtgaatcagc aagtggaacc aaaaagactt gaggactgat 120 tggatgagga gaggttag 138 <210> 230 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 230 actggtgccc tcctcaactc ccacctgcat ctggggccca tactggttgg ctcccgcggt 60 gccatgtctg cagtgtgccc cccagccccg g 91 <210> 231 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 231 actggtgccc tcctcaactc ccacctgcat ctggggccca tactggttgg ctcccgcggt 60 gccatgtctg cagtgtgccc cccagccccg gactggtgcc ctcctcaact cccacctgca 120 tctggggccc atactggttg gctcccgcgg tgccatgtct gcagtgtgcc ccccagcccc 180 gg 182 <210> 232 <211> 128 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 232 cgcgccgacc acgtggtcga ccacgtggtc cacgcgccga ccacgtggtc gaccacgtgg 60 tccacgcgcc gaccacgtgg tcgaccacgt ggtccacgcg ccgaccacgt ggtcgaccac 120 gtggtcca 128 <210> 233 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 233 gtcacgtggc tcagtcacgt ggctcagtca cgtggctcag tcacgtggc 49 <210> 234 <211> 98 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 234 gtcacgtggc tcagtcacgt ggctcagtca cgtggctcag tcacgtggcg tcacgtggct 60 cagtcacgtg gctcagtcac gtggctcagt cacgtggc 98 <210> 235 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 235 gaccacgtgg tcgaccacgt ggtcgaccac gtggtcgacc acgtggtc 48 <210> 236 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 236 gaccacgtgg tcgaccacgt ggtcgaccac gtggtcgacc acgtggtcga ccacgtggtc 60 gaccacgtgg tcgaccacgt ggtcgaccac gtggtc 96 <210> 237 <211> 124 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 237 cctctacccc ctttgatctt accccctttg atcttacccc ctttgatctt accccctttg 60 atcttacccc ctttgatctt accccctttg atcttacccc ctttgatctt accccctttg 120 atct 124 <210> 238 <211> 514 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 238 ggcctgaaat aacctctgaa agaggaactt ggttaggtac cttctgaggc tgaaagaacc 60 agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca gcaggcagaa 120 gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc 180 cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata gtcccactgc 240 agtttgagga gaatatttgt tatatttgca aaataaaata agtttgcaag tttttttttt 300 ctgccccaaa gagctctgtg tccttgaaca taaaatacaa ataaccgcta tgctgttaat 360 tattggcaaa tgtcccattt tcaacctaag gaaataccat aaagtaacag atataccaac 420 aaaaggttac tagttaacag gcattgcctg aaaagagtat aaaagaattt cagcatgatt 480 ttccatattg tgcttccacc actgccaata acac 514 <210> 239 <211> 199 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 239 ctgtgtcctt gaacataaaa tacaaataac cgctatgctg ttaattattg gcaaatgtcc 60 cattttcaac ctaaggaaat accataaagt aacagatata ccaacaaaag gttactagtt 120 aacaggcatt gcctgaaaag agtataaaag aatttcagca tgattttcca tattgtgctt 180 ccaccactgc caataacac 199 <210> 240 <211> 1150 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 240 aaattagttt tgaatctttc taataccaaa gttcagttta ctgttccatg ttgcttctga 60 gtggcttcac agacttatga aaaagtaaac ggaatcagaa ttacatcaat gcaaaagcat 120 tgctgtgaac tctgtactta ggactaaact ttgagcaata acacatatag attgaggatt 180 gtttgctgtt agtatacaaa ctctggttca aagctcctct ttattgcttg tcttggaaaa 240 tttgctgttc ttcatggttt ctcttttcac tgctatctat ttttctcaac cactcacatg 300 gctacaataa ctgtctgcaa gcttatgatt cccaaatatc tatctctagc ctcaatcttg 360 ttccagaaga taaaaagtag tattcaaatg cacatcaacg tctccacttg gagggcttaa 420 agacgtttca acatacaaac cggggagttt tgcctggaat gtttcctaaa atgtgtcctg 480 tagcacatag ggtcctcttg ttccttaaaa tctaattact tttagcccag tgctcatccc 540 acctatgggg agatgagagt gaaaagggag cctgattaat aattacacta agtcaatagg 600 catagagcca ggactgtttg ggtaaactgg tcactttatc ttaaactaaa tatatccaaa 660 actgaacatg tacttagtta ctaagtcttt gactttatct cattcatacc actcagcttt 720 atccaggcca cttatttgac agtattattg cgaaaacttc ctaactggtc tccttatcat 780 agtcttatcc ccttttgaaa caaaagagac agtttcaaaa tacaaatatg atttttatta 840 gctccctttt gttgtctata atagtcccag aaggagttat aaactccatt taaaaagtct 900 ttgagatgtg gcccttgcca actttgccag gctgtgtcct tgaacataaa atacaaataa 960 ccgctatgct gttaattatt ggcaaatgtc ccattttcaa cctaaggaaa taccataaag 1020 taacagatat accaacaaaa ggttactagt taacaggcat tgcctgaaaa gagtataaaa 1080 gaatttcagc atgattttcc caagtttgct tatttatgaa aagttatcga taatttcttt 1140 agttttgtat 1150 <210> 241 <211> 609 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 241 tccctgccca cccgcggaaa ccgccccagg tgggccgcgc cccctcccca gcagccagca 60 gggcgccagg gctgagccgg ccgtggaggg gagcgggtcc cgcgggttat acaggcgccg 120 gggctccgcg gcaggcaaga gaagctgagg cctgagaacg gcccgggcct tggcgtacgg 180 caggggacga cctgggatgg gggcagcggg cggcggcgca gggagtgggc cgggggccgg 240 tgtgcgcggg cgggacgggg cccggggtcg ggagaccacc gctcggaaga tggggccggg 300 agaggccgcc gtcgcagcgc agagggcacc ggcggggaga cgcgaggacg cggggccggg 360 aacacggacg ccggagtaga agcgcggggg gcgcgggctg gagcgggggc ggggacgccg 420 gggtcggggg cggtgcgggt ttgaggggag ggggcggggc gggtccttcc ctgggggggt 480 ggggagaggg ggcgggggcc catgtgaccg gctcagaccg gttctggaga caaaaggggc 540 cgcggcggcc ggagcgggac gggcccggcg cgggagggag cgaagcagcg cgggcagcga 600 gcgagtgag 609 <210> 242 <211> 319 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 242 accaccgctc ggaagatggg gccgggagag gccgccgtcg cagcgcagag ggcaccggcg 60 gggagacgcg aggacgcggg gccgggaaca cggacgccgg agtagaagcg cggggggcgc 120 gggctggagc gggggcgggg acgccggggt cgggggcggt gcgggtttga ggggaggggg 180 cggggcgggt ccttccctgg gggggtgggg agagggggcg ggggcccatg tgaccggctc 240 agaccggttc tggagacaaa aggggccgcg gcggccggag cgggacgggc ccggcgcggg 300 agggagcgaa gcagcgcgg 319 <210> 243 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 243 ccgcggcggc cggagcggga cgggcccggc gcgggaggga gcgaagcagc gcgggcagcg 60 agcgagtgag 70 <210> 244 <211> 1511 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 244 ggagtctcac tctgtcgccc aagctggagt gcagtagtgc gatctcagct cactgcaacc 60 tctgccctct gagttcaagt gattctcctg cctcagcctc ccgagtagct gggattacag 120 gcgcctgcca ccgcgcccag ctaatttttt gtatttttgg tagagacggg gtttcaccat 180 cttggccagg ctggtcttga actcctgacc tcatgatcca cccgcctcgg cttcccaaag 240 tgctgggatt acaggcgtga gccaccgtgc ctggcctaaa gaactggatt tctaatggtg 300 aaatctaagc aggagaggtg ggatttgggt gtaggatacc tttcaaatag ccttctactc 360 catctatgaa ataggctagc tttggctcag taaatttgct gtgtaatgat tttctaatga 420 gttaggctgg ctttaagccc ctggttattt cgttgtaacc agttaggctt tgcctcttga 480 agggccacct gggactgtcg tgcagtagat tttcttttaa cgccccagaa tcaggtgctt 540 tctctgactt tgtgtggctc tactgaatca aatctagcaa gccacagagg ctttcagact 600 tttaagatac aatattcaaa ggtgaggcag gctgtgaaaa gcccagcggt ccctggctgt 660 ccctgaacgc gactatttgc aggttggctt tgagaacccg gtcagagctg cgttaggaaa 720 acggttcccg ggaagctcct cagagagtag aatgaggagg tggattttgt gtgaaggaac 780 accttgtgtg gctctggtgg ccaggaaaga gctggcacaa gctgaaagaa ggcctgtggc 840 gaagcggagg gggacctaag tcagggaccc ccacctgccc ccaggaagga tgaaaaggag 900 acaaaaatcc taaagggaaa agccctccag gctgtaggcc aatgagcggc gggaaggagg 960 agtgaggctg gggaacttct cccagagcca gtcagagcgg acggctgctg ggaagccaat 1020 cagcgcgctc gagcctgcag cccctctgca gtagttatgc cagagcgccc tgtgtagagc 1080 ggctgcgagc gggcagctgg gctcggctgc cgggagccac cgcgcgggct ccgcaccctc 1140 ctctcgcact gccttcgccc ggtccccgcg ccgcggtgcc ccagtggccc ccgccgcgct 1200 ccacgccgcg cccccgcacc ccgccggcta ccggccgcac aaccgccacc gccccctggc 1260 cgcgcggctc gcctcgcccc gccccgtccc tcctcgcccc gccccacccc agtcagcccc 1320 gccctgcccc gcgccgccaa gcggttcccg ccctcgccca gcgcccaggt agctgcgagg 1380 aaacttttgc agcggctggg tagcagcacg tctcttgctc ctcagggcca ctgccaggct 1440 tgccgagtcc tgggactgct ctcgctccgg ctgccactct cccgcgctct cctagctccc 1500 tgcgaagcag g 1511 <210> 245 <211> 1200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 245 ggagaggtgg gatttgggtg taggatacct ttcaaatagc cttctactcc atctatgaaa 60 taggctagct ttggctcagt aaatttgctg tgtaatgatt ttctaatgag ttaggctggc 120 tttaagcccc tggttatttc gttgtaacca gttaggcttt gcctcttgaa gggccacctg 180 ggactgtcgt gcagtagatt ttcttttaac gccccagaat caggtgcttt ctctgacttt 240 gtgtggctct actgaatcaa atctagcaag ccacagaggc tttcagactt ttaagataca 300 atattcaaag gtgaggcagg ctgtgaaaag cccagcggtc cctggctgtc cctgaacgcg 360 actatttgca ggttggcttt gagaacccgg tcagagctgc gttaggaaaa cggttcccgg 420 gaagctcctc agagagtaga atgaggaggt ggattttgtg tgaaggaaca ccttgtgtgg 480 ctctggtggc caggaaagag ctggcacaag ctgaaagaag gcctgtggcg aagcggaggg 540 ggacctaagt cagggacccc cacctgcccc caggaaggat gaaaaggaga caaaaatcct 600 aaagggaaaa gccctccagg ctgtaggcca atgagcggcg ggaaggagga gtgaggctgg 660 ggaacttctc ccagagccag tcagagcgga cggctgctgg gaagccaatc agcgcgctcg 720 agcctgcagc ccctctgcag tagttatgcc agagcgccct gtgtagagcg gctgcgagcg 780 ggcagctggg ctcggctgcc gggagccacc gcgcgggctc cgcaccctcc tctcgcactg 840 ccttcgcccg gtccccgcgc cgcggtgccc cagtggcccc cgccgcgctc cacgccgcgc 900 ccccgcaccc cgccggctac cggccgcaca accgccaccg ccccctggcc gcgcggctcg 960 cctcgccccg ccccgtccct cctcgccccg ccccacccca gtcagccccg ccctgccccg 1020 cgccgccaag cggttcccgc cctcgcccag cgcccaggta gctgcgagga aacttttgca 1080 gcggctgggt agcagcacgt ctcttgctcc tcagggccac tgccaggctt gccgagtcct 1140 gggactgctc tcgctccggc tgccactctc ccgcgctctc ctagctccct gcgaagcagg 1200 <210> 246 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 246 aaagggaaaa gccctccagg ctgtaggcca atgagcggcg ggaaggagga gtgaggctgg 60 ggaacttctc ccagagccag tcagagcgga cggctgctgg gaagccaatc agcgcgctcg 120 agcctgcagc ccctctgcag tagttatgcc agagcgccct gtgtagagcg gctgcgagcg 180 ggcagctggg ctcggctgcc gggagccacc gcgcgggctc cgcaccctcc tctcgcactg 240 ccttcgcccg gtccccgcgc cgcggtgccc cagtggcccc cgccgcgctc cacgccgcgc 300 ccccgcaccc cgccggctac cggccgcaca accgccaccg ccccctggcc gcgcggctcg 360 cctcgccccg ccccgtccct cctcgccccg ccccacccca gtcagccccg ccctgccccg 420 cgccgccaag cggttcccgc cctcgcccag cgcccaggta gctgcgagga aacttttgca 480 gcggctgggt agcagcacgt ctcttgctcc tcagggccac tgccaggctt gccgagtcct 540 gggactgctc tcgctccggc tgccactctc ccgcgctctc ctagctccct gcgaagcagg 600 <210> 247 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 247 ccccgcaccc cgccggctac cggccgcaca accgccaccg ccccctggcc gcgcggctcg 60 cctcgccccg ccccgtccct cctcgccccg ccccacccca gtcagccccg ccctgccccg 120 cgccgccaag cggttcccgc cctcgcccag cgcccaggta gctgcgagga aacttttgca 180 gcggctgggt agcagcacgt ctcttgctcc tcagggccac tgccaggctt gccgagtcct 240 gggactgctc tcgctccggc tgccactctc ccgcgctctc ctagctccct gcgaagcagg 300 <210> 248 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 248 gtcagccccg ccctgccccg cgccgccaag cggttcccgc cctcgcccag cgcccaggta 60 gctgcgagga aacttttgca gcggctgggt agcagcacgt ctcttgctcc tcagggccac 120 tgccaggctt gccgagtcct gggactgctc tcgctccggc tgccactctc ccgcgctctc 180 ctagctccct gcgaagcagg 200 <210> 249 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 249 cgcccaggta gctgcgagga aacttttgca gcggctgggt agcagcacgt ctcttgctcc 60 tcagggccac tgccaggctt gccgagtcct gggactgctc tcgctccggc tgccactctc 120 ccgcgctctc ctagctccct gcgaagcagg 150 <210> 250 <211> 455 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 250 tggcccctcc ctcgggttac cccacagcct aggccgattc gacctctctc cgctggggcc 60 ctcgctggcg tccctgcacc ctgggagcgc gagcggcgcg cgggcgggga agcgcggccc 120 agacccccgg gtccgcccgg agcagctgcg ctgtcggggc caggccgggc tcccagtgga 180 ttcgcgggca cagacgccca ggaccgcgct tcccacgtgg cggagggact ggggacccgg 240 gcacccgtcc tgccccttca ccttccagct ccgcctcctc cgcgcggacc ccgccccgtc 300 ccgacccctc ccgggtcccc ggcccagccc cctccgggcc ctcccagccc ctccccttcc 360 tttccgcggc cccgccctct cctcgcggcg cgagtttcag gcagcgctgc gtcctgctgc 420 gcacgtggga agccctggcc ccggccaccc ccgcg 455 <210> 251 <211> 258 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 251 ccaggaccgc gcttcccacg tggcggaggg actggggacc cgggcacccg tcctgcccct 60 tcaccttcca gctccgcctc ctccgcgcgg accccgcccc gtcccgaccc ctcccgggtc 120 cccggcccag ccccctccgg gccctcccag cccctcccct tcctttccgc ggccccgccc 180 tctcctcgcg gcgcgagttt caggcagcgc tgcgtcctgc tgcgcacgtg ggaagccctg 240 gccccggcca cccccgcg 258 <210> 252 <211> 159 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 252 cgtcccgacc cctcccgggt ccccggccca gccccctccg ggccctccca gcccctcccc 60 ttcctttccg cggccccgcc ctctcctcgc ggcgcgagtt tcaggcagcg ctgcgtcctg 120 ctgcgcacgt gggaagccct ggccccggcc acccccgcg 159 <210> 253 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 253 cccctcccct tcctttccgc ggccccgccc tctcctcgcg gcgcgagttt caggcagcgc 60 tgcgtcctgc tgcgcacgtg ggaagccctg gccccggcca cccccgcg 108 <210> 254 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 254 cccgggtccc cggcccagcc ccctccgggc cctcccagcc cctccccttc ctttccgcgg 60 ccccgccctc tcctcgcggc gcg 83 <210> 255 <211> 976 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 255 ccatagaacc agagaagtga gtggatgtga tgcccagctc cagaagtgac tccagaacac 60 cctgttccaa agcagaggac acactgattt tttttttaat aggctgcagg acttactgtt 120 ggtgggacgc cctgctttgc gaagggaaag gaggagtttg ccctgagcac aggcccccac 180 cctccactgg gctttcccca gctcccttgt cttcttatca cggtagtggc ccagtccctg 240 gcccctgact ccagaaggtg gccctcctgg aaacccaggt cgtgcagtca acgatgtact 300 cgccgggaca gcgatgtctg ctgcactcca tccctcccct gttcatttgt ccttcatgcc 360 cgtctggagt agatgctttt tgcagaggtg gcaccctgta aagctctcct gtctgacttt 420 tttttttttt ttagactgag ttttgctctt gttgcctagg ctggagtgca atggcacaat 480 ctcagctcac tgcaccctct gcctcccggg ttcaagcgat tctcctgcct cagcctcccg 540 agtagttggg attacaggca tgcaccacca cgcccagcta atttttgtat ttttagtaga 600 gacaaggttt caccgtgatg gccaggctgg tcttgaactc caggactcaa gtgatgctcc 660 tgcctaggcc tctcaaagtg ttgggattac aggcgtgagc cactgcaccc ggcctgcacg 720 cgttctttga aagcagtcga gggggcgcta ggtgtgggca gggacgagct ggcgcggcgt 780 cgctgggtgc accgcgacca cgggcagagc cacgcggcgg gaggactaca actcccggca 840 caccccgcgc cgccccgcct ctactcccag aaggccgcgg ggggtggacc gcctaagagg 900 gcgtgcgctc ccgacatgcc ccgcggcgcg ccattaaccg ccagatttga atcgcgggac 960 ccgttggcag aggtgg 976 <210> 256 <211> 500 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 256 caatctcagc tcactgcacc ctctgcctcc cgggttcaag cgattctcct gcctcagcct 60 cccgagtagt tgggattaca ggcatgcacc accacgccca gctaattttt gtatttttag 120 tagagacaag gtttcaccgt gatggccagg ctggtcttga actccaggac tcaagtgatg 180 ctcctgccta ggcctctcaa agtgttggga ttacaggcgt gagccactgc acccggcctg 240 cacgcgttct ttgaaagcag tcgagggggc gctaggtgtg ggcagggacg agctggcgcg 300 gcgtcgctgg gtgcaccgcg accacgggca gagccacgcg gcgggaggac tacaactccc 360 ggcacacccc gcgccgcccc gcctctactc ccagaaggcc gcggggggtg gaccgcctaa 420 gagggcgtgc gctcccgaca tgccccgcgg cgcgccatta accgccagat ttgaatcgcg 480 ggacccgttg gcagaggtgg 500 <210> 257 <211> 250 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 257 ttgaaagcag tcgagggggc gctaggtgtg ggcagggacg agctggcgcg gcgtcgctgg 60 gtgcaccgcg accacgggca gagccacgcg gcgggaggac tacaactccc ggcacacccc 120 gcgccgcccc gcctctactc ccagaaggcc gcggggggtg gaccgcctaa gagggcgtgc 180 gctcccgaca tgccccgcgg cgcgccatta accgccagat ttgaatcgcg ggacccgttg 240 gcagaggtgg 250 <210> 258 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 258 tacaactccc ggcacacccc gcgccgcccc gcctctactc ccagaaggcc gcggggggtg 60 gaccgcctaa gagggcgtgc gctcccgaca tgccccgcgg cgcgccatta accgccagat 120 ttgaatcgcg ggacccgttg gcagaggtgg 150 <210> 259 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 259 cctaagaggg cgtgcgctcc cgacatgccc cgcggcgcgc cattaaccgc cagatttgaa 60 tcgcgggacc cgttggcaga ggtgg 85 <210> 260 <211> 860 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 260 aattctagtt tggtcctaga tgaccacata tccattgttc cttcaacgag cacatggtaa 60 agagcctaga acacagagac acagaacaca gtggagaaaa gggagtgaaa tgtctttaat 120 gacacttact atatatggga ttttgtgaca atatacaagg atggttaaga catataaggt 180 gatgcaaaaa aacatattaa caattatagt gacaaaaaat gaggagcata taattataca 240 ttgatttata cagagtacca gaggaacaca gcattgagag ccgtaacacc acctgaggga 300 gtggagaaag gcttcagaga gaaagtgttt tttggaatgg atcactgttt ccaaaagaac 360 taaagtacag tttgagaaat gcatacttaa ttcattactt ttttcccctc aactttaata 420 ataaatttac ccaacaaaaa agtttatttt tgacttgtaa atctcttaaa atcataaaaa 480 agtaaaatta gcttttaaaa acaggtagtc accatagcat tgaatgtgta gtttataata 540 cagcaaagtt aaatacaatt tcaaattacc tattaagtta gttgctcatt tctttgattt 600 catttagcat tgatctaact caatgtggaa gaaggttaca ttcgtgcaag ttaacacggc 660 ttaatgatta actatgttca cctaccaacc ttaccttttc tgggcaaata ttggtatata 720 tagagttaag aagtctaggt ctgcttccag aagaaaacag ttccacgttg cttgaaattg 780 aaaatcaaga taaaaatgtt cacaattaag ctccttcttt ttattgttcc tctagttatt 840 tcctccagaa ttgatcaaga 860 <210> 261 <211> 347 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 261 atagcattga atgtgtagtt tataatacag caaagttaaa tacaatttca aattacctat 60 taagttagtt gctcatttct ttgatttcat ttagcattga tctaactcaa tgtggaagaa 120 ggttacattc gtgcaagtta acacggctta atgattaact atgttcacct accaacctta 180 ccttttctgg gcaaatattg gtatatatag agttaagaag tctaggtctg cttccagaag 240 aaaacagttc cacgttgctt gaaattgaaa atcaagataa aaatgttcac aattaagctc 300 cttcttttta ttgttcctct agttatttcc tccagaattg atcaaga 347 <210> 262 <211> 241 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 262 tcaatgtgga agaaggttac attcgtgcaa gttaacacgg cttaatgatt aactatgttc 60 acctaccaac cttacctttt ctgggcaaat attggtatat atagagttaa gaagtctagg 120 tctgcttcca gaagaaaaca gttccacgtt gcttgaaatt gaaaatcaag ataaaaatgt 180 tcacaattaa gctccttctt tttattgttc ctctagttat ttcctccaga attgatcaag 240 a 241 <210> 263 <211> 404 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 263 tgggatgttt cgagcagtcc tgctgaagtc cttttatatc ctgtttaagg gatgcctgtt 60 aactagtaac cttcagtgag caaacatatg actctatttc cttacgttga agttaggcaa 120 tttgccaata attaacagag caggggtcac ttgtatccta tgttcaagga caaagaccac 180 ttcagagtgg aaaaaaaatc taaactgttc aaatagatta tttcccctga agaataattc 240 attcatctca acataagaca tagatatagc cataaagaaa aggtagcaga cttactatgt 300 aactccaaat acaagttcag gctattcatt agtggatata tttcttgatt atccagttat 360 agtatatttt attttattta gtgtatcgca tctggtttaa cata 404 <210> 264 <211> 470 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 264 atgagggaag cgggtgtgat ccacttgaaa actgctggtt ccttcaccgc aggcagtgct 60 ggaagtggga tgtttcgagc agtcctgctg aagtcctttt atatcctgtt taagggatgc 120 ctgttaacta gtaaccttca gtgagcaaac atatgactct atttccttac gttgaagtta 180 ggcaatttgc caataattaa cagagcaggg gtcacttgta tcctatgttc aaggacaaag 240 accacttcag agtggaaaaa aaatctaaac tgttcaaata gattatttcc cctgaagaat 300 aattcattca tctcaacata agacatagat atagccataa agaaaaggta gcagacttac 360 tatgtaactc caaatacaag ttcaggctat tcattagtgg atatatttct tgattatcca 420 gttatagtat attttatttt atttagtgta tcgcatctgg tttaacatag 470 <210> 265 <211> 800 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 265 atgagggaag cgggtgtgat ccacttgaaa actgctggtt ccttcaccgc aggcagtgct 60 ggaagtggga tgtttcgagc agtcctgctg aagtcctttt atatcctgtt taagggatgc 120 ctgttaacta gtaaccttca gtgagcaaac atatgactct atttccttac gttgaagtta 180 ggcaatttgc caataattaa cagagcaggg gtcacttgta tcctatgttc aaggacaaag 240 accacttcag agtggaaaaa aaatctaaac tgttcaaata gattatttcc cctgaagaat 300 aattcattca tctcaacata agacatagat atagccataa agaaaaggta gcagacttac 360 tatgtaactc caaatacaag ttcaggctat tcattagtgg atatatttct tgattatcca 420 gttatagtat attttatttt atttagtgta tcgcatctgg tttaacatag aaaacttaca 480 gcacaaaacc tgatgagcca gctcccattc taattttatg tgccaaagaa taattccata 540 tgtatgtcac aggtgcatgg gtcagctgca acatcctctc aagccctaag atgatgatgc 600 taacagcaac aaatgggcac tgatagtttc catttctcta cacattagag ttgatggaaa 660 acttttaaaa cttcccagtg cgtatcgaaa ctagaactca gacgttggcg tgtcagagtc 720 tgtgtgtcta gaggtccaga catgtttgct aaggcttcat atgtagttga gtttattttt 780 tattttttta aattcatggc 800 <210> 266 <211> 1104 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 266 atgagggaag cgggtgtgat ccacttgaaa actgctggtt ccttcaccgc aggcagtgct 60 ggaagtggga tgtttcgagc agtcctgctg aagtcctttt atatcctgtt taagggatgc 120 ctgttaacta gtaaccttca gtgagcaaac atatgactct atttccttac gttgaagtta 180 ggcaatttgc caataattaa cagagcaggg gtcacttgta tcctatgttc aaggacaaag 240 accacttcag agtggaaaaa aaatctaaac tgttcaaata gattatttcc cctgaagaat 300 aattcattca tctcaacata agacatagat atagccataa agaaaaggta gcagacttac 360 tatgtaactc caaatacaag ttcaggctat tcattagtgg atatatttct tgattatcca 420 gttatagtat attttatttt atttagtgta tcgcatctgg tttaacatag aaaacttaca 480 gcacaaaacc tgatgagcca gctcccattc taattttatg tgccaaagaa taattccata 540 tgtatgtcac aggtgcatgg gtcagctgca acatcctctc aagccctaag atgatgatgc 600 taacagcaac aaatgggcac tgatagtttc catttctcta cacattagag ttgatggaaa 660 acttttaaaa cttcccagtg cgtatcgaaa ctagaactca gacgttggcg tgtcagagtc 720 tgtgtgtcta gaggtccaga catgtttgct aaggcttcat atgtagttga gtttattttt 780 tattttttta aattcaggcg actgggtttg aattttgccc tctccgttat ctgccacatg 840 actttgtgtg aggtttctaa taccaactgc aaacaaccct aagcccacgt gtgctgttgc 900 tcaaagcttt gtcgcaaata ctgagctcac accacatacc tctcatagct ctatgtctgg 960 ttctgtttgt cacttcctga gcccatgaaa cctctcagaa gcaatatggt taaacaaact 1020 ggactttagt ctatgaaagg ctctaccctt gactattcaa actgtcagcc agatgacaaa 1080 aactcaaacc agctttattc tggc 1104 <210> 267 <211> 942 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 267 atgagggaag cgggtgtgat ccacttgaaa actgctggtt ccttcaccgc aggcagtgct 60 ggaagtggga tgtttcgagc agtcctgctg aagtcctttt atatcctgtt taagggatgc 120 ctgttaacta gtaaccttca gtgagcaaac atatgactct atttccttac gttgaagtta 180 ggcaatttgc caataattaa cagagcaggg gtcacttgta tcctatgttc aaggacaaag 240 accacttcag agtggaaaaa aatcttgcaa atgctgcaaa tgttcttcac catctaaact 300 gttcaaatag attatttccc ctgaagaata attcattcat ctcaacataa gacatagata 360 tagccataaa gaaaaggtag cagacttact atgtaactcc aaatacattc tttttgaaag 420 aaataataaa atgcacacca tatgctaggc actgaacaaa ttgtttcagt agttcaggct 480 attcattagt ggatatattt cttgattatc cagttattat ttcgctcaaa accatcggtc 540 aagtatattt tattttattt agtgtatcgc atctggttta acatagaaaa cttacagcac 600 aaaacctgat gagccagctc ccattctaat tttatgtgcc aaagaataat tccatatgta 660 tgtcacaggt gcatgggtca gctgcaacat cctctcaagc cctaagatga tgatgctaac 720 agcaacaaat gggcactgac atacttctga ccctaagagt gcttcactca taccttcacc 780 ctcaatgccg tagagtctat gatagtttcc atttctctac acattagagt tgatggaaaa 840 cttttaaaac ttcccagtgc gtatcgaaac tagaactcag acgttggcgt gtcagagtct 900 gtgtgtctag aggtccagac atgtttgcta aggcttcata tg 942 <210> 268 <211> 1097 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 268 tagcccgaca gagcaagaga ggagccgcta cccagccgcc gcaaaagttt cctcgcagct 60 acctgggcgc tgggcgaggg cgggaacagc ttggcggtgc ggggcggccc ggggcggagc 120 cttgtgggcg tggcgaggag ggacggggcg gggcgaggca aggcgagccg cgctgcctgg 180 aggacggcgt ggggtcgtgt agctgctggc ctgcgggatg cggggcgtgg caaggagctt 240 agctgggaga ttgggtttac caaggtggcg ggcaagcctt ggtgggagag gcgcgggaag 300 aggataagga gcgtgtgcgg tggctcccgg caatcctgcc ctgacactcg ctcgccgctg 360 ctctacactg ggcgctctgg cataactact gcagaggggc tgcaggctca ggcacgctga 420 ttggcttccc agcagcagtc ccctctgact ggctctggga gaagttcccc agcctcactc 480 ctcctttccg cctccctttg gcctacagcc gggagggctt ttccttttca gcctttgcaa 540 gctctccatc ttccttggag tggagtggag gtctgcggtt taggtacccg actcgaccct 600 aggccttctc ccacccagat ctggctcctt ctggccacca gagcccacac aaggtttcct 660 aagcacaaaa tccctctcct tgctgttttc tgagaaaggt ttcttgggaa ccctttccca 720 atgcagctgt ggccaagccc tcaaagccta cccacaaata gtcacgttcc agagcgctgg 780 ggacctctgg atttcacagc ctggctcatc tttgtaccta aaaggtctgg aagcccgtgt 840 agcttgctgg gtttcattca atagaaccac acaaagtaaa tgtgtgcaaa tttaggcact 900 tgatcctgat tcctaggtga atcatatcat ctacaggata atcacgggcg accctcataa 960 agcaaagtgt agctggtgag agtaactcat tcaggaaatc attttacaga tgaaattcat 1020 taagtcatgg ttagtctgtt tcatacctgg agtagagccc tatttagaag atttcctgga 1080 tgtcaatcca cgtttct 1097 <210> 269 <211> 3793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 269 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatccaa gcactctgat ttgacaatta aagcactctg 3060 atttgacaat taaagcactc tgatttgaca attaaagcac tctgatttga caattagtcg 3120 acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780 agctgcctgc agg 3793 <210> 270 <211> 3793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 270 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatccaa ccatacaacc tactacctca aaccatacaa 3060 cctactacct caaaccatac aacctactac ctcaaaccat acaacctact acctcagtcg 3120 acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780 agctgcctgc agg 3793 <210> 271 <211> 3782 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 271 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggct 720 tcgaatcgat gaattcgaag cttctaccca ccgtactcgt caattccaag ggcatcggta 780 aacatctgct caaactcgaa gtcggccata tccagagcgc cgtagggggc ggagtcgtgg 840 ggggtaaatc ccggacccgg ggaatccccg tcccccaaca tgtccagatc gaaatcgtct 900 agcgcgtcgg catgcgccat cgccacgtcc tcgccgtcta agtggagctc gtcccccagg 960 ctgacatcgg tcgggggggc cgtcgacagt ctgcgcgtgt gtcccgcggg gagaaaggac 1020 aggcgcggag ccgccagccc cgcctcttcg ggggcgtcgt cgtccgggag atcgagcagg 1080 ccctcgatgg tagacccgta attgtttttc gtacgcgcgc ggctgtacgc ggaggcctgt 1140 tcgaccatcg cgtcgatgcc cgcgacgagc aggtcgaggg cgaactcgaa gtcccggtcc 1200 agcatctccg ccacggtgtc gccgccccgg gccgccatga tgtcctgcgc gtcctcgatg 1260 acgcccgcgg tgtccggcac ctcggtcacc gcggtcatcg agtcctggaa gtactcctcc 1320 ggactcagcc cggtgtccgc cacccgggcg aggaagcggc cctcgatggt gccgtagccg 1380 tagacgaact ggaagacggc cgagatggcg ccggtcaggc ggtgcgcggg cagcccgctg 1440 cggcgcacga cgttctgcac cgcgcgggag aaggccagcg agtgcgggcc gatgttgagg 1500 taggtgccga ccagccggga cgaccagggg tggcgcacca gcagcgcccg gttctcccgg 1560 gccagggccc gcagttcctc gcgccagtcg agcccggcgt ccgggtccgg gtggcgcagc 1620 tcgccgaaga cggcgtccag ggcgagctcg agcaactggt ccttggtgtc gacgtaccag 1680 tacacggaca tcgcggtgac gttcagctcg gcggccaggc ggcgcatcga gaaccccgtc 1740 aggccctccg tgtccagcag ccggacggtg accccggtga tccggtcccg gtcgagcccg 1800 gacggctgcc ccccacggcg accgccgcgc cgcccctccc ccgacagcca cacgctgtcc 1860 cgcggcccct cccgccctgc cttcgccatg cgcacctctc ctcgactcat accggtagcg 1920 ctagcgatga gctctggtag tagactagtg gcccccatta tataccctct agagcatatg 1980 tctcacaaag agggctttgt gtagtctcac aaagagggct ttgtgtagtc tcacaaagag 2040 ggctttgtgt agggcgcgcc cccgtagctt ggcgtaatca catgtccgtc gttttacaac 2100 gtcgtgactg ggaaaaccct ggcctgcaag gcgattaagt tgggtaacgc cagggttttc 2160 ccagtcacga cgttgtaaaa cgacggacat gtgaaatagc gctgtacagc gtatgggaat 2220 ctcttgtacg gtgtacgagt atcttcccgt acaccgtacg gcgcgccagt taataattaa 2280 ctagttaata attaactagt taataattaa ctcatatgct ctagagggta tataatgggg 2340 gccactagtc tactaccaga gctcatcgct agcgctggat ccgccaccat ggtgagcaag 2400 ggcgaggagg ataacatggc catcatcaag gagttcatgc gcttcaaggt gcacatggag 2460 ggctccgtga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 2520 ggcacccaga ccgccaagct gaaggtgacc aagggtggcc ccctgccctt cgcctgggac 2580 atcctgtccc ctcagttcat gtacggctcc aaggcctacg tgaagcaccc cgccgacatc 2640 cccgactact tgaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 2700 gaggacggcg gcgtggtgac cgtgacccag gactcctccc tccaggacgg cgagttcatc 2760 tacaaggtga agctgcgcgg caccaacttc ccctccgacg gccccgtaat gcagaagaag 2820 accatgggct gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc 2880 gagatcaagc agcggctgaa gctgaaggac ggcggccact acgacgctga ggtcaagacc 2940 acctacaagg ccaagaagcc cgtgcagctg cccggcgcct acaacgtcaa catcaagttg 3000 gacatcacct cccacaacga ggactacacc atcgtggaac agtacgaacg cgccgagggc 3060 cgccactcca ccggcggcat ggacgagctg tacaagtagg gtaccgtcga cctcgagaga 3120 tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca 3180 ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg 3240 tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga 3300 agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat 3360 cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg 3420 agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga 3480 gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc 3540 caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc 3600 ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga 3660 gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 3720 ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 3780 gg 3782 <210> 272 <211> 3940 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 272 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggtg 720 aggtagtagg ttgtatggtt tgaggtagta ggttgtatgg tttgaggtag taggttgtat 780 ggtttgaggt agtaggttgt atggttatcg atgaattcga agcttctacc caccgtactc 840 gtcaattcca agggcatcgg taaacatctg ctcaaactcg aagtcggcca tatccagagc 900 gccgtagggg gcggagtcgt ggggggtaaa tcccggaccc ggggaatccc cgtcccccaa 960 catgtccaga tcgaaatcgt ctagcgcgtc ggcatgcgcc atcgccacgt cctcgccgtc 1020 taagtggagc tcgtccccca ggctgacatc ggtcgggggg gccgtcgaca gtctgcgcgt 1080 gtgtcccgcg gggagaaagg acaggcgcgg agccgccagc cccgcctctt cgggggcgtc 1140 gtcgtccggg agatcgagca ggccctcgat ggtagacccg taattgtttt tcgtacgcgc 1200 gcggctgtac gcggaggcct gttcgaccat cgcgtcgatg cccgcgacga gcaggtcgag 1260 ggcgaactcg aagtcccggt ccagcatctc cgccacggtg tcgccgcccc gggccgccat 1320 gatgtcctgc gcgtcctcga tgacgcccgc ggtgtccggc acctcggtca ccgcggtcat 1380 cgagtcctgg aagtactcct ccggactcag cccggtgtcc gccacccggg cgaggaagcg 1440 gccctcgatg gtgccgtagc cgtagacgaa ctggaagacg gccgagatgg cgccggtcag 1500 gcggtgcgcg ggcagcccgc tgcggcgcac gacgttctgc accgcgcggg agaaggccag 1560 cgagtgcggg ccgatgttga ggtaggtgcc gaccagccgg gacgaccagg ggtggcgcac 1620 cagcagcgcc cggttctccc gggccagggc ccgcagttcc tcgcgccagt cgagcccggc 1680 gtccgggtcc gggtggcgca gctcgccgaa gacggcgtcc agggcgagct cgagcaactg 1740 gtccttggtg tcgacgtacc agtacacgga catcgcggtg acgttcagct cggcggccag 1800 gcggcgcatc gagaaccccg tcaggccctc cgtgtccagc agccggacgg tgaccccggt 1860 gatccggtcc cggtcgagcc cggacggctg ccccccacgg cgaccgccgc gccgcccctc 1920 ccccgacagc cacacgctgt cccgcggccc ctcccgccct gccttcgcca tgcgcacctc 1980 tcctcgactc ataccggtag cgctagcgat gagctctggt agtagactag tggcccccat 2040 tatataccct ctagagcata tgtctcacaa agagggcttt gtgtagtctc acaaagaggg 2100 ctttgtgtag tctcacaaag agggctttgt gtagggcgcg cccccgtagc ttggcgtaat 2160 cacatgtccg tcgttttaca acgtcgtgac tgggaaaacc ctggcctgca aggcgattaa 2220 gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggac atgtgaaata 2280 gcgctgtaca gcgtatggga atctcttgta cggtgtacga gtatcttccc gtacaccgta 2340 cggcgcgcca gttaataatt aactagttaa taattaacta gttaataatt aactcatatg 2400 ctctagaggg tatataatgg gggccactag tctactacca gagctcatcg ctagcgctgg 2460 atccgccacc atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat 2520 gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga 2580 gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg 2640 ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta 2700 cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa 2760 gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc 2820 cctccaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga 2880 cggccccgta atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc 2940 cgaggacggc gccctgaagg gcgagatcaa gcagcggctg aagctgaagg acggcggcca 3000 ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc 3060 ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga 3120 acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta 3180 gggtaccaac catacaacct actacctcaa accatacaac ctactacctc aaaccataca 3240 acctactacc tcaaaccata caacctacta cctcaagatc tacgggtggc atccctgtga 3300 cccctcccca gtgcctctcc tggccctgga agttgccact ccagtgccca ccagccttgt 3360 cctaataaaa ttaagttgca tcattttgtc tgactaggtg tccttctata atattatggg 3420 gtggaggggg gtggtatgga gcaaggggca agttgggaag acaacctgta gggcctgcgg 3480 ggtctattgg gaaccaagct ggagtgcagt ggcacaatct tggctcactg caatctccgc 3540 ctcctgggtt caagcgattc tcctgcctca gcctcccgag ttgttgggat tccaggcatg 3600 catgaccagg ctcagctaat ttttgttttt ttggtagaga cggggtttca ccatattggc 3660 caggctggtc tccaactcct aatctcaggt gatctaccca ccttggcctc ccaaattgct 3720 gggattacag gcgtgaacca ctgctccctt ccctgtcctt ctgattttgt aggtaaccac 3780 gtgcggaccg agcggccgca ggaaccccta gtgatggagt tggccactcc ctctctgcgc 3840 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 3900 gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3940 <210> 273 <211> 4107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 273 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctagggg 720 gtccacttgc tcctgggccc acacagtcct gcagtattgt gtatataagg ccagggcaaa 780 gaggagcagg ttttaaagtg aaaggcaggc aggtgttggg gaggcagtta ccggggcaac 840 gggaacaggg cgtttcggag gtggttgcca tggggacctg gatgctgttc cattcgccat 900 tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 960 tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 1020 cacgacgttg taaaacgacg gaattcgaag cttacgacgg acatgtgaaa tagcgctgta 1080 cagcgtatgg gaatctcttg tacggtgtac gagtatcttc ccgtacaccg tacggcgcgc 1140 cagttaataa ttaactagtt aataattaac tagttaataa ttaactcata tgctctagag 1200 ggtatataat gggggccact agtctactac cagagctcat cgctagcgct ggatccgcca 1260 ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc atgcgcttca 1320 aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc gagggcgagg 1380 gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt ggccccctgc 1440 ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc tacgtgaagc 1500 accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc aagtgggagc 1560 gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc tccctccagg 1620 acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc gacggccccg 1680 taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac cccgaggacg 1740 gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc cactacgacg 1800 ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc gcctacaacg 1860 tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg gaacagtacg 1920 aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag tccggaagag 1980 ccgagggcag gggaagtctt ctaacatgcg gggacgtgga ggaaaatccc gggcccagat 2040 ctatgagtcg aggagaggtg cgcatggcga aggcagggcg ggaggggccg cgggacagcg 2100 tgtggctgtc gggggagggg cggcgcggcg gtcgccgtgg ggggcagccg tccgggctcg 2160 accgggaccg gatcaccggg gtcaccgtcc ggctgctgga cacggagggc ctgacggggt 2220 tctcgatgcg ccgcctggcc gccgagctga acgtcaccgc gatgtccgtg tactggtacg 2280 tcgacaccaa ggaccagttg ctcgagctcg ccctggacgc cgtcttcggc gagctgcgcc 2340 acccggaccc ggacgccggg ctcgactggc gcgaggaact gcgggccctg gcccgggaga 2400 accgggcgct gctggtgcgc cacccctggt cgtcccggct ggtcggcacc tacctcaaca 2460 tcggcccgca ctcgctggcc ttctcccgcg cggtgcagaa cgtcgtgcgc cgcagcgggc 2520 tgcccgcgca ccgcctgacc ggcgccatct cggccgtctt ccagttcgtc tacggctacg 2580 gcaccatcga gggccgcttc ctcgcccggg tggcggacac cgggctgagt ccggaggagt 2640 acttccagga ctcgatgacc gcggtgaccg aggtgccgga caccgcgggc gtcatcgagg 2700 acgcgcagga catcatggcg gcccggggcg gcgacaccgt ggcggagatg ctggaccggg 2760 acttcgagtt cgccctcgac ctgctcgtcg cgggcatcga cgcgatggtc gaacaggcct 2820 ccgcgtacag ccgcgcgcat gatgagtttc ccaccatggt gtttccttct gggcagatca 2880 gccaggcctc ggccttggcc ccggcccctc cccaagtcct gccccaggct ccagcccctg 2940 cccctgctcc agccatggta tcagctctgg cccaggcccc agcccctgtc ccagtcctag 3000 ccccaggccc tcctcaggct gtggccccac ctgcccccaa gcccacccag gctggggaag 3060 gaacgctgtc agaggccctg ctgcagctgc agtttgatga tgaagacctg ggggccttgc 3120 ttggcaacag cacagaccca gctgtgttca cagacctggc atccgtcgac aactccgagt 3180 ttcagcagct gctgaaccag ggcatacctg tggcccccca cacaactgag cccatgctga 3240 tggagtaccc tgaggctata actcgcctag tgacaggggc ccagaggccc cccgacccag 3300 ctcctgctcc actgggggcc ccggggctcc ccaatggcct cctttcagga gatgaagact 3360 tctcctccat tgcggacatg gacttctcag ccctgctgag tcagatcagc tcctaaggaa 3420 gcttggtacc gtcgacctcg agagatctac gggtggcatc cctgtgaccc ctccccagtg 3480 cctctcctgg ccctggaagt tgccactcca gtgcccacca gccttgtcct aataaaatta 3540 agttgcatca ttttgtctga ctaggtgtcc ttctataata ttatggggtg gaggggggtg 3600 gtatggagca aggggcaagt tgggaagaca acctgtaggg cctgcggggt ctattgggaa 3660 ccaagctgga gtgcagtggc acaatcttgg ctcactgcaa tctccgcctc ctgggttcaa 3720 gcgattctcc tgcctcagcc tcccgagttg ttgggattcc aggcatgcat gaccaggctc 3780 agctaatttt tgtttttttg gtagagacgg ggtttcacca tattggccag gctggtctcc 3840 aactcctaat ctcaggtgat ctacccacct tggcctccca aattgctggg attacaggcg 3900 tgaaccactg ctcccttccc tgtccttctg attttgtagg taaccacgtg cggaccgagc 3960 ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4020 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4080 gcgagcgagc gcgcagctgc ctgcagg 4107 <210> 274 <211> 4134 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 274 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctagggg 720 gtccacttgc tcctgggccc acacagtcct gcagtattgt gtatataagg ccagggcaaa 780 gaggagcagg ttttaaagtg aaaggcaggc aggtgttggg gaggcagtta ccggggcaac 840 gggaacaggg cgtttcggag gtggttgcca tggggacctg gatgctgttc cattcgccat 900 tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 960 tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 1020 cacgacgttg taaaacgacg gaattcgaag cttacgacgg acatgtgaaa tagcgctgta 1080 cagcgtatgg gaatctcttg tacggtgtac gagtatcttc ccgtacaccg tacggcgcgc 1140 cctacacaaa gccctctttg tgagactaca caaagccctc tttgtgagac tacacaaagc 1200 cctctttgtg agacatatgc tctagagggt atataatggg ggccactagt ctactaccag 1260 agctcatcgc tagcgctgga tccgccacca tggtgagcaa gggcgaggag gataacatgg 1320 ccatcatcaa ggagttcatg cgcttcaagg tgcacatgga gggctccgtg aacggccacg 1380 agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag accgccaagc 1440 tgaaggtgac caagggtggc cccctgccct tcgcctggga catcctgtcc cctcagttca 1500 tgtacggctc caaggcctac gtgaagcacc ccgccgacat ccccgactac ttgaagctgt 1560 ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc ggcgtggtga 1620 ccgtgaccca ggactcctcc ctccaggacg gcgagttcat ctacaaggtg aagctgcgcg 1680 gcaccaactt cccctccgac ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct 1740 cctccgagcg gatgtacccc gaggacggcg ccctgaaggg cgagatcaag cagcggctga 1800 agctgaagga cggcggccac tacgacgctg aggtcaagac cacctacaag gccaagaagc 1860 ccgtgcagct gcccggcgcc tacaacgtca acatcaagtt ggacatcacc tcccacaacg 1920 aggactacac catcgtggaa cagtacgaac gcgccgaggg ccgccactcc accggcggca 1980 tggacgagct gtacaagtcc ggaagagccg agggcagggg aagtcttcta acatgcgggg 2040 acgtggagga aaatcccggg cccagatcta tgagtcgagg agaggtgcgc atggcgaagg 2100 cagggcggga ggggccgcgg gacagcgtgt ggctgtcggg ggaggggcgg cgcggcggtc 2160 gccgtggggg gcagccgtcc gggctcgacc gggaccggat caccggggtc accgtccggc 2220 tgctggacac ggagggcctg acggggttct cgatgcgccg cctggccgcc gagctgaacg 2280 tcaccgcgat gtccgtgtac tggtacgtcg acaccaagga ccagttgctc gagctcgccc 2340 tggacgccgt cttcggcgag ctgcgccacc cggacccgga cgccgggctc gactggcgcg 2400 aggaactgcg ggccctggcc cgggagaacc gggcgctgct ggtgcgccac ccctggtcgt 2460 cccggctggt cggcacctac ctcaacatcg gcccgcactc gctggccttc tcccgcgcgg 2520 tgcagaacgt cgtgcgccgc agcgggctgc ccgcgcaccg cctgaccggc gccatctcgg 2580 ccgtcttcca gttcgtctac ggctacggca ccatcgaggg ccgcttcctc gcccgggtgg 2640 cggacaccgg gctgagtccg gaggagtact tccaggactc gatgaccgcg gtgaccgagg 2700 tgccggacac cgcgggcgtc atcgaggacg cgcaggacat catggcggcc cggggcggcg 2760 acaccgtggc ggagatgctg gaccgggact tcgagttcgc cctcgacctg ctcgtcgcgg 2820 gcatcgacgc gatggtcgaa caggcctccg cgtacagccg cgcgcatgat gagtttccca 2880 ccatggtgtt tccttctggg cagatcagcc aggcctcggc cttggccccg gcccctcccc 2940 aagtcctgcc ccaggctcca gcccctgccc ctgctccagc catggtatca gctctggccc 3000 aggccccagc ccctgtccca gtcctagccc caggccctcc tcaggctgtg gccccacctg 3060 cccccaagcc cacccaggct ggggaaggaa cgctgtcaga ggccctgctg cagctgcagt 3120 ttgatgatga agacctgggg gccttgcttg gcaacagcac agacccagct gtgttcacag 3180 acctggcatc cgtcgacaac tccgagtttc agcagctgct gaaccagggc atacctgtgg 3240 ccccccacac aactgagccc atgctgatgg agtaccctga ggctataact cgcctagtga 3300 caggggccca gaggcccccc gacccagctc ctgctccact gggggccccg gggctcccca 3360 atggcctcct ttcaggagat gaagacttct cctccattgc ggacatggac ttctcagccc 3420 tgctgagtca gatcagctcc taaggaagct tggtaccgtc gacctcgaga gatctacggg 3480 tggcatccct gtgacccctc cccagtgcct ctcctggccc tggaagttgc cactccagtg 3540 cccaccagcc ttgtcctaat aaaattaagt tgcatcattt tgtctgacta ggtgtccttc 3600 tataatatta tggggtggag gggggtggta tggagcaagg ggcaagttgg gaagacaacc 3660 tgtagggcct gcggggtcta ttgggaacca agctggagtg cagtggcaca atcttggctc 3720 actgcaatct ccgcctcctg ggttcaagcg attctcctgc ctcagcctcc cgagttgttg 3780 ggattccagg catgcatgac caggctcagc taatttttgt ttttttggta gagacggggt 3840 ttcaccatat tggccaggct ggtctccaac tcctaatctc aggtgatcta cccaccttgg 3900 cctcccaaat tgctgggatt acaggcgtga accactgctc ccttccctgt ccttctgatt 3960 ttgtaggtaa ccacgtgcgg accgagcggc cgcaggaacc cctagtgatg gagttggcca 4020 ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 4080 cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg cagg 4134 <210> 275 <211> 3789 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 275 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatccac ctatcctgaa ttacttgaaa cctatcctga 3060 attacttgaa acctatcctg aattacttga aacctatcct gaattacttg aagtcgacct 3120 cgagagatct acgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa 3180 gttgccactc cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct 3240 gactaggtgt ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa 3300 gttgggaaga caacctgtag ggcctgcggg gtctattggg aaccaagctg gagtgcagtg 3360 gcacaatctt ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag 3420 cctcccgagt tgttgggatt ccaggcatgc atgaccaggc tcagctaatt tttgtttttt 3480 tggtagagac ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg 3540 atctacccac cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc 3600 cctgtccttc tgattttgta ggtaaccacg tgcggaccga gcggccgcag gaacccctag 3660 tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 3720 aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagct 3780 gcctgcagg 3789 <210> 276 <211> 3793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 276 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatccac agttcttcaa ctggcagctt acagttcttc 3060 aactggcagc ttacagttct tcaactggca gcttacagtt cttcaactgg cagcttgtcg 3120 acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780 agctgcctgc agg 3793 <210> 277 <211> 3793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 277 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatcccg tgttcacagc ggaccttgat cgtgttcaca 3060 gcggaccttg atcgtgttca cagcggacct tgatcgtgtt cacagcggac cttgatgtcg 3120 acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780 agctgcctgc agg 3793 <210> 278 <211> 3792 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 278 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatctcc aaaacatgaa ttgctgctgt ccaaaacatg 3060 aattgctgct gtccaaaaca tgaattgctg ctgtccaaaa catgaattgc tgctggtcga 3120 cctcgagaga tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg 3180 gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg 3240 tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg 3300 caagttggga agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca 3360 gtggcacaat cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct 3420 cagcctcccg agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt 3480 ttttggtaga gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag 3540 gtgatctacc caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc 3600 ttccctgtcc ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc 3660 tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3720 caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 3780 gctgcctgca gg 3792 <210> 279 <211> 3793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 279 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatccca aacaccattg tcacactcca caaacaccat 3060 tgtcacactc cacaaacacc attgtcacac tccacaaaca ccattgtcac actccagtcg 3120 acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780 agctgcctgc agg 3793 <210> 280 <211> 3797 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 280 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatcctc cagtcagttc ctgatgcagt atccagtcag 3060 ttcctgatgc agtatccagt cagttcctga tgcagtatcc agtcagttcc tgatgcagta 3120 gtcgacctcg agagatctac gggtggcatc cctgtgaccc ctccccagtg cctctcctgg 3180 ccctggaagt tgccactcca gtgcccacca gccttgtcct aataaaatta agttgcatca 3240 ttttgtctga ctaggtgtcc ttctataata ttatggggtg gaggggggtg gtatggagca 3300 aggggcaagt tgggaagaca acctgtaggg cctgcggggt ctattgggaa ccaagctgga 3360 gtgcagtggc acaatcttgg ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc 3420 tgcctcagcc tcccgagttg ttgggattcc aggcatgcat gaccaggctc agctaatttt 3480 tgtttttttg gtagagacgg ggtttcacca tattggccag gctggtctcc aactcctaat 3540 ctcaggtgat ctacccacct tggcctccca aattgctggg attacaggcg tgaaccactg 3600 ctcccttccc tgtccttctg attttgtagg taaccacgtg cggaccgagc ggccgcagga 3660 acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg 3720 gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 3780 gcgcagctgc ctgcagg 3797 <210> 281 <211> 3793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 281 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatcctc acagttgcca gctgagatta tcacagttgc 3060 cagctgagat tatcacagtt gccagctgag attatcacag ttgccagctg agattagtcg 3120 acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780 agctgcctgc agg 3793 <210> 282 <211> 3793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 282 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatccac aagctttttg ctcgtcttat acaagctttt 3060 tgctcgtctt atacaagctt tttgctcgtc ttatacaagc tttttgctcg tcttatgtcg 3120 acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780 agctgcctgc agg 3793 <210> 283 <211> 3793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 283 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720 cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840 ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960 tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020 agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260 agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440 ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500 tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560 tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680 cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280 agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340 atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400 ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460 aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520 tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580 ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640 gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700 accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760 tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820 ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880 gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940 gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000 gacgagctgt acaagtagac gcggatccac aaaccttttg ttcgtcttat acaaaccttt 3060 tgttcgtctt atacaaacct tttgttcgtc ttatacaaac cttttgttcg tcttatgtcg 3120 acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780 agctgcctgc agg 3793 <210> 284 <211> 3792 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 284 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggct 720 tcgaatcgat gaattcgaag cttctaccca ccgtactcgt caattccaag ggcatcggta 780 aacatctgct caaactcgaa gtcggccata tccagagcgc cgtagggggc ggagtcgtgg 840 ggggtaaatc ccggacccgg ggaatccccg tcccccaaca tgtccagatc gaaatcgtct 900 agcgcgtcgg catgcgccat cgccacgtcc tcgccgtcta agtggagctc gtcccccagg 960 ctgacatcgg tcgggggggc cgtcgacagt ctgcgcgtgt gtcccgcggg gagaaaggac 1020 aggcgcggag ccgccagccc cgcctcttcg ggggcgtcgt cgtccgggag atcgagcagg 1080 ccctcgatgg tagacccgta attgtttttc gtacgcgcgc ggctgtacgc ggaggcctgt 1140 tcgaccatcg cgtcgatgcc cgcgacgagc aggtcgaggg cgaactcgaa gtcccggtcc 1200 agcatctccg ccacggtgtc gccgccccgg gccgccatga tgtcctgcgc gtcctcgatg 1260 acgcccgcgg tgtccggcac ctcggtcacc gcggtcatcg agtcctggaa gtactcctcc 1320 ggactcagcc cggtgtccgc cacccgggcg aggaagcggc cctcgatggt gccgtagccg 1380 tagacgaact ggaagacggc cgagatggcg ccggtcaggc ggtgcgcggg cagcccgctg 1440 cggcgcacga cgttctgcac cgcgcgggag aaggccagcg agtgcgggcc gatgttgagg 1500 taggtgccga ccagccggga cgaccagggg tggcgcacca gcagcgcccg gttctcccgg 1560 gccagggccc gcagttcctc gcgccagtcg agcccggcgt ccgggtccgg gtggcgcagc 1620 tcgccgaaga cggcgtccag ggcgagctcg agcaactggt ccttggtgtc gacgtaccag 1680 tacacggaca tcgcggtgac gttcagctcg gcggccaggc ggcgcatcga gaaccccgtc 1740 aggccctccg tgtccagcag ccggacggtg accccggtga tccggtcccg gtcgagcccg 1800 gacggctgcc ccccacggcg accgccgcgc cgcccctccc ccgacagcca cacgctgtcc 1860 cgcggcccct cccgccctgc cttcgccatg cgcacctctc ctcgactcat accggtagcg 1920 ctagcgatga gctctggtag tagactagtg gcccccatta tataccctct agagcatatg 1980 tctcacaaag agggctttgt gtagtctcac aaagagggct ttgtgtagtc tcacaaagag 2040 ggctttgtgt agggcgcgcc cccgtagctt ggcgtaatca catgtccgtc gttttacaac 2100 gtcgtgactg ggaaaaccct ggcctgcaag gcgattaagt tgggtaacgc cagggttttc 2160 ccagtcacga cgttgtaaaa cgacggacat gtgaaatagc gctgtacagc gtatgggaat 2220 ctcttgtacg gtgtacgagt atcttcccgt acaccgtacg gcgcgccagt taataattaa 2280 ctagttaata attaactagt taataattaa ctcatatgct ctagagggta tataatgggg 2340 gccactagtc tactaccaga gctcatcgct agcgctggat ccgccaccat ggtgagcaag 2400 ggcgaggagg ataacatggc catcatcaag gagttcatgc gcttcaaggt gcacatggag 2460 ggctccgtga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 2520 ggcacccaga ccgccaagct gaaggtgacc aagggtggcc ccctgccctt cgcctgggac 2580 atcctgtccc ctcagttcat gtacggctcc aaggcctacg tgaagcaccc cgccgacatc 2640 cccgactact tgaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 2700 gaggacggcg gcgtggtgac cgtgacccag gactcctccc tccaggacgg cgagttcatc 2760 tacaaggtga agctgcgcgg caccaacttc ccctccgacg gccccgtaat gcagaagaag 2820 accatgggct gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc 2880 gagatcaagc agcggctgaa gctgaaggac ggcggccact acgacgctga ggtcaagacc 2940 acctacaagg ccaagaagcc cgtgcagctg cccggcgcct acaacgtcaa catcaagttg 3000 gacatcacct cccacaacga ggactacacc atcgtggaac agtacgaacg cgccgagggc 3060 cgccactcca ccggcggcat ggacgagctg tacaagtagg gtacccaaac accattgtca 3120 cactccaaga tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg 3180 gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg 3240 tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg 3300 caagttggga agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca 3360 gtggcacaat cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct 3420 cagcctcccg agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt 3480 ttttggtaga gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag 3540 gtgatctacc caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc 3600 ttccctgtcc ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc 3660 tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3720 caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 3780 gctgcctgca gg 3792 <210> 285 <211> 4213 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 285 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggct 720 tcgaatcgat gaattcgaag cttctaccca ccgtactcgt caattccaag ggcatcggta 780 aacatctgct caaactcgaa gtcggccata tccagagcgc cgtagggggc ggagtcgtgg 840 ggggtaaatc ccggacccgg ggaatccccg tcccccaaca tgtccagatc gaaatcgtct 900 agcgcgtcgg catgcgccat cgccacgtcc tcgccgtcta agtggagctc gtcccccagg 960 ctgacatcgg tcgggggggc cgtcgacagt ctgcgcgtgt gtcccgcggg gagaaaggac 1020 aggcgcggag ccgccagccc cgcctcttcg ggggcgtcgt cgtccgggag atcgagcagg 1080 ccctcgatgg tagacccgta attgtttttc gtacgcgcgc ggctgtacgc ggaggcctgt 1140 tcgaccatcg cgtcgatgcc cgcgacgagc aggtcgaggg cgaactcgaa gtcccggtcc 1200 agcatctccg ccacggtgtc gccgccccgg gccgccatga tgtcctgcgc gtcctcgatg 1260 acgcccgcgg tgtccggcac ctcggtcacc gcggtcatcg agtcctggaa gtactcctcc 1320 ggactcagcc cggtgtccgc cacccgggcg aggaagcggc cctcgatggt gccgtagccg 1380 tagacgaact ggaagacggc cgagatggcg ccggtcaggc ggtgcgcggg cagcccgctg 1440 cggcgcacga cgttctgcac cgcgcgggag aaggccagcg agtgcgggcc gatgttgagg 1500 taggtgccga ccagccggga cgaccagggg tggcgcacca gcagcgcccg gttctcccgg 1560 gccagggccc gcagttcctc gcgccagtcg agcccggcgt ccgggtccgg gtggcgcagc 1620 tcgccgaaga cggcgtccag ggcgagctcg agcaactggt ccttggtgtc gacgtaccag 1680 tacacggaca tcgcggtgac gttcagctcg gcggccaggc ggcgcatcga gaaccccgtc 1740 aggccctccg tgtccagcag ccggacggtg accccggtga tccggtcccg gtcgagcccg 1800 gacggctgcc ccccacggcg accgccgcgc cgcccctccc ccgacagcca cacgctgtcc 1860 cgcggcccct cccgccctgc cttcgccatg cgcacctctc ctcgactcat accggtagcg 1920 ctagcgatga gctctggtag tagactagtg gcccccatta tataccctct agagcatatg 1980 tctcacaaag agggctttgt gtagtctcac aaagagggct ttgtgtagtc tcacaaagag 2040 ggctttgtgt agggcgcgcc cccgtagctt ggcgtaatca catgtccgtc gttttacaac 2100 gtcgtgactg ggaaaaccct ggcctgcaag gcgattaagt tgggtaacgc cagggttttc 2160 ccagtcacga cgttgtaaaa cgacggacat gtgaaatagc gctgtacagc gtatgggaat 2220 ctcttgtacg gtgtacgagt atcttcccgt acaccgtacg gcgcgccagt taataattaa 2280 ctagttaata attaactagt taataattaa ctcatatgct ctagagggta tataatgggg 2340 gccactagtc tactaccaga gctcatcgct agcgctggat cccgccacca tggcttcgta 2400 cccctgccat caacacgcgt ctgcgttcga ccaggctgcg cgttctcgcg gccatagcaa 2460 ccgacgtacg gcgttgcgcc ctcgccggca gcaagaagcc acggaagtcc gcctggagca 2520 gaaaatgccc acgctactgc gggtttatat agacggtcct cacgggatgg ggaaaaccac 2580 caccacgcaa ctgctggtgg ccctgggttc gcgcgacgat atcgtctacg tacccgagcc 2640 gatgacttac tggcaggtgc tgggggcttc cgagacaatc gcgaacatct acaccacaca 2700 acaccgcctc gaccagggtg agatatcggc cggggacgcg gcggtggtaa tgacaagcgc 2760 ccagataaca atgggcatgc cttatgccgt gaccgacgcc gttctggctc ctcatatcgg 2820 gggggaggct gggagctcac atgccccgcc cccggccctc accctcatct tcgaccgcca 2880 tcccatcgcc gccctcctgt gctacccggc cgcgcgatac cttatgggca gcatgacccc 2940 ccaggccgtg ctggcgttcg tggccctcat cccgccgacc ttgcccggca caaacatcgt 3000 gttgggggcc cttccggagg acagacacat cgaccgcctg gccaaacgcc agcgccccgg 3060 cgagcggctt gacctggcta tgctggccgc gattcgccgc gtttacgggc tgcttgccaa 3120 tacggtgcgg tatctgcagg gcggcgggtc gtggcgggag gattggggac agctttcggg 3180 gacggccgtg ccgccccagg gtgccgagcc ccagagcaac gcgggcccac gaccccatat 3240 cggggacacg ttatttaccc tgtttcgggc ccccgagttg ctggccccca acggcgacct 3300 gtacaacgtg tttgcctggg ccttggacgt cttggccaaa cgcctccgtc ccatgcacgt 3360 ctttatcctg gattacgacc aatcgcccgc cggctgccgg gacgccctgc tgcaacttac 3420 ctccgggatg gtccagaccc acgtcaccac ccccggctcc ataccgacga tctgcgacct 3480 ggcgcgcacg tttgcccggg agatggggga ggctaactga ggtacccaaa caccattgtc 3540 acactccaag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3600 ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3660 gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3720 gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3780 agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3840 tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3900 tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3960 ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 4020 cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 4080 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 4140 ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 4200 agctgcctgc agg 4213 <210> 286 <211> 4361 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 286 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180 tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240 gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300 agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360 ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660 tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggtg 720 aggtagtagg ttgtatggtt tgaggtagta ggttgtatgg tttgaggtag taggttgtat 780 ggtttgaggt agtaggttgt atggttatcg atgaattcga agcttctacc caccgtactc 840 gtcaattcca agggcatcgg taaacatctg ctcaaactcg aagtcggcca tatccagagc 900 gccgtagggg gcggagtcgt ggggggtaaa tcccggaccc ggggaatccc cgtcccccaa 960 catgtccaga tcgaaatcgt ctagcgcgtc ggcatgcgcc atcgccacgt cctcgccgtc 1020 taagtggagc tcgtccccca ggctgacatc ggtcgggggg gccgtcgaca gtctgcgcgt 1080 gtgtcccgcg gggagaaagg acaggcgcgg agccgccagc cccgcctctt cgggggcgtc 1140 gtcgtccggg agatcgagca ggccctcgat ggtagacccg taattgtttt tcgtacgcgc 1200 gcggctgtac gcggaggcct gttcgaccat cgcgtcgatg cccgcgacga gcaggtcgag 1260 ggcgaactcg aagtcccggt ccagcatctc cgccacggtg tcgccgcccc gggccgccat 1320 gatgtcctgc gcgtcctcga tgacgcccgc ggtgtccggc acctcggtca ccgcggtcat 1380 cgagtcctgg aagtactcct ccggactcag cccggtgtcc gccacccggg cgaggaagcg 1440 gccctcgatg gtgccgtagc cgtagacgaa ctggaagacg gccgagatgg cgccggtcag 1500 gcggtgcgcg ggcagcccgc tgcggcgcac gacgttctgc accgcgcggg agaaggccag 1560 cgagtgcggg ccgatgttga ggtaggtgcc gaccagccgg gacgaccagg ggtggcgcac 1620 cagcagcgcc cggttctccc gggccagggc ccgcagttcc tcgcgccagt cgagcccggc 1680 gtccgggtcc gggtggcgca gctcgccgaa gacggcgtcc agggcgagct cgagcaactg 1740 gtccttggtg tcgacgtacc agtacacgga catcgcggtg acgttcagct cggcggccag 1800 gcggcgcatc gagaaccccg tcaggccctc cgtgtccagc agccggacgg tgaccccggt 1860 gatccggtcc cggtcgagcc cggacggctg ccccccacgg cgaccgccgc gccgcccctc 1920 ccccgacagc cacacgctgt cccgcggccc ctcccgccct gccttcgcca tgcgcacctc 1980 tcctcgactc ataccggtag cgctagcgat gagctctggt agtagactag tggcccccat 2040 tatataccct ctagagcata tgtctcacaa agagggcttt gtgtagtctc acaaagaggg 2100 ctttgtgtag tctcacaaag agggctttgt gtagggcgcg cccccgtagc ttggcgtaat 2160 cacatgtccg tcgttttaca acgtcgtgac tgggaaaacc ctggcctgca aggcgattaa 2220 gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggac atgtgaaata 2280 gcgctgtaca gcgtatggga atctcttgta cggtgtacga gtatcttccc gtacaccgta 2340 cggcgcgcca gttaataatt aactagttaa taattaacta gttaataatt aactcatatg 2400 ctctagaggg tatataatgg gggccactag tctactacca gagctcatcg ctagcgctgg 2460 atcccgccac catggcttcg tacccctgcc atcaacacgc gtctgcgttc gaccaggctg 2520 cgcgttctcg cggccatagc aaccgacgta cggcgttgcg ccctcgccgg cagcaagaag 2580 ccacggaagt ccgcctggag cagaaaatgc ccacgctact gcgggtttat atagacggtc 2640 ctcacgggat ggggaaaacc accaccacgc aactgctggt ggccctgggt tcgcgcgacg 2700 atatcgtcta cgtacccgag ccgatgactt actggcaggt gctgggggct tccgagacaa 2760 tcgcgaacat ctacaccaca caacaccgcc tcgaccaggg tgagatatcg gccggggacg 2820 cggcggtggt aatgacaagc gcccagataa caatgggcat gccttatgcc gtgaccgacg 2880 ccgttctggc tcctcatatc gggggggagg ctgggagctc acatgccccg cccccggccc 2940 tcaccctcat cttcgaccgc catcccatcg ccgccctcct gtgctacccg gccgcgcgat 3000 accttatggg cagcatgacc ccccaggccg tgctggcgtt cgtggccctc atcccgccga 3060 ccttgcccgg cacaaacatc gtgttggggg cccttccgga ggacagacac atcgaccgcc 3120 tggccaaacg ccagcgcccc ggcgagcggc ttgacctggc tatgctggcc gcgattcgcc 3180 gcgtttacgg gctgcttgcc aatacggtgc ggtatctgca gggcggcggg tcgtggcggg 3240 aggattgggg acagctttcg gggacggccg tgccgcccca gggtgccgag ccccagagca 3300 acgcgggccc acgaccccat atcggggaca cgttatttac cctgtttcgg gcccccgagt 3360 tgctggcccc caacggcgac ctgtacaacg tgtttgcctg ggccttggac gtcttggcca 3420 aacgcctccg tcccatgcac gtctttatcc tggattacga ccaatcgccc gccggctgcc 3480 gggacgccct gctgcaactt acctccggga tggtccagac ccacgtcacc acccccggct 3540 ccataccgac gatctgcgac ctggcgcgca cgtttgcccg ggagatgggg gaggctaact 3600 gaggtaccaa ccatacaacc tactacctca aaccatacaa cctactacct caaaccatac 3660 aacctactac ctcaaaccat acaacctact acctcaagat ctacgggtgg catccctgtg 3720 acccctcccc agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg 3780 tcctaataaa attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg 3840 ggtggagggg ggtggtatgg agcaaggggc aagttgggaa gacaacctgt agggcctgcg 3900 gggtctattg ggaaccaagc tggagtgcag tggcacaatc ttggctcact gcaatctccg 3960 cctcctgggt tcaagcgatt ctcctgcctc agcctcccga gttgttggga ttccaggcat 4020 gcatgaccag gctcagctaa tttttgtttt tttggtagag acggggtttc accatattgg 4080 ccaggctggt ctccaactcc taatctcagg tgatctaccc accttggcct cccaaattgc 4140 tgggattaca ggcgtgaacc actgctccct tccctgtcct tctgattttg taggtaacca 4200 cgtgcggacc gagcggccgc aggaacccct agtgatggag ttggccactc cctctctgcg 4260 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 4320 ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag g 4361 <210> 287 <211> 3358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 287 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tccaagcact ctgatttgac aattaaagca ctctgatttg acaattaaag 2820 cactctgatt tgacaattaa agcactctga tttgacaatt agtcgacctc gagagatcta 2880 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358 <210> 288 <211> 3358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 288 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tccaaccata caacctacta cctcaaacca tacaacctac tacctcaaac 2820 catacaacct actacctcaa accatacaac ctactacctc agtcgacctc gagagatcta 2880 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358 <210> 289 <211> 3347 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 289 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcct aggcttcgaa tcgatgaatt 480 cgaagcttct acccaccgta ctcgtcaatt ccaagggcat cggtaaacat ctgctcaaac 540 tcgaagtcgg ccatatccag agcgccgtag ggggcggagt cgtggggggt aaatcccgga 600 cccggggaat ccccgtcccc caacatgtcc agatcgaaat cgtctagcgc gtcggcatgc 660 gccatcgcca cgtcctcgcc gtctaagtgg agctcgtccc ccaggctgac atcggtcggg 720 ggggccgtcg acagtctgcg cgtgtgtccc gcggggagaa aggacaggcg cggagccgcc 780 agccccgcct cttcgggggc gtcgtcgtcc gggagatcga gcaggccctc gatggtagac 840 ccgtaattgt ttttcgtacg cgcgcggctg tacgcggagg cctgttcgac catcgcgtcg 900 atgcccgcga cgagcaggtc gagggcgaac tcgaagtccc ggtccagcat ctccgccacg 960 gtgtcgccgc cccgggccgc catgatgtcc tgcgcgtcct cgatgacgcc cgcggtgtcc 1020 ggcacctcgg tcaccgcggt catcgagtcc tggaagtact cctccggact cagcccggtg 1080 tccgccaccc gggcgaggaa gcggccctcg atggtgccgt agccgtagac gaactggaag 1140 acggccgaga tggcgccggt caggcggtgc gcgggcagcc cgctgcggcg cacgacgttc 1200 tgcaccgcgc gggagaaggc cagcgagtgc gggccgatgt tgaggtaggt gccgaccagc 1260 cgggacgacc aggggtggcg caccagcagc gcccggttct cccgggccag ggcccgcagt 1320 tcctcgcgcc agtcgagccc ggcgtccggg tccgggtggc gcagctcgcc gaagacggcg 1380 tccagggcga gctcgagcaa ctggtccttg gtgtcgacgt accagtacac ggacatcgcg 1440 gtgacgttca gctcggcggc caggcggcgc atcgagaacc ccgtcaggcc ctccgtgtcc 1500 agcagccgga cggtgacccc ggtgatccgg tcccggtcga gcccggacgg ctgcccccca 1560 cggcgaccgc cgcgccgccc ctcccccgac agccacacgc tgtcccgcgg cccctcccgc 1620 cctgccttcg ccatgcgcac ctctcctcga ctcataccgg tagcgctagc gatgagctct 1680 ggtagtagac tagtggcccc cattatatac cctctagagc atatgtctca caaagagggc 1740 tttgtgtagt ctcacaaaga gggctttgtg tagtctcaca aagagggctt tgtgtagggc 1800 gcgcccccgt agcttggcgt aatcacatgt ccgtcgtttt acaacgtcgt gactgggaaa 1860 accctggcct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 1920 taaaacgacg gacatgtgaa atagcgctgt acagcgtatg ggaatctctt gtacggtgta 1980 cgagtatctt cccgtacacc gtacggcgcg ccagttaata attaactagt taataattaa 2040 ctagttaata attaactcat atgctctaga gggtatataa tgggggccac tagtctacta 2100 ccagagctca tcgctagcgc tggatccgcc accatggtga gcaagggcga ggaggataac 2160 atggccatca tcaaggagtt catgcgcttc aaggtgcaca tggagggctc cgtgaacggc 2220 cacgagttcg agatcgaggg cgagggcgag ggccgcccct acgagggcac ccagaccgcc 2280 aagctgaagg tgaccaaggg tggccccctg cccttcgcct gggacatcct gtcccctcag 2340 ttcatgtacg gctccaaggc ctacgtgaag caccccgccg acatccccga ctacttgaag 2400 ctgtccttcc ccgagggctt caagtgggag cgcgtgatga acttcgagga cggcggcgtg 2460 gtgaccgtga cccaggactc ctccctccag gacggcgagt tcatctacaa ggtgaagctg 2520 cgcggcacca acttcccctc cgacggcccc gtaatgcaga agaagaccat gggctgggag 2580 gcctcctccg agcggatgta ccccgaggac ggcgccctga agggcgagat caagcagcgg 2640 ctgaagctga aggacggcgg ccactacgac gctgaggtca agaccaccta caaggccaag 2700 aagcccgtgc agctgcccgg cgcctacaac gtcaacatca agttggacat cacctcccac 2760 aacgaggact acaccatcgt ggaacagtac gaacgcgccg agggccgcca ctccaccggc 2820 ggcatggacg agctgtacaa gtagggtacc gtcgacctcg agagatctac gggtggcatc 2880 cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca gtgcccacca 2940 gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc ttctataata 3000 ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca acctgtaggg 3060 cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg ctcactgcaa 3120 tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg ttgggattcc 3180 aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg ggtttcacca 3240 tattggccag gctggtctcc aactcctaat ctcaggtgat ctacccacct tggcctccca 3300 aattgctggg attacaggcg tgaaccactg ctcccttccc tgtcctt 3347 <210> 290 <211> 3505 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 290 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcct aggtgaggta gtaggttgta 480 tggtttgagg tagtaggttg tatggtttga ggtagtaggt tgtatggttt gaggtagtag 540 gttgtatggt tatcgatgaa ttcgaagctt ctacccaccg tactcgtcaa ttccaagggc 600 atcggtaaac atctgctcaa actcgaagtc ggccatatcc agagcgccgt agggggcgga 660 gtcgtggggg gtaaatcccg gacccgggga atccccgtcc cccaacatgt ccagatcgaa 720 atcgtctagc gcgtcggcat gcgccatcgc cacgtcctcg ccgtctaagt ggagctcgtc 780 ccccaggctg acatcggtcg ggggggccgt cgacagtctg cgcgtgtgtc ccgcggggag 840 aaaggacagg cgcggagccg ccagccccgc ctcttcgggg gcgtcgtcgt ccgggagatc 900 gagcaggccc tcgatggtag acccgtaatt gtttttcgta cgcgcgcggc tgtacgcgga 960 ggcctgttcg accatcgcgt cgatgcccgc gacgagcagg tcgagggcga actcgaagtc 1020 ccggtccagc atctccgcca cggtgtcgcc gccccgggcc gccatgatgt cctgcgcgtc 1080 ctcgatgacg cccgcggtgt ccggcacctc ggtcaccgcg gtcatcgagt cctggaagta 1140 ctcctccgga ctcagcccgg tgtccgccac ccgggcgagg aagcggccct cgatggtgcc 1200 gtagccgtag acgaactgga agacggccga gatggcgccg gtcaggcggt gcgcgggcag 1260 cccgctgcgg cgcacgacgt tctgcaccgc gcgggagaag gccagcgagt gcgggccgat 1320 gttgaggtag gtgccgacca gccgggacga ccaggggtgg cgcaccagca gcgcccggtt 1380 ctcccgggcc agggcccgca gttcctcgcg ccagtcgagc ccggcgtccg ggtccgggtg 1440 gcgcagctcg ccgaagacgg cgtccagggc gagctcgagc aactggtcct tggtgtcgac 1500 gtaccagtac acggacatcg cggtgacgtt cagctcggcg gccaggcggc gcatcgagaa 1560 ccccgtcagg ccctccgtgt ccagcagccg gacggtgacc ccggtgatcc ggtcccggtc 1620 gagcccggac ggctgccccc cacggcgacc gccgcgccgc ccctcccccg acagccacac 1680 gctgtcccgc ggcccctccc gccctgcctt cgccatgcgc acctctcctc gactcatacc 1740 ggtagcgcta gcgatgagct ctggtagtag actagtggcc cccattatat accctctaga 1800 gcatatgtct cacaaagagg gctttgtgta gtctcacaaa gagggctttg tgtagtctca 1860 caaagagggc tttgtgtagg gcgcgccccc gtagcttggc gtaatcacat gtccgtcgtt 1920 ttacaacgtc gtgactggga aaaccctggc ctgcaaggcg attaagttgg gtaacgccag 1980 ggttttccca gtcacgacgt tgtaaaacga cggacatgtg aaatagcgct gtacagcgta 2040 tgggaatctc ttgtacggtg tacgagtatc ttcccgtaca ccgtacggcg cgccagttaa 2100 taattaacta gttaataatt aactagttaa taattaactc atatgctcta gagggtatat 2160 aatgggggcc actagtctac taccagagct catcgctagc gctggatccg ccaccatggt 2220 gagcaagggc gaggaggata acatggccat catcaaggag ttcatgcgct tcaaggtgca 2280 catggagggc tccgtgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc 2340 ctacgagggc acccagaccg ccaagctgaa ggtgaccaag ggtggccccc tgcccttcgc 2400 ctgggacatc ctgtcccctc agttcatgta cggctccaag gcctacgtga agcaccccgc 2460 cgacatcccc gactacttga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat 2520 gaacttcgag gacggcggcg tggtgaccgt gacccaggac tcctccctcc aggacggcga 2580 gttcatctac aaggtgaagc tgcgcggcac caacttcccc tccgacggcc ccgtaatgca 2640 gaagaagacc atgggctggg aggcctcctc cgagcggatg taccccgagg acggcgccct 2700 gaagggcgag atcaagcagc ggctgaagct gaaggacggc ggccactacg acgctgaggt 2760 caagaccacc tacaaggcca agaagcccgt gcagctgccc ggcgcctaca acgtcaacat 2820 caagttggac atcacctccc acaacgagga ctacaccatc gtggaacagt acgaacgcgc 2880 cgagggccgc cactccaccg gcggcatgga cgagctgtac aagtagggta ccaaccatac 2940 aacctactac ctcaaaccat acaacctact acctcaaacc atacaaccta ctacctcaaa 3000 ccatacaacc tactacctca agatctacgg gtggcatccc tgtgacccct ccccagtgcc 3060 tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa taaaattaag 3120 ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga ggggggtggt 3180 atggagcaag gggcaagttg ggaagacaac ctgtagggcc tgcggggtct attgggaacc 3240 aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct gggttcaagc 3300 gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga ccaggctcag 3360 ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc tggtctccaa 3420 ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat tacaggcgtg 3480 aaccactgct cccttccctg tcctt 3505 <210> 291 <211> 3672 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 291 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcct agggggtcca cttgctcctg 480 ggcccacaca gtcctgcagt attgtgtata taaggccagg gcaaagagga gcaggtttta 540 aagtgaaagg caggcaggtg ttggggaggc agttaccggg gcaacgggaa cagggcgttt 600 cggaggtggt tgccatgggg acctggatgc tgttccattc gccattcagg ctgcgcaact 660 gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat 720 gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa 780 cgacggaatt cgaagcttac gacggacatg tgaaatagcg ctgtacagcg tatgggaatc 840 tcttgtacgg tgtacgagta tcttcccgta caccgtacgg cgcgccagtt aataattaac 900 tagttaataa ttaactagtt aataattaac tcatatgctc tagagggtat ataatggggg 960 ccactagtct actaccagag ctcatcgcta gcgctggatc cgccaccatg gtgagcaagg 1020 gcgaggagga taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg 1080 gctccgtgaa cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg 1140 gcacccagac cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca 1200 tcctgtcccc tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc 1260 ccgactactt gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg 1320 aggacggcgg cgtggtgacc gtgacccagg actcctccct ccaggacggc gagttcatct 1380 acaaggtgaa gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga 1440 ccatgggctg ggaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg 1500 agatcaagca gcggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca 1560 cctacaaggc caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg 1620 acatcacctc ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc 1680 gccactccac cggcggcatg gacgagctgt acaagtccgg aagagccgag ggcaggggaa 1740 gtcttctaac atgcggggac gtggaggaaa atcccgggcc cagatctatg agtcgaggag 1800 aggtgcgcat ggcgaaggca gggcgggagg ggccgcggga cagcgtgtgg ctgtcggggg 1860 aggggcggcg cggcggtcgc cgtggggggc agccgtccgg gctcgaccgg gaccggatca 1920 ccggggtcac cgtccggctg ctggacacgg agggcctgac ggggttctcg atgcgccgcc 1980 tggccgccga gctgaacgtc accgcgatgt ccgtgtactg gtacgtcgac accaaggacc 2040 agttgctcga gctcgccctg gacgccgtct tcggcgagct gcgccacccg gacccggacg 2100 ccgggctcga ctggcgcgag gaactgcggg ccctggcccg ggagaaccgg gcgctgctgg 2160 tgcgccaccc ctggtcgtcc cggctggtcg gcacctacct caacatcggc ccgcactcgc 2220 tggccttctc ccgcgcggtg cagaacgtcg tgcgccgcag cgggctgccc gcgcaccgcc 2280 tgaccggcgc catctcggcc gtcttccagt tcgtctacgg ctacggcacc atcgagggcc 2340 gcttcctcgc ccgggtggcg gacaccgggc tgagtccgga ggagtacttc caggactcga 2400 tgaccgcggt gaccgaggtg ccggacaccg cgggcgtcat cgaggacgcg caggacatca 2460 tggcggcccg gggcggcgac accgtggcgg agatgctgga ccgggacttc gagttcgccc 2520 tcgacctgct cgtcgcgggc atcgacgcga tggtcgaaca ggcctccgcg tacagccgcg 2580 cgcatgatga gtttcccacc atggtgtttc cttctgggca gatcagccag gcctcggcct 2640 tggccccggc ccctccccaa gtcctgcccc aggctccagc ccctgcccct gctccagcca 2700 tggtatcagc tctggcccag gccccagccc ctgtcccagt cctagcccca ggccctcctc 2760 aggctgtggc cccacctgcc cccaagccca cccaggctgg ggaaggaacg ctgtcagagg 2820 ccctgctgca gctgcagttt gatgatgaag acctgggggc cttgcttggc aacagcacag 2880 acccagctgt gttcacagac ctggcatccg tcgacaactc cgagtttcag cagctgctga 2940 accagggcat acctgtggcc ccccacacaa ctgagcccat gctgatggag taccctgagg 3000 ctataactcg cctagtgaca ggggcccaga ggccccccga cccagctcct gctccactgg 3060 gggccccggg gctccccaat ggcctccttt caggagatga agacttctcc tccattgcgg 3120 acatggactt ctcagccctg ctgagtcaga tcagctccta aggaagcttg gtaccgtcga 3180 cctcgagaga tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg 3240 gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg 3300 tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg 3360 caagttggga agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca 3420 gtggcacaat cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct 3480 cagcctcccg agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt 3540 ttttggtaga gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag 3600 gtgatctacc caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc 3660 ttccctgtcc tt 3672 <210> 292 <211> 3699 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 292 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcct agggggtcca cttgctcctg 480 ggcccacaca gtcctgcagt attgtgtata taaggccagg gcaaagagga gcaggtttta 540 aagtgaaagg caggcaggtg ttggggaggc agttaccggg gcaacgggaa cagggcgttt 600 cggaggtggt tgccatgggg acctggatgc tgttccattc gccattcagg ctgcgcaact 660 gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat 720 gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa 780 cgacggaatt cgaagcttac gacggacatg tgaaatagcg ctgtacagcg tatgggaatc 840 tcttgtacgg tgtacgagta tcttcccgta caccgtacgg cgcgccctac acaaagccct 900 ctttgtgaga ctacacaaag ccctctttgt gagactacac aaagccctct ttgtgagaca 960 tatgctctag agggtatata atgggggcca ctagtctact accagagctc atcgctagcg 1020 ctggatccgc caccatggtg agcaagggcg aggaggataa catggccatc atcaaggagt 1080 tcatgcgctt caaggtgcac atggagggct ccgtgaacgg ccacgagttc gagatcgagg 1140 gcgagggcga gggccgcccc tacgagggca cccagaccgc caagctgaag gtgaccaagg 1200 gtggccccct gcccttcgcc tgggacatcc tgtcccctca gttcatgtac ggctccaagg 1260 cctacgtgaa gcaccccgcc gacatccccg actacttgaa gctgtccttc cccgagggct 1320 tcaagtggga gcgcgtgatg aacttcgagg acggcggcgt ggtgaccgtg acccaggact 1380 cctccctcca ggacggcgag ttcatctaca aggtgaagct gcgcggcacc aacttcccct 1440 ccgacggccc cgtaatgcag aagaagacca tgggctggga ggcctcctcc gagcggatgt 1500 accccgagga cggcgccctg aagggcgaga tcaagcagcg gctgaagctg aaggacggcg 1560 gccactacga cgctgaggtc aagaccacct acaaggccaa gaagcccgtg cagctgcccg 1620 gcgcctacaa cgtcaacatc aagttggaca tcacctccca caacgaggac tacaccatcg 1680 tggaacagta cgaacgcgcc gagggccgcc actccaccgg cggcatggac gagctgtaca 1740 agtccggaag agccgagggc aggggaagtc ttctaacatg cggggacgtg gaggaaaatc 1800 ccgggcccag atctatgagt cgaggagagg tgcgcatggc gaaggcaggg cgggaggggc 1860 cgcgggacag cgtgtggctg tcgggggagg ggcggcgcgg cggtcgccgt ggggggcagc 1920 cgtccgggct cgaccgggac cggatcaccg gggtcaccgt ccggctgctg gacacggagg 1980 gcctgacggg gttctcgatg cgccgcctgg ccgccgagct gaacgtcacc gcgatgtccg 2040 tgtactggta cgtcgacacc aaggaccagt tgctcgagct cgccctggac gccgtcttcg 2100 gcgagctgcg ccacccggac ccggacgccg ggctcgactg gcgcgaggaa ctgcgggccc 2160 tggcccggga gaaccgggcg ctgctggtgc gccacccctg gtcgtcccgg ctggtcggca 2220 cctacctcaa catcggcccg cactcgctgg ccttctcccg cgcggtgcag aacgtcgtgc 2280 gccgcagcgg gctgcccgcg caccgcctga ccggcgccat ctcggccgtc ttccagttcg 2340 tctacggcta cggcaccatc gagggccgct tcctcgcccg ggtggcggac accgggctga 2400 gtccggagga gtacttccag gactcgatga ccgcggtgac cgaggtgccg gacaccgcgg 2460 gcgtcatcga ggacgcgcag gacatcatgg cggcccgggg cggcgacacc gtggcggaga 2520 tgctggaccg ggacttcgag ttcgccctcg acctgctcgt cgcgggcatc gacgcgatgg 2580 tcgaacaggc ctccgcgtac agccgcgcgc atgatgagtt tcccaccatg gtgtttcctt 2640 ctgggcagat cagccaggcc tcggccttgg ccccggcccc tccccaagtc ctgccccagg 2700 ctccagcccc tgcccctgct ccagccatgg tatcagctct ggcccaggcc ccagcccctg 2760 tcccagtcct agccccaggc cctcctcagg ctgtggcccc acctgccccc aagcccaccc 2820 aggctgggga aggaacgctg tcagaggccc tgctgcagct gcagtttgat gatgaagacc 2880 tgggggcctt gcttggcaac agcacagacc cagctgtgtt cacagacctg gcatccgtcg 2940 acaactccga gtttcagcag ctgctgaacc agggcatacc tgtggccccc cacacaactg 3000 agcccatgct gatggagtac cctgaggcta taactcgcct agtgacaggg gcccagaggc 3060 cccccgaccc agctcctgct ccactggggg ccccggggct ccccaatggc ctcctttcag 3120 gagatgaaga cttctcctcc attgcggaca tggacttctc agccctgctg agtcagatca 3180 gctcctaagg aagcttggta ccgtcgacct cgagagatct acgggtggca tccctgtgac 3240 ccctccccag tgcctctcct ggccctggaa gttgccactc cagtgcccac cagccttgtc 3300 ctaataaaat taagttgcat cattttgtct gactaggtgt ccttctataa tattatgggg 3360 tggagggggg tggtatggag caaggggcaa gttgggaaga caacctgtag ggcctgcggg 3420 gtctattggg aaccaagctg gagtgcagtg gcacaatctt ggctcactgc aatctccgcc 3480 tcctgggttc aagcgattct cctgcctcag cctcccgagt tgttgggatt ccaggcatgc 3540 atgaccaggc tcagctaatt tttgtttttt tggtagagac ggggtttcac catattggcc 3600 aggctggtct ccaactccta atctcaggtg atctacccac cttggcctcc caaattgctg 3660 ggattacagg cgtgaaccac tgctcccttc cctgtcctt 3699 <210> 293 <211> 3354 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 293 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tccacctatc ctgaattact tgaaacctat cctgaattac ttgaaaccta 2820 tcctgaatta cttgaaacct atcctgaatt acttgaagtc gacctcgaga gatctacggg 2880 tggcatccct gtgacccctc cccagtgcct ctcctggccc tggaagttgc cactccagtg 2940 cccaccagcc ttgtcctaat aaaattaagt tgcatcattt tgtctgacta ggtgtccttc 3000 tataatatta tggggtggag gggggtggta tggagcaagg ggcaagttgg gaagacaacc 3060 tgtagggcct gcggggtcta ttgggaacca agctggagtg cagtggcaca atcttggctc 3120 actgcaatct ccgcctcctg ggttcaagcg attctcctgc ctcagcctcc cgagttgttg 3180 ggattccagg catgcatgac caggctcagc taatttttgt ttttttggta gagacggggt 3240 ttcaccatat tggccaggct ggtctccaac tcctaatctc aggtgatcta cccaccttgg 3300 cctcccaaat tgctgggatt acaggcgtga accactgctc ccttccctgt cctt 3354 <210> 294 <211> 3358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 294 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tccacagttc ttcaactggc agcttacagt tcttcaactg gcagcttaca 2820 gttcttcaac tggcagctta cagttcttca actggcagct tgtcgacctc gagagatcta 2880 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358 <210> 295 <211> 3358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 295 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tcccgtgttc acagcggacc ttgatcgtgt tcacagcgga ccttgatcgt 2820 gttcacagcg gaccttgatc gtgttcacag cggaccttga tgtcgacctc gagagatcta 2880 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358 <210> 296 <211> 3357 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 296 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tctccaaaac atgaattgct gctgtccaaa acatgaattg ctgctgtcca 2820 aaacatgaat tgctgctgtc caaaacatga attgctgctg gtcgacctcg agagatctac 2880 gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca 2940 gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc 3000 ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca 3060 acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg 3120 ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg 3180 ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg 3240 ggtttcacca tattggccag gctggtctcc aactcctaat ctcaggtgat ctacccacct 3300 tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc tgtcctt 3357 <210> 297 <211> 3358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 297 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tcccaaacac cattgtcaca ctccacaaac accattgtca cactccacaa 2820 acaccattgt cacactccac aaacaccatt gtcacactcc agtcgacctc gagagatcta 2880 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358 <210> 298 <211> 3362 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 298 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tcctccagtc agttcctgat gcagtatcca gtcagttcct gatgcagtat 2820 ccagtcagtt cctgatgcag tatccagtca gttcctgatg cagtagtcga cctcgagaga 2880 tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca 2940 ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg 3000 tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga 3060 agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat 3120 cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg 3180 agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga 3240 gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc 3300 caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc 3360 tt 3362 <210> 299 <211> 3358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 299 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tcctcacagt tgccagctga gattatcaca gttgccagct gagattatca 2820 cagttgccag ctgagattat cacagttgcc agctgagatt agtcgacctc gagagatcta 2880 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358 <210> 300 <211> 3358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 300 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tccacaagct ttttgctcgt cttatacaag ctttttgctc gtcttataca 2820 agctttttgc tcgtcttata caagcttttt gctcgtctta tgtcgacctc gagagatcta 2880 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358 <210> 301 <211> 3358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 301 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480 tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540 cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600 tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660 tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720 tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780 tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840 tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900 agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960 acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020 aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080 acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140 tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200 cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260 tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320 tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380 caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440 actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800 cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860 atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920 gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980 gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040 ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100 atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220 ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280 tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400 tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460 gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520 cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580 cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640 gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700 gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760 tagacgcgga tccacaaacc ttttgttcgt cttatacaaa ccttttgttc gtcttataca 2820 aaccttttgt tcgtcttata caaacctttt gttcgtctta tgtcgacctc gagagatcta 2880 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358 <210> 302 <211> 3357 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 302 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcct aggcttcgaa tcgatgaatt 480 cgaagcttct acccaccgta ctcgtcaatt ccaagggcat cggtaaacat ctgctcaaac 540 tcgaagtcgg ccatatccag agcgccgtag ggggcggagt cgtggggggt aaatcccgga 600 cccggggaat ccccgtcccc caacatgtcc agatcgaaat cgtctagcgc gtcggcatgc 660 gccatcgcca cgtcctcgcc gtctaagtgg agctcgtccc ccaggctgac atcggtcggg 720 ggggccgtcg acagtctgcg cgtgtgtccc gcggggagaa aggacaggcg cggagccgcc 780 agccccgcct cttcgggggc gtcgtcgtcc gggagatcga gcaggccctc gatggtagac 840 ccgtaattgt ttttcgtacg cgcgcggctg tacgcggagg cctgttcgac catcgcgtcg 900 atgcccgcga cgagcaggtc gagggcgaac tcgaagtccc ggtccagcat ctccgccacg 960 gtgtcgccgc cccgggccgc catgatgtcc tgcgcgtcct cgatgacgcc cgcggtgtcc 1020 ggcacctcgg tcaccgcggt catcgagtcc tggaagtact cctccggact cagcccggtg 1080 tccgccaccc gggcgaggaa gcggccctcg atggtgccgt agccgtagac gaactggaag 1140 acggccgaga tggcgccggt caggcggtgc gcgggcagcc cgctgcggcg cacgacgttc 1200 tgcaccgcgc gggagaaggc cagcgagtgc gggccgatgt tgaggtaggt gccgaccagc 1260 cgggacgacc aggggtggcg caccagcagc gcccggttct cccgggccag ggcccgcagt 1320 tcctcgcgcc agtcgagccc ggcgtccggg tccgggtggc gcagctcgcc gaagacggcg 1380 tccagggcga gctcgagcaa ctggtccttg gtgtcgacgt accagtacac ggacatcgcg 1440 gtgacgttca gctcggcggc caggcggcgc atcgagaacc ccgtcaggcc ctccgtgtcc 1500 agcagccgga cggtgacccc ggtgatccgg tcccggtcga gcccggacgg ctgcccccca 1560 cggcgaccgc cgcgccgccc ctcccccgac agccacacgc tgtcccgcgg cccctcccgc 1620 cctgccttcg ccatgcgcac ctctcctcga ctcataccgg tagcgctagc gatgagctct 1680 ggtagtagac tagtggcccc cattatatac cctctagagc atatgtctca caaagagggc 1740 tttgtgtagt ctcacaaaga gggctttgtg tagtctcaca aagagggctt tgtgtagggc 1800 gcgcccccgt agcttggcgt aatcacatgt ccgtcgtttt acaacgtcgt gactgggaaa 1860 accctggcct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 1920 taaaacgacg gacatgtgaa atagcgctgt acagcgtatg ggaatctctt gtacggtgta 1980 cgagtatctt cccgtacacc gtacggcgcg ccagttaata attaactagt taataattaa 2040 ctagttaata attaactcat atgctctaga gggtatataa tgggggccac tagtctacta 2100 ccagagctca tcgctagcgc tggatccgcc accatggtga gcaagggcga ggaggataac 2160 atggccatca tcaaggagtt catgcgcttc aaggtgcaca tggagggctc cgtgaacggc 2220 cacgagttcg agatcgaggg cgagggcgag ggccgcccct acgagggcac ccagaccgcc 2280 aagctgaagg tgaccaaggg tggccccctg cccttcgcct gggacatcct gtcccctcag 2340 ttcatgtacg gctccaaggc ctacgtgaag caccccgccg acatccccga ctacttgaag 2400 ctgtccttcc ccgagggctt caagtgggag cgcgtgatga acttcgagga cggcggcgtg 2460 gtgaccgtga cccaggactc ctccctccag gacggcgagt tcatctacaa ggtgaagctg 2520 cgcggcacca acttcccctc cgacggcccc gtaatgcaga agaagaccat gggctgggag 2580 gcctcctccg agcggatgta ccccgaggac ggcgccctga agggcgagat caagcagcgg 2640 ctgaagctga aggacggcgg ccactacgac gctgaggtca agaccaccta caaggccaag 2700 aagcccgtgc agctgcccgg cgcctacaac gtcaacatca agttggacat cacctcccac 2760 aacgaggact acaccatcgt ggaacagtac gaacgcgccg agggccgcca ctccaccggc 2820 ggcatggacg agctgtacaa gtagggtacc caaacaccat tgtcacactc caagatctac 2880 gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca 2940 gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc 3000 ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca 3060 acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg 3120 ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg 3180 ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg 3240 ggtttcacca tattggccag gctggtctcc aactcctaat ctcaggtgat ctacccacct 3300 tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc tgtcctt 3357 <210> 303 <211> 3778 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 303 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcct aggcttcgaa tcgatgaatt 480 cgaagcttct acccaccgta ctcgtcaatt ccaagggcat cggtaaacat ctgctcaaac 540 tcgaagtcgg ccatatccag agcgccgtag ggggcggagt cgtggggggt aaatcccgga 600 cccggggaat ccccgtcccc caacatgtcc agatcgaaat cgtctagcgc gtcggcatgc 660 gccatcgcca cgtcctcgcc gtctaagtgg agctcgtccc ccaggctgac atcggtcggg 720 ggggccgtcg acagtctgcg cgtgtgtccc gcggggagaa aggacaggcg cggagccgcc 780 agccccgcct cttcgggggc gtcgtcgtcc gggagatcga gcaggccctc gatggtagac 840 ccgtaattgt ttttcgtacg cgcgcggctg tacgcggagg cctgttcgac catcgcgtcg 900 atgcccgcga cgagcaggtc gagggcgaac tcgaagtccc ggtccagcat ctccgccacg 960 gtgtcgccgc cccgggccgc catgatgtcc tgcgcgtcct cgatgacgcc cgcggtgtcc 1020 ggcacctcgg tcaccgcggt catcgagtcc tggaagtact cctccggact cagcccggtg 1080 tccgccaccc gggcgaggaa gcggccctcg atggtgccgt agccgtagac gaactggaag 1140 acggccgaga tggcgccggt caggcggtgc gcgggcagcc cgctgcggcg cacgacgttc 1200 tgcaccgcgc gggagaaggc cagcgagtgc gggccgatgt tgaggtaggt gccgaccagc 1260 cgggacgacc aggggtggcg caccagcagc gcccggttct cccgggccag ggcccgcagt 1320 tcctcgcgcc agtcgagccc ggcgtccggg tccgggtggc gcagctcgcc gaagacggcg 1380 tccagggcga gctcgagcaa ctggtccttg gtgtcgacgt accagtacac ggacatcgcg 1440 gtgacgttca gctcggcggc caggcggcgc atcgagaacc ccgtcaggcc ctccgtgtcc 1500 agcagccgga cggtgacccc ggtgatccgg tcccggtcga gcccggacgg ctgcccccca 1560 cggcgaccgc cgcgccgccc ctcccccgac agccacacgc tgtcccgcgg cccctcccgc 1620 cctgccttcg ccatgcgcac ctctcctcga ctcataccgg tagcgctagc gatgagctct 1680 ggtagtagac tagtggcccc cattatatac cctctagagc atatgtctca caaagagggc 1740 tttgtgtagt ctcacaaaga gggctttgtg tagtctcaca aagagggctt tgtgtagggc 1800 gcgcccccgt agcttggcgt aatcacatgt ccgtcgtttt acaacgtcgt gactgggaaa 1860 accctggcct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 1920 taaaacgacg gacatgtgaa atagcgctgt acagcgtatg ggaatctctt gtacggtgta 1980 cgagtatctt cccgtacacc gtacggcgcg ccagttaata attaactagt taataattaa 2040 ctagttaata attaactcat atgctctaga gggtatataa tgggggccac tagtctacta 2100 ccagagctca tcgctagcgc tggatcccgc caccatggct tcgtacccct gccatcaaca 2160 cgcgtctgcg ttcgaccagg ctgcgcgttc tcgcggccat agcaaccgac gtacggcgtt 2220 gcgccctcgc cggcagcaag aagccacgga agtccgcctg gagcagaaaa tgcccacgct 2280 actgcgggtt tatatagacg gtcctcacgg gatggggaaa accaccacca cgcaactgct 2340 ggtggccctg ggttcgcgcg acgatatcgt ctacgtaccc gagccgatga cttactggca 2400 ggtgctgggg gcttccgaga caatcgcgaa catctacacc acacaacacc gcctcgacca 2460 gggtgagata tcggccgggg acgcggcggt ggtaatgaca agcgcccaga taacaatggg 2520 catgccttat gccgtgaccg acgccgttct ggctcctcat atcggggggg aggctgggag 2580 ctcacatgcc ccgcccccgg ccctcaccct catcttcgac cgccatccca tcgccgccct 2640 cctgtgctac ccggccgcgc gataccttat gggcagcatg accccccagg ccgtgctggc 2700 gttcgtggcc ctcatcccgc cgaccttgcc cggcacaaac atcgtgttgg gggcccttcc 2760 ggaggacaga cacatcgacc gcctggccaa acgccagcgc cccggcgagc ggcttgacct 2820 ggctatgctg gccgcgattc gccgcgttta cgggctgctt gccaatacgg tgcggtatct 2880 gcagggcggc gggtcgtggc gggaggattg gggacagctt tcggggacgg ccgtgccgcc 2940 ccagggtgcc gagccccaga gcaacgcggg cccacgaccc catatcgggg acacgttatt 3000 taccctgttt cgggcccccg agttgctggc ccccaacggc gacctgtaca acgtgtttgc 3060 ctgggccttg gacgtcttgg ccaaacgcct ccgtcccatg cacgtcttta tcctggatta 3120 cgaccaatcg cccgccggct gccgggacgc cctgctgcaa cttacctccg ggatggtcca 3180 gacccacgtc accacccccg gctccatacc gacgatctgc gacctggcgc gcacgtttgc 3240 ccgggagatg ggggaggcta actgaggtac ccaaacacca ttgtcacact ccaagatcta 3300 cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 3360 agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3420 cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3480 aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3540 gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3600 gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3660 gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3720 ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3778 <210> 304 <211> 3926 <212> DNA <213> 305 <400> 304 cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60 ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120 ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240 ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360 ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420 aaacctctac aaatgtggta tggctgatta tgatcctcct aggtgaggta gtaggttgta 480 tggtttgagg tagtaggttg tatggtttga ggtagtaggt tgtatggttt gaggtagtag 540 gttgtatggt tatcgatgaa ttcgaagctt ctacccaccg tactcgtcaa ttccaagggc 600 atcggtaaac atctgctcaa actcgaagtc ggccatatcc agagcgccgt agggggcgga 660 gtcgtggggg gtaaatcccg gacccgggga atccccgtcc cccaacatgt ccagatcgaa 720 atcgtctagc gcgtcggcat gcgccatcgc cacgtcctcg ccgtctaagt ggagctcgtc 780 ccccaggctg acatcggtcg ggggggccgt cgacagtctg cgcgtgtgtc ccgcggggag 840 aaaggacagg cgcggagccg ccagccccgc ctcttcgggg gcgtcgtcgt ccgggagatc 900 gagcaggccc tcgatggtag acccgtaatt gtttttcgta cgcgcgcggc tgtacgcgga 960 ggcctgttcg accatcgcgt cgatgcccgc gacgagcagg tcgagggcga actcgaagtc 1020 ccggtccagc atctccgcca cggtgtcgcc gccccgggcc gccatgatgt cctgcgcgtc 1080 ctcgatgacg cccgcggtgt ccggcacctc ggtcaccgcg gtcatcgagt cctggaagta 1140 ctcctccgga ctcagcccgg tgtccgccac ccgggcgagg aagcggccct cgatggtgcc 1200 gtagccgtag acgaactgga agacggccga gatggcgccg gtcaggcggt gcgcgggcag 1260 cccgctgcgg cgcacgacgt tctgcaccgc gcgggagaag gccagcgagt gcgggccgat 1320 gttgaggtag gtgccgacca gccgggacga ccaggggtgg cgcaccagca gcgcccggtt 1380 ctcccgggcc agggcccgca gttcctcgcg ccagtcgagc ccggcgtccg ggtccgggtg 1440 gcgcagctcg ccgaagacgg cgtccagggc gagctcgagc aactggtcct tggtgtcgac 1500 gtaccagtac acggacatcg cggtgacgtt cagctcggcg gccaggcggc gcatcgagaa 1560 ccccgtcagg ccctccgtgt ccagcagccg gacggtgacc ccggtgatcc ggtcccggtc 1620 gagcccggac ggctgccccc cacggcgacc gccgcgccgc ccctcccccg acagccacac 1680 gctgtcccgc ggcccctccc gccctgcctt cgccatgcgc acctctcctc gactcatacc 1740 ggtagcgcta gcgatgagct ctggtagtag actagtggcc cccattatat accctctaga 1800 gcatatgtct cacaaagagg gctttgtgta gtctcacaaa gagggctttg tgtagtctca 1860 caaagagggc tttgtgtagg gcgcgccccc gtagcttggc gtaatcacat gtccgtcgtt 1920 ttacaacgtc gtgactggga aaaccctggc ctgcaaggcg attaagttgg gtaacgccag 1980 ggttttccca gtcacgacgt tgtaaaacga cggacatgtg aaatagcgct gtacagcgta 2040 tgggaatctc ttgtacggtg tacgagtatc ttcccgtaca ccgtacggcg cgccagttaa 2100 taattaacta gttaataatt aactagttaa taattaactc atatgctcta gagggtatat 2160 aatgggggcc actagtctac taccagagct catcgctagc gctggatccc gccaccatgg 2220 cttcgtaccc ctgccatcaa cacgcgtctg cgttcgacca ggctgcgcgt tctcgcggcc 2280 atagcaaccg acgtacggcg ttgcgccctc gccggcagca agaagccacg gaagtccgcc 2340 tggagcagaa aatgcccacg ctactgcggg tttatataga cggtcctcac gggatgggga 2400 aaaccaccac cacgcaactg ctggtggccc tgggttcgcg cgacgatatc gtctacgtac 2460 ccgagccgat gacttactgg caggtgctgg gggcttccga gacaatcgcg aacatctaca 2520 ccacacaaca ccgcctcgac cagggtgaga tatcggccgg ggacgcggcg gtggtaatga 2580 caagcgccca gataacaatg ggcatgcctt atgccgtgac cgacgccgtt ctggctcctc 2640 atatcggggg ggaggctggg agctcacatg ccccgccccc ggccctcacc ctcatcttcg 2700 accgccatcc catcgccgcc ctcctgtgct acccggccgc gcgatacctt atgggcagca 2760 tgacccccca ggccgtgctg gcgttcgtgg ccctcatccc gccgaccttg cccggcacaa 2820 acatcgtgtt gggggccctt ccggaggaca gacacatcga ccgcctggcc aaacgccagc 2880 gccccggcga gcggcttgac ctggctatgc tggccgcgat tcgccgcgtt tacgggctgc 2940 ttgccaatac ggtgcggtat ctgcagggcg gcgggtcgtg gcgggaggat tggggacagc 3000 tttcggggac ggccgtgccg ccccagggtg ccgagcccca gagcaacgcg ggcccacgac 3060 cccatatcgg ggacacgtta tttaccctgt ttcgggcccc cgagttgctg gcccccaacg 3120 gcgacctgta caacgtgttt gcctgggcct tggacgtctt ggccaaacgc ctccgtccca 3180 tgcacgtctt tatcctggat tacgaccaat cgcccgccgg ctgccgggac gccctgctgc 3240 aacttacctc cgggatggtc cagacccacg tcaccacccc cggctccata ccgacgatct 3300 gcgacctggc gcgcacgttt gcccgggaga tgggggaggc taactgaggt accaaccata 3360 caacctacta cctcaaacca tacaacctac tacctcaaac catacaacct actacctcaa 3420 accatacaac ctactacctc aagatctacg ggtggcatcc ctgtgacccc tccccagtgc 3480 ctctcctggc cctggaagtt gccactccag tgcccaccag ccttgtccta ataaaattaa 3540 gttgcatcat tttgtctgac taggtgtcct tctataatat tatggggtgg aggggggtgg 3600 tatggagcaa ggggcaagtt gggaagacaa cctgtagggc ctgcggggtc tattgggaac 3660 caagctggag tgcagtggca caatcttggc tcactgcaat ctccgcctcc tgggttcaag 3720 cgattctcct gcctcagcct cccgagttgt tgggattcca ggcatgcatg accaggctca 3780 gctaattttt gtttttttgg tagagacggg gtttcaccat attggccagg ctggtctcca 3840 actcctaatc tcaggtgatc tacccacctt ggcctcccaa attgctggga ttacaggcgt 3900 gaaccactgc tcccttccct gtcctt 3926 <210> 305 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 305 guuuacaauu gacuaacacu cca 23 <210> 306 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 306 uggaguguga caaugguguu ugu 23

Claims (117)

  1. 하기를 포함하는 인접 폴리핵산 분자로서:
    a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) 표 1에 열거된 miRNA에 대한 표적 부위 또는 이들의 조합을 포함하는 것인 제1 카세트; 및
    b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트;
    여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인
    인접 폴리핵산 분자.
  2. 제1항에 있어서, 제1 RNA가 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  3. 제1항 또는 제2항에 있어서, 제1 RNA가 3' UTR을 포함하며, 여기서 3' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 제1 RNA가 5' UTR을 포함하며, 여기서 5' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 제2 RNA가 표 1에 열거된 마이크로RNA에 대한 표적 부위 또는 이들의 조합을 추가로 포함하는 것인 인접 폴리핵산 분자.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 제2 RNA가 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 추가로 포함하는 것인 인접 폴리핵산 분자.
  7. 제6항에 있어서, 제2 RNA가 3' UTR을 포함하며, 여기서 3' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  8. 제6항 또는 제7항에 있어서, 제2 RNA가 5' UTR을 포함하며, 여기서 5' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서, 제1 카세트의 적어도 하나의 miRNA 표적 부위 및 제2 카세트의 적어도 하나의 miRNA 표적 부위가 동일한 핵산 서열이거나 또는 동일한 miRNA에 의해 조절되는 상이한 서열인 인접 폴리핵산 분자.
  10. 제6항 내지 제9항 중 어느 한 항에 있어서, 제1 RNA 및 제2 RNA가 각각 let-7c 표적 부위를 포함하는 것인 인접 폴리핵산 분자.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 전사활성인자 반응 요소가 표 3에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서, 제2 RNA의 발현이 전사 인자 반응 요소에 작동가능하게 연결된 것인 인접 폴리핵산 분자.
  13. 제12항에 있어서, 전사 인자 반응 요소가 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 전사활성인자가 독립적으로 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
  15. 제1항 내지 제13항 중 어느 한 항에 있어서, 제1 RNA의 발현이 전사 인자 반응 요소에 작동가능하게 연결된 것인 인접 폴리핵산 분자.
  16. 제15항에 있어서, 전사 인자 반응 요소가 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  17. 제12항, 제13항 및 제16항 중 어느 한 항에 있어서, 전사활성인자가 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 제1 카세트 및/또는 제2 카세트가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
  19. 제18항에 있어서, 프로모터 요소가 표 5에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  20. 제18항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
  21. 제15항 내지 제17항 중 어느 한 항에 있어서,
    제1 카세트가 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고;
    제2 카세트가 5'에서 3'으로: (i) 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하는 것인
    인접 폴리핵산 분자.
  22. 제21항에 있어서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소가 동일한 핵산 서열로 이루어진 것인 인접 폴리핵산 분자.
  23. 제21항에 있어서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소가 상이한 핵산 서열로 이루어진 것인 인접 폴리핵산 분자.
  24. 제15항 내지 제23항 중 어느 한 항에 있어서, 제1 카세트 및/또는 제2 카세트가 2개 이상의 전사 인자 반응 요소를 포함하는 것인 인접 폴리핵산 분자.
  25. 제24항에 있어서, 제1 카세트 및/또는 제2 카세트가 2개의 상이한 전사 인자 반응 요소를 포함하는 것인 인접 폴리핵산 분자.
  26. 제21항 내지 제25항 중 어느 한 항에 있어서, 제1 카세트의 상류 조절 구성요소가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
  27. 제26항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
  28. 제21항 내지 제27항 중 어느 한 항에 있어서, 제2 카세트의 상류 조절 구성요소가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
  29. 제28항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 제1 카세트 및 제2 카세트가 수렴형 배향으로 존재하는 것인 인접 폴리핵산 분자.
  31. 제1항 내지 제29항 중 어느 한 항에 있어서, 제1 카세트 및 제2 카세트가 발산형 배향으로 존재하는 것인 인접 폴리핵산 분자.
  32. 제1항 내지 제29항 중 어느 한 항에 있어서, 제1 카세트 및 제2 카세트가 머리-대-꼬리 배향으로 존재하는 것인 인접 폴리핵산 분자.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 제1 카세트 및/또는 제2 카세트가 인슐레이터에 의해 플랭킹되는 것인 인접 폴리핵산 분자.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 제2 카세트의 전사활성인자가 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16, 또는 NarLc-RelA인 인접 폴리핵산 분자.
  35. 제1항 내지 제33항 중 어느 한 항에 있어서, 제2 카세트의 전사활성인자가 표 2에 열거된 핵산 서열을 포함하는 것인 인접 폴리핵산 분자.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 출력이 단백질 또는 RNA 분자인 인접 폴리핵산 분자.
  37. 제1항 내지 제36항 중 어느 한 항에 있어서, 출력이 치료제인 인접 폴리핵산 분자.
  38. 제36항 또는 제37항에 있어서, 출력이 형광 단백질, 세포독소, 전구약물 활성화를 촉매하는 효소, 면역조정 단백질 및/또는 RNA, DNA-변형 인자, 세포-표면 수용체, 유전자 발현-조절 인자, 키나제, 후성적 변형인자, 및/또는 벡터 복제에 필요한 인자, 및/또는 병원체의 항원 폴리펩티드를 코딩하는 서열인 인접 폴리핵산 분자.
  39. 제36항 또는 제37항에 있어서, 출력이 인간 심플렉스 헤르페스 바이러스 1로부터의 티미딘 키나제 효소 (HSV-TK)인 인접 폴리핵산 분자.
  40. 제38항에 있어서, 면역조정 단백질 및/또는 RNA가 시토카인 또는 콜로니 자극 인자인 인접 폴리핵산 분자.
  41. 제38항에 있어서, DNA-변형 인자가 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소인 인접 폴리핵산 분자.
  42. 제41항에 있어서, DNA-변형 효소가 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas DNA 변형 시스템의 단백질 구성요소인 인접 폴리핵산 분자.
  43. 제38항에 있어서, 유전자 발현-조절 인자가 유전자 발현을 조절할 수 있는 단백질, 또는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소인 인접 폴리핵산 분자.
  44. 표 6에 열거된 핵산 서열을 포함하는 인접 폴리핵산 분자.
  45. 인접 폴리핵산 분자로서, 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 (i) 출력의 핵산 서열; (ii) 전사활성인자의 핵산 서열; 및 (iii) 표 1에 열거된 miRNA에 대한 표적 부위 또는 이들의 조합을 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
  46. 제45항에 있어서, 제1 RNA가 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  47. 제45항 또는 제46항에 있어서, RNA가 출력 및 전사활성인자의 핵산 서열들을 분리하는 폴리시스트론성 발현 요소의 핵산 서열을 추가로 포함하는 것인 인접 폴리핵산 분자.
  48. 제45항 내지 제47항 중 어느 한 항에 있어서, RNA가 3' UTR을 포함하며, 여기서 3' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  49. 제45항 내지 제48항 중 어느 한 항에 있어서, RNA가 5' UTR을 포함하며, 여기서 5' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  50. 제45항 내지 제49항 중 어느 한 항에 있어서, RNA가 let-7c 표적 부위를 포함하는 것인 인접 폴리핵산 분자.
  51. 제45항 내지 제50항 중 어느 한 항에 있어서, 전사활성인자 반응 요소가 표 3에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  52. 제45항 내지 제50항 중 어느 한 항에 있어서, 전사활성인자가 독립적으로 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
  53. 제45항 내지 제52항 중 어느 한 항에 있어서, RNA의 발현이 전사활성인자 반응 요소 및 전사 인자 반응 요소에 작동가능하게 연결된 것인 인접 폴리핵산 분자.
  54. 제53항에 있어서, 전사 인자 반응 요소가 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  55. 제53항에 있어서, 전사활성인자가 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
  56. 제45항 내지 제55항 중 어느 한 항에 있어서, 카세트가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
  57. 제56항에 있어서, 프로모터 요소가 표 5에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
  58. 제56항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
  59. 제53항 또는 제55항에 있어서, 인접 폴리핵산 분자가 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력 및 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하는 것인 인접 폴리핵산 분자.
  60. 제59항에 있어서, (i)에서의 상류 조절 구성요소가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
  61. 제60항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
  62. 제45항 내지 제61항 중 어느 한 항에 있어서, 적어도 하나의 카세트의 전사활성인자가 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16, 또는 NarLc-RelA인 인접 폴리핵산 분자.
  63. 제45항 내지 제61항 중 어느 한 항에 있어서, 제2 카세트의 전사활성인자가 표 2에 열거된 핵산 서열을 포함하는 것인 인접 폴리핵산 분자.
  64. 제45항 내지 제62항 중 어느 한 항에 있어서, 출력이 단백질 또는 RNA 분자인 인접 폴리핵산 분자.
  65. 제45항 내지 제64항 중 어느 한 항에 있어서, 출력이 치료 단백질 또는 RNA 분자인 인접 폴리핵산 분자.
  66. 제64항 또는 제65항에 있어서, 출력이 형광 단백질, 세포독소, 전구약물 활성화를 촉매하는 효소, 면역조정 단백질 및/또는 RNA, DNA-변형 인자, 세포-표면 수용체, 유전자 발현-조절 인자, 키나제, 후성적 변형인자, 및/또는 벡터 복제에 필요한 인자, 및/또는 병원체의 항원 폴리펩티드를 코딩하는 서열인 인접 폴리핵산 분자.
  67. 제64항 또는 제65항에 있어서, 출력이 인간 심플렉스 헤르페스 바이러스 1로부터의 티미딘 키나제 효소 (HSV-TK)인 인접 폴리핵산 분자.
  68. 제66항에 있어서, 면역조정 단백질 및/또는 RNA가 시토카인 또는 콜로니 자극 인자인 인접 폴리핵산 분자.
  69. 제66항에 있어서, DNA-변형 인자가 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소인 인접 폴리핵산 분자.
  70. 제69항에 있어서, DNA-변형 효소가 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas 시스템의 단백질 구성요소인 인접 폴리핵산 분자.
  71. 제66항에 있어서, 유전자 발현-조절 인자가 유전자 발현을 조절할 수 있는 단백질, 또는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소인 인접 폴리핵산 분자.
  72. 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자를 포함하는 벡터.
  73. 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자를 포함하는 조작된 바이러스 게놈.
  74. 제73항에 있어서, 바이러스 게놈이 아데노-연관 바이러스 (AAV) 게놈, 렌티바이러스 게놈, 아데노바이러스 게놈, 헤르페스 심플렉스 바이러스 (HSV) 게놈, 백시니아 바이러스 게놈, 폭스바이러스 게놈, 뉴캐슬병 바이러스 (NDV) 게놈, 콕사키바이러스 게놈, 레오바이러스 게놈, 홍역 바이러스 게놈, 소포성 구내염 바이러스 (VSV) 게놈, 파르보바이러스 게놈, 세네카 밸리 바이러스 게놈, 마라바 바이러스 게놈, 또는 감기 바이러스 게놈인 조작된 바이러스 게놈.
  75. 제73항 또는 제74항의 조작된 바이러스 게놈을 포함하는 비리온.
  76. 제75항에 있어서, AAV-DJ, AAV8, AAV6, 또는 AAV-B1 캡시드를 추가로 포함하는 비리온.
  77. 세포의 집단을 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온과 접촉시키는 것을 포함하는 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법으로서, 여기서 세포의 집단은 적어도 하나의 표적 세포 유형 및 하나 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준 및/또는 활성에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준 및/또는 활성은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절되는 것인 방법.
  78. 제77항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함하는 것인 방법.
  79. 제77항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 이 프로모터 단편을 추가로 포함하는 것인 방법.
  80. 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 진단하는 방법으로서, 여기서 출력의 수준은 질환 및 또는 병태의 존재 또는 부재를 지시하는 것인 방법.
  81. 제80항에 있어서, 질환이 암인 방법.
  82. 제81항에 있어서, 암이 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종인 방법.
  83. 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 치료하는 방법.
  84. 제83항에 있어서, 전구약물을 투여하는 것을 추가로 포함하며, 임의적으로 여기서 전구약물이 간시클로비르이고, 임의적으로 여기서 인접 폴리핵산 분자가 표 6에 열거된 핵산 서열을 포함하는 것인 방법.
  85. 제83항에 있어서, 질환이 암인 방법.
  86. 제85항에 있어서, 암이 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종인 방법.
  87. 세포의 집단을 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온과 접촉시키는 것을 포함하는 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 사용하기 위한 조성물로서, 여기서 세포의 집단은 적어도 하나의 표적 세포 유형 및 하나 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준 및/또는 활성에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준 및/또는 활성은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절되는 것인 조성물.
  88. 제87항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함하는 것인 방법.
  89. 제87항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 이 프로모터 단편을 추가로 포함하는 것인 방법.
  90. 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 진단하는 방법에 사용하기 위한 조성물로서, 여기서 출력의 수준은 질환 및 또는 병태의 존재 또는 부재를 지시하는 것인 조성물.
  91. 제90항에 있어서, 질환이 암인 사용하기 위한 조성물.
  92. 제91항에 있어서, 암이 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종인 사용하기 위한 조성물.
  93. 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 치료하는 방법에 사용하기 위한 조성물.
  94. 제93항에 있어서, 전구약물을 투여하는 것을 추가로 포함하며, 임의적으로 여기서 전구약물이 간시클로비르이고, 임의적으로 여기서 인접 폴리핵산 분자가 표 6에 열거된 핵산 서열을 포함하는 것인 방법.
  95. 제93항에 있어서, 질환이 암인 사용하기 위한 조성물.
  96. 제95항에 있어서, 암이 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종인 사용하기 위한 조성물.
  97. 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하는 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법으로서, 여기서:
    a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 비-표적 세포의 적어도 하위세트, 예컨대 적어도 2개 및 임의적으로 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고;
    b) 인접 폴리핵산 분자는 하기를 포함하고:
    (i) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하며, 여기서 제1 RNA는 출력의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하는 것인 제1 카세트; 및
    (ii) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트;
    여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키고;
    여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절되는 것인
    방법.
  98. 제97항에 있어서, 인접 폴리핵산 분자가 표 6에 열거된 핵산 서열을 포함하는 것인 방법.
  99. 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하는 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법으로서, 여기서:
    a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 비-표적 세포의 적어도 하위세트, 예컨대 적어도 2개 및 임의적으로 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고;
    b) 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 mRNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 출력의 핵산 서열; 전사활성인자의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하고;
    여기서 전사활성인자는, 단백질로서 발현되는 경우, 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키고;
    여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절되는 것인
    방법.
  100. 제97항 또는 제99항에 있어서, 인접 폴리핵산 분자를 포함하는 조성물이 인접 폴리핵산을 포함하는 벡터, 인접 폴리핵산을 포함하는 조작된 바이러스 게놈, 또는 폴리핵산을 포함하는 비리온을 포함하는 것인 방법.
  101. 제97항 내지 제100항 중 어느 한 항에 있어서, 내인성 miRNA가 표 1에 열거된 miRNA 또는 표 1에 열거된 miRNA의 조합으로부터 선택되는 것인 방법.
  102. 제97항 내지 제101항 중 어느 한 항에 있어서, 내인성 miRNA가 let-7c, let-7a, let-7b, let-7d, let-7e, let-7f, let-7g, let-7i, miR-22, miR-26b, miR-122, miR-208a, miR-208b, miR-1, miR-217, miR-216a, 또는 이들의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  103. 제97항 내지 제101항 중 어느 한 항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함하는 것인 방법.
  104. 제97항 내지 제101항 중 어느 한 항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 이 프로모터 단편을 추가로 포함하는 것인 방법.
  105. 제97항 내지 제103항 중 어느 한 항에 있어서, 표적 세포가 종양 세포이고, 세포-특이적 이벤트가 종양 세포 사멸인 방법.
  106. 제105항에 있어서, 종양 세포 사멸이 활성화 수용체 리간드, 특이적 항원, 자극 시토카인 또는 이들의 임의의 조합의 발현을 통한 면역 표적화에 의해 매개되는 것인 방법.
  107. 제97항 내지 제103항 중 어느 한 항에 있어서, 표적 세포가 노화 세포이고, 세포-특이적 이벤트가 노화 세포 사멸인 방법.
  108. 제97항 내지 제107항 중 어느 한 항에 있어서, 세포의 집단을 출력에 의해 치료제 또는 독성 화합물로 대사되는 전구약물 또는 비-독성 전구체 화합물과 접촉시키는 것을 추가로 포함하는 방법.
  109. 제97항 내지 제103항 중 어느 한 항에 있어서, 출력 발현이, 비-표적 세포가 출력 발현의 결여로 인하여 그리고 무관하며 비특이적인 세포 사멸-유도 작용제의 존재 하에서 제거되는 동안, 표적 세포 집단의 생존을 보장하는 것인 방법.
  110. 제97항 내지 제103항 중 어느 한 항에 있어서, 표적 세포가 관심의 특정한 표현형을 포함하며, 그에 따라 출력 발현이 이 특정한 표현형의 세포에 제한되는 것인 방법.
  111. 제97항 내지 제102항 중 어느 한 항에 있어서, 표적 세포가 선택되는 세포 유형이고, 세포-특이적 이벤트가 자연적으로는 선택되는 세포 유형에서는 부재하거나 불활성인 유전자의 발현을 통한 신규 기능의 코딩인 방법.
  112. 제97항 내지 제111항 중 어느 한 항에 있어서, 세포의 집단이 다세포 유기체를 포함하는 것인 방법.
  113. 제112항에 있어서, 다세포 유기체가 동물인 방법.
  114. 제113항에 있어서, 동물이 인간인 방법.
  115. 제97항 내지 제114항 중 어느 한 항에 있어서, 세포의 집단이 생체외에서 접촉되는 것인 방법.
  116. 제97항 내지 제114항 중 어느 한 항에 있어서, 세포의 집단이 생체내에서 접촉되는 것인 방법.
  117. 하기를 포함하는 인접 폴리핵산 분자로서:
    a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) miRNA에 대한 표적 부위를 포함하며, 여기서 상기 miRNA는 포유동물의 적어도 2개의 상이한 건강한 조직에서 고도로 발현되고/거나 활성이고, 표적 세포의 하나 이상의 유형에서 낮은 수준으로 발현되는 것인 제1 카세트;
    b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트,
    여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인
    인접 폴리핵산 분자.
KR1020227039223A 2020-04-14 2021-04-14 세포 분류기 회로 및 그의 사용 방법 KR20230002611A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063009736P 2020-04-14 2020-04-14
US63/009,736 2020-04-14
PCT/IB2021/000246 WO2021209813A2 (en) 2020-04-14 2021-04-14 Cell classifier circuits and methods of use thereof

Publications (1)

Publication Number Publication Date
KR20230002611A true KR20230002611A (ko) 2023-01-05

Family

ID=75919340

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227039223A KR20230002611A (ko) 2020-04-14 2021-04-14 세포 분류기 회로 및 그의 사용 방법

Country Status (8)

Country Link
US (1) US20230133209A1 (ko)
EP (1) EP4136241A2 (ko)
JP (1) JP2023522025A (ko)
KR (1) KR20230002611A (ko)
CN (1) CN115702247A (ko)
AU (1) AU2021256845A1 (ko)
CA (1) CA3179339A1 (ko)
WO (1) WO2021209813A2 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108884448B (zh) * 2016-01-27 2022-12-30 昂克诺斯公司 溶瘤病毒载体及其用途
CN112823209A (zh) * 2018-10-11 2021-05-18 瑞士苏黎世联邦理工大学 使用编码高度紧凑的多输入逻辑门的核酸载体治疗疾病的方法

Also Published As

Publication number Publication date
WO2021209813A3 (en) 2021-12-30
CN115702247A (zh) 2023-02-14
US20230133209A1 (en) 2023-05-04
AU2021256845A1 (en) 2022-11-24
EP4136241A2 (en) 2023-02-22
CA3179339A1 (en) 2021-10-21
WO2021209813A2 (en) 2021-10-21
JP2023522025A (ja) 2023-05-26

Similar Documents

Publication Publication Date Title
KR102271675B1 (ko) 헌팅톤병의 aav 치료
US20210388389A1 (en) Compositions and methods for rapid and modular generation of chimeric antigen receptor t cells
CN113271955A (zh) 用于细胞介导的溶瘤病毒疗法的增强的系统
KR20210068485A (ko) 노화를 역전시키고 기관 및 조직 재생을 촉진시키기 위한 세포 재프로그래밍
KR102249982B1 (ko) 트랜스포존 시스템, 이를 포함한 키트, 및 이들의 용도
CN112585277A (zh) 表达重组受体的t细胞、相关多核苷酸和方法
BR122020025496B1 (pt) Método de produção de uma célula imune modificada, em que a célula imune é uma célula t alogênica ou autóloga
CA3096708A1 (en) Compositions and methods for multiplexed tumor vaccination with endogenous gene activation
JP2022545461A (ja) 細胞型運命指定の調節因子を同定するための組成物および方法
KR20230029603A (ko) 필수 유전자 녹-인에 의한 선택
KR20230137399A (ko) 기능성 핵산 분자 및 방법
CN113559134B (zh) 一种用于肿瘤治疗的药物
JP2023521410A (ja) 大型のアデノウイルスペイロードの組み込み
KR20230002611A (ko) 세포 분류기 회로 및 그의 사용 방법
US20220387626A1 (en) Compositions and methods comprising viral vector systems for multiplexed activation of endogenous genes as immunotherapy and viral-based immune-gene therapy
CN111683673A (zh) 肌营养不良症的治疗
US20230002756A1 (en) High Performance Platform for Combinatorial Genetic Screening
TW202308669A (zh) 嵌合共刺激性受體、趨化激素受體及彼等於細胞免疫治療之用途
JP2022513347A (ja) 高度にコンパクトな多入力論理ゲートをコードする核酸ベクターを使用して疾患を処置する方法
WO2023196880A2 (en) Human t-cell lymphotropic virus type 1 targeting proteins and methods of use
WO2024023530A1 (en) Functional nucleic acid molecule and method
CA3209126A1 (en) Small molecule-regulated cell signaling expression system
CA3164622A1 (en) Adeno-associated viral vector, compositions, methods of promoting muscle regeneration, and treatment methods
CN117062912A (zh) 用于基于crispr的转录抑制的融合蛋白
CN117580941A (zh) 多重CRISPR/Cas9介导的靶基因激活系统

Legal Events

Date Code Title Description
A201 Request for examination