KR20230091894A - 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 - Google Patents

부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 Download PDF

Info

Publication number
KR20230091894A
KR20230091894A KR1020237013187A KR20237013187A KR20230091894A KR 20230091894 A KR20230091894 A KR 20230091894A KR 1020237013187 A KR1020237013187 A KR 1020237013187A KR 20237013187 A KR20237013187 A KR 20237013187A KR 20230091894 A KR20230091894 A KR 20230091894A
Authority
KR
South Korea
Prior art keywords
dna
site
integration
cell
artificial sequence
Prior art date
Application number
KR1020237013187A
Other languages
English (en)
Inventor
오마르 아부다예
조나단 구텐베르크
Original Assignee
메사추세츠 인스티튜트 오브 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메사추세츠 인스티튜트 오브 테크놀로지 filed Critical 메사추세츠 인스티튜트 오브 테크놀로지
Publication of KR20230091894A publication Critical patent/KR20230091894A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

본 개시내용은 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법 및 조성물을 제공한다. PASTE는 표적 게놈으로 통합 부위의 첨가 후, 상기 부위에 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열의 삽입을 포함한다. PASTE는 유전자 편집 기술과 인테그라제 기술을 결합하여 질환의 치료 및 질환의 진단을 위한 게놈에서 유전자의 단방향 혼입을 달성한다.

Description

부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물
관련 출원에 대한 상호 참조
이 출원은 2021년 7월 16일에 출원된 미국 가특허 출원 제63/222,550호 및 2020년 10월 21일에 출원된 미국 가특허 출원 제63/094,803호의 이점을 주장한다. 상기 참조된 특허 출원의 전체 내용은 전체가 본원에 참조로 포함된다.
개시 분야
본원에 개시된 주제는 일반적으로 질환의 치료 및 진단을 위한 부위 특이적 표적화(targeting) 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물에 관한 것이다.
CRISPR-Cas(클러스터링된 규칙적인 간격의 짧은 회문(palindromic) 반복-CRISPR 관련 단백질) 면역의 RNA 유도 DNA 표적화 원리를 사용하는 게놈 편집이 널리 활용되어 왔으며, 매우 다양한 적용을 위한 강력한 게놈 편집 수단이 되었다. CRISPR-Cas 시스템의 주요 장점은 프로그램 가능한 DNA 간섭에 대한 최소한의 요구 사항: 맞춤형 이중 RNA 구조에 의해 유도된 Cas9, Cas12, 또는 임의의 프로그램 가능한 뉴클레아제와 같은 엔도뉴클레아제에 있다. Cas9는 표적 가닥을 절단하기 위해 HNH 뉴클레아제 도메인을 사용하는 다중도메인 효소이다. CRISPR/Cas9 단백질-RNA 복합체는 가이드 RNA(가이드 RNA)에 의해 표적에 국소화된 다음, 절단되어 DNA 이중 가닥 파단 (dsDNA 파단, DSB)을 생성한다. 절단 후, DNA 복구 메커니즘은 절단된 가닥을 복구하기 위해 활성화된다. 복구 메커니즘은 일반적으로 두 가지 유형: 비상동성 말단 결합(NHEJ) 또는 상동성 재조합(HR) 중 하나이다. 일반적으로, NHEJ는 복구를 지배하고, 오류가 발생하기 쉽고, 랜덤 indel(삽입 또는 결실)을 생성하여 특히 프레임 시프트 돌연변이를 유발한다. 대조적으로, HR은 보다 정밀한 복구 능력을 가지며 잠재적으로 정확한 치환 또는 삽입을 혼입할 수 있다. HR을 향상시키기 위해, 몇 가지 기술, 예를 들어, DSB에서 그들의 국소화를 시행하기 위해 Cas9 뉴클레아제의 융합 단백질과 상동성 지시된 복구(HDR) 이펙터의 조합, 중첩 상동성 암의 도입 또는 NHEJ의 억제가 시도되었다. 이러한 기술의 대부분은 숙주 DNA 복구 시스템에 의존한다.
최근에, 가이드 프라임 편집자(PE) PEI, PE2 및 PE3과 같은 새로운 가이드화 편집자가 개발되었다(참조: Liu, D. et al., Nature 2019, 576, 149-157). 이들 PE는 Cas 9H 840A 니카아제(Cas9n (H840A))와 융합되는 역전사 효소(RT)이고, 게놈 편집은 프라임 편집 가이드 RNA(pegRNA)를 사용하여 달성된다. 이러한 발전에도 불구하고, 프로그램 가능한 유전자 통합은 여전히 일반적으로 세포 경로 또는 복구 과정에 의존적이다.
따라서, 유전자 편집 및 전달을 위한 보다 효과적인 도구가 필요하다.
요약
본 개시내용은 핵산을 세포 게놈(cell genome)으로 부위 특이적으로 통합(site-specific integration)하는 방법을 제공한다. 상기 방법은 역전사 효소 도메인(reverse transcriptase domain)에 연결된 DNA 결합 뉴클레아제를 세포에 도입함으로써 세포 게놈의 목적하는 위치에 통합 부위를 혼입하는 단계를 포함하고, 여기서 DNA 결합 뉴클레아제는 니카아제 활성; 및 통합 서열에 연결된 프라이머 결합 서열을 포함하는 가이드 RNA(gRNA)를 포함하며, 여기서 gRNA는 DNA 결합 뉴클레아제와 상호작용하고 세포 게놈에서 목적하는 위치를 표적으로 하고, 여기서 DNA 결합 뉴클레아제는 세포 게놈의 가닥을 니킹(nicking)하고 역전사 효소 도메인은 gRNA의 통합 서열을 니킹된 부위에 혼입하여 세포 게놈의 목적하는 위치에 통합 부위를 제공한다. 상기 방법은 통합 부위에 상보적이거나 회합(associating)된 서열에 연결된 핵산을 포함하는 DNA 또는 RNA 가닥, 및 통합 효소를 세포로 도입함으로써 핵산을 세포 게놈에 통합하는 단계를 추가로 포함하고, 여기서 통합 효소는 통합 부위에 상보적이거나 회합된 서열의 통합, 재조합 또는 역 전사에 의해 통합 부위에서 핵산을 세포 게놈에 혼입하여 핵산을 세포의 세포 게놈의 목적하는 위치로 도입한다.
일부 구현예에서, gRNA는 DNA 결합 뉴클레아제에 의해 니킹된 게놈 가닥에 대한 세포 게놈의 상보적인 가닥에 혼성화될 수 있다.
일부 구현예에서, 통합 효소는 펩티드 또는 이를 암호화(encoding)하는 핵산으로서 도입될 수 있다.
일부 구현예에서, DNA 결합 뉴클레아제는 펩티드 또는 이를 암호화하는 핵산으로서 도입될 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA 또는 RNA 가닥은 미니서클(minicircle), 플라스미드, mRNA 또는 선형 DNA로서 세포 내로 도입될 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA 또는 RNA 가닥은 1000 bp 내지 10,000 bp일 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA 또는 RNA 가닥은 10,000 bp 초과일 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA 또는 RNA 가닥은 1000 bp 미만일 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA는 미니서클로서 세포 내로 도입될 수 있다.
일부 구현예에서, 미니서클은 박테리아 기원의 서열을 포함할 수 없다.
일부 구현예에서, DNA 결합 뉴클레아제는 역전사 효소 도메인에 연결될 수 있고, 통합 효소는 링커(linker)를 통해 연결될 수 있다. 링커는 절단 가능할 수 있다. 링커는 비절단 가능할 수 있다. 링커는 역전사 효소에 연결된 DNA 결합 뉴클레아제의 2개의 회합 결합 도메인으로 대체될 수 있다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1,
Figure pct00001
C31, RDF, FLP,
Figure pct00002
BT1, R1, R2, R3, R4, R5, TP901-1, A118,
Figure pct00003
FC1,
Figure pct00004
C1, MR11, TG1,
Figure pct00005
370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, 베네딕트, KSSJEB, 패티P, 둠(Doom), 스카울(Scowl), 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰(Sheen), 문드레아(Mundrea), BxZ2,
Figure pct00006
RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르(Himar) 1), 마리너(모스(mos) 1) 및 미노스에 의해 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 통합 효소는 Bxb1 또는 이의 돌연변이체일 수 있다.
일부 구현예에서, 통합 부위는 attB 부위, attP 부위, attL 부위, attR 부위, lox71 부위, Vox 부위, 또는 FRT 부위로부터 선택될 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A, 및 Cas12a/b 니카아제로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소 도메인은 몰로니 뮤린(Moloney Murine) 백혈병 바이러스(M-MLV) 역전사 효소 도메인, 전사 제노폴리머라제(RTX), 조류 골수모세포증 바이러스 역전사 효소(AMV-RT), 및 유박테리움 렉탈레 마투라제 RT(마라톤RT(MarathonRT))로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소 도메인은 야생형 서열에 대한 돌연변이를 포함할 수 있다.
일부 구현예에서, M-MLV 역전사 효소 도메인은 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함할 수 있다.
일부 구현예에서, 상기 방법은 제2 니킹 가이드 RNA(ngRNA)를 도입하는 단계를 추가로 포함할 수 있다. ngRNA는 상보적인 가닥 상에서 gRNA 닉의 하류 90 염기에서 니킹을 지시할 수 있다.
일부 구현예에서, gRNA, DNA 결합 뉴클레아제를 암호화하는 핵산, 역전사 효소, 상보적 통합 부위에 연결된 핵산을 포함하는 DNA, 통합 효소, 및 임의로 ngRNA는 단일 반응으로 세포 내로 도입될 수 있다.
일부 구현예에서, gRNA, DNA 결합 뉴클레아제를 암호화하는 핵산, 역전사 효소, 상보적 통합 부위에 연결된 핵산을 포함하는 DNA, 통합 효소, 및 임의로 ngRNA는 바이러스, RNP, mRNA, 지질, 또는 중합체성 나노 입자를 사용하여 도입될 수 있다.
일부 구현예에서, 핵산은 리포터 유전자(reporter gene)일 수 있다. 리포터 유전자는 형광 단백질일 수 있다.
일부 구현예에서, 세포는 분열 세포(dividing cell)일 수 있다.
일부 구현예에서, 세포는 비분열 세포일 수 있다.
일부 구현예에서, 세포 게놈에서 목적하는 위치는 돌연변이된 유전자의 유전자좌(locus)일 수 있다.
일부 구현예에서, 핵산은 소분자의 존재하에서 단백질의 프로그램 가능한 녹다운을 위한 분해 태그(degradation tag)일 수 있다.
일부 구현예에서, 세포는 포유류 세포, 박테리아 세포 또는 식물 세포일 수 있다.
일부 구현예에서, 핵산은 T-세포 또는 자연 살해(NK) 세포로의 통합을 위한 T-세포 수용체(TCR), 키메라 항원 수용체(CAR), 인터류킨, 사이토카인, 또는 면역 체크포인트 유전자(immune checkpoint gene)일 수 있다. TCR, CAR, 인터류킨, 사이토카인, 또는 면역 체크포인트 유전자는 미니서클 DNA를 사용하여 T-세포 또는 NK 세포 게놈의 표적 부위에 혼입될 수 있다.
일부 구현예에서, 핵산은 베타 헤모글로빈(HBB) 유전자일 수 있고, 세포는 조혈 줄기 세포(HSC)일 수 있다. HBB 유전자는 미니서클 DNA를 사용하여 HSC 게놈에서 표적 부위에 혼입될 수 있다. 핵산은 베타 지중해 빈혈(beta thalassemia) 또는 겸상 적혈구 빈혈(sickle cell anemia)을 담당하는 유전자일 수 있다.
일부 구현예에서, 핵산은 대사 유전자일 수 있다. 대사 유전자는 알파-1 항트립신 결핍 또는 오르니틴 트랜스카르바밀라제(OTC) 결핍에 관여할 수 있다. 대사 유전자는 유전된 질환에 관여하는 유전자일 수 있다.
일부 구현예에서, 핵산은 유전된 질환 또는 유전된 증후군에 관여하는 유전자일 수 있다. 유전된 질환은 낭포성 섬유증(cystic fibrosis), 가족성 고콜레스테롤혈증(familial hypercholesterolemia), 아데노신 데아미나제(ADA) 결핍, X-연결 SCID(X-SCID), 위스콧-알드리치 증후군(Wiskott-Aldrich syndrome; WAS), 혈색소 침착증(hemochromatosis), 테이-삭스병(Tay-Sachs), 취약 X 증후군(fragile X syndrome), 헌팅턴병(Huntington's disease), 마르판 증후군(Marfan syndrome), 페닐케톤뇨증(phenylketonuria), 또는 근위축증(muscular dystrophy)일 수 있다.
본 개시내용은 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터(vector)를 제공한다.
일부 구현예에서, 링커는 절단 가능할 수 있다.
일부 구현예에서, 링커는 비-절단 가능할 수 있다.
일부 구현예에서, 링커는 역전사 효소에 연결된 DNA 결합 뉴클레아제의 두 개의 회합 결합 도메인을 포함할 수 있다.
일부 구현예에서, 통합 효소는 조건부 활성화 도메인 또는 조건부 발현 도메인을 포함할 수 있다.
일부 구현예에서, 통합 효소는 에스트로겐 수용체에 융합될 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소는 M-MLV 역전사 효소, AMV-RT, 마라톤RT, 또는 RTX일 수 있다. 역전사 효소는 야생형 M-MLV 역전사 효소에 대해 변형된(modified) M-MLV 역전사 효소일 수 있다. M-MLV 역전사 효소 도메인은 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함할 수 있다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1,
Figure pct00007
C31, RDF, FLP,
Figure pct00008
BT1, R1, R2, R3, R4, R5, TP901-1, A118,
Figure pct00009
FC1,
Figure pct00010
C1, MR11, TG1,
Figure pct00011
370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
Figure pct00012
RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 재조합 효소 또는 인테그라제는 Bxb1 또는 이의 돌연변이체일 수 있다.
본 개시내용은 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터를 포함하는 세포를 제공한다. 세포는 프라이머 결합 서열, 통합 서열, 및 가이드 서열을 포함하는 gRNA를 추가로 포함하며, 여기서 gRNA는 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있다. 세포는 핵산 및 암호화된 인테그라제, 재조합 효소 또는 역전사 효소에 의해 인식된 서열을 포함하는 DNA 미니서클을 추가로 포함한다. 세포는 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합시킬 수 있는 니킹 가이드 RNA(ngRNA)를 추가로 포함하고, 여기서 ngRNA는 gRNA로부터 떨어진 서열을 표적으로 한다.
일부 구현예에서, 미니서클은 박테리아 기원의 서열을 포함할 수 없다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1,
Figure pct00013
C31, RDF, FLP,
Figure pct00014
BT1, R1, R2, R3, R4, R5, TP901-1, A118,
Figure pct00015
FC1,
Figure pct00016
C1, MR11, TG1,
Figure pct00017
370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
Figure pct00018
RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 통합 효소는 Bxb1 또는 이의 돌연변이체일 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소는 M-MLV 역전사 효소일 수 있다. 역전사 효소는 변형된 M-MLV 역전사 효소일 수 있다. M-MLV 역전사 효소의 아미노산 서열은 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함할 수 있다.
일부 구현예에서, 세포는 세포에 ngRNA를 도입하는 단계를 추가로 포함할 수 있다. ngRNA는 +90 ngRNA일 수 있다. +90 ngRNA는 상보적인 가닥 상에서 gRNA 닉의 하류 90 염기에서 니킹을 지시할 수 있다.
본 개시내용은 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 포함하는 폴리펩티드를 제공한다.
일부 구현예에서, 링커는 절단 가능할 수 있다.
일부 구현예에서, 링커는 비-절단 가능할 수 있다.
일부 구현예에서, 통합 효소는 에스트로겐 수용체에 융합될 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소는 M-MLV 역전사 효소, AMV-RT, 마라톤RT, 또는 XRT일 수 있다. 역전사 효소는 야생형 M-MLV 역전사 효소에 대한 변형된 M-MLV일 수 있다. M-MLV 역전사 효소 도메인은 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함할 수 있다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1,
Figure pct00019
C31, RDF, FLP,
Figure pct00020
BT1, R1, R2, R3, R4, R5, TP901-1, A118,
Figure pct00021
FC1,
Figure pct00022
C1, MR11, TG1,
Figure pct00023
370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
Figure pct00024
RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 통합 효소는 Bxb1 또는 이의 돌연변이체일 수 있다.
본 개시내용은 니카아제 활성을 포함하는 DNA 결합 뉴클레아제에 특이적으로 결합하는 gRNA를 제공하고, 상기 gRNA는 니킹된 DNA 가닥에 혼성화하는 프라이머 결합 부위, 통합 효소를 위한 인식 부위, 및 세포 게놈에서 표적 부위를 인식하고 DNA 결합 뉴클레아제에 의해 니킹된 가닥에 상보적인 게놈 가닥에 혼성화하는 표적 인식 서열을 포함한다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 프라이머 결합 부위는 니킹된 DNA 가닥의 3' 말단에 혼성화될 수 있다.
일부 구현예에서, 통합 효소를 위한 인식 부위는 attB 부위, attP 부위, attL 부위, attR 부위, lox71 부위 및 FRT 부위로부터 선택될 수 있다.
일부 구현예에서, 통합 효소를 위한 인식 부위는 Bxb1 부위일 수 있다.
본 개시내용은 2개 이상의 핵산을 세포 게놈에 부위 특이적으로 통합시키는 방법을 제공한다. 상기 방법은 역전사 효소 도메인에 연결된 DNA 결합 뉴클레아제를 세포에 도입함으로써 세포 게놈의 목적하는 위치에 두 개의 통합 부위를 혼입하는 단계를 포함하고, 여기서 DNA 결합 뉴클레아제는 니카아제 활성, 및 각각 고유한 통합 서열에 연결된 프라이머 결합 서열을 포함하는 2개의 가이드 RNA(gRNA)을 포함하고, 여기서 gRNA는 DNA 결합 뉴클레아제와 상호작용하고 세포 게놈에서 목적하는 위치를 표적화 하며, 여기서 DNA 결합 뉴클레아제는 세포 게놈의 가닥을 니킹하고, 역전사 효소 도메인은 니킹된 부위로 gRNA의 각 통합 서열을 혼입하여 세포 게놈의 목적하는 위치에 통합 부위를 제공한다. 상기 방법은 핵산을 포함하는 2개 이상의 DNA 또는 RNA를 세포에 도입함으로써 핵산을 통합하는 단계를 추가로 포함하고, 여기서 각 DNA는 직교 통합 부위(orthogonal integration site), 및 통합 효소에 의해 측면화되고, 통합 효소는 통합 부위에 상보적이거나 회합되는 서열의 인테그라제, 재조합 효소 또는 역전사 효소에 의해 통합 부위에서 세포 게놈에 핵산을 혼입하여 핵산을 세포의 세포 게놈의 목적하는 위치에 도입한다.
일부 구현예에서, 세포 게놈에 삽입된 두 개의 상이한 통합 부위 각각은 상이한 회문 또는 비회문 중심 디뉴클레오티드를 포함하는 attB 서열일 수 있다.
일부 구현예에서, 세포 게놈에 삽입된 두 개의 상이한 통합 부위 각각은 상이한 회문 또는 비회문 중심 디뉴클레오티드를 포함하는 attP 서열일 수 있다.
일부 구현예에서, 통합 효소는 핵산을 포함하는 두 개 이상의 DNA 또는 RNA 각각이 한 쌍의 직교 attB 부위 서열과 attP 부위 서열의 재조합을 통해 게놈 내로 핵산의 통합을 방향적으로 가능하게 하도록 할 수 있다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1,
Figure pct00025
C31, RDF, FLP,
Figure pct00026
BT1, TP901-1, A118,
Figure pct00027
FC1,
Figure pct00028
C1, MR11, TG1,
Figure pct00029
370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
Figure pct00030
RV, R1, R2, R3, R4, R5, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 통합 효소는 Bxb1 또는 이의 돌연변이체일 수 있다.
일부 구현예에서, 유전자를 포함하는 DNA는 세포 유지 경로, 세포-분열 또는 신호 전달 경로에 관여하는 유전자일 수 있다.
일부 구현예에서, 역전사 효소 도메인은 몰로니 뮤린 백혈병 바이러스(M-MLV) 역전사 효소 도메인, 전사 제노폴리머라제(RTX), 조류 골수모세포증 바이러스 역전사 효소(AMV-RT), 또는 유박테리움 렉탈레 마투라제 RT(마라톤RT)를 포함할 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, attB 부위 서열 및 attP 부위 서열의 쌍은 서열번호 5 및 서열번호 6, 서열번호 7 및 서열번호 8, 서열번호 9 및 서열번호 10, 서열번호 11 및 서열번호 12, 서열번호 13 및 서열번호 14, 서열번호 15 및 서열번호 16, 서열번호 17 및 서열번호 18, 서열번호 19 및 서열번호 20, 서열번호 21 및 서열번호 22, 서열번호 23 및 서열번호 24, 서열번호 25 및 서열번호 26, 서열번호 27 및 서열번호 28, 서열번호 29 및 서열번호 30, 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 34, 및 서열번호 35 및 서열번호 36으로 이루어진 그룹으로부터 선택될 수 있다.
본 개시내용은 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터를 포함하는 세포를 제공하고, 여기서 DNA 결합 뉴클레아제는 역전사 효소에 C-말단 연결되며, 여기서 역전사 효소는 링커를 통해 재조합 효소 또는 인테그라제에 연결된다. 세포는 프라이머 결합 서열, 통합 서열 및 가이드 서열을 포함하는 두 개의 가이드 RNA(gRNA)를 추가로 포함하고, 여기서 gRNA는 니카아제 활성을 포함하는 암호화된 DNA 결합 뉴클레아제와 상호작용할 수 있다. 세포는 핵산을 포함하는 두 개 이상의 DNA 또는 RNA 가닥 및 암호화된 인테그라제 또는 재조합 효소에 의해 인식된 측면에 있는(flanked) attB 부위 서열 및 attP 부위 서열의 쌍을 추가로 포함한다. 세포는 임의로 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합시킬 수 있는 니킹 가이드 RNA(ngRNA)를 추가로 포함하고, 여기서 ngRNA는 gRNA로부터 떨어진 서열을 표적으로 한다.
본 개시내용은 변형된 게놈을 포함하는 세포를 제공하며, 여기서 변형은 세포 내로 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되는, 벡터; 각각 프라이머 결합 서열, 게놈 통합 서열 및 가이드 서열을 포함하는 두 개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, 두 개의 가이드 RNA(gRNA); 및 임의로 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합시킬 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA)를 도입함으로써 세포 게놈 내에 두 개의 직교 통합 부위의 혼입을 포함한다.
본 개시내용은 두 개 이상의 핵산을 제90항의 세포의 세포 게놈에 통합하는 방법을 제공하고, 상기 방법은 세포에 각각 핵산과 한 쌍의 측면에 있는 직교 통합 부위 서열을 포함하는 둘 이상의 DNA; 핵산을 포함하는 둘 이상의 DNA의 방향적 연결을 가능하게 하는 통합 부위 서열을 인식할 수 있는 통합 효소; 및 제1 DNA의 5' 직교 통합 서열과 제1 게놈 통합 서열을, 마지막 DNA의 3' 직교 통합 서열과 마지막 게놈 통합 서열을 통합하여 둘 이상의 핵산을 세포 게놈에 혼입시킴으로써 세포 게놈에 핵산의 혼입을 가능하게 함을 도입하는 단계를 포함한다.
본 개시내용은 변형된 게놈을 포함하는 세포를 제공하고, 여기서 상기 변형은 세포에 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되는, 벡터; 각각 프라이머 결합 서열, 게놈 통합 서열 및 가이드 서열을 포함하는 두 개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, 두 개의 가이드 RNA(gRNA); 및 임의로 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합시킬 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA); 핵산을 포함하는 둘 이상의 DNA 또는 RNA로서, 각각의 DNA가 직교 통합 부위에 의해 측면에 있는 둘 이상의 DNA 또는 RNA; 및 통합 효소로서, 상기 통합 효소가 통합 부위에서 세포 게놈 내로 핵산을 혼입하는, 통합 효소를 도입함으로써 세포 게놈 내에 두 개의 직교 통합 부위의 혼입을 포함한다.
본원에 기재된 구현예의 측면, 특징, 이점 및 장점은 다음의 설명, 첨부된 청구범위 및 동반되는 다음 도면과 관련하여 명백할 것이다:
도 1은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)의 개념의 개략도를 도시하고;
도 2는 본 교시의 구현예에 따른 프라임 편집 과정을 개략도를 도시하고;
도 3은 본 교시의 구현예에 따른 다양한 플라스미드의 존재하에 HEK293FT 세포주 내의 렌티바이러스 통합 lox71 부위에서 녹색 형광 단백질(GFP)의 퍼센트 통합을 도시하고;
도 4는 본 교시의 구현예에 따른 다양한 길이의 lox71 또는 lox66의 통합을 위한 HEK293FT 게놈의 퍼센트 편집을 도시하고;
도 5a는 본 교시의 구현예에 따른 상이한 PE/Cre 벡터를 갖는 lox71 부위의 퍼센트 편집을 도시하고;
도 5b는 본 교시의 구현예에 따른 HEK293FT 세포 게놈 내의 lox71 부위에서 GFP의 퍼센트 통합을 도시하고;
도 6은 본 교시의 구현예에 따른 게놈에 핵산을 통합하기 위해 Bxb1을 사용하는 개략적인 표현을 도시하고;
도 7은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 Bxb1 프로그램 가능한 첨가(PASTE)를 사용하여 attB 유전자좌 내로의 GFP 또는 Gluc의 퍼센트 통합을 도시하고;
도 8은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 다양한 HEK3 표적화 pegRNA 프로그램 가능한 첨가(PASTE)의 퍼센트 편집을 도시하고;
도 9a는 SUPT16H 마커가 본 교시의 구현예에 따른 PASTE를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9b는 SRRM2 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9c는 LAMNB1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9d는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9e는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9f는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9g는 DEPDC4 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 10a는 본 교시의 구현예에 따른 PASTE를 사용하여 게놈 내의 ACTB N-말단 부위에서 Bxb1 attB 부위의 첨가를 위한 적색의 전기천공 보조 형질감염과 청색의 리포펙타민 보조 형질감염의 비교를 도시하고;
도 10b는 본 교시의 구현예에 따른 PASTE를 사용하여 게놈 내의 ACTB N-말단 부위에서 EGFP 통합을 위한 전기천공 보조 형질감염과 청색의 리포펙타민 보조 형질감염의 비교를 도시하고;
도 11은 본 교시의 구현예에 따른 다양한 HEK3 표적화 pegRNA와 EGFP 및 Gluc의 통합의 다이어그램을 도시하고;
도 12는 본 교시의 구현예에 따른 통합 효소로서
Figure pct00031
C31을 사용하는 개략도를 도시하고;
도 13은 본 교시의 구현예에 따라 외부 측면 attB 부위를 혼입한 고유한 가이드 RNA를 사용하여 다중 유전자좌에 관심 있는 다수의 유전자를 삽입하는 것을 포함하는 다중화의 개략도를 도시하고;
도 14a는 본 교시의 구현예에 따른 우측 GT-EGFP에 의한 직교 편집의 다이어그램을 도시하고;
도 14b는 본 교시의 구현예에 따른 우측 GA-mCherry에 의한 직교 편집의 다이어그램을 도시하고;
도 15a는 본 교시의 구현예에 따른 ACTB-EGFP 및 NOLC1-mCherry의 다중화의 형광 이미지를 도시하고;
도 15b는 본 교시의 구현예에 따른 ACTB-EGFP 및 LAMNB1-mCherry의 다중화의 형광 이미지를 도시하고;.
도 16a는 9X9 attP 및 attB 중심 디뉴클레오티드 변이체의 차세대 서열분석 결과 및 이들의 편집 백분율을 도시하고, 여기서 잠재적 다중화 적용을 위한 attB/attP 조합의 직교성은 본 교시의 구현예에 따라 도시되고;
도 16b는 본 교시의 구현예에 따른 9X9 attP 및 attB 중심 디뉴클레오티드 변이체의 히트맵 및 이들의 편집 백분율을 도시하고;
도 17은 본 교시의 구현예에 따른 HEK293FT 세포에서 알부민 가이드-pegRNA를 사용하는 세르피나 및 CPS1의 알부민 유전자좌로의 통합을 도시하고;
도 18은 본 교시의 구현예에 따른 T-세포를 조작하기 위한 상이한 핵산의 개략도를 도시하고;
도 19는 본 교시의 구현예에 따른 1차 T-세포 내의 ACTB 유전자좌에서 EGFP 통합을 위한 편집 효율을 도시하고;
도 20은 본 교시의 구현예에 따른 상이한 pegRNA를 갖는 HEK293FT의 TRAC 유전자좌에서의 편집을 도시하고;
도 21a는 본 교시의 구현예에 따른 니킹 가이드 1 및 2를 사용하여 ACTB 유전자좌에서의 attB 통합을 도시하고;
도 21b는 본 교시의 구현예에 따른 니킹 가이드 1 및 2를 사용하여 ACTB 유전자좌에서의 EGFP 통합을 도시하고;
도 21c는 본 교시의 구현예에 따른 ACTB 부위에서 EGFP 통합을 도시하고;
도 22a는 본 교시의 구현예에 따른 간 간세포 암종 세포주 HEPG2에서 PASTE 편집을 도시하고;
도 22b는 본 교시의 구현예에 따른 만성 골수성 백혈병 세포주 K562의 PASTE 편집을 도시하고;
도 23a는 본 교시의 구현예에 따른 표적화 및 비-표적화 가이드에 의한 attB 첨가를 도시하고;
도 23b는 본 교시의 구현예에 따른 표적화 및 비표적화 가이드와 EGFP 통합을 도시하고;
도 23c는 본 교시의 구현예에 따른 돌연변이화된 Bxb1에 대한 EGFP 통합을 도시하고;
도 24a는 본 교시의 구현예에 따른 pegRNA에 대한 설계 파라미터의 개략도를 도시하고;
도 24b는 본 교시의 구현예에 따른 니킹 가이드 RNA에 대한 설계 파라미터의 개략도를 도시하고;
도 25a는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 ACTD 유전자좌에서의 EGFP의 통합을 도시하고;
도 25b는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 LMNB1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25c는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 NOLC1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25d는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이 및 상이한 니킹 가이드를 갖는 GRSF1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25e는 본 교시의 구현예에 따른 돌연변이체 attP 부위와의 EGFP 통합을 도시하고;
도 25f는 본 교시의 구현예에 따른 유전자의 확장된 패널의 PASTE 편집을 도시하고;
도 26a는 본 교시의 구현예에 따른 ACTB 유전자좌에서의 PASTE EGPF 편집을 도시하고;
도 26b는 본 교시의 구현예에 따른 ACTB 유전자좌에서의 HITI EGPF 편집을 도시하고;
도 26c는 본 교시의 구현예에 따른 14개 유전자의 패널을 편집하는 PASTE와 HITI 사이의 비교를 도시하고;
도 26d는 본 교시의 구현예에 따른 PASTE Bxb1 표적외 통합을 도시하고;
도 26e는 본 교시의 구현예에 따른 PASTE Cas9 표적외 통합을 도시하고;
도 26f는 본 교시의 구현예에 따른 상이한 크기의 유전자 삽입물에 대한 EGFP 통합을 도시하고;
도 27a는 본 교시의 구현예에 따른 선택된 attB 및 attP 부위 세트 사이의 직교성을 도시하고;
도 27b는 본 교시의 구현예에 따른 선택된 attB 및 attP 부위 세트 사이의 직교성을 도시하고;
도 27c는 본 교시의 구현예에 따른 조작된 디뉴클레오티드 조합을 사용하는 직교 PASTE 편집을 위한 개략도를 도시하고;
도 28a는 본 교시의 구현예에 따른 PASTE에 의한 ACTB 및 SUPT16H 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28b는 본 교시의 구현예에 따른 PASTE에 의한 NOLC1 및 SRRM2 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28c는 본 교시의 구현예에 따른 PASTE에 의한 LMNB1 및 DEBDC4 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28d는 본 교시의 구현예에 따른 PASTE에 의한 3개의 내인성 부위에서 직교 유전자 통합을 도시하고;
도 28e는 본 교시의 구현예에 따른 PASTE를 통해 3개의 내인성 부위에서 1-플렉스, 2-플렉스, 및 3-플렉스 유전자 삽입을 통한 다중화된 삽입을 도시하고;
도 28f는 본 교시의 구현예에 따른 PASTE를 사용하는 ACTB (EGFP) 및 NOLC1 (mCherry)의 다중화된 유전자 태깅을 갖는 두 개의 단일 세포의 형광 이미지를 도시하고;
도 28g는 본 교시의 구현예에 따른 PASTE를 사용하는 ACTB (EGFP) 및 LMNB1 (mCherry)의 다중화된 유전자 태깅을 갖는 두 개의 단일 세포의 형광 이미지를 도시하고;
도 29a는 본 교시의 구현예에 따른 ACTB 유전자좌에서 Bxb1 attB 부위 삽입의 프라임 편집 효율을 도시하고;
도 29b는 본 교시의 구현예에 따른 ACTB 유전자좌에서 상이한 길이의 Bxb1 attB 부위를 삽입하는 데 있어서의 프라임 편집 효율을 도시하고;
도 29c는 상이한 인테그라제로부터 attB 서열을 삽입하는 프라임 편집 효율을 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29d는 Bxb1 인테그라제 및 Cre 재조합 효소로부터 attB 서열을 삽입하는 프라임 편집 효율을 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29e는 본 교시의 구현예에 따른 가이드 및 표적 서열을 나타내는 ACTB 유전자좌에 PASTE 삽입의 개략도를 도시한다. 도 29e는 출현 순서로 각각 서열번호 428-431을 개시하고;
도 29f는 ACTB 유전자좌의 5' 말단을 표적으로 하는 인테그라제의 패널과 GFP의 PASTE 통합 효율의 비교를 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29g는 본 교시의 구현예에 따른 Bxb1 인테그라제와 Cre 재조합 효소 사이의 GFP 카고 통합 효율의 비교를 도시하고;
도 29h는 본 교시의 구현예에 따른 상이한 프라임 및 인테그라제 성분에 대한 PASTE 편집 활성의 의존성을 도시하고;
도 29i는 본 교시의 구현예에 따른 인테그라제 효율에 대한 단일 벡터 PASTE 시스템(SpCas9-RT-P2A-Bxb1)의 적정을 도시하고;
도 29j는 본 교시의 구현예에 따른 내인성 ACTB 표적에서 PASTE 삽입 효율에 대한 카고 크기의 효과를 도시하고;
도 29k는 본 교시의 구현예에 따른 다수의 카고 크기에 대한 PASTE에 의한 완전한 삽입을 보여주는 겔 전기영동을 도시하고;
도 30a는 생성된 결과적인 attR 및 attL 부위 및 본 교시의 구현예에 따른 통합 접합부를 검정하기 위한 PCR 프라이머를 포함하는, PASTE 통합의 개략도를 도시하고;
도 30b는 ACTB 유전자좌에서 GFP의 PASTE 삽입으로부터 좌측 통합 접합부의 PCR 및 겔 전기영동 판독 값을 도시하고, 여기서 삽입은 프레임내 및 프레임외 GFP 통합 실험뿐만 아니라 비프라임 대조군에 대해 분석되고, PCR 단편의 예상 크기는 본 교시의 구현예에 따라 서브 패널 도 30a의 개략도에 도시된 프라이머를 사용하여 도시되고;
도 30c는 ACTB 유전자좌에서 GFP의 PASTE 삽입으로부터 우측 통합 접합부의 PCR 및 겔 전기영동 판독 값을 도시하고, 여기서 삽입은 프레임내 및 프레임외 GFP 통합 실험뿐만 아니라 비프라임 대조군에 대해 분석되고, PCR 단편의 예상 크기는 본 교시의 구현예에 따라 서브 패널 도 30a의 개략도에 도시된 프라이머를 사용하여 도시되고;
도 30d는 본 교시의 구현예에 따른 ACTB의 N-말단에 대한 PASTE를 통한 GFP의 프레임내 융합을 위한 우측 통합 접합부에 대해 제시된 생어 서열분석을 도시하고;
도 30e는 본 교시의 구현예에 따른 ACTB의 N-말단에 대한 PASTE를 통한 GFP의 프레임내 융합을 위한 좌측 통합 접합부에 대해 제시된 생어 서열분석을 도시하고;
도 31a는 약 1kb GFP 삽입물의 PASTE 통합에 영향을 미치는 다양한 파라미터의 개략도를 도시하고, 여기서 pegRNA 상에서, PBS, RT, 및 attB 길이는 attB 삽입의 효율을 변경할 수 있고, 니킹 가이드 선택은 또한 본 교시의 구현예에 따른 전체 유전자 통합 효율에 영향을 미치고;
도 31b는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합에 대한 PBS 및 RT 길이의 영향을 도시하고;
도 31c는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합에 대한 PBS 및 RT 길이의 영향을 도시하고;
도 31d는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31e는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31f는 본 교시의 구현예에 따른 NOLC1 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31g는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합 효율에 대한 최소한의 PBS, RT, 및 attB 길이의 영향을 도시하고;
도 31h는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합 효율에 대한 최소한의 PBS, RT, 및 attB 길이의 영향을 도시하고;
도 31i는 본 교시의 구현예에 따른 보다 긴 pegRNA 설계와 비교하여 니킹 가이드, 프라임, 및 Bxb1의 존재 및 부재하에 38 bp attB를 함유하는 최소 압축 pegRNA에 의한 LMNB1 유전자좌에서 GFP의 PASTE 통합을 도시하고;
도 32a는 본 교시의 구현예에 따른 두 개의 상이한 니킹 가이드 설계에 의한 ACTB 및 LMNB1 유전자좌에서 PASTE 삽입 효율을 도시하고;
도 32b는 표적 및 비표적화 스페이서 및 본 교시의 구현예에 따른 Bxb1 발현을 포함하거나 포함하지 않는 매칭된 pegRNA에 의한 ACTB 및 LMNB1에서 PASTE 편집 효율을 도시하고;
도 33a는 본 교시의 구현예에 따른 상이한 Bxb1 촉매 돌연변이체에 의한 ACTB 유전자좌에서 GFP의 PASTE 통합을 도시하고;
도 33b는 본 교시의 구현예에 따른 상이한 RT 촉매 돌연변이체에 의한 ACTB 유전자좌에서 GFP의 PASTE의 통합을 도시하고;
도 34a는 본 교시의 구현예에 따른 내인성 게놈 유전자좌의 패널에서 PASTE에 의한 GFP 통합을 도시하고;
도 34b는 본 교시의 구현예에 따른 PASTE를 통해 ACTB 유전자좌에서 상이한 유전자 카고의 패널의 통합을 도시하고;
도 34c는 본 교시의 구현예에 따른 ACTB 유전자좌에서 치료학적으로 관련된 유전자의 통합 효율을 도시하고;
도 34d는 본 교시의 구현예에 따른 ACTB 유전자좌와 SRRM2 유전자좌에서 프레임내 내인성 유전자 태깅에 의한 PASTE를 통한 GFP를 이용하는 내인성 단백질 태깅을 도시하고;
도 34e는 본 교시의 구현예에 따른 NOLC1 유전자좌 및 LMNB1 유전자좌에서 프레임내 내인성 유전자 태깅에 의한 PASTE를 통한 GFP를 이용하는 내인성 단백질 태깅을 도시하고;
도 35는 본 교시의 구현예에 따른 PASTE를 통한 LMNB1 유전자좌에서 상이한 유전자 카고의 패널의 통합을 도시하고;
도 36a는 본 교시의 구현예에 따른 ACTB 유전자좌에서 5kb GFP 주형을 사용하는 16개의 중심 디뉴클레오티드 attB/attP 서열 쌍 모두에 대한 PASTE 통합 효율을 도시하고;
도 36b는 풀링된 attB/attP 디뉴클레오티드 직교성 검정의 개략도를 도시하며, 여기서 각 attB 디뉴클레오티드 서열은 모든 16개의 디뉴클레오티드 서열 및 Bxb1 인테그라제의 바코딩된 풀로 공동-형질감염되고, 상대적 통합 효율은 바코드의 차세대 서열분석에 의해 결정되고, 모든 16개의 attB 디뉴클레오티드는 본 교시의 구현예에 따라 attP 풀에 의해 배열된 형태로 프로파일링되고;
도 36c는 본 교시의 구현예에 따른 풀링된 직교성 검정에 의해 결정된 모든 가능한 attB/attP 디뉴클레오티드 쌍에 대한 상대적 삽입 선호도를 도시하고;
도 36d는 본 교시의 구현예에 따른 ACTB 유전자좌에서 PASTE에 의한 GFP 통합에 대해 평가된 상위 4개의 attB/attP 디뉴클레오티드 쌍의 직교성을 도시하고;
도 37은 풀링된 리포터 검정에 의해 측정된 바와 같은 Bxb1 디뉴클레오티드의 직교성을 도시하고, 여기서 각 웹 로고 모티프는 본 교시의 구현예에 따른 나열된 디뉴클레오티드와 함께 표기된 attB 서열에서 풀에서의 상이한 attP 서열의 상대적 통합을 보여주고;
도 38a는 특정 게놈 유전자좌에서 상이한 카고 세트의 다중화 통합의 개략도를 도시하고, 여기서 3개의 형광 카고(GFP, mCherry, 및 YFP)는 본 교시의 구현예에 따른 프레임내 유전자 태깅을 위한 3개의 상이한 유전자좌(ACTB, LMNB1, NOLC1)에 직교로 삽입되며;
도 38b는 본 교시의 구현예에 따른 ACTB, LMNB1 및 NOLC1 유전자좌에서 형광단 조합의 다중화된 PASTE 삽입의 효율을 도시하고;
도 39a는 본 교시의 구현예에 따른 상동성-독립적 표적화 통합(HITI)에 의한 삽입율과 비교하여 PASTE에 의한 게놈 유전자좌의 패널에서의 GFP 통합 효율을 도시하고;
도 39b는 ACTB 및 LMNB1 표적 부위에서 PASTE와 HITI에 의한 의도하지 않은 indel 생성의 비교를 도시하고, 여기서 의도하지 않은 indel과 비교하여 관찰된 표적 상 EGFP 통합 비율은 본 교시의 구현예에 따라 제시되고;
도 39c는 동일한 표적에서 상동성-지시된 복구(HDR)와 비교하여 ACTB 유전자좌에서 PASTE에 의한 GFP 주형의 통합을 도시하고, 여기서 정량화는 단일 세포 클론 계수에 의한 것이며, 표적화 및 비표적화 가이드는 HDR 삽입용으로 사용되었고, 여기서 PASTE의 경우 표적화 및 비표적화는 본 교시의 구현예에 따라 각각 SpCas9-RT 단백질의 존재 또는 부재를 지칭하고;
도 39d는 ACTB 표적 부위에서 PASTE 및 HDR 기반 EGFP 삽입에 의한 의도하지 않은 indel 생성의 비교를 도시하고, 여기서 생성된 모든 단일-세포 클론에 걸쳐 측정된 평균 indel 비율은 본 교시의 구현예에 따라 제시되고;
도 39e는 본 교시의 구현예에 따른 Bxb1 및 Cas9 표적외 식별 및 검출 검정을 위한 개략도를 도시하고;
도 39f는 본 교시의 구현예에 따른 인간 게놈에서 예측된 Bxb1 표적외 부위에서 GFP 통합 활성을 도시하고;
도 39g는 본 교시의 구현예에 따라 예측된 PASTE ACTB Cas9 가이드 표적외 부위에서의 GFP 통합 활성을 도시하고;
도 39h는 본 교시의 구현예에 따른 예측된 HITI ACTB Cas9 가이드 표적외 부위에서의 GFP 통합 활성을 도시하고;
도 39i는 본 교시의 구현예에 따른 PASTE에 의한 게놈 전체 표적외 통합 부위를 검정하기 위한 차세대 서열분석 방법의 개략도를 도시하고;
도 39j는 게놈 전체 통합 검정을 사용하여 표적 상 ACTB 부위에서 판독치의 정렬을 도시하고, 여기서 예상되는 표적 상 통합 결과는 본 교시의 구현예에 따라 제시되고;
도 39k는 본 교시의 구현예에 따른 PASTE에 대한 3개의 단일 세포 클론 및 무프라임 상태에 대한 3개의 단일 세포 클론에 걸친 표적 상 및 표적외 통합 이벤트의 분석을 도시하고;
도 39l은 PASTE 편집에 의한 대표적인 단일 세포 클론에 대한 통합 이벤트의 맨해튼 플롯을 도시하고, 여기서 표적 상의 부위는 본 교시의 구현예에 따르는 염색체 7 상의 ACTB 유전자에 있고;
도 40a는 본 교시의 구현예에 따른 HepG2 세포 중의 ACTB 및 LMNB1 유전자좌에서 EGFP의 PASTE 및 HITI 매개 삽입에 의해 생성된 indel 비율의 비교를 도시하고;
도 40b는 본 교시의 구현예에 따른 합성 앰플리콘을 사용하여 예측된 Bxb1 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 40c는 본 교시의 구현예에 따른 합성 앰플리콘을 사용하여 예측된 PASTE ACTB Cas9 가이드 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 40d는 본 교시의 구현예에 따라 합성 앰플리콘을 사용하여 예측된 HITI ACTB Cas9 가이드 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 41a는 Bxb1 인테그라제, EGFP의 PASTE 표적화 ACTB 통합, 또는 본 교시의 구현예에 따른 Bxb1 발현 없이 EGFP 삽입을 위한 프라임 편집 표적화 ACTB를 발현하는 HEK293FT 세포에서 다수의 유의한 차등적으로 조절된 유전자를 도시하고;
도 41b는 서열분석된 mRNA 대 유의성(p-값)의 배수 발현 변화를 묘사하는 화산 플롯을 도시하고, 여기서 각각의 점은 고유한 mRNA 전사체를 나타내고, 유의한 전사체는 상향조절(적색) 또는 하향조절(청색)에 따라 음영처리되며, 여기서 배수 발현 변화는 본 교시의 구현예에 따라 ACTB-표적화 가이드-단독 발현(카고 포함)에 대해 측정되며;
도 41c는 Bxb1-단독 조건에 대한 상위 유의하게 상향조절 및 하향조절된 유전자를 도시하고, 여기서 유전자는 Bxb1 단독 발현, GFP-단독 발현, EGFP 삽입을 위한 PASTE 표적화 ACTB, Bxb1 없는 EGFP 발현을 위한 프라임 표적화 ACTB, 및 본 교시의 구현예에 따른 가이드/카고 단독을 위한 백만 개당 계수(cpm)의 상응하는 Z-점수로 도시되고;
도 42a는 세포 주기 억제의 존재하에 PASTE 성능을 개략도를 도시하고, 여기서 세포는 PASTE 또는 Cas9 유도 HDR에 의한 삽입을 위한 플라스미드로 형질감염되고, 아피디콜린으로 처리되어 세포 분열을 정지시키고, 여기서 PASTE 및 HDR의 효율은 본 교시의 구현예에 따라 각각 ddPCR 또는 앰플리콘 서열분석으로 판독되고;
도 42b는 본 교시의 구현예에 따른 앰플리콘 서열분석으로 판독된 세포 분열의 존재 또는 부재하에 두 개의 Cas9 가이드를 갖는 EMX1 유전자좌에서 HDR에 의한 단일 돌연변이의 편집 효율을 도시하고;
도 42c는 본 교시의 구현예에 따른 세포 분열의 존재 또는 부재하에 PASTE를갖는 ACTB 유전자좌에서 최대 13.3kb의 다양한 크기의 GFP 삽입물의 통합 효율을 도시하고;
도 42d는 본 교시의 구현예에 따른 K562 세포에서 두 벡터(PE2 및 Bxb1) 및 단일 벡터(PE2-P2A-Bxb1) 설계에 의한 PASTE 편집 효율을 도시하고;
도 42e는 본 교시의 구현예에 따른 1차 인간 T 세포에서 단일 벡터(PE2-P2A-Bxb1) 설계에 의한 PASTE 편집 효율을 도시하고;
도 42f는 본 교시의 구현예에 따른 ACTB 유전자좌에서 치료학적으로 관련된 유전자의 통합 효율을 도시하고;
도 42g는 PASTE 통합된 도입유전자에 대한 단백질 생산 검정의 개략도를 도시하고, 여기서 세르피나1 및 CPS1 도입유전자는 본 교시의 구현예에 따라 ddPCR 및 발광 모두로 판독하기 위해 HIV 루시페라제로 태깅되고;
도 42h는 본 교시의 구현예에 따른 ACTB 유전자좌에서 HEK293FT 세포에서 세르피나1 및 CPS1 도입유전자의 통합 효율을 도시하고;
도 42i는 본 교시의 구현예에 따른 ACTB 유전자좌에서 HEpG2 세포에서 세르피나1 및 CPS1 도입유전자의 통합 효율을 도시하고;
도 42j는 본 교시의 구현예에 따른 HepG2 세포에서 세르피나1-HIBIT 및 CPS1-HIBIT의 세포내 수준을 도시하고;
도 42k는 본 교시의 구현예에 따른 HepG2 세포에서 세르피나1-HIBIT 및 CPS1-HIBIT의 분비된 수준을 도시하고;
도 43a는 본 교시의 구현예에 따라 5μM 아피디콜린 처리에 의해 차단된 비분열 HEK293FT 세포에서 현저하게 감소된 EMX1 유전자좌의 HDR 매개 편집을 도시하고;
도 43b는 본 교시의 구현예에 따라 5μM 아피디콜린 처리에 의해 차단된 분열 및 비분열 HEK293FT 세포에서 ACTB 유전자좌에서의 PASTE-매개 삽입에 대한 삽입 미니서클 DNA 양의 효과를 도시하고;
도 43c는 본 교시의 구현예에 따른 통합 효율의 용량 의존성을 나타내는, AAV를 통해 전달된 GFP 주형에 의한 ACTB 유전자좌에서의 GFP의 PASTE 통합을 도시하고;
도 44a는 정상 PASTE SV40 NLS를 본 교시의 구현예에 따른 c-Myc NLS/가변 이분파 SV40 NLS 설계와 비교하는 3개의 내인성 유전자좌에서의 PASTE 통합 활성을 도시하고;
도 44b는 정상 PASTE SV40 NLS를 본 교시의 구현예에 따른 c-Myc NLS/가변 이분파 SV40 NLS 설계와 비교하는 상이한 GFP 미니서클 주형 양을 갖는 ACTB 유전자좌에서의 PASTE 통합 활성을 도시하고;
도 45는 본 교시의 구현예에 따른 푸로마이신 성장 선택 마커를 사용하는 PASTE 편집 활성의 개선을 도시하고;
도 46a는 본 교시의 구현예에 따른 단백질 발현 루시페라제 검정으로 측정된 바와 같이 HIBIT 태깅된 세르피나1 및 CPS1 유전자의 통합을 도시하고;
도 46b는 표준화된 HIBIT 래더로 정규화되어 본 교시의 구현예에 따른 단백질 수준의 정확한 정량화를 가능하게 하는 단백질 발현 루시페라제 검정으로 측정된 바와 같이 HIBIT 태깅된 세르피나1 및 CPS1 유전자의 통합을 도시하고;
도 47a는 본 교시의 구현예에 따라, ACTB 유전자좌에서의 EGFP 통합을 위한 링커의 패널 및 역전사 효소(RT) 변형을 갖는 PASTE 작제물의 최적화를 도시하고;
도 47b는 내인성 ACTB 표적에서 PASTE 삽입 효율에 대한 카고 크기의 효과를 도시한다. 카고는 본 교시의 구현예에 따라 고정된 몰량으로 형질감염되었고;
도 48a는 본 교시의 구현예에 따라, ACTB에서 상이한 길이 BxbINT AttB 부위의 삽입을 위한 프라임 편집 효율을 도시하고;
도 48b는 본 교시의 구현예에 따라, 표적화 및 비표적화 가이드와 함께 ACTB에서 BxbINT AttB 부위의 삽입을 위한 프라임 편집 효율을 도시하고;
도 48c는 ACTB에서 상이한 인테그라제(Bxb1, Tp9 및 Btl)의 AttB 부위의 삽입을 위한 프라임 편집 효율을 도시한다. 랜딩 부위의 양 방향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방형; R, 역방향);
도 48d는 본 교시의 구현예에 따라, 니킹 가이드를 포함하거나 포함하지 않는 ACTB에서 EGFP의 삽입을 위한 PASTE 편집 효율을 도시하고;
도 49a는 투여량 적정 및 단백질 최적화에 의한 PASTE 편집의 최적화를 도시한다. ACTB에서 EGFP의 PASTE 통합 효율은 성분의 상이한 투여량의 단일 벡터 전달로 측정된다.
도 49b. ACTB에서 EGFP의 PASTE 통합 효율은 EGFP 주형 벡터에 대한 성분의 상이한 비율의 단일 벡터 전달로 측정된다.
도 49c. 상이한 RT 도메인 융합을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49d. 상이한 RT 도메인 융합 및 링커를 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49e. 돌연변이체 RT 도메인을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49f. 돌연변이된 BxbINT 도메인을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 50a. AAV 형질도입을 통해 전달된 삽입 주형. PASTE 편집 기계는 형질감염을 통해 전달되었고, 주형은 표시된 수준에서 AAV 투약을 통해 공동 전달되었다.
도 50b. 3개의 바이러스 벡터를 갖는 완전한 PASTE 시스템의 AdV 전달의 개략도.
도 50c. HEK293FT 및 HepG2 세포에서 인테그라제, 가이드 및 카고의 AdV 전달의 통합 효율. BxbINT 및 가이드 RNA 또는 카고는 플라스미드 형질감염(Pl), AdV 형질도입(AdV)을 통해 전달되거나, 생략되었다(-). SpCas9-RT는 플라스미드로서만 전달되거나 생략되었다.
도 50d. HEK293FT 및 HepG2 세포에서 모든 PASTE 성분의 AdV 전달.
도 50e. PASTE 성분의 mRNA 및 합성 가이드 전달의 개략도.
도 50f. AdV 또는 플라스미드 카고와 쌍을 이루는, mRNA 및 합성 가이드에 의한 PASTE 시스템 성분의 전달.
도 50g. 합성 가이드 및 AdV 또는 플라스미드 카고에 의한 원형 mRNA의 전달.
도 50h. 1차 인간 T 세포에서 단일 벡터 설계에 의한 PASTE 편집 효율.
도 50i. 1차 인간 간세포에서 단일 벡터 설계에 의한 PASTE 편집 효율.
도 51a. attB 서열의 조합 삽입과 함께 LMNB1의 제1 엑손의 130bp 및 385bp 결실을 갖는 LMNB1 유전자좌에서의 PASTE 편집 효율.
도 51b. PASTE 시스템을 사용한 967 bp 카고의 조합 삽입과 함께 LMNB1의 제1 엑손의 130 bp 결실을 갖는 PASTE 편집 효율.
상세한 설명
명확성을 위해, 다음의 논의는 출원인 교시의 구현예의 다양한 측면을 기재할 것임을 이해할 것이다. 특정 구현예는 철저한 설명 또는 본원에서 논의되는 더 광범위한 측면에 대한 제한으로서 의도되지 않는다는 것을 주시해야 한다. 특정 구현예와 함께 기재된 한 측면은 반드시 그 구현예에 제한되는 것은 아니며, 임의의 다른 구현예(들)와 함께 실시될 수 있다. 본 명세서 전반에 걸쳐 "하나의 구현예", "한 구현예", "예시적 구현예"에 대한 참조는 구현예와 관련하여 기재된 특정 특징, 구조 또는 특성이 본 개시내용의 적어도 하나의 구현예에 포함된다는 것을 의미한다. 따라서, 본 명세서 전반에 걸쳐 여러 곳에서 "하나의 구현예에서", "한 구현예에서" 또는 "예시적 구현예"라는 문구의 출현은 반드시 모두 동일한 구현예를 언급하는 것은 아니지만, 그럴 수도 있다. 더욱이, 특별한 특징, 구조 또는 특성은 본 개시내용으로부터 당업자에게 명백할 수 있는 바와 같이, 하나 이상의 구현예에서 임의의 적절한 방식으로 조합될 수 있다.
일반적 정의
다르게 정의되지 않는 한, 본원에 사용된 기술 및 과학 용어는 본 개시내용이 속하는 기술분야의 숙련가에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 분자 생물학에서 일반적인 용어 및 기술의 정의는 문헌[참조: Molecular Cloning: A Laboratory Manual, 2nd edition (1989) (Sambrook, Fritsch, and Maniatis); Molecular Cloning: A Laboratory Manual, 4th edition (2012) (Green and Sambrook); Current Protocols in Molecular Biology (1987) (F.M. Ausubel et al. eds.); the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (1995) (M.J. MacPherson, B.D. Hames, and G.R. Taylor eds.): Antibodies, A Laboratory Manual (1988) (Harlow and Lane, eds.): Antibodies A Laboratory Manual, 2nd edition 2013 (E.A. Greenfield ed.); Animal Cell Culture (1987) (R.I. Freshney, ed.); Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223); Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829); Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710); Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994), March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons (New York, N.Y. 1992); and Marten H. Hofker and Jan van Deursen, Transgenic Mouse Methods and Protocols, 2nd edition (2011)]에서 찾을 수 있다.
본원에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥상 명백하게 달리 지시하지 않는 한 단수 및 복수의 지시대상을 모두 포함한다. 따라서, 예를 들어, "세포"에 대한 참조는 다수의 이러한 세포를 포함한다.
본원에 사용된 용어 "임의의" 또는 "임의로"는 후속적으로 기재된 이벤트, 상황 또는 치환기가 발생할 수 있거나 발생하지 않을 수 있고, 설명은 이벤트 또는 상황이 발생하는 경우와 그렇지 않은 경우를 포함함을 의미한다.
종점에 의한 수치 범위의 인용은 인용된 종점뿐만 아니라 각각의 범위 내에 포함된 모든 숫자 및 분수를 포함한다.
본원에 사용된 용어 "약" 또는 "대략"은 파라미터, 양, 시간적 지속 시간 등과 같은 측정 가능한 값을 지칭하고, 지정된 값의 및 값으로부터 변형, 예를 들어, 이러한 변형이 본 개시내용에서 수행하기에 적절한 한 지정된 값의 및 값으로부터의 +/- 10% 이하, +/- 5% 이하, +/- 1% 이하, +/- 0.5% 이하, 및 +/- 0.1% 이하의 변형을 포함하는 것을 의미한다. 수식어 "약" 또는 "대략"이 지칭하는 값은 그 자체로 또한 구체적으로 그리고 바람직하게 개시된 것으로 이해되어야 한다.
본원에 인용된 모든 간행물 및 참고문헌은 명백하게 그 전체가 참조로 본원에 포함된다는 점이 주시된다. 본원에서 논의된 간행물은 본 출원의 출원일 이전에 그들의 개시내용을 위해서만 제공된다. 본원의 어떠한 내용도 본 개시내용이 이러한 간행물을 앞서 발생할 자격이 없음을 인정하는 것으로 해석되어서는 안 된다. 또한, 제공된 공개 날짜는 독립적으로 확인될 필요가 있는 실제 공개 날짜와 상이할 수 있다.
개요
본원에 개시된 구현예는 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하는 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법 및 조성물을 제공한다. PASTE의 개념을 설명하는 개략도가 도 1에 도시되어 있다. 이하 더 상세히 논의된 바와 같이, PASTE는 표적 게놈 내로의 통합 부위의 첨가 후 상기 부위에 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열의 삽입을 포함한다. 이 과정은 세포에서 하나 이상의 반응으로 수행될 수 있다. 표적 게놈 내로 통합 부위의 첨가는, 예를 들어, 제한 없이, 프라임 편집, 재조합 아데노 관련 바이러스(rAAV)-매개 핵산 통합, 전사 활성제-유사 이펙터 뉴클레아제(TALENS), 및 아연 핑거 뉴클레아제(ZFN)를 포함하는 유전자 편집 기술을 사용하여 수행된다. 통합 부위에서 도입유전자의 통합은, 예를 들어, 제한 없이, 인테그라제, 재조합 효소 및 역전사 효소를 포함하는 인테그라제 기술을 사용하여 수행된다. 본원에 개시된 부위 특이적 유전 공학에 필요한 성분은 적어도 하나 이상의 뉴클레아제, 하나 이상의 gRNA, 하나 이상의 통합 효소, 및 통합 부위에 상보적이거나 회합되고 세포 게놈에 삽입되는 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열에 연결되는 하나 이상의 서열을 포함한다.
본원에 개시된 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물의 이점은 DNA 손상 반응에 의존하지 않고 큰 요소의 프로그램 가능한 삽입이다.
본원에 개시된 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물의 다른 이점은 다수의 부위에서 프로그램 가능한 삽입을 가능하게 하는 용이한 다중화이다.
본원에 개시된 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물의 다른 이점은 미니서클 주형을 통한 확장 가능한 생산 및 전달이다.
프라임 편집
본 개시내용은 표적 게놈 내로 통합 부위를 첨가하기 위해, 유전자 편집 기술, 예를 들어, 프라임 편집을 사용하는 부위특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물을 제공한다. 프라임 편집은 아래에서 더 상세히 논의될 것이다.
프라임 편집은 특정된 DNA 부위에 새로운 유전 정보를 직접 기입하는 다양하고 정밀한 게놈 편집 방법이다. 프라임 편집의 개념을 설명하는 개략적인 다이어그램은 도 2에 도시되어 있다. 문헌[참조: Anzalone, A.V., et al. "Search-and-replace genome editing without double-strand breaks or donor DNA," Nature 576, 149-157 (2019)]을 참조한다. 프라임 편집은 조작된 역전사 효소(RT)에 융합되고 프라임 편집 가이드 RNA(pegRNA)로 프로그래밍된 촉매적으로 손상된 Cas9 엔도뉴클레아제를 사용한다. 당업자는 pegRNA 모두가 표적 부위를 특정하고 목적하는 편집을 암호화한다는 것을 이해할 것이다. 촉매적으로 손상된 Cas9 엔도뉴클레아제는 또한 역전사 효소에 융합되는 Cas9 니카아제를 포함한다. 유전자 편집 동안, 단백질의 Cas9 니카아제 부분은 pegRNA에 의해 DNA 표적 부위로 유도된다. 이어서, 역전사 효소 도메인은 pegRNA를 사용하여 목적하는 편집의 역전사 효소를 주형화하여 DNA를 니킹된 표적 DNA 가닥에 직접 중합한다. 편집된 DNA 가닥은 원래의 DNA 가닥을 대체하여 하나의 편집된 가닥과 하나의 편집되지 않은 가닥을 함유하는 헤테로듀플렉스를 생성한다. 이후, 프라임 편집자(PE)는 편집을 편집되지 않은 가닥에 복사하는 것을 선호하도록 헤테로듀플렉스의 분해를 안내하여 과정을 완료한다.
프라임 편집자는 Cas9 H840A 니카아제에 융합되는 몰로니 뮤린 백혈병 바이러스(M-MLV) 역전사 효소(RT)를 지칭한다. Cas9 니카아제의 C-말단에 RT를 융합하면 더 높은 편집 효율을 초래할 수 있다. 이러한 복합체는 PE1이라고 한다. Cas9(H840A)는 또한 비-M-MLV 역전사 효소, 예를 들어, AMV-RT 또는 XRT(Cas9 (Cas9(H840A)-AMV-RT 또는 XRT)에 연결될 수 있다. 일부 구현예에서, Cas 9(H840A)는 Cas12a/b 또는 Cas9(D10A)로 대체될 수 있다. 최대 약 45배 더 높은 효율을 갖는, M-MLV RT(D200N/L603W/T330P/T306K/W313F)의 펜타돌연변이체에 융합되는 Cas9(야생형), Cas9(H840A), Cas9(D10A) 또는 Cas 12a/b 니카아제는 PE2라고 한다. 일부 구현예에서, M-MLV RT는 하나 이상의 돌연변이를 포함한다: Y8H, P51L, S56A, S67R, E69K, V129P, L139P, T197A, H204R, V223H, T246E, N249D, E286R, Q291I, E302K, E302R, F309N, M320L, P330E, L435G, L435R, N454K, D524A, D524G, D524N, E562Q, D583N, H594Q, E607K, D653N, 및 L671P. 일부 구현예에서, 역전사 효소는 또한 야생형 또는 변형된 전사 제노폴리머라제(RTX), 조류 골수모세포증 바이러스 역전사 효소(AMV-RT), 고양이 면역결핍 바이러스 역전사 효소(FIV-RT), FeLV-RT(고양이 백혈병 바이러스 역전사 효소), HIV-RT(인간 면역결핍 바이러스 역전사 효소), 또는 유박테리움 렉탈레 마투라제 RT(마라톤RT)일 수 있다. PE3은 비편집 가닥을 니킹하여 잠재적으로 세포가 편집된 가닥을 주형으로 사용하여 그 가닥을 다시 만들어 HR을 유도하도록 함을 포함한다. 비-편집된 가닥의 니킹은 니킹 가이드 RNA(ngRNA)의 사용을 포함할 수 있다.
비-편집된 가닥을 니킹하면 편집 효율을 증가시킬 수 있다. 예를 들어, 비편집된 가닥을 니킹하면 편집 효율을 약 1.1배, 약 1.3배, 약 1.5배, 약 1.7배, 약 1.9배, 약 2.1배, 약 2.3배, 약 2.5배, 약 2.7배, 약 2.9배, 약 3.1배, 약 3.3배, 약 3.5배, 약 3.7배, 약 3.9배, 4.1배, 약 4.3배, 약 4.5배, 약 4.7배, 약 4.9배, 또는 종점으로서 이들 값들 중 임의의 2개로부터 형성되는 임의의 범위로 증가시킬 수 있다.
최적의 니킹 위치는 게놈 부위에 따라 다르지만, pegRNA 유도 닉으로부터 약 40-90bp 편집의 3'에 위치된 닉은 일반적으로 과도한 indel 형성 없이 편집 효율을 증가시킬 수 있다. 프라임 편집 실행은 pegRNA 매개 닉으로부터 약 50 bp의 비편집 가닥 닉으로 시작하고, indel 주파수가 허용 가능한 수준을 초과하면 대안적인 닉 위치를 시험하도록 한다.
본원에 사용된 용어 "가이드 RNA"(gRNA) 등은 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열의 표적 게놈으로 삽입 또는 결실을 유도하는 RNA를 지칭한다. gRNA는 또한 프라임 편집 가이드 RNA(pegRNA), 니킹 가이드 RNA(ngRNA), 및 단일 가이드 RNA(sgRNA)를 지칭할 수 있다. 일부 구현예에서, 용어 "gRNA 분자"는 gRNA를 암호화하는 핵산을 지칭한다. 일부 구현예에서, gRNA 분자는 천연이다. 일부 구현예에서, gRNA 분자는 비-천연이다. 일부 구현예에서, gRNA 분자는 합성 gRNA 분자이다. gRNA는 게놈의 표적 핵산 또는 서열에 대해 Cas9, Cas 12a/b, Cas9(H840A) 또는 Cas9(D10A) 분자와 같은 뉴클레아제 또는 니카아제를 표적으로 할 수 있다. 일부 구현예에서, gRNA는 역전사 효소 도메인에 결합된 DNA 니카아제에 결합할 수 있다. 본원에 사용된 "변형된 gRNA"는 세포에 도입된 후 비-변형 gRNA 분자와 비교하여 세포에 도입된 후 개선된 반감기를 갖는 gRNA 분자를 지칭한다. 일부 구현예에서, 가이드 RNA는 인테그라제, 트랜스포사제, 또는 재조합 효소에 의한 인식을 위한 삽입 부위 서열의 첨가를 용이하게 할 수 있다.
본원에 사용된 용어 "프라임-편집 가이드 RNA"(pegRNA) 등은 프라이머 결합 부위(PBS)를 포함하는 확장된 단일 가이드 RNA(sgRNA), 역전사 효소(RT) 주형 서열, 및 재조합 효소, 인테그라제, 또는 트랜스포사제에 의해 인식될 수 있는 통합 부위 서열을 지칭한다. pegRNA에 대한 예시적인 설계 파라미터는 도 24a에 도시되어 있다. 예를 들어, PBS는 적어도 약 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt 또는 그 이상 nt의 길이를 가질 수 있다. 예를 들어, PBS는 약 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt, 또는 종점으로서 이들 값들 중 임의의 2개로부터 형성되는 임의의 범위의 길이를 가질 수 있다. 예를 들어, 5은 적어도 약 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt, 31nt, 32nt, 33nt, 34nt, 35nt, 36nt, 37nt, 38nt, 39nt, 40nt, 41nt, 42nt, 43nt, 44nt, 45nt, 46nt, 47nt, 48nt, 49nt, 50nt 또는 그 이상 nt의 길이를 가질 수 있다. 예를 들어, RT 주형 서열은 약 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt, 31nt, 32nt, 33nt, 34nt, 35nt, 36nt, 37nt, 38nt, 39nt, 40nt, 41nt, 42nt, 43nt, 44nt, 45nt, 46nt, 47nt, 48nt, 49nt, 50nt, 또는 종점으로서 이들 값들 중 임의의 2개로부터 형성되는 임의의 범위의 길이를 가질 수 있다.
게놈 편집 동안, 프라이머 결합 부위는 니킹된 DNA 가닥의 3' 말단이 pegRNA에 혼성화되도록 하는 한편, RT 주형은 편집된 유전 정보의 합성을 위한 주형의 역할을 한다. pegRNA는, 예를 들어, 제한 없이, (i) 편집될 표적 뉴클레오티드 서열을 식별하고, (ii) 표적화된 서열을 대체하는 새로운 유전 정보를 암호화할 수 있다. 일부 구현예에서, pegRNA는 (i) 편집될 표적 뉴클레오티드 서열을 식별하고 (ii) 표적화 서열을 대체하는 통합 부위를 암호화할 수 있다.
본원에 사용된 용어 "니킹 가이드 RNA"(ngRNA) 등은 편집된 가닥 및 비-편집된 가닥과 같은 가닥을 니킹할 수 있는 RNA 서열을 지칭한다. ngRNA에 대한 예시적인 설계 파라미터는 도 24b에 도시되어 있다. ngRNA는 gRNA 유도 닉의 부위로부터 약 1nt 이상 떨어진 곳에서 닉을 유도할 수 있다. 예를 들어, ngRNA는 gRNA 유도된 닉의 부위로부터 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120 또는 그 이상 nt 떨어진 곳에서 니킹할 수 있다. 일부 구현예에서, ngRNA는 가이드 서열 서열번호 74를 갖는 서열번호 75를 포함한다. 본원에 사용된 용어 "역전사 효소" 및 "역전사 효소 도메인"은 RNA 전사체를 상보적인 DNA로 역전시킬 수 있는 효소 또는 효소적 활성 도메인을 지칭한다. 역전사 효소 또는 역전사 효소 도메인은 RNA 의존성 DNA 중합 효소이다. 이러한 역전사 효소 도메인은 M-MLV 역전사 효소, 또는 변형된 역전사 효소, 예를 들어, 제한 없이, Superscript® 역전사 효소(Invitrogen; Carlsbad, Carlsbad), Superscript® VILO™ cDNA 합성(Invitrogen; Carlsbad, California), RTX, AMV-RT, 및 Quantiscript 역전사 효소(Qiagen, Hilden, Germany)를 포함하지만, 이에 제한되지 않는다.
본원에 개시된 pegRNA-PE 복합체는 게놈 내의 표적 부위를 인식하고, Cas9는, 예를 들어, 프로토스페이서 인접 모티프(PAM) 가닥을 니킹한다. pegRNA 내의 프라이머 결합 부위(PBS)는 PAM 가닥에 혼성화한다. 편집 서열을 함유하는 PBS에 작동 가능하게 연결된 RT 주형은 표적 부위 내로 DNA에 대한 RT 주형의 역전사를 지시한다. 편집된 3' 플랩 및 편집되지 않은 5' 플랩, 세포 5' 플랩 절단 및 결찰, 및 DNA 복구 사이의 평형은 안정적으로 편집된 DNA를 초래한다. 염기 편집을 최적화하기 위해, Cas9 니카아제를 사용하여 비-편집된 가닥을 니킹함으로써 편집된 가닥을 주형으로 사용하여 DNA 복구를 그 가닥에 지시할 수 있다.
인테그라제 기술
본 개시내용은 인테그라제 기술을 사용하는 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물을 제공한다. 인테그라제 기술은 아래에서 더 상세히 논의될 것이다.
본원에 사용된 인테그라제 기술은 프라임 편집 뉴클레아제와 같은 뉴클레아제를 통해 통합 부위에 관심 유전자 또는 관심 핵산 서열의 통합을 지시하는 단백질을 암호화하는 단백질 또는 핵산을 포함한다. 통합을 지시하는 단백질은 통합 효소와 같은 효소일 수 있다. 통합 효소는 통합에 의해 통합 부위에서 게놈 또는 관심 핵산을 세포 게놈에 혼입하는 인테그라제일 수 있다. 통합 효소는 재조합에 의해 통합 부위에서 세포 게놈 내로 게놈 또는 관심 핵산을 혼입하는 재조합 효소일 수 있다. 통합 효소는 역전사에 의해 통합 부위에서 게놈 또는 관심 핵산을 세포 게놈으로 혼입하는 역전사 효소일 수 있다. 통합 효소는 역전위에 의해 통합 부위에서 게놈 또는 관심 핵산을 세포 게놈에 혼입하는 레트로트랜스포사제일 수 있다.
본원에 사용된 용어 "통합 효소"는 세포의 게놈에서, 단일 반응 또는 다중 반응으로 관심 유전자 또는 관심 핵산 서열을 목적하는 위치에 또는 통합 부위에 통합하는데 사용되는 효소 또는 단백질을 지칭한다. 통합 효소의 예는, 예를 들어, 제한 없이, Cre, Dre, Vika, Bxb1,
Figure pct00032
C31, RDF, FLP,
Figure pct00033
BT1, R1, R2, R3, R4, R5, TP901-1, A118,
Figure pct00034
FC1,
Figure pct00035
C1, MR11, TG1,
Figure pct00036
370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, 베네딕트, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
Figure pct00037
RV, 및 R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제를 포함한다. 일부 구현예에서, 용어 "통합 효소"는 상기 언급된 효소를 암호화하는 핵산(DNA 또는 RNA)을 지칭한다. 일부 구현예에서, Cre 재조합 효소는 Cre 재조합 효소 발현 플라스미드(서열번호 71)로부터 발현된다.
포유류 발현 플라스미드는 하기 표 1에서 찾을 수 있다.
[표 1]
Figure pct00038
Figure pct00039
미니서클 카고 유전자 맵은 하기 표 2에서 찾을 수 있다.
Figure pct00040
Figure pct00041
일부 구현예에서,
Figure pct00042
C31 파아지의 세린 인테그라제
Figure pct00043
C31이 통합 효소로서 사용된다. pegRNA와 함께 인테그라제
Figure pct00044
C31은 의사 attP 통합 부위(서열번호 78)를 삽입하는데 사용될 수 있다. 관심 유전자 또는 핵산 및 attB(서열번호 3) 부위를 함유하는 DNA 미니서클은 관심 유전자 또는 핵산을 세포의 게놈으로 통합시키는데 사용될 수 있다. 이 통합은
Figure pct00045
C31 인테그라제를 갖는 발현 벡터의 공동 형질감염에 의해 보조될 수 있다.
본원에 사용된 용어 "인테그라제"는 야생형 인테그라제 및 임의의 다양한 돌연변이체 또는 변형된 인테그라제를 포함하는 박테리오파지 유래 인테그라제를 지칭한다. 본원에 사용된 용어 "인테그라제 복합체"는 인테그라제 및 통합 숙주 인자(IF)를 포함하는 복합체를 지칭할 수 있다. 본원에 사용된 용어 "인테그라제 복합체" 등은 또한 인테그라제, 통합 숙주 인자, 및 박테리오파지 X-유래 엑시시오나제(Xis)를 포함하는 복합체를 지칭할 수 있다.
본원에 사용된 용어 "재조합 효소" 등은 재조합 효소 인식 서열 사이의 DNA의 재조합을 매개하는 부위 특이적 효소를 지칭하며, 이는 재조합 효소 인식 서열 사이의 DNA 단편의 절제, 통합, 반전, 또는 교환(예: 전좌)을 초래한다. 재조합 효소는 두 개의 별개의 패밀리: 세린 재조합 효소(예: 레졸바제 및 인버타제) 및 티로신 재조합 효소(예: 인테그라제)로 분류될 수 있다. 세린 재조합 효소의 예는 제한 없이, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1,
Figure pct00046
C31, TP901, TG1,
Figure pct00047
BT1, R1, R2, R3, R4, R5,
Figure pct00048
RV1,
Figure pct00049
FC1, MR11, A118, U153 및 gp29를 포함한다. 세린 재조합 효소의 예는 또한, 제한 없이, 재조합 효소, 피치스, 베라크루즈, 레베우카, 테이아, 베네딕트, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, 및 미코박테리움 파지로부터의 BxZ2를 포함한다. 티로신 재조합 효소의 예는, 제한 없이, Cre, FLP, R, 람다, HK101, HK022, 및 pSAM2를 포함한다. 세린 및 티로신 재조합 효소 명칭은 재조합 효소가 DNA를 공격하는데 사용하고 가닥 교환 동안 DNA에 공유 결합되는 보존된 친핵성 아미노산 잔기로부터 유래한다.
재조합 효소는 유전자 녹아웃/녹-인의 생성 및 유전자 치료 적용을 포함하는 수많은 적용을 갖는다. 예를 들어, 문헌[Brown et al., "Serine recombinases as tools for genome engineering." Methods, 2011; 53(4):372-9; Hirano et al., "Site-specific recombinases as tools for heterologous gene integration." Appl. Microbiol. Biotechnol. 2011; 92(2):227-39; Chavez and Calos, "Therapeutic applications of the ΦC31 integrase system." Curr . Gene Ther . 2011; 11(5):375-81; Turan and Bode, "Site-specific recombinases: from tag-and-target- to tag-and-exchange-based genomic modifications." FASEB J. 2011; 25(12):4088-107; Venken and Bellen, "Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase." Methods Mol . Biol . 2012; 859:203-28; Murphy, "Phage recombinases and their applications." Adv . Virus Res. 2012; 83:367-414; Zhang et al., "Conditional gene manipulation: Creating a new biological era." J. Zhejiang Univ. Sci. B. 2012; 13(7):511-24; Karpenshif and Bernstein, "From yeast to mammals: recent advances in genetic control of homologous recombination." DNA Repair (Amst). 2012; 1; 11(10):781-8]을 참조하고, 각각의 전체 내용은 그 전체가 참조로 포함된다.
본원에 제공된 재조합 효소는 본 개시내용의 구현예에서 사용될 수 있는 재조합 효소의 배타적인 예인 것을 의미하지 않는다. 본 개시내용의 방법 및 조성물은 새로운 직교 재조합 효소에 대한 데이터베이스를 마이닝하거나 정의된 DNA 특이성을 갖는 합성 재조합 효소를 설계함으로써 확장될 수 있다(참조: 예를 들어, Groth et al., "Phage integrases: biology and applications." J . Mol . Biol . 2004; 335, 667-678; Gordley et al., "Synthesis of programmable integrases." Proc. Natl . Acad . Sci . USA. 2009; 106, 5053-5058; 각각의 전체 내용은 그 전체가 참고로 포함된다).
본원에 기재된 시스템, 방법, 및 조성물에 유용한 재조합 효소의 다른 예가 당업자에게 공지되어 있고, 발견되거나 생성되는 임의의 새로운 재조합 효소는 본 개시내용의 상이한 구현예에서 사용될 수 있을 것으로 예상된다.
본원에 사용된 용어 "레트로트랜스포사제" 등은 효소, 또는 하나 이상의 효소의 조합을 지칭하고, 여기서 적어도 하나의 효소는 역전사 효소 도메인을 갖는다. 레트로트랜스포사제는 이종 핵산의 긴 서열(예: 3000개 이상의 뉴클레오티드)을 게놈에 삽입할 수 있다. 레트로트랜스포사제의 예는, 예를 들어, 제한 없이, 요소, 예를 들어, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스에 의해 암호화된 레트로트랜스포사제 및 이들의 임의의 돌연변이체를 포함한다
일부 구현예에서, 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열은 상보적 또는 회합된 통합 부위에 연결된 핵산을 암호화하는 RNA 단편, 예를 들어, 레트로트랜스포존을 사용하여 게놈에서 목적하는 위치에 삽입된다. 레트로트랜스포존을 사용하여 게놈의 목적하는 위치에서의 위치에 관심 핵산의 삽입은 레트로트랜스포사제에 의해 보조된다.
본원에 개시된 관심 유전자 및 핵산 서열은 당업계에 공지된 임의의 유전자 및 핵산 서열일 수 있다. 관심 유전자 및 핵산 서열은 치료적 및/또는 진단적 사용을 위한 것일 수 있다. 관심 유전자의 예는, 제한 없이, GBA, BTK, ADA, CNGB3, CNGA3, ATF6, GNAT2, ABCA1, ABCA7, APOE, CETP, LIPC, MMP9, PLTP, VTN, ABCA4, MFSD8, TLR3, TLR4, ERCC6, HMCN1, HTRA1, MCDR4, MCDR5, ARMS2, C2, C3, CFB, CFH, JAG1, NOTCH2, CACNA1F, 세르피나1, TTR, GSN, B2M, APOA2, APOA1, OSMR, ELP4, PAX6, ARG, ASL, PITX2, FOXC1, BBS1, BBS10, BBS2, BBS9, MKKS, MKS1, BBS4, BBS7, TTC8, ARL6, BBS5, BBS12, TRIM32, CEP290, ADIPOR1, BBIP1, CEP19, IFT27, LZTFL1, DMD, BEST1, HBB, CYP4V2, AMACR, CYP7B1, HSD3B7, AKR1D1, OPN1SW, NR2F1, RLBP1, RGS9, RGS9BP, PROM1, PRPH2, GUCY2D, CACD, CHM, ALAD, ASS1, SLC25A13, OTC, ACADVL, ETFDH, TMEM67, CC2D2A, RPGRIP1L, KCNV2, CRX, GUCA1A, CERKL, CDHR1, PDE6C, TTLL5, RPGR, CEP78, C21orf2, C8ORF37, RPGRIP1, ADAM9, POC1B, PITPNM3, RAB28, CACNA2D4, AIPL1, UNC119, PDE6H, OPN1LW, RIMS1, CNNM4, IFT81, RAX2, RDH5, SEMA4A, CORD17, PDE6B, GRK1, SAG, RHO, CABP4, GNB3, SLC24A1, GNAT1, GRM6, TRPM1, LRIT3, TGFBI, TACSTD2, KRT12, OVOL2, CPS1, UGT1A1, UGT1A9, UGT1A8, UGT1A7, UGT1A6, UGT1A5, UGT1A4, CFTR, DLD, EFEMP1, ABCC2, ZNF408, LRP5, FZD4, TSPAN12, EVR3, APOB, SLC2A2, LOC106627981, GBA1, NR2E3, OAT, SLC40A1, F8, F9, UROD, CPOX, HFE, JH, LDLR, EPHX1, TJP2, BAAT, NBAS, LARS1, HAMP, HJV, RS1, ADAMTS18, LRAT, RPE65, LCA5, MERTK, GDF6, RD3, CCT2, CLUAP1, DTHD1, NMNAT1, SPATA7, IFT140, IMPDH1, OTX2, RDH12, TULP1, CRB1, MT-ND4, MT-ND1, MT-ND6, BCKDHA, BCKDHB, DBT, MMAB, ARSB, GUSB, NAGS, NPC1, NPC2, NDP, OPA1, OPA3, OPA4, OPA5, RTN4IP1, TMEM126A, OPA6, OPA8, ACO2, PAH, PRKCSH, SEC63, GAA, UROS, PPOX, HPX, HMOX1, HMBS, MIR223, CYP1B1, LTBP2, AGXT, ATP8B1, ABCB11, ABCB4, FECH, ALAS2, PRPF31, RP1, EYS, TOPORS, USH2A, CNGA1, C2ORF71, RP2, KLHL7, ORF1, RP6, RP24, RP34, ROM1, ADGRA3, AGBL5, AHR, ARHGEF18, CA4, CLCC1, DHDDS, EMC1, FAM161A, HGSNAT, HK1, IDH3B, KIAA1549, KIZ, MAK, NEUROD1, NRL, PDE6A, PDE6G, PRCD, PRPF3, PRPF4, PRPF6, PRPF8, RBP3, REEP6, SAMD11, SLC7A14, SNRNP200, SPP2, ZNF513, NEK2, NEK4, NXNL1, OFD1, RP1L1, RP22, RP29, RP32, RP63, RP9, RGR, POMGNT1, DHX38, ARL3, COL2A1, SLCO1B1, SLCO1B3, KCNJ13, TIMP3, ELOVL4, TFR2, FAH, HPD, MYO7A, CDH23, PCDH15, DFNB31, GPR98, USH1C, USH1G, CIB2, CLRN1, HARS, ABHD12, ADGRV1, ARSG, CEP250, IMPG1, IMPG2, VCAN, G6PC1, ATP7B 및 이들의 임의의 유도체를 포함한다.
본원에 사용된 용어 "레트로트랜스포존", "점핑 유전자", "점핑 핵산" 등은 역전사에 의존하는 세포 이동 가능한 유전 요소를 지칭한다. 레트로트랜스포존은 비복제 적격 세포 기원이며, 외래 핵산 서열을 운반할 수 있다. 레트로트랜스포존은 특정 고전적 특징, 예를 들어, 긴 말단 반복(LTR), 레트로바이러스 프라이머 결합 부위 등을 보유하는 레트로바이러스의 기생충으로서 작용할 수 있다. 그러나, 천연 레트로트랜스포존은 일반적으로 기능적 레트로바이러스 구조 유전자를 함유하지 않고, 이는 일반적으로 복제 적격 바이러스를 산출하기 위해 재결합할 수 있을 것이다. 일부 레트로트랜스포존은 소위 "이기적 DNA" 또는 유전 정보의 예이고, 이는 그 자체를 복제하는 능력을 제외하고 아무 것도 암호화하지 않는다. 레트로트랜스포존은 숙주 세포 내에 가끔 존재하는 레트로바이러스 또는 레트로트랜스포사제를 이용함으로써 그렇게 하여 바이러스 입자 내에서 자체 효율적으로 패키징하여 그것을 새로운 숙주 게놈으로 수송하고, 여기서 그것은 다시 RNA로서 발현된다. 그 RNA 내에서 암호화된 정보는 잠재적으로 점핑 유전자와 함께 운반된다. 레트로트랜스포존은 LTR 레트로트랜스포존 또는 비-LTR 레트로트랜스포존을 포함하는 DNA 트랜스포존 또는 레트로트랜스포존일 수 있다.
비-긴 말단 반복(LTR) 레트로트랜스포존은 진핵 게놈에서 널리 보급되는 이동성 유전 요소의 일종이다. 그들은 두 부류를 포함한다: 아퓨린/아피리미딘 엔도뉴클레아제(APE) 유형 및 제한 효소 유형 엔도뉴클레아제(RLE)-유형. APE 부류 레트로스포존은 두 가지 기능적 도메인으로 구성된다: 엔도뉴클레아제/DNA 결합 도메인, 및 역전사 효소 도메인. RLE 부류는 3개의 기능적 도메인으로 구성된다: DNA 결합 도메인, 역전사 도메인, 및 엔도뉴클레아제 도메인. 비-LTR 레트로트랜스포존의 역전사 효소 도메인은 RNA 서열 주형을 결합하고 그것을 숙주 게놈의 표적 DNA로 역전사함으로써 기능한다. RNA 서열 주형은 트랜스포스파제에 특이적으로 결합된 3' 비번역 영역, 및 일반적으로 트랜스포사제 단백질을 암호화하는 개방 판독 프레임(들)("ORF")을 갖는 가변 5' 영역을 갖는다. RNA 서열 주형은 또한, 레트로트랜스포사제에 특이적으로 결합하는 5' 비번역 영역을 포함할 수 있다. 일부 구현예에서, 비-LTR 트랜스포존은 LINE 레트로트랜스포존, 예를 들어, L1, 및 SINE 레트로트랜스포존, 예를 들어, Alu 서열을 포함할 수 있다. 다른 예는, 예를 들어, 제한 없이, R1, R2, R3, R4 및 R5 레트로-트랜스포존을 포함한다(참조: Moss, W. N. et al., RNA Biol. 2011, 8(5), 714-718; and Burke, W. D. et al., Molecular Biology and Evolution 2003, 20(8), 1260-1270). 트랜스포존은 자율적이거나 비-자율적일 수 있다.
레트로바이러스를 포함하는 LTR 레트로트랜스포존은 인간 게놈의 약 8% 및 마우스 게놈의 10%를 포함하는 전형적인 포유류 게놈의 상당한 부분을 차지한다(참조: Lander et al., 2001, Nature 409, 860-921; Waterson et al., 2002, Nature 420, 520-562). LTR 요소는 레트로트랜스포존, 내인성 레트로바이러스(ERV), 및 HERV 기원을 갖는 반복 요소, 예를 들어, SINE-R을 포함한다. LTR 레트로트랜스포존은 두 개의 효소: 인테그라제 및 레트로트랜스포사제를 암호화하는 영역 측면에 배치되는 두 개의 LTR 서열을 포함한다.
ERV는 고대 생식 세포 감염의 잔재인 인간 내인성 레트로바이러스(HEV)를 포함한다. 대부분의 HEV 프로바이러스가 광범위한 결실 및 돌연변이를 경험하였지만, 일부는 글리코실화된 env 단백질을 포함한 기능성 단백질을 코딩하는 ORFS를 유지했다. env 유전자는 LTR 요소가 세포와 개체 사이에서 확산될 가능성을 부여한다. 실제로, 3개의 개방 판독 프레임(pol, gag 및 env)은 모두 인간에서 식별되었으며, 증거는 ERV가 생식계열에서 활성임을 시사한다. 예를 들어, 문헌(Wang et al., 2010, Genome Res. 20, 19-27)을 참조한다. 또한, HERV-K(HML-2) 그룹을 포함한 몇몇 패밀리가 바이러스 입자를 형성하는 것으로 나타났고, 명백히 손상되지 않은 프로바이러스는 최근 인간 인구의 작은 부분에서 발견되었다. 예를 들어, 문헌(Bannert and Kurth, 2006, Proc. Natl. Acad. USA 101, 14572-14579)을 참조한다.
LTR 레트로트랜스포존은 DNA 트랜스포존에서 관찰된 DNA 절단 및 DNA 가닥 전달의 동일한 단계를 사용하여 게놈의 새로운 부위에 삽입된다. 그러나, DNA 트랜스포존과 대조적으로, LTR 레트로트랜스포존의 재조합은 RNA 중간체를 포함한다. LTR 레트로트랜스포존은 인간 게놈의 약 8%를 차지한다. 예를 들어, 문헌(Lander et al., 2001, Nature 409, 860-921; Hua-Van et al., 2011, Biol. Dir. 6, 19)을 참조한다.
통합 부위
본 개시내용은 표적 게놈에 통합 부위의 첨가를 통해 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물을 제공한다. 통합 부위는 아래에서 더 상세히 논의될 것이다.
본원에 사용된 용어 "통합 부위"는 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열이 삽입되는 표적 게놈 내의 부위를 지칭한다. 통합 부위의 예는, 예를 들어, 제한 없이, lox71 부위(서열번호 1), attB 부위(서열번호 3 및 서열번호 43), attP 부위(서열번호 4 및 서열번호 44), attL 부위(서열번호 67), attR 부위(서열번호 68), Vox 부위(서열번호 69), FRT 부위(서열번호 70) 또는 의사 attP 부위(서열번호 78)를 포함한다. 통합 부위는 뉴클레아제, gRNA, 및/또는 통합 효소를 사용하여 세포의 게놈 또는 이의 단편에 삽입될 수 있다. 통합 부위는 프라임 편집자, 예를 들어, 제한 없이, PE1, PE2 및 PE3을 사용하여 세포의 게놈에 삽입될 수 있고, 여기서 통합 부위는 pegRNA 상에 운반된다. pegRNA는 당업계에 공지된 임의의 부위를 표적으로 할 수 있다. pegRNA에 의해 표적화된 부위의 예는, 제한 없이, ACTB, SUPT16H, SRRM2, NOLC1, DEPDC4, NES, LMNB1, AAVS1 유전자좌, CC10, CFTR, 세르피나1, ABCA4, 및 이들의 임의의 유도체를 포함한다. 상보적 통합 부위는 외인성 DNA 또는 RNA에서 관심 유전자 또는 관심 핵산 서열에 작동 가능하게 연결될 수 있다. 일부 구현예에서, 하나의 통합 부위는 표적 게놈에 첨가된다. 일부 구현예에서, 하나 이상의 통합 부위가 표적 게놈에 첨가된다.
관심 있는 다수의 유전자 또는 핵산을 삽입하기 위해, 둘 이상의 통합 부위가 목적하는 위치에 첨가된다. 관심 있는 핵산 서열을 포함하는 다수의 DNA는 통합 서열, 예를 들어, 제한 없이, attB 및 attP에 직교로 측면화된다. 통합 부위는 재조합 효소의 인식 부위 또는 뉴클레오티드 서열을 유의하게 인식하지 못하는 경우, "직교"이다. 따라서, 재조합 효소의 하나의 attB 부위는 상이한 재조합 효소의 attB 부위에 직교할 수 있다. 또한, 재조합 효소의 한 쌍의 attB 및 attP 부위는 동일한 재조합 효소에 의해 인식된 다른 한 쌍의 attB 및 attP 부위에 직교할 수 있다. 한 쌍의 재조합 효소는 서로의 attB 또는 attP 부위 서열의 인식이 있을 때, 본원에 정의된 바와 같이 서로 직교하는 것으로 간주된다.
동일한 재조합 효소 또는 상이한 재조합 효소에 의한 통합 부위 또는 부위의 쌍의 인식 부족은 약 30% 미만일 수 있다. 일부 구현예에서, 동일한 재조합 효소 또는 상이한 재조합 효소에 의한 통합 부위 또는 부위의 쌍의 인식 부족은 약 30% 미만, 약 28% 미만, 약 26% 미만, 약 24% 미만, 약 22% 미만, 약 20% 미만, 약 18% 미만, 약 16% 미만, 약 14% 미만, 약 12% 미만, 약 10% 미만, 약 8% 미만, 약 6% 미만, 약 4% 미만, 약 2% 미만, 약 1%, 또는 종점으로서 이들 값 중 임의의 두 개로부터 형성되는 임의의 범위일 수 있다. 크로스토크는 약 30% 미만일 수 있다. 일부 구현예에서, 크로스토크는 약 30% 미만, 약 28% 미만, 약 26% 미만, 약 24% 미만, 약 22% 미만, 약 20% 미만, 약 18% 미만, 약 16% 미만, 약 14% 미만, 약 12% 미만, 약 10% 미만, 약 8% 미만, 약 6% 미만, 약 4% 미만, 약 2% 미만, 약 1% 미만, 또는 종점으로서 이들 값 중 임의의 2개로부터 형성되는 임의의 범위이다.
일부 구현예에서, attB 및/또는 attP 부위 서열은 중심 디뉴클레오티드 서열을 포함한다. 예를 들어, 중심 디뉴클레오티드는 GT로부터 GA로 변경될 수 있고, attB/attP 부위를 함유하는 GA만이 상호작용하고 서열을 함유하는 GT와 교차 반응하지 않을 것으로 나타났다. 일부 구현예에서, 중심 디뉴클레오티드는 AG, AC, TG, TC, CA, CT, GA, AA, TT, CC, GG, AT, TA, GC, CG 및 GT로 이루어진 그룹으로부터 선택된다.
본원에 사용된 용어 "attB 및 attP 부위 서열의 쌍" 등은 동일한 중심 디뉴클레오티드를 공유하고 재결합할 수 있는 attB 및 attP 부위 서열을 지칭한다. 이는 하나의 세린 인테그라제의 존재하에, 이들 직교 att 부위의 최대 6쌍이 재결합할 수 있음을 의미한다(attPTT는 attBTT와 특이적으로 재결합하고, attPTC는 attBTC와 특이적으로 재결합하고, 등등이다).
일부 구현예에서, 중심 디뉴클레오티드는 비회문성이다. 일부 구현예에서, 중심 디뉴클레오티드는 회문성이다. 일부 구현예에서, 한 쌍의 attB 부위 서열 및 attP 부위 서열은 둘 이상의 상이한 핵산의 방향적 통합을 유도하기 위한 관심 유전자 또는 관심 핵산 서열을 암호화하는 상이한 DNA에 사용된다.
하기 표 3은 상이한 중심 디뉴클레오티드(CD)를 갖는 attB 부위 서열 및 attP 부위 서열의 쌍의 예를 나타낸다.
[표 3]
Figure pct00050
PASTE
본 개시내용은 PASTE를 사용하는 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물을 제공한다. PASTE는 아래에서 더 상세히 논의될 것이다.
본원에 개시된 부위 특이적 유전 공학은 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열을 세포의 게놈에 삽입하기 위한 것이다. 일부 구현예에서, 관심 유전자는 유전 질환, 예를 들어, 제한 없이, 대사 질환, 낭포성 섬유증, 근이영양증, 혈색소 침착증, 테이삭스병, 헌팅톤병, 선천성 난청(Congenital Deafness), 겸상 적혈구 빈혈증, 가족성 고콜레스테롤혈증, 아데노신 데아미나제(ADA) 결핍, X-연결 SCID(X-SCID), 및 위스콧-알드리치 증후군(WAS)에 연루된 돌연변이된 유전자이다. 일부 구현예에서, 관심 유전자 또는 관심 핵산 서열은, 예를 들어, 제한 없이, 유전자의 발현을 결정하기 위한 유전자 분석을 위한 유전자의 상류 또는 하류의 리포터 유전자일 수 있다. 일부 구현예에서, 리포터 유전자는GFP 주형(서열번호 76) 또는 가우시아 루시페라제(G-루시페라제) 주형(서열번호 77)이다. 일부 구현예에서, 관심 유전자 또는 관심 핵산 서열은 식물에서 가뭄 내성, 날씨 강건성, 및 증가된 수율 및 제초제 내성을 향상시키기 위해 유전자를 삽입하기 위해 식물 유전학에 사용될 수 있다. 일부 구현예에서, 관심 유전자 또는 관심 핵산 서열은 관절염(arthritis), 건선(psoriasis), 낭창(lupus), 체강 질환(coeliac disease), 사구체신염(glomerulonephritis), 간염(hepatitis), 및 염증성 장 질환(inflammatory bowel disease)을 포함하지만, 이에 제한되지 않는 면역 질환의 치료를 위한 세포에 단백질(예: 리소좀 효소), 혈액 인자(예: 인자 I, II, V, VII, X, XI, XII 또는 XIII), 막 단백질, 엑손, 세포내 단백질(예: 세포질 단백질, 핵 단백질, 세포 기관 단백질, 예를 들어, 미토콘드리아 단백질 또는 리소좀 단백질), 세포외 단백질, 구조 단백질, 신호전달 단백질, 조절 단백질, 수송 단백질, 감각 단백질, 운동 단백질, 방어 단백질, 또는 저장 단백질, 항염증성 신호전달 분자의 부위 특이적 삽입을 위해 사용될 수 있다.
삽입된 유전자 또는 핵산의 크기는 약 1 bp 내지 약 50,000 bp로 다양할 수 있다. 일부 구현예에서, 삽입된 유전자 또는 핵산의 크기는 약 1 bp, 10 bp, 50 bp, 100 bp, 150 bp, 200 bp, 250 bp, 300 bp, 350 bp, 400 bp, 600 bp, 800 bp, 1000 bp, 1200 bp, 1400 bp, 1600 bp, 1800 bp, 2000 bp, 2200 bp, 2400 bp, 2600 bp, 2800 bp, 3000 bp, 3200 bp, 3400 bp, 3600 bp, 3800 bp, 4000 bp, 4200 bp, 4400 bp, 4600 bp, 4800 bp, 5000 bp, 5200 bp, 5400 bp, 5600 bp, 5800 bp, 6000 bp, 6200,6400 bp, 6600 bp, 6800 bp, 7000 bp, 7200 bp, 7400 bp, 7600 bp, 7800 bp, 8000 bp, 8200 bp, 8400 bp, 8600 bp, 8800 bp, 9000 bp, 9200 bp, 9400 bp, 9600 bp, 9800 bp, 10,000 bp, 10,200 bp, 10,400 bp, 10,600 bp, 10,800 bp, 11,000 bp, 11,200 bp, 11,400 bp, 11,600 bp, 11,800 bp, 12,000 bp, 14,000 bp, 16,000 bp, 18,000 bp, 20,000 bp, 30,000 bp, 40,000 bp, 50,000 bp, 또는 종점으로서 이들 값 중 임의의 2개로부터 형성되는 임의의 범위일 수 있다.
일부 구현예에서, 본원에 개시된 관심 유전자 또는 관심 핵산 서열을 사용하는 부위 특이적 공학은 종양 표적화 또는 동종 생성을 위한 T 세포 및 NK의 공학을 위한 것이다. 이들은 종양 특이성을 위한 수용체 또는 CAR, 항-PDl 항체, 사이토카인 유사 IFN-감마, TNF-알파, IL-15, IL-12, IL-18, IL-21, 및 IL-10, 및 면역 탈출 유전자의 사용을 포함할 수 있다.
본 개시내용에서, 관심 유전자 또는 관심 핵산의 부위 특이적 삽입은 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 통해 수행된다. PASTE를 사용하여 관심 유전자 또는 관심 핵산을 삽입하기 위한 성분은, 예를 들어, 제한 없이, 뉴클레아제, 통합 부위를 첨가하는 gRNA, 통합 부위에 상보적이거나 회합된 서열에 연결된 유전자 또는 핵산을 포함하는 DNA 또는 RNA 가닥, 및 통합 효소이다. PASTE를 사용하여 관심 유전자 또는 관심 핵산을 삽입하기 위한 성분은, 예를 들어, 제한 없이, 프라임 편집자 발현, 통합 부위를 첨가하는 pegRNA, 니킹 가이드 RNA, 통합 효소(Cre 또는 세린 재조합 효소), 유전자 및 통합 신호와 함께 관심 유전자 또는 관심 핵산 서열을 포함하는 유전자 도입 벡터이다. 뉴클레아제 및 프라임 편집자는 통합 부위를 게놈에 통합시킨다. 통합 효소는 관심 유전자를 통합 부위에 통합시킨다. 일부 구현예에서, 유전자 및 통합 신호와 함께 관심 유전자 또는 핵산 서열을 포함하는 유전자 도입 벡터는 박테리아 DNA 서열이 없는 DNA 미니서클이다. 일부 구현예에서, 유전자 도입 벡터는 진핵생물 또는 원핵생물 벡터이다.
본원에 사용된 용어 "벡터" 또는 "유전자 도입 벡터"는 숙주 유기체에서 작동 가능하게 연결된 코딩 서열의 발현에 필요한 목적하는 코딩 서열 및 적절한 핵산 서열을 함유하는 재조합 DNA 분자를 지칭한다. 원핵생물에서 발현에 필요한 핵산 서열은 일반적으로, 예를 들어, 제한 없이, 프로모터, 작동자(임의의), 리보솜 결합 부위, 및/또는 다른 서열을 포함한다. 진핵생물 세포는 일반적으로 프로모터(구성적, 유도성 또는 조직 특이적), 인핸서 및 종결 및 폴리아데닐화 신호를 활용하는 것으로 공지되어 있지만, 일부 요소는 결실될 수 있고, 필요한 발현을 희생시키지 않고 다른 요소가 첨가될 수 있다. 유전자 도입 벡터는 링커를 통해 서로 연결된 PE와 통합 효소를 암호화할 수 있다. 링커는 절단 가능한 링커일 수 있다. 예를 들어, 링커를 통해 서로 연결된 PE와 통합 효소를 암호화하는 유전자 도입 벡터는 서열번호 73을 포함하는 pCMV PE2 P2A Cre이다. 일부 구현예에서, 링커는 절단 가능하지 않은 링커일 수 있다. 일부 구현예에서, 뉴클레아제, 프라임 편집자 및/또는 통합 효소는 상이한 벡터에서 암호화될 수 있다.
본 개시내용의 구현예에 따른 단일 부위에 관심 있는 다수의 유전자 또는 핵산 서열을 삽입하는 방법이 도 12에 도시되어 있다. 일부 구현예에서, 다중화는 도 13에 도시된 바와 같은 고유한 pegRNA를 사용하여 다수의 유전자좌에 관심 있는 다중 유전자를 삽입하는 것을 포함한다(참조: Merrick, C. A. et al., ACS Synth. Biol. 2018, 7, 299-310). 본원에서 "다중화"로서 지칭되는, 관심 있는 다중 유전자 또는 관심 있는 핵산의 세포 게놈으로의 삽입은 제1 핵산을 포함하는 DNA 또는 RNA의 5' 말단에 상보적 5' 통합 부위 및 마지막 핵산을 포함하는 DNA 또는 RNA의 3' 말단에 3' 통합 부위의 혼입에 의해 촉진된다. 일부 구현예에서, 다중화를 사용하여 세포 게놈에 삽입되는 관심 게놈 또는 관심 아미노산 서열의 수는 약 1, 2, 3, 4, 5, 6, 7, 8, 9 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 또는 종점으로서 이들 값 중 임의의 두 개로부터 형성되는 임의의 범위일 수 있다.
일부 구현예에서, 다중화는, 예를 들어, 신호전달 캐스케이드, 그의 보조인자와 함께 관심 단백질의 과발현, 신생물 조건에서 돌연변이된 다중 유전자의 삽입, 또는 암의 치료를 위한 다중 CAR의 삽입을 가능하게 한다.
일부 구현예에서, 통합 부위는 비프라임 편집 방법, 예를 들어, rAAV 매개 핵산 통합, TALENS 및 ZFN을 사용하여 게놈에 삽입될 수 있다. 다수의 고유한 특성은 AAV를 인간 유전자 치료를 위한 유망한 벡터로 만든다(참조: Muzyczka, CURRENT TOPICS IN MICROBIOLOGY AND IMMUNOLOGY, 158:97-129 (1992)). 다른 바이러스 벡터와 달리, AAV는 임의의 공지된 인간 질환과 관련되는 것으로 나타나지 않았고, 일반적으로 병원성으로 간주되지 않는다. 야생형 AAV는 부위 특이적 방식으로 숙주 염색체로 통합할 수 있다(참조: M. Kotin et al., PROC. NATL. ACAD. SCI, USA, 87:2211-2215 (1990); R.J. Samulski, EMBO 10(12):3941-3950 (1991)). 이중 가닥 DNA 파괴를 생성하는 대신, AAV는 DNA 변형을 달성하기 위해 내인성 상동 재조합을 자극한다. 또한, 게놈 편집하고 표적화 DSB를 도입하기 위한 전사 활성제-유사 이펙터 뉴클레아제(TALEN) 및 아연-핑거 뉴클레아제(ZFN). TALEN의 특이성은 반복 단위의 위치 12 및 13에 위치된 소위 반복 가변 디잔기(RVD)인 두 개의 다형성 아미노산으로부터 발생한다. TALENS는 FokI 뉴클레아제에 연결되고, 이는 목적하는 위치에서 DNA를 절단한다. ZFN은 맞춤형 부위 특이적 게놈 편집을 위한 인공 제한 효소이다. 아연 핑거 자체는 전사 인자이며, 여기서 각 핑거는 3-4개 염기를 인식한다. 이러한 핑거 모듈을 혼합하고 매칭함으로써, 연구자들은 어느 서열을 표적화할지 맞춤화할 수 있다.
본원에 사용된 바와 같이, 숙주 게놈의 변형을 위한 플라스미드, 핵산 또는 단백질의 세포, 조직 또는 기관으로의 "투여", "도입" 또는 "전달"이라는 용어는 생체내, 시험관내 또는 생체외에서 발생할 수 있는 이러한 투여, 도입 또는 전달을 위한 수송을 지칭한다. 유전자 변형을 위한 플라스미드, DNA, 또는 RNA는 전형적으로 화학적 수단(예: 인산칼슘 형질감염, 폴리에틸렌이민(PEI) 또는 리포펙션), 물리적 수단(전기천공 또는 미세주입), 감염(이는 전형적으로 감염성 제제, 예를 들어, 바이러스(예: AAV Rep 유전자를 발현하는 바쿨로바이러스)의 도입을 의미한다), 형질 도입(미생물학에서, 이는 바이러스에 의한 세포의 안정한 감염, 또는 바이러스 인자(예: 박테리오파지)에 의해 하나의 미생물로부터 다른 미생물로 유전 물질의 전달)에 의해 달성되는 형질감염에 의해 세포에 도입될 수 있다. 재조합 폴리펩티드, 단백질 또는 올리고뉴클레오티드의 발현을 위한 벡터는 세포, 조직, 기관 또는 대상체에서 물리적 수단(예: 인산칼슘 형질감염, 전기천공, 미세주입, 또는 리포펙션)에 의해 수득될 수 있다. 벡터는 담체에 시험관내, 생체외 또는 생체내 전달을 위한 약제학적으로 허용되는 담체로 벡터를 제조함으로써 전달될 수 있다.
본원에 사용된 용어 "형질감염"은 세포에 의한 외인성 핵산 분자의 흡수를 지칭한다. 외인성 핵산이 세포 막에 도입된 경우 세포는 "형질감염된다". 형질감염은 단일 형질감염, 공동 형질감염 또는 다중 형질감염일 수 있다. 수많은 형질감염 기술은 일반적으로 당업계에 공지되어 있다. 예를 들어, 문헌(Graham et al. (1973) Virology, 52: 456)을 참조한다. 이러한 기술은 하나 이상의 외인성 핵산 분자를 적합한 숙주 세포에 도입하는데 사용될 수 있다.
일부 구현예에서, 유전자 편집을 위한 외인성 핵산 분자 및/또는 다른 성분은 단일 형질감염으로 조합되고 전달된다. 다른 구현예에서, 유전자 편집을 위한 외인성 핵산 분자 및/또는 다른 성분은 단일 형질감염으로 조합되고 전달되지 않는다. 일부 구현예에서, 유전자 편집을 위한 외인성 핵산 분자 및/또는 다른 성분은 단일 형질감염으로 조합되고 전달되어, 예를 들어, 제한 없이, 프라임 편집 벡터, 랜딩 부위, 예를 들어, pegRNA를 함유하는 랜딩 부위, 니킹 가이드, 예를 들어, 프라임 편집을 자극하기 위한 니킹 가이드, 발현 벡터, 예를 들어, 상응하는 인테그라제 또는 재조합 효소를 위한 발현 벡터, 미니서클 DNA 카고, 예를 들어, 녹색 형광 단백질(GFP)을 암호화하는 미니서클 DNA 카고, 이들의 임의의 유도체, 및 이들의 임의의 조합을 포함한다. 일부 구현예에서, 관심 유전자 또는 관심 아미노산 서열은 리포좀을 사용하여 도입될 수 있다. 일부 구현예에서, 관심 유전자 또는 관심 아미노산 서열은 적합한 벡터, 예를 들어, 제한 없이, 플라스미드 및 바이러스 벡터를 사용하여 전달될 수 있다. 바이러스 벡터의 예는, 제한 없이, 아데노 관련 바이러스(AAV), 렌티바이러스, 아데노바이러스, 다른 바이러스 벡터, 이들의 유도체, 또는 이들의 조합을 포함한다. 단백질 및 하나 이상의 가이드 RNA는 하나 이상의 벡터, 예를 들어, 플라스미드 또는 바이러스 벡터로 패키징될 수 있다. 일부 구현예에서, 전달은 나노 입자 또는 엑소좀을 통해서이다. 예를 들어, 엑소좀은 RNA 전달에 특히 유용할 수 있다.
일부 구현예에서, 프라임 편집은 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%의 효율로 랜딩 부위를 삽입한다. 일부 구현예에서, 프라임 편집은 약 1%, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 약 50%, 또는 종점으로서 이들 값 중 임의의 두 개로부터 형성되는 임의의 범위의 효율로 랜딩 부위(들)를 삽입한다.
서열
효소, 가이드, 통합 부위 및 플라스미드의 서열은 하기 표 4에서 찾을 수 있다.
[표 4]
Figure pct00051
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
Figure pct00065
Figure pct00066
Figure pct00067
Figure pct00068
Figure pct00069
Figure pct00070
Figure pct00071
Figure pct00072
Figure pct00073
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
Figure pct00078
Figure pct00079
Figure pct00080
Figure pct00081
Figure pct00082
Figure pct00083
Figure pct00084
Figure pct00085
Figure pct00086
Figure pct00087
삽입 부위의 서열은 이하 표 4에서 찾을 수 있다.
Figure pct00088
Figure pct00089
Figure pct00090
Figure pct00091
Figure pct00092
Figure pct00093
Figure pct00094
Figure pct00095
Bxb1 및 RT 돌연변이체의 서열은 하기 표 6에서 찾을 수 있다.
Figure pct00096
Figure pct00097
ddPCR 판독에 사용되는 프라이머, 프로브 및 제한 효소의 서열은 하기 표 7에서 찾을 수 있다.
[표 7]
Figure pct00098
Figure pct00099
Figure pct00100
Figure pct00101
Figure pct00102
Figure pct00103
Figure pct00104
Figure pct00105
Figure pct00106
NGS 판독에 사용되는 프라이머의 서열은 하기 표 8에서 찾을 수 있다.
Figure pct00107
Figure pct00108
Figure pct00109
표적외 부위의 서열은 하기 표 9에서 찾을 수 있다.
Figure pct00110
하기 표 10의 링커 서열.
Figure pct00111
하기 표 11의 예시적인 융합 서열.
Figure pct00112
Figure pct00113
Figure pct00114
Figure pct00115
Figure pct00116
Figure pct00117
실시예
몇몇 실험예가 고려되지만, 이들 실시예는 비제한적인 것으로 의도된다.
실시예 1
CRE 통합 효율
CRE 통합 효율을 시험하였다. lox71/lox66/Cre 재조합 효소 시스템을 사용하여 GFP로 PASTE의 효능을 시험하기 위해, 렌티바이러스를 사용하여 게놈에 통합된 lox71 서열(서열번호 1)을 갖는 클로날 HEK293FT 세포주를 개발하였다. GFP의 통합은 (1) Cre 재조합 효소 발현 플라스미드를 포함하는 플러스/마이너스 서열번호 71 및 (2) GFP 주형 및 서열번호 2의 lox 66 Cre 부위를 포함하는 서열번호 72에 의한 변형된 HEK293FT 세포주의 형질감염에 의해 시험되었다. 72시간 후에, GFP의 lox71 부위로의 퍼센트 통합을 프로빙하였다. 도 3은 다양한 플라스미드의 존재하에서 HEK293FT 세포주에서 렌티바이러스 통합 lox71 부위에서 GFP의 퍼센트 통합을 도시한다. 절단 가능한 링커 또는 절단 가능하지 않은 링커를 통해 PE2에 연결된 프라임 편집 복합체와 Cre 재조합 효소를 갖는 포유류 발현 벡터인 pCMV PE2 P2A Cre(서열번호 73)이 GFP의 통합을 나타내는 것으로 관찰되었다.
실시예 2
Cre 재조합 효소에 의한 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)-Lox 부위의 첨가
lox71(서열번호 1) 또는 lox66(서열번호 2) 서열을 프라임 편집을 사용하여 HEK293FT 세포 게놈에 삽입하여 HEK293FT 게놈으로의 GFP의 통합을 시험하였다. lox71 또는 lox66 서열을 HEK293FT 세포 게놈에 삽입하기 위해, 다양한 길이의 RT 영역에 작동 가능하게 연결된 13개 염기 쌍의 PBS 길이를 갖는 pegRNA를 사용하였다. 하기 플라스미드를 HEK293FT 세포의 형질감염에 사용하였다. 세포를 (1) 프라임 편집 작제물(PE2) 또는 조건부 Cre 발현을 갖는 PE2, (2) HEK3 유전자좌를 표적으로 하는 Lox71 또는 Lox66 pegRNA 및 (3) HEK3 유전자좌를 표적으로 하는 플러스/마이너스 +90 HEK3 니킹 제2 가이드 RNA(+90 ngRNA)로 형질감염시켰다. 72시간 후, HEK3 유전자좌에서 HEK293FT 게놈의 % 편집은 lox71 또는 lox66의 다양한 길이의 통합을 위해 프로빙하였다(도 4 참조). +90 ngRNA(서열번호 75)를 갖는 34개의 염기 쌍 lox71(HEK3 유전자좌 가이드, 서열번호 83; 및 RT 34와 PBS 13을 갖는 Lox71 pegRNA, 서열번호 81) 및 +90 ngRNA(서열번호 75)를 갖는 34개의 염기 쌍 lox66(HEK3 유전자좌 가이드, 서열번호 83; 및 RT 34와 PBS 13을 갖는 Lox66 pegRNA, 서열번호 82)이 가장 높은 % 편집을 갖는 것으로 관찰되었다.
실시예 3
Cre 재조합 효소에 의한 PASTE - 유전자의 통합
13개의 염기 쌍의 PBS 길이 및 34개의 염기 쌍의 삽입 길이를 갖는 lox71 또는 lox66 pegRNA를 사용하여 HEK293F 게놈에서 GFP의 통합을 프로빙하였다. PE와 Cre는 유도성 발현 벡터에서 전달되었고, 2일째에 유도되었다. HEK293FT 세포를 다음 플라스미드로 형질감염시켰다: (1) 프라임 편집 작제물(PE2 또는 조건부 Cre 발현을 갖는 PE2); (2) Lox71 pegRNA; (3) 플러스/마이너스 +90 HEK3 니킹 가이드 RNA; 및 (4) Lox66 부위를 갖는 EGFP 주형. 72시간 후, lox71 부위의 퍼센트 편집 및 GFP의 퍼센트 통합은 다양한 PE/Cre 작제물의 존재하에 lox66 부위를 사용하거나 하지 않고 프로빙하였다. 도 5a는 상이한 PE/Cre 벡터로 lox71 부위의 퍼센트 편집을 요약한다. 도 5b는 HEK293FT 세포 게놈의 lox71 부위에서 GFP의 퍼센트 통합을 요약한다. lox71 부위가 유도성 또는 비-유도성 PE/Cre 발현 시스템의 존재하에 편집되었지만, GFP 통합은 없는 것으로 관찰되었다.
실시예 4
Bxb1 통합 데이터 렌티 리포터
통합 시스템은 표적 유전자가 더 높은 효율로 게놈에 통합될 수 있는 인테그라제 시스템으로 전환되었다. 세린 인테그라제 Bxb1은 Cre 재조합 효소보다 더 활성이고, 표적 유전자의 비가역적 통합을 위해 박테리아 및 포유류 세포에서 매우 효율적인 것으로 나타났다. 도 6은 Bxb1을 사용하는 PASTE 방법론의 개략도를 도시한다(참조: Merrick, C. A. et al., ACS Synth . Biol . 2018, 7, 299-310).
Bxb1 통합 시스템의 효율을 프로빙하기 위해, 렌티바이러스를 사용하여 통합된 attB Bxb1 부위(서열번호 3)를 갖는 클로날 HEK293FT 세포주를 개발하였다. 이어서, 변형된 HEK293FT 세포주를 다음 플라스미드로 옮겼다: (1) 플러스/마이너스 Bxb1 발현 플라스미드 및 (2) attP Bxb1 부위를 갖는 플러스/마이너스 GFP(서열번호 76) 또는 G-Luc(서열번호 77) 미니서클 주형. 72시간 후, HEK293FT 게놈의 attB 부위에 GFP 또는 Gluc의 통합을 프로빙하였다. attB 유전자좌로 GFP 또는 Gluc의 퍼센트 통합은 도 7에 도시되어 있다. GFP 및 Gluc이 HEK293FT 세포에서 attB 부위로의 효율적인 통합을 나타내는 것으로 관찰되었다.
실시예 5
PRIME를 사용하여 인간 게놈에 Bxb1 부위의 첨가
최상의 효율로 HEK293FT 세포주에 통합될 수 있는 attB의 최대 길이를 프로빙하였다. 프라임 편집을 위해 attB(서열번호 3) 또는 그의 역 보체 attP(서열번호 4)의 최상의 길이를 프로빙하기 위해, 다양한 RT 상동성 길이를 갖는 13nt의 PBS 길이를 갖는 pegRNA를 사용하였다. 하기 플라스미드를 HEK293FT에서 형질감염시켰다: (1) 프라임 발현 플라스미드; (2) HEK3 표적화 pegRNA 설계; 및 (3) HEK3 +90 니킹 가이드. 72시간 후, 각각의 attB 작제물의 퍼센트 통합을 프로빙하였다. 도 8은 각각의 HEK3 표적화 pegRNA에서의 % 편집을 도시한다. 44개, 34개 및 26개의 염기쌍을 갖는 attB 및 34개 및 26개의 염기 쌍을 갖는 attB 역 보체가 가장 높은 % 편집을 나타냈음이 관찰되었다.
그런 다음, 통합 PASTE를 HEK29FT 세포에서 GFP로 세포-소기관 마커 단백질을 태깅하면서 시험하였다. PASTE를 사용하여 상이한 세포 배양 웰에서 GFP로 SUPT16H, SRRM2, LAMNB1, NOLC1 및 DEPDC4를 태깅하고 현미경법을 사용하여 세포 내에서 단백질 국소화를 추적하는 데 있어서 PASTE의 유용성을 시험하였다. 도 9a 내지 9g는 각 소기관에 대한 형광 현미경법 결과를 도시한다. SUPT16H-GFP가 핵에서 농축되는 것으로 관찰되었고, SRRM2-GFP는 핵 반점에서 농축되는 것으로 관찰되었으며, LAMNB1-GFP는 핵막에서 농축되는 것으로 관찰되었고, NOLC1-GFP는 원섬유 중심에서 농축되는 것으로 관찰되었고, DEPDC4-GFP는 아그레솜에서 농축되는 것으로 관찰되었다.
플라스미드의 형질감염은 도 10a-10b에 도시된 바와 같이 전기천공을 사용하여 달성될 수 있다.
실시예 6
PASTE에 의한 유전자의 프로그래밍 가능한 통합
PASTE에 의한 Gluc 또는 EGFP의 유전자 통합 효율을 시험하였다. PASTE에 의한 유전자 통합을 가능하게 하기 위해, 다음 HEK3 표적화 pegRNA를 사용하였다: (1) 44 pegRNA: 13nt의 PBS 및 44nt의 RT 상동성; (2) 34 pegRNA: 13nt의 PBS 및 34nt의 RT 상동성; 및 (3) 26 pegRNA: 13nt의 PBS 및 26nt의 RT 상동성.
HEK293 세포주를 다음 플라스미드 HEK293FT로 형질감염시켰다: (1) 프라임 발현 플라스미드; (2) Bxb1 발현 플라스미드; (3) HEK3 표적화 pegRNA 설계; (4) HEK3 +90 니킹 가이드; 및 (5) EGFP 또는 Gluc 미니서클. 72시간 후, Gluc 또는 EGFP의 퍼센트 통합이 관찰되었다. 도 11은 각각의 시험된 HEK3 표적화 pegRNA와 EGFP 및 Gluc의 통합을 도시한다. EGFP 및 Gluc는 PASTE를 사용하여 효율적으로 통합되었음이 관찰되었다.
실시예 7
다중 유전자 통합을 위한 PASTE
다중 유전자를 세포에 부위 특이적 통합하기 위한 PASTE 기술은 직교 attB 및 attP 부위의 사용으로 촉진된다. 중심 디뉴클레오티드는 GT로부터 GA로 변경될 수 있고, attB/attP 부위를 함유하는 GA만dl 상호작용할 수 있고 GT 함유 서열과 교차 반응하지 않는다. 다중화된 PASTE 편집을 위한 직교 attB/attP 쌍을 찾기 위한 디뉴클레오티드 조합의 스크린이 수행될 수 있다. 많은 직교 디뉴클레오티드 조합이 Bxb1 리포터 시스템을 사용하여 발견될 수 있음을 보여주었다.
이를 시험하기 위해, Bxb1을 위한 attBGT 및 attBGA 디뉴클레오티드를 프라임 편집에 의해 ACTB 부위에 첨가했다. EGFP-attPGT DNA 미니서클 및 mCherry-attPGA DNA 미니서클을 도입하여 Bxb1의 존재 또는 부재하에 퍼센트 EGFP 및 mCherry 편집을 시험하였다. EGFP 및 mCherry 편집의 결과를 도 14a-14b에 나타내었다.
우측 GT-EGFP 및 GA-mCherry 쌍과의 직교 편집이 달성되어 세포에서 다중화된 PASTE 편집 능력을 입증하였다.
다중화된 PASTE를 사용하여 동일한 세포에 두 개의 유전자를 도입하여 단일 반응에서 두 개의 상이한 유전자를 태깅하였다. EGFP 및 mCherry는 단일 반응에서 x 세포주에서 ACTB 및 NOLC1의 유전자좌로 태깅하였다. 또한, EGFP 및 mCherry를 ACTB 및 LAMNB1의 유전자좌로 태깅하였다. 세포를 형광 현미경법을 사용하여 시각화하였다. 도 15a-15b는 다중화된 PASTE에 대한 형광 현미경법의 결과를 나타낸다.
attB 및 attP의 9x9 교차에서 9개의 상이한 attB 및 attP 중심 디뉴클레오티드- AA, GA, CA, AG, AC, CC, GT, CT 및 TT(서열번호 7, 8, 23, 24, 19, 20, 25, 26, 27, 28, 9, 10, 15, 16, 17, 18, 5 및 6)-에 의한 다중화 능력을 시험하였다. 편집은 차세대 서열분석을 사용하여 프로빙하였다. attB 및 attP 중심 디뉴클레오티드의 9x9 교차- AA, GA, CA, AG, AC, CC, GT, CT 및 TT-의 결과는 도 16a에 제시되어 있다. attB 및 attP의 직교 쌍만이 가장 높은 편집 백분율을 나타낸다. 이 결과는 또한 도 16b의 히트-맵으로 제시되어 있다.
실시예 8
알부민 및 CPS1의 알부민 유전자좌로의 통합
알부민 가이드를 갖는 12 pegRNA를 PBS에 연결하고, 가변 길이의 역전사 효소 서열, 및 상이한 니킹 가이드 RNA를 사용하여 HEK293FT 세포를 형질감염시켰다. 알부민에서의 % 편집을 차세대 서열분석을 사용하여 프로빙하였다. 알부민 유전자좌에서의 프라임 편집의 결과를 도 17에 나타낸다. 서열번호 79가 세르피나1로 가장 높은 퍼센트 편집을 나타내었고, 서열번호 80이 CPS1로 가장 높은 퍼센트 편집을 나타낸 것으로 관찰되었다.
실시예 9
T-세포 조작
CD8+ T-세포를 조작하기 위해, T-세포에서 PASTE 전달 및 편집의 효율성을 평가할 수 있다(도 18). ACTB 표적화 pegRNA는 EGFP 삽입 주형을 갖는 통합 부위를 삽입하는데 사용될 수 있다. PASTE 성분을 CD8+ T-세포에 전달하기 위해, 전기천공이 자극되지 않은 T-세포를 위한 최적화된 전기천공 프로토콜과 함께 사용될 수 있다. 다수의 플라스미드가 전기천공의 효율을 감소시킬 수 있으므로, 더 적은 벡터를 사용하는 통합된 PASTE 성분을 적용할 수 있다.
5개 벡터, 3개 벡터, 및 2개 벡터 PASTE 시스템은 강력한 T-세포 편집이 3-벡터 접근법을 사용하는 최대 편집으로 달성될 수 있음을 보여준다(도 19). 또한, 전체 플라스미드 양, 세포 수 및 전압/암페어 프로토콜을 포함하는, 전기천공 조건의 확장된 세트를 시험할 수 있다. 또한, T-세포의 자극은 형질도입의 효율 및 PASTE 효율에 영향을 미칠 수 있다. 또한, T-활성제 CD3/CD28 리간드로 자극된 CD4+/CD8+ T 세포 혼합물은 비자극된 세포에 비해 더 높은 PASTE 편집 효율을 가질 수 있다. 전체 전달 속도로부터 PASTE의 효율을 분리하기 위해, PASTE 벡터 상의 mCherry 발현 카세트를 평가하여 성공적으로 형질감염된 T 세포를 분류할 수 있다. 최적화된 파라미터가 달성되면, TRAC, IL2Rα 및 PDCD1 유전자좌를 포함하는 T 세포에서 PASTE를 갖는 10개의 삽입 부위의 패널은 단일 및 다중화된 편집 맥락 모두에서 상이한 삽입(예: EGFP, BFP 및 YFP)을 사용하여 평가될 수 있다. HEK293FT에서 관련 부위의 시험된 서브세트는 EGFP 삽입에 대해 40% 초과의 편집을 달성하였다(도 20). 상이한 TCR 및 CAR 작제물을 갖는 TRAC 유전자좌에서 PASTE의 효율을 평가할 수 있다. T-세포는 성공적으로 형질감염되어 CAR 또는 TCR의 삽입을 달성할 수 있다.
실시예 10
CFTR을 위한 PASTE
CFTR 유전자좌를 위한 PASTE는 HEK293FT 세포에서 시험하여 인간 세포에 대한 상위 수행 pegRNA 및 니킹 설계를 식별할 수 있다. Neuro-2A 세포를 또한 시험하여 마우스 세포에 대한 상위 수행 pegRNA 및 니킹 설계를 식별할 수 있다. 최상의 작제물은 시험관내 마우스 공기 폐 계면(ALI) 오가노이드에서 시험 또는 마우스에서 낭포성 섬유증의 전임상 모델에서의 전달을 위해 적용될 수 있다. 표 12는 CFTR 유전자 조절을 위한 pegRNA, 니킹 가이드 및 미니서클 DNA 특성을 나타낸다.
[표 12]
Figure pct00118
실시예 11
PASTE를 사용하는 AttB 및 EGPF 통합
ACTB 유전자좌에서 attB 및 EGPF의 통합 효율을 평가하였다(도 21a-21c). Bxb1이 이 부위에 EGFP 주형을 첨가할 수 있는지 여부를 조사하기 위해, 다음 성분 각각을 발현하는 5개의 플라스미드 시스템을 사용하는 전달 접근법이 전개되었다: 1) pegRNA 발현, 2) 니킹 가이드 발현, 3) 프라임 발현(Cas9-RT), 4) Bxb1 발현 및 5) 삽입 주형(이 경우 EGFP). 이 접근법은 서열분석에 의해 측정된 바와 같이, HEK293FT 세포에서 최대 24%의 attB 부위의 편집 효율 및 약 10%의 EGFP의 통합을 산출하는 것으로 밝혀졌다(도 21a-21b). 최적의 활성은 3~4일 내에 달성되며, 모든 성분의 단일 단계 형질감염 또는 전기천공으로 수행될 수 있다. EGFP 플라스미드는 미니서클로 설계되어 목적하지 않은 모든 박테리아 성분을 제거할 수 있기 때문에, Bxb1 재조합 부위에서 최소한의 흉터와 함께 목적하는 유전자만이 삽입된다.
도구를 더 간단하게 사용하기 위해, Bxb1은 P2A 링커를 통해 Cas9-RT 융합에 대한 프라임에 연결되어 PASTE 단백질 발현에 2개가 아닌 단일 플라스미드만이 사용되도록 허용한다. 이러한 최적화는 동일한 수준의 편집을 유지할 수 있어서 도구를 사용하고 전달하는 것을 더 용이하게 한다(도 21c).
실시예 12
상이한 세포 유형에서 프로그램 가능한 EGFP 통합
간 간세포 암종 세포주 HEPG2(도 22a) 및 만성 골수성 백혈병 세포주 K562(도 22b)에서의 프로그램 가능한 EGFP 통합을 평가하였다. K562 및 HEPG2 세포의 ACTB 유전자좌에서 약 15%의 EGFP 통합이 관찰되어 세포 유형 전반에 걸쳐 플랫폼의 견고성을 입증했다.
실시예 13
향상된 PASTE 활성을 위한 Bxb1의 돌연변이유발
향상된 PASTE 활성을 위한 Bxb1의 돌연변이유발을 평가하였다(도 23a-23c). PASTE 활성을 최적화하기 위한 2개의 레버가 존재한다: 1) 인테그라제 활성의 개선및 2) 통합 서열의 프라임 첨가의 향상. 도 23a-23b에 도시된 바와 같이, Bxb1 활성은 PASTE에 의해 첨가된 Bxb1 attB 부위의 약 30%만이 Bxb1에 의해 통합되기 때문에 개선될 수 있다. 이는 Bxb1 효율이 개선될 수 있는 경우, PASTE가 개선될 수 있음을 예시한다. 또한, Bxb1 인테그라제에서의 촉매 잔기는 보존 및 구조 분석을 통해 식별되었고, Bxb1 돌연변이체는 PASTE의 일부로서 시험하기 위해 생성되었다. 도 23b에 도시된 바와 같이, 돌연변이는 통합을 약 20-30% 향상시킬 수 있다.
실시예 14
프라임 편집 통합 효율에 대한 pegRNA PBS 및 RT 길이의 효과
프라임 편집 통합 효율에 대한 pegRNA PBS 및 RT 길이의 효과를 평가하였다(도 25a-25f). PASTE는 최대 약 20%의 편집 비율을 달성하기 위해 ACTB 유전자좌에서 PBS 및 RT 길이를 조정함으로써 최적화될 수 있는 것으로 밝혀졌다(도 25a). attB 부위를 단축시키는 것은 프라임이 더 짧은 서열을 삽입하는 데 더 좋기 때문에 PASTE 기능을 개선하는데 도움이 될 수 있는 것으로 밝혀졌다. PBS, RT 및 attB 길이의 첨가 최적화는 최적 설계가 LMNB1, NOLC1, 및 GRSF1 유전자의 상류 삽입을 위해 발견될 수 있음을 보여주었다(도 25b, 25c 및 25d). attB에 대한 36nt만큼 짧은 길이는 리포터 플라스미드로의 통합을 위해 여전히 기능적인 것으로 밝혀졌다(도 25b 및 25c). attB 서열의 역보완된 버전이 프라임 편집을 통해 더 잘 통합되어 프라임이 삽입하는 서열이 중요하다는 것을 시사하는 것으로 밝혀졌다. attP 부위 돌연변이체와의 EGFP 통합은 특정 돌연변이체가 통합 효율을 현저하게 개선할 수 있음을 보여주었다(도 25e). PASTE는 또한 큰 유전자 패널로 수행하여 ACTB, LMNB1, SUPT16H, SRRM2, NOLC1, KLHL15, GRSF1, DEPDC4, NES, PGM1, CLTA, BASP1 및 DNAJC18의 N-말단에 EGFP를 삽입하였다(도 25f). 약 5% 내지 40%의 편집 비율은 디지털 액적 PCR(ddPCR)을 사용하여 발견되었다.
실시예 15
PASTE 및 HITI 표적 상 및 표적외 활성의 비교
PASTE 및 HITI 표적 상 및 표적외 활성을 비교하였다(도 26a-26f). PASTE 및 HITI는 동일한 가이드 서열을 사용할 때, 각각 약 22% 및 5% 통합 효율을 갖는 것으로 밝혀졌다(도 26a 및 26b). PASTE는 14개의 유전자 편집을 분석할 때 대부분의 부위에서 HITI를 능가하는 것으로 밝혀졌다(도 26c). ddPCR 기반 접근법을 사용하여, PASTE는 Bxb1 표적외 통합(도 26d) 및 Cas9 표적외 통합(도 26e)를 위한 최소 표적외 활성으로 매우 특이적인 것으로 밝혀졌다. 상이한 크기의 삽입물의 분석은 PASTE가 크기 1kb 내지 10kb의 서열을 신뢰성 있게 삽입할 수 있어(도 26f) PASTE가 작업할 수 있는 광범위한 서열 크기를 나타낸다는 것을 보여주었다. 더 큰 크기에서 삽입 효율의 감소도 관찰되었으며, 이는 더 큰 플라스미드 크기에서 HEK293FT 세포로의 플라스미드 전달의 감소에 기인할 가능성이 있었다.
실시예 16
PASTE 및 직교 디뉴클레오티드 attB 및 attP 부위에 의한 다중화
PASTE 및 직교 디뉴클레오티드 attB 및 attP 부위에 의한 다중화를 평가하였다(도 28a-28c). 중심 디뉴클레오티드 모티프의 돌연변이체에 대해 다중 직교 조합이 발견되었다(도 28a 및 28b). 도 28c에 도시된 바와 같이, 프로그램 가능한 다중화 유전자 삽입은 단백질 성분을 동일하게 유지하면서 상이한 pegRNA 및 유전자 삽입물만을 전달하는 PASTE와의 이러한 직교 조합을 사용함으로써 달성될 수 있다(도 8c).
실시예 17
내인성 부위에서 PASTE 다중화 통합
내인성 부위에서 PASTE 다중화 통합을 평가하였다(도 28a-28g). 서열(GLSGQPPRSPSSGSSG(서열번호 426)) 내의 글리신, 세린 및 플로핀의 농축으로 인해 단백질 링커에 이상적인 Bxb1에 의한 통합 후 남겨진 attR 흉터를 위한 판독 프레임이 식별되었다. PegRNA는 N-말단에서 다수의 유전자를 EGFP(ACTB, NOLC1, LMNB1, SUPT16H, SRRM2, 및 DEPDC4)로 태깅하기 위한 attR의 분해를 위해 이 링커 프레임을 사용하여 설계하였다. 이들 유전자가 모두 뚜렷한 단백질 국소화 외관을 갖기 때문에, 현미경 검사가 적절한 유전자 태깅을 확인하기 위해 사용될 수 있다. PASTE는 참조 이미지와 일치하는 단백질 국소화 및 세포에서 단백질의 예상된 국소화로 고효율 유전자 태깅이 가능한 것으로 밝혀졌다(도 28a-28c). 유전자는 또한 다중화된 방식으로 태깅되어 조작된 통합 부위의 직교성을 입증하였다. ACTB, LMNB1, NOLC1 및 GRSF는 단일, 이중-플렉싱 및 삼중-플렉싱의 그룹으로 HEK293FT에 각각 GT, TG, AC 및 CA를 운반하는 직교 pegRNA로 표적화하였다(도 28d-28e). 이러한 디뉴클레오티드는 EGFP, BFP 및 mCherry를 운반하는 주형과 쌍을 이루어 이러한 표지된 유전자의 다색 이미징을 허용하였다. 이러한 다중화 실험을 위한 통합 효율은 약 5% 내지 32%의 범위로 밝혀졌으며, 이는 PASTE에 의한 효율적인 다중 통합을 나타낸다. 이러한 다중화된 통합 실험의 공초점 현미경법을 사용하여, 세포는 이러한 상이한 단백질의 동시 표지와 함께 발견되었다(도 28f-28g).
실시예 18
CRISPR 기반 게놈 편집 및 부위 특이적 통합의 조합
CRISPR 기반 게놈 편집 및 부위 특이적 통합의 조합을 평가하였다.
상이한 attB의 길이 절단을 함유하는 PegRNA를 평가하였다(도 29a). 프라임 편집은 베타-액틴(ACTB) 유전자 유전자좌에서 최대 56bp 서열을 삽입할 수 있는 것으로 밝혀졌고, 31 bp 미만의 길이에서 더 높은 효율을 보였다(도 29a-b). 동족체 랜딩 부위의 통합은 다중 삽입 효소: Bxb1, TP901, 및 phiBT1 파지 세린 인테그라제 및 Cre 재조합 효소에 대해 시험되었다. 프라임 편집은 시험된 모든 랜딩 부위를 10 내지 30% 사이의 효율로 성공적으로 삽입하였다(도 29c-d). 완전한 시스템을 시험하기 위해, 모든 성분을 단일 형질감염으로 조합하여 전달하였다: 프라임 편집 벡터, pegRNA를 함유하는 랜딩 부위, 프라임 편집을 자극하기 위한 니킹 가이드, 상응하는 인테그라제 또는 재조합 효소를 위한 포유류 발현 벡터 및 녹색 형광 단백질(GFP)을 암호화하는 969 bp 미니서클 DNA 카고(도 29e). 4개의 인테그라제 및 재조합 효소 중 GFP 통합 비율을 비교하였고, Bxb1 인테그라제는 표적화 ACTB 유전자좌에서 가장 높은 통합 비율(약 20%)을 가졌고 최적의 성능을 위한 프라임 편집 니킹 가이드를 필요로 하는 것으로 밝혀졌다(도 29f-h). 마지막으로, 형질감염된 성분의 수를 감소시키기 위해, Bxb1은 P2A 단백질 절단 부위를 통해 SpCas9-M-MLV 역전사 효소(PE2) 융합 단백질과 함께 공동 발현되었다. 이러한 조합은 최대 30%의 높은 GFP 삽입 효율을 유지하였다(도 29e). 완전한 시스템, PASTE는 10% 초과의 통합 효율로 9,500 bp만큼 큰 주형의 정밀한 통합을 달성하였고(도 29j-k 및 26e), 전장 카고의 완전한 통합은 생어 서열분석에 의해 확인되었다(도 30a-e).
실시예 19
프라임 편집에 대한 프라임 편집 및 인테그라제 파라미터의 영향
프라임 편집의 통합 효율성에 대한 프라임 편집 및 인테그라제 파라미터의 영향을 평가하였다.
PASTE에 대한 관련 pegRNA 파라미터는 프라이머 결합 부위(PBS), 역전사 주형(RT), 및 attB 부위 길이뿐만 아니라 pegRNA 스페이서 및 니킹 가이드의 상대적 위치 및 효능을 포함한다(도 31a). PBS 및 RT 길이의 범위는 두 개의 유전자좌, ACTB 및 라민 Bl(LMNB1)에서 시험되었고, 효율성을 지배하는 규칙은 유전자좌 사이에서 다양한 것으로 밝혀졌고, 더 짧은 PBS 길이와 더 긴 RT 설계는 ACTB 유전자좌에서 더 높은 편집을 갖고(도 31b), 더 긴 PBS 및 더 짧은 RT 설계는 LMNB1에서 더 잘 수행된다(도 31c).
attB 랜딩 부위의 길이는 두 가지 상충되는 요인, 더 작은 삽입물에 대한 프라임 편집의 더 높은 효율과 더 짧은 attB 길이에서 Bxb1 통합의 감소된 효율의 균형을 유지해야 한다. AttB 길이는 ACTB, LMNB1, 및 핵소체 인단백질 p130(NOLC1)에서 평가되었으며, 최적의 attB 길이는 유전자좌 의존적인 것으로 밝혀졌다. ACTB 유전자좌에서, 긴 attB 길이는 프라임 편집에 의해 삽입될 수 있었고(도 29b), GFP의 삽입에 대한 전체 PASTE 효율은 긴 attB 길이에 대해 가장 높았다(도 31d). 대조적으로, 중간 attB 길이는 LMNB1(도 31e) 및 NOLC1(도 31f)에서 더 높은 전체 통합 효율(>20%)을 가졌고, 더 짧은 ATB 서열을 설치하는 효율성의 증가가 이러한 부위에서 Bxb1 통합의 감소를 극복했음을 나타낸다.
프라임 편집의 PE3 버전은 PE2와 삽입을 향한 플랩 중간체의 바이어스 분해에 대한 첨가 니킹 가이드를 결합한다. PASTE의 편집에 대한 니킹 가이드 선택의 중요성을 시험하기 위해, ACTB 및 LMNB1 유전자좌에서의 편집을 2개의 니킹 가이드 위치로 시험하였다. 차선의 니킹 가이드 위치는 니킹 가이드 부재하의 PASTE 효율의 75% 감소와 일치하여(도 29g) PASTE 효율을 최대 30% 감소시키는 것으로 밝혀졌다(도 32a). pegRNA 스페이서 서열은 PASTE의 편집에 필요한 것으로 밝혀졌고, 비표적화 가이드에 의한 스페이서 서열의 치환은 편집을 제거하는 것으로 밝혀졌다(도 32b).
합리적인 돌연변이는 또한 PE2 작제물의 Bxb1 인테그라제 및 역전사 효소 도메인 모두에 도입되어 PASTE를 추가로 최적화하였다. 이들 돌연변이의 일부가 PASTE에 의해 잘 견디었지만(도 33a-b), 그들 중 어느 것도 PASTE 편집 효율을 개선시키지 않았다.
짧은 RT 및 PBS 길이는 편집에 추가의 개선을 제공할 수 있다. 더 짧은 RT 및 PBS 가이드의 패널은 ACTB 및 LMNB1 유전자좌에서 시험되었고 더 짧은 RT 및 PBS 서열이 ACTB에서 편집을 증가시키지 않았지만(도 31g), 약 40%의 GFP 삽입률에 도달하는 최선의 수행 가이드로 LMNB1에서 편집을 개선시킨 것으로 최고 수행 가이드가 약 40%의 GFP 삽입률에 도달하는 것으로 밝혀졌다(도 31i).
실시예 20
다중 내인성 유전자에서 PASTE 태깅
GFP 삽입 효율은 PASTE 프로그래밍의 다양성을 시험하기 위해 7개의 상이한 유전자 유전자좌- ACTB, SUPT16H, SRRM2, NOLC1, DEPCDC4, NES 및 LMNB1-에서 측정하였다. 최대 22%의 통합 비율의 범위가 발견되었다(도 34a). PASTE는 카고 플라스미드에 대한 상동성 또는 서열 유사성을 요구하지 않기 때문에, 다양한 카고 서열의 통합은 모듈식이고, 상이한 유전자좌에 걸쳐 쉽게 스케일링된다. 크기가 969 bp로부터 4906 bp까지 다양한 6개의 상이한 유전자 카고는 ACTB 및 LMNB1 유전자좌에서 PASTE에 의한 삽입에 대해 시험되었다. 유전자와 삽입 유전자좌에 따라 5%와 22% 사이의 통합 주파수가 발견되었다(도 34b 및 35). 추가로, 7개의 공통 치료 유전자, CEP290, OTC, HBB, PAH, GBA, BTK, 및 ADA의 패널이 ACTB 유전자좌에서 삽입에 대해 평가하였고, 이러한 카고의 효율적인 통합은 5% 내지 20% 사이에서 발견되었다(도 34c).
내인성 유전자 발현의 중단 없이 프레임 내 단백질 태깅 또는 카고 발현을 위한 PASTE의 정확한 삽입을 평가하였다. Bxb1은 카고 통합 후 게놈에 잔류 서열(attL 및 attR이라 함)을 남기기 때문에, 이러한 게놈 흉터는 단백질 링커로서 작용할 수 있다. attR 서열의 프레임은 미니서클 카고에 대한 attP의 전략적 배치를 통해 위치되어 적합한 단백질 링커, GGLSGQPPRSSSGSSG(서열번호 427)를 달성하였다. 이 링커를 사용하여 4개의 유전자(ACTB, SRRM2, NOLC1, 및 LMNBT)를 PASTE를 사용하여 GFP로 태깅하였다. 정확한 유전자 태깅을 평가하기 위해, GFP의 준세포 위치를 면역 형광에 의해 태깅된 유전자 생성물과 비교하였다. 4개의 표적 유전자좌 모두에 대해, GFP는 태깅된 유전자 생성물과 공동-국소화되어 성공적인 태깅을 나타낸다(도 34d-e).
실시예 21
Bxb1 통합을 위한 직교 서열 선호도
Bxb1의 중심 디뉴클레오티드는 통합을 위한 attB 및 attP 부위의 회합에 관여하고, 매칭된 중심 디뉴클레오티드 서열을 변경하면 인테그라제 활성을 수정하고 두 유전자의 삽입을 위한 직교성을 제공할 수 있다. attB/attP 디뉴클레오티드 세트를 확장하면 PASTE에 의한 다중화된 유전자 삽입을 가능하게 할 수 있다. 16개의 디뉴클레오티드 attB/attP 서열 쌍 모두에 걸쳐 PASTE에 의한 ACTB 유전자좌에서의 GFP 통합 효율은 PASTE의 삽입을 위한 최적의 attB/attP 디뉴클레오티드를 찾기 위해 프로파일링되었다. 야생형 GT 서열보다 더 큰 통합 효율을 갖는 여러 디뉴클레오티드가 발견되었다(도 36a). 대부분의 디뉴클레오티드는 야생형 attB/attP 효율과 비교하여 75%의 편집 효율 이상이었으며, 이러한 디뉴클레오티드는 PASTE에 의한 다중화된 유전자 삽입을 위한 직교 채널일 수 있음을 암시한다.
이어서, 매칭된 및 매칭되지 않은 attB/attP 디뉴클레오티드 상호작용의 특이성을 평가하였다. attB/patP 통합을 비교하기 위해 풀링된 검정을 사용하여 확장 가능한 방식으로 모든 디뉴클레오티드 조합 사이의 상호작용을 프로파일링하였다(도 36b). 고유 식별자로 16개의 attP 디뉴클레오티드 플라스미드를 바코딩하고, 이 attP 풀을 Bxb1 인테그라제 발현 벡터 및 단일 attB 디뉴클레오티드 수용체 플라스미드로 공동 형질감염시키고, 생성되는 통합 생성물을 서열분석함으로써, 가능한 모든 attB/attP 쌍의 상대적 통합 효율을 측정하였다(도 36c). 디뉴클레오티드 특이성은 다양한 것으로 밝혀졌으며, 일부 디뉴클레오티드(GG)는 무시할 수 있는 크로스토크와 강한 자기-상호작용을 나타내고, 다른 뉴클레오티드(AA)는 최소한의 자기-선호도를 나타낸다. attP 선호도의 서열 로고(도 37)는 제1 위치에서 C 또는 G를 갖는 디뉴클레오티드가 공유된 제1 염기를 갖는 attB 디뉴클레오티드 서열에 대해 더 강한 선호도가 갖는 반면, 다른 attP 디뉴클레오티드, 특히 제1 위치에 A를 갖는 것들은 제1 attB 염기에 대해 감소된 특이성을 갖는다는 것을 나타냈다.
그런 다음, GA, AG, AC 및 CT 디뉴클레오티드 pegRNA를 ACTB에서 GFP 통합에 대해 시험한 다음, 그들의 상응하는 attP 카고와 쌍을 이루거나 다른 3개의 디뉴클레오티드 attP 서열과 잘못 쌍을 이루었다. 4개의 시험된 디뉴클레오티드는 모두 효율적으로 상응하는 attB/attP 쌍과 쌍을 이룰 때에만 카고를 통합하는 것으로 밝혀졌으며, 잘못 쌍을 이룬 조합에 걸쳐 검출 가능한 통합은 없었다(도 36d).
실시예 22
PASTE에 의한 다중 유전자 통합
매칭된 aatP 카고를 게놈의 특정 부위에 지시하는 직교 pegRNA를 사용하여 세포에서의 다중화를 평가하였다(도 38a). 3개의 상위 디뉴클레오티드 부착 부위 쌍(CT, AG, 및 GA)을 선택하여, ACTB(CT), LMNB1(AG) 및 NOLC1(GA)을 표적으로 하는 pegRNA 및 GFP(CT), mCherry(AG) 및 YFP(GA)를 함유하는 상응하는 미니서클 카고를 설계하였다. 이러한 시약을 세포에 공동 전달시, 5% 내지 25% 통합 범위에서 이들 pegRNA와 카고의 모든 가능한 조합의 단일-플렉스, 이중-플렉스 및 삼중-플렉스 편집이 달성되는 것으로 밝혀졌다(도 38b).
다중화된 유전자 통합을 위한 적용은 세포내 국소화 및 동일한 세포 내의 상호작용을 시각화하기 위해 상이한 단백질을 표지하기 위한 것이다. PASTE는 동일한 세포에서 ACTB(GFP) 및 NOLC1(mCherry) 또는 ACTB(GFP) 및 LMNB1(mCherry)을 동시에 태깅하는데 사용되었다. GFP와 mCherry 형광의 중첩이 관찰되지 않았고, 태깅된 유전자는 ACTB, NOLC1 및 LMNB1 단백질 생성물의 공지된 준세포 국소화를 기반으로 적절한 세포 구획에서 보이는 것으로 확인되었다(도 15a-b).
실시예 23
DSB 기반 삽입 방법과 비교된 PASTE 효율
PASTE 효율은 비교 가능한 DSB 기반 삽입 방법을 초과하는 것으로 밝혀졌다.
PASTE 편집은 NHEJ(즉, 상동성-독립적 표적화 통합, HITI) 또는 HDR 경로 중 하나를 사용하여 DSB-의존성 유전자 통합과 함께 평가하였다. PASTE는 HITI(도 39a-b) 또는 HDR(도 39c-d)보다 더 낫거나 동등한 유전자 삽입 효율을 가졌다. 7개의 상이한 내인성 표적 패널에서, PASTE는 7개 유전자 중 6개에서 HITI 편집을 초과했으며, 7번째 유전자에 대해 유사한 효율을 보였다(도 39a). DSB 생성은 대안적이고 목적하지 않은 편집 결과로서 삽입 또는 결실(indel)로 이어질 수 있기 때문에, 세 가지 방법 모두의 indel 주파수는 차세대 서열분석에 의해 평가되었으며, HEK293FT 및 HepG2 세포 모두에서 HDR 또는 HITI보다 PASTE로 생성된 indel이 훨씬 적다는 것을 발견하여(도 39b, 39d 및 40a), PASTE에 의한 고순도의 유전자 통합 결과를 보여준다.
실시예 24
PASTE 및 HITI 유전자 통합의 표적외 특성화
표적외 편집은 게놈 편집 기술에 사용될 수 있다. 특정 부위에서 PASTE의 특이성은 인간 게놈의 의사-attB 부위로의 Bxb1 통합에 의해 생성된 표적외 및 인간 게놈에서 가이드- 및 Cas9-의존 편집에 의해 생성된 표적외에 기초하여 평가되었다(도 39e). Bxb1은 의사 부착 부위에서 인간 게놈으로의 문서화된 통합이 결여된 반면, 천연 Bxb1 attB 코어 서열과 부분적 유사성을 갖는 잠재적 부위는 계산적으로 식별되었다. 이들 부위에 걸쳐 ddPCR에 의한 Bxb1 통합을 시험하였고, 표적외 활성은 밝혀지지 않았다(도 39f 및 40b-d). ACTB pegRNA를 위한 Cas9 표적외 검정하기 위해, 2개의 잠재적 표적외 부위를 계산적 예측을 통해 식별하였고, PASTE에 대한 표적외 통합은 밝혀지지 않았지만(도 39g 및 40a-d), 부위 중 하나에서 HITI에 의한 실질적인 표적외 활성은 밝혀졌다(도 39h 및 40a-d).
삽입-게놈 접합부의 태깅 및 PCR 증폭을 통해 Cas9 또는 Bxb1로 인한 게놈 전체 표적외를 추가로 평가하였다(도 39i). PASTE 편집 및 음성 대조군 누락 PE2를 갖는 조건에 대해 단일 세포 클론을 단리시켰고, 이들 클론으로부터 삽입 게놈 접합부의 깊은 서열분석은 모두 표적 상 ACTB 부위에 정렬하는 판독을 나타내어 표적외 게놈 삽입이 없음을 확인하였다(도 39j-l).
PASTE에 포함된 역전사 효소와 인테그라제의 발현은 세포 건강에 유해한 영향을 미칠 수 있다. 완전한 PASTE 시스템, PE2만을 갖는 상응하는 가이드 및 카고, 및 Bxb1만을 갖는 상응하는 가이드 및 카고를 형질감염시키고, 전사체 전체 RNA 서열분석을 통해 단백질 발현이 없는 GFP 대조군 형질감염 및 가이드 모두와 비교하여 이러한 효과의 정도를 결정하였다. 프라임 편집의 부재하에 Bxb1 발현은 몇 가지 중요한 표적외를 갖는 것으로 밝혀졌지만, 완전한 PASTE 시스템은 1.5배 이상의 변화를 갖는 하나의 차등적으로 조절된 유전자만을 가졌다(도 41a-b). Bxb1 과발현에 의해 상향조절된 유전자는 TENT5C 및 DDIT3와 같은 스트레스 반응 유전자를 포함하지만, 이러한 변화는 잠재적으로 PASTE 작제물 상의 P2A 링커로부터 Bxb1의 감소된 발현으로 인해 PASTE 시스템의 발현에서는 보이지 않았다(도 41c).
실시예 25
비분열 세포에서의 PASTE 효율
비분열 세포에서의 PASTE 활성을 평가하였다. Cas9 및 HDR 주형 또는 PASTE를 HEK293FT 세포로 형질감염시키고, 세포 분열은 아피디콜린 처리를 통해 정지시켰다(도 42a). 차단된 세포 분열의 본 모델에서, PASTE는 ACTB 유전자좌에서 20%초과의 GFP 유전자 통합 활성을 유지하는 반면, HDR-매개 통합은 제거된 것으로 밝혀졌다(도 42b 및 43a).
실시예 26
치료적 도입유전자의 생산 및 분비
더 큰 도입유전자를 사용하고 추가의 세포주에서 PASTE를 평가하였다.
치료적 도입유전자에 대한 크기 제한을 평가하기 위해, 분열 및 아피디콜린 처리된 세포 모두에서 최대 13.3kb 길이의 카고의 삽입을 평가하였다. 10% 초과의 삽입 효율이 발견되어(도 42c), 모든 전장 인간 cDNA 도입유전자의 약 99.7%의 삽입을 가능하게 하였다. 전달 비효율성 때문에 세포로 큰 삽입물 전달의 감소를 극복하기 위해, 삽입물의 더 많은 DNA 양을 전달하는 것은 유전자 통합 효율을 현저히 개선시키는 것으로 밝혀졌다(도 43b). K562 림프구 라인 및 1차 인간 T 세포에서 PASTE와 같은 첨가 세포 유형에 대한 PASTE 편집도 또한 평가하였다. PE2-P2A-Bxb1(PASTE) 및 PE2와 Bxb1의 별도 전달 모두가 두 세포 유형에서 효율적인 편집을 초래하는 것으로 밝혀졌다(도 42d-e). 마지막으로, 생체내 PASTE의 치료적 전달은 DNA 카고의 바이러스 전달을 필요로 할 수 있으므로, AAV가 Bxb1을 통해 게놈에 통합될 수 있는 페이로드를 함유하는 attP를 전달할 수 있는지 여부가 평가되었다. ACTB 유전자좌를 표적화하면, AAV는 용량 의존적 방식으로 최대 4%의 비율로 인테그라제 매개 삽입을 위한 적합한 주형을 전달할 수 있는 것으로 밝혀졌다(도 42f 및 43c).
PASTE의 효율을 향상시키기 위해, PE2*NLS를 프라임 편집을 위해 혼입하고 다중 유전자좌에서 개선된 PASTE 통합이 발견되었다(도 44a). 게다가, PE2*는 카고 플라스미드의 낮은 적정에서 보다 견고한 통합을 초래하여 플라스미드 8ng만큼 낮은 양의 통합을 입증하였다(도 44b). 불완전한 플라스미드 전달로 인해 PASTE 효율의 감소를 방지하기 위해, 푸로마이신 내성 유전자는 공동-전달되었고 약물 선택의 존재하에 PASTE 효율을 증가시키는 것으로 밝혀졌다(도 45).
프로그램 가능한 유전자 통합은 치료적 단백질 생성물의 발현을 위한 양식을 제공하고, 단백질 생산은 각각 질환 알파-1 항트립신 결핍 및 CPS1 결핍에 관여하는 치료적으로 관련된 단백질 알파-1 안티트립신(세르피나1에 의해 암호화됨) 및 카바모일 포스페이트 합성효소 I(CPS1에 의해 암호화됨)에 대해 평가되었다. 발광 단백질 서브유닛 HiBiT로 유전자 생성물을 태깅함으로써, 도입유전자 생산 및 분비가 PASTE 처리에 응답하여 독립적으로 평가되었다(도 42g). PASTE를 HEK293FT 세포 및 인간 간세포 암종 세포주(HepG2)에서 세르피나1 또는 CPS1 카고로 형질감염시키고, ACTB 유전자좌에서 효율적인 통합이 밝혀졌다(도 42h-i). 이러한 통합은 강력한 단백질 발현, 유전자 도입 생성물의 세포 내 축적(도 42j 및 46a-b), 및 단백질의 배지로의 분비를 초래하였다(도 42k).
실시예 27
최적화된 PASTE 작제물
복잡한 활성을 최적화하기 위해, 대안적인 역전사 효소 융합 및 돌연변이, 역전사 효소 도메인과 인테그라제 사이 및 Cas9와 역전사 효소 도메인 사이의 다양한 링커, 및 역전사 효소 및 BxbINT 도메인 돌연변이체를 포함하는 단백질 변형의 패널을 스크리닝하였다(도 47a 및 도 49c-도 49f). Cas9와 역전사 효소 사이의 48개의 잔기 XTEN 링커 및 Sto7d DNA 결합 도메인에 대한 MMuLV의 융합을 포함하는 다수의 단백질 변형(참조: Oscorbin et al. FEBS Lett. 594. 4338-4356. 2020)은 편집 효율을 향상시켰다(도 47a 및 도 49c-도 49d). 이러한 상위 변형이 역전사 효소-Sto7d 도메인과 BxbINT 사이의 GGGGS 링커(서열번호 420)와 결합되었을 때, 그들은 약 55% 유전자 통합을 생성하여 표적 부위에 직접 인테그라제를 모집하는 중요성을 강조했다(도 47a). 이 최적화된 작제물은 SpCas9-(XTEN-48)-RT-Sto7d-(GGGGS)-BxbINT로 지칭되었다. 최적화된 작제물은 약 20% 통합 효율로 약 36,000 bp만큼 큰 주형의 정확한 통합을 달성하였고(도 47a), 전장 카고의 완전한 통합은 생어 서열분석에 의해 확인되었다.
추가로, 상이한 AttB 길이 절단을 함유하는 pegRNA를 시험하고 프라임 편집이 베타-액틴(ACTB) 유전자 유전자좌에 최대 56 bp 서열을 삽입할 수 있었고, 31 bp 미만의 길이에서 더 높은 효율을 갖는 것으로 밝혀졌다(도 48a-도 48b). Bxb1 (즉, BxbINT), TP901(즉, Tp9INT), 및 phiBTL(즉, Bt1INT) 파지 세린 인테그린을 포함하는 다중 효소의 패널을 평가하였다. 프라임 편집은 10-30% 사이의 효율로 시험된 모든 랜딩 부위를 성공적으로 삽입하였다(도 48c-도 48d).
실시예 28
바이러스 전달 및 생체내 편집
완전한 PASTE 시스템을 바이러스 벡터에 패키징하기 위해, AdV 벡터를 활용하였다(도 50b). 아데노바이러스는 SpCas9-RT-BxbINT 및 가이드 발현을 위한 플라스미드와 함께 BxbINT 매개 삽입, 또는 SpCas9-RT의 플라스미드 전달과 함께 가이드 및 BxbINT의 AdV 전달에 적합한 주형을 전달할 수 있는지에 대해 평가하였고, HEK293FT 및 HepG2 세포에서 EGFP를 운반하는 약 36kb 아데노바이러스 게놈의 10-20% 통합이 달성되었음을 발견하였다(도 50c). 3개의 AdV 벡터에 걸쳐 카고 및 PASTE 시스템 성분의 패키징 및 전달시, 완전한 PASTE 시스템(Cas9-역전사 효소, 인테그라제 및 가이드 RNA, 또는 카고)은 HEK293FT 및 HepG2 세포에서 바이러스 단독 전달과 함께 약 50 내지 60%의 통합으로 아데노바이러스 전달로 치환될 수 있다(도 50d).
PASTE가 생체내 전달에 적합함을 추가로 입증하기 위해, PASTE 단백질 성분의 mRNA 버전 뿐만 아니라 화학적으로 변형된 합성 atgRNA 및 LMNB1 표적에 대한 니킹 가이드가 개발되었다(도 50e). 아데노바이러스 또는 플라스미드를 통한 주형의 전달과 함께 mRNA 및 가이드의 전기천공은 최대 약 23%의 고효율 통합을 산출하였다(도 50e-도 50f). 보다 지속적인 BxbINT 발현은 게놈에서 새로 배치된 AttB 부위로의 통합을 허용할 수 있으므로, 원형 mRNA 발현을 시험하고, 통합 효율을 약 30%로 향상시키는 것으로 밝혀졌다(도 50g-도 50i).
실시예 29
PASTE0에 의한 동시 결실 & 삽입
PASTE 시스템을 사용하여 동시에 하나의 서열을 결실시키고 다른 하나를 삽입하였다. AttB 핵산 서열의 조합된 삽입과 함께 LMNB1의 제1 엑손의 130 bp 및 385 bp 결실을 수행하였다(도 51a). 이 데이터는 PASTE 시스템을 사용하여 DNA 서열을 대체하는 것이 가능함을 보여준다.
PASTE 시스템을 사용하여 967 bp 카고의 조합된 삽입과 함께 LMNB1의 제1 엑손의 130 bp 결실이 또한 수행되었다.
2개의 attP 서열 중 하나를, 상기 기재된 바와 같이, 돌연변이된 AttP를 갖는 미니 서클 주형을 사용하여 삽입하였다. 이 AttP 돌연변이체는 특히 더 짧은 AttB(38-44bp)에 대해 더 나은 통합 동역학 및 효율을 나타낸다. 본 실험에서 사용된 LMNB1 AttB는 38 bp이다(도 51b).
SEQUENCE LISTING <110> MASSACHUSETTS INSTITUTE OF TECHNOLOGY <120> SYSTEMS, METHODS, AND COMPOSITIONS FOR SITE-SPECIFIC GENETIC ENGINEERING USING PROGRAMMABLE ADDITION VIA SITE-SPECIFIC TARGETING ELEMENTS (PASTE) <130> 720766: 083474-016PC <140> <141> <150> 63/222,550 <151> 2021-07-16 <160> 431 <170> PatentIn version 3.5 <210> 1 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Lox71 <400> 1 ataacttcgt ataatgtatg ctatacgaac ggta 34 <210> 2 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Lox66 <400> 2 taccgttcgt ataatgtatg ctatacgaag ttat 34 <210> 3 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB <400> 3 ggccggcttg tcgacgacgg cggtctccgt cgtcaggatc atccgg 46 <210> 4 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP <400> 4 ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcc 46 <210> 5 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-TT <400> 5 ggcttgtcga cgacggcgtt ctccgtcgtc aggatcat 38 <210> 6 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-TT <400> 6 gtggtttgtc tggtcaacca ccgcgttctc agtggtgtac ggtacaaacc ca 52 <210> 7 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-AA <400> 7 ggcttgtcga cgacggcgaa ctccgtcgtc aggatcat 38 <210> 8 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-AA <400> 8 gtggtttgtc tggtcaacca ccgcgaactc agtggtgtac ggtacaaacc ca 52 <210> 9 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-CC <400> 9 ggcttgtcga cgacggcgcc ctccgtcgtc aggatcat 38 <210> 10 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-CC <400> 10 gtggtttgtc tggtcaacca ccgcgccctc agtggtgtac ggtacaaacc ca 52 <210> 11 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-GG <400> 11 ggcttgtcga cgacggcggg ctccgtcgtc aggatcat 38 <210> 12 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-GG <400> 12 gtggtttgtc tggtcaacca ccgcgggctc agtggtgtac ggtacaaacc ca 52 <210> 13 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-TG <400> 13 ggcttgtcga cgacggcgtg ctccgtcgtc aggatcat 38 <210> 14 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-TG <400> 14 gtggtttgtc tggtcaacca ccgcgtgctc agtggtgtac ggtacaaacc ca 52 <210> 15 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-GT <400> 15 ggcttgtcga cgacggcggt ctccgtcgtc aggatcat 38 <210> 16 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-GT <400> 16 gtggtttgtc tggtcaacca ccgcggtctc agtggtgtac ggtacaaacc ca 52 <210> 17 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-CT <400> 17 ggcttgtcga cgacggcgct ctccgtcgtc aggatcat 38 <210> 18 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-CT <400> 18 gtggtttgtc tggtcaacca ccgcgctctc agtggtgtac ggtacaaacc ca 52 <210> 19 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-CA <400> 19 ggcttgtcga cgacggcgca ctccgtcgtc aggatcat 38 <210> 20 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-CA <400> 20 gtggtttgtc tggtcaacca ccgcgcactc agtggtgtac ggtacaaacc ca 52 <210> 21 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-TC <400> 21 ggcttgtcga cgacggcgtc ctccgtcgtc aggatcat 38 <210> 22 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-TC <400> 22 gtggtttgtc tggtcaacca ccgcgtcctc agtggtgtac ggtacaaacc ca 52 <210> 23 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-GA <400> 23 ggcttgtcga cgacggcgga ctccgtcgtc aggatcat 38 <210> 24 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-GA <400> 24 gtggtttgtc tggtcaacca ccgcggactc agtggtgtac ggtacaaacc ca 52 <210> 25 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-AG <400> 25 ggcttgtcga cgacggcgag ctccgtcgtc aggatcat 38 <210> 26 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-AG <400> 26 gtggtttgtc tggtcaacca ccgcgagctc agtggtgtac ggtacaaacc ca 52 <210> 27 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-AC <400> 27 ggcttgtcga cgacggcgac ctccgtcgtc aggatcat 38 <210> 28 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-AC <400> 28 gtggtttgtc tggtcaacca ccgcgacctc agtggtgtac ggtacaaacc ca 52 <210> 29 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-AT <400> 29 ggcttgtcga cgacggcgat ctccgtcgtc aggatcat 38 <210> 30 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-AT <400> 30 gtggtttgtc tggtcaacca ccgcgatctc agtggtgtac ggtacaaacc ca 52 <210> 31 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-GC <400> 31 ggcttgtcga cgacggcggc ctccgtcgtc aggatcat 38 <210> 32 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-GC <400> 32 gtggtttgtc tggtcaacca ccgcggcctc agtggtgtac ggtacaaacc ca 52 <210> 33 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-CG <400> 33 ggcttgtcga cgacggcgcg ctccgtcgtc aggatcat 38 <210> 34 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-CG <400> 34 gtggtttgtc tggtcaacca ccgcgcgctc agtggtgtac ggtacaaacc ca 52 <210> 35 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttB-TA <400> 35 ggcttgtcga cgacggcgta ctccgtcgtc aggatcat 38 <210> 36 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttP-TA <400> 36 gtggtttgtc tggtcaacca ccgcgtactc agtggtgtac ggtacaaacc ca 52 <210> 37 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> C-31-B <400> 37 tgcgggtgcc agggcgtgcc cttgggctcc ccgggcgcgt actcc 45 <210> 38 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> C31-P <400> 38 gtgccccaac tggggtaacc tttgagttct ctcagttggg gg 42 <210> 39 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> R4-B <400> 39 gcgcccaagt tgcccatgac catgccgaag cagtggtaga agggcaccgg cagacac 57 <210> 40 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> R4-P <400> 40 aggcatgttc cccaaagcga taccacttga agcagtggta ctgcttgtgg gtacactctg 60 cgggtgatga 70 <210> 41 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> BT1-B <400> 41 gtccttgacc aggtttttga cgaaagtgat ccagatgatc cagctccaca ccccgaacgc 60 <210> 42 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> BT1-P <400> 42 ggtgctgggt tgttgtctct ggacagtgat ccatgggaaa ctactcagca ccaccaatgt 60 tcc 63 <210> 43 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Bxb-B <400> 43 tcggccggct tgtcgacgac ggcggtctcc gtcgtcagga tcatccgggc 50 <210> 44 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Bxb-P <400> 44 gtcgtggttt gtctggtcaa ccaccgcggt ctcagtggtg tacggtacaa accccgac 58 <210> 45 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> TG1-B <400> 45 gatcagctcc gcgggcaaga ccttctcctt cacggggtgg aaggtc 46 <210> 46 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> TG1-P <400> 46 tcaaccccgt tccagcccaa cagtgttagt ctttgctctt acccagttgg gcgggatagc 60 ctgcccg 67 <210> 47 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> C1-B <400> 47 aacgattttc aaaggatcac tgaatcaaaa gtattgctca tccacgcgaa atttttc 57 <210> 48 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> C1-P <400> 48 aatattttag gtatatgatt ttgtttatta gtgtaaataa cactatgtac ctaaaat 57 <210> 49 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> C370-B <400> 49 tgtaaaggag actgataatg gcatgtacaa ctatactcgt cggtaaaaag gca 53 <210> 50 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> C370-P <400> 50 taaaaaaata cagcgttttt catgtacaac tatactagtt gtagtgccta aa 52 <210> 51 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> K38-B <400> 51 gagcgccgga tcagggagtg gacggcctgg gagcgctaca cgctgtggct gcggtc 56 <210> 52 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> K38-P <400> 52 ccctaatacg caagtcgata actctcctgg gagcgttgac aacttgcgca ccctga 56 <210> 53 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> RB-B <400> 53 tctcgtggtg gtggaaggtg ttggtgcggg gttggccgtg gtcgaggtgg ggtggtggta 60 gccattcg 68 <210> 54 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> RV-P <400> 54 gcacaggtgt agtgtatctc acaggtccac ggttggccgt ggactgctga agaacattcc 60 acgccagga 69 <210> 55 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> SPBC-B <400> 55 agtgcagcat gtcattaata tcagtacaga taaagctgta tctcctgtga acacaatggg 60 tgcca 65 <210> 56 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> SPBC-P <400> 56 aaagtagtaa gtatcttaaa aaacagataa agctgtatat taagatactt actac 55 <210> 57 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> TP901-B <400> 57 tgataattgc caacacaatt aacatctcaa tcaaggtaaa tgctttttcg tttt 54 <210> 58 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> TP901-P <400> 58 aattgcgagt ttttatttcg tttatttcaa ttaaggtaac taaaaaactc cttt 54 <210> 59 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Wbeta-B <400> 59 aaggtagcgt caacgatagg tgtaactgtc gtgtttgtaa cggtacttcc aacagctggc 60 gtttcagt 68 <210> 60 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Wbeta-P <400> 60 tagttttaaa gttggttatt agttactgtg atatttatca cggtacccaa taaccaatga 60 atatttga 68 <210> 61 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> A118-B <400> 61 tgtaactttt tcggatcaag ctatgaagga cgcaaagagg gaactaaaca cttaatt 57 <210> 62 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> A118-P <400> 62 ttgtttagtt cctcgttttc tctcgttgga agaagaagaa acgagaaact aaaatta 57 <210> 63 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> BL3-B <400> 63 caacctgttg acatgtttcc acagacaact cacgtggagg tagtcacggc ttttacgtta 60 gtt 63 <210> 64 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> BL3-P <400> 64 gagaatactg ttgaacaatg aaaaactagg catgtagaag ttgtttgtgc actaacttta 60 a 61 <210> 65 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MR11-B <400> 65 acaggtcaac acatcgcagt tatcgaacaa tcttcgaaaa tgtatggagg cacttgtatc 60 aatataggat gtataccttc gaagacactt gtacatgatg gattagaagg caaatccttt 120 <210> 66 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MR11-P <400> 66 caaaataaaa aacattgatt tttattaact tcttttgtgc ggaactacga acagttcatt 60 aatacgaagt gtacaaactt ccatacaaaa ataaccacga caattaagac gtggtttcta 120 <210> 67 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttL <400> 67 attatttctc accctga 17 <210> 68 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> AttR <400> 68 atcatctccc acccgga 17 <210> 69 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Vox <400> 69 aataggtctg agaacgccca ttctcagacg tatt 34 <210> 70 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> FRT <400> 70 gaagttccta tactttctag agaataggaa cttc 34 <210> 71 <211> 5881 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Cre Recombinase Expression Plasmid <400> 71 ggtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 60 agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 120 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 180 gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 240 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 300 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 360 gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt cactctcccc 420 atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 480 gcgatggggg cggggggggg gggggcgcgc gccaggcggg gggggggggg gggggggggg 540 gggggggggg gggcgggggg gggcggcggc agccaatcag agcggcgcgc tccgaaagtt 600 tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc 660 gggagtcgct gcgcgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 720 gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 780 tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 840 aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 900 cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 960 ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 1020 gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 1080 gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 1140 cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 1200 tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 1260 ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 1320 cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 1380 gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 1440 cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 1500 gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc 1560 gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt 1620 gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct 1680 cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tctgagccgc 1740 caccatggcc aatttactga ccgtacacca aaatttgcct gcattaccgg tcgatgcaac 1800 gagtgatgag gttcgcaaga acctgatgga catgttcagg gatcgccagg cgttttctga 1860 gcatacctgg aaaatgcttc tgtccgtttg ccggtcgtgg gcggcatggt gcaagttgaa 1920 taaccggaaa tggtttcccg cagaacctga agatgttcgc gattatcttc tatatcttca 1980 ggcgcgcggt ctggcagtaa aaactatcca gcaacatttg ggccagctaa acatgcttca 2040 tcgtcggtcc gggctgccac gaccaagtga cagcaatgct gtttcactgg ttatgcggcg 2100 gatccgaaaa gaaaacgttg atgccggtga acgtgcaaaa caggctctag cgttcgaacg 2160 cactgatttc gaccaggttc gttcactcat ggaaaatagc gatcgctgcc aggatatacg 2220 taatctggca tttctgggga ttgcttataa caccctgtta cgtatagccg aaattgccag 2280 gatcagggtt aaagatatct cacgtactga cggtgggaga atgttaatcc atattggcag 2340 aacgaaaacg ctggttagca ccgcaggtgt agagaaggca cttagcctgg gggtaactaa 2400 actggtcgag cgatggattt ccgtctctgg tgtagctgat gatccgaata actacctgtt 2460 ttgccgggtc agaaaaaatg gtgttgccgc gccatctgcc accagccagc tatcaactcg 2520 cgccctggaa gggatttttg aagcaactca tcgattgatt tacggcgcta aggatgactc 2580 tggtcagaga tacctggcct ggtctggaca cagtgcccgt gtcggagccg cgcgagatat 2640 ggcccgcgct ggagtttcaa taccggagat catgcaagct ggtggctgga ccaatgtaaa 2700 tattgtcatg aactatatcc gtaacctgga tagtgaaaca ggggcaatgg tgcgcctgct 2760 ggaagatggc gatggaccgg tggaacaaaa acttatttct gaagaagatc tgtgatagcg 2820 gccgcactcc tcaggtgcag gctgcctatc agaaggtggt ggctggtgtg gccaatgccc 2880 tggctcacaa ataccactga gatctttttc cctctgccaa aaattatggg gacatcatga 2940 agccccttga gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt 3000 gttggaattt tttgtgtctc tcactcggaa ggacatatgg gagggcaaat catttaaaac 3060 atcagaatga gtatttggtt tagagtttgg caacatatgc ccatatgctg gctgccatga 3120 acaaaggttg gctataaaga ggtcatcagt atatgaaaca gccccctgct gtccattcct 3180 tattccatag aaaagccttg acttgaggtt agattttttt tatattttgt tttgtgttat 3240 ttttttcttt aacatcccta aaattttcct tacatgtttt actagccaga tttttcctcc 3300 tctcctgact actcccagtc atagctgtcc ctcttctctt atggagatcc ctcgacctgc 3360 agcccaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 3420 acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 3480 gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 3540 tcgtgccagc ggatccgcat ctcaattagt cagcaaccat agtcccgccc ctaactccgc 3600 ccatcccgcc cctaactccg cccagttccg cccattctcc gccccatggc tgactaattt 3660 tttttattta tgcagaggcc gaggccgcct cggcctctga gctattccag aagtagtgag 3720 gaggcttttt tggaggccta ggcttttgca aaaagctaac ttgtttattg cagcttataa 3780 tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 3840 ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgga tccgctgcat 3900 taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 3960 tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 4020 aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 4080 aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 4140 ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 4200 acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 4260 ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 4320 tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 4380 tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 4440 gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 4500 agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 4560 tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 4620 agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 4680 tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 4740 acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 4800 tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 4860 agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 4920 tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 4980 acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 5040 tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 5100 ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 5160 agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 5220 tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 5280 acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 5340 agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 5400 actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 5460 tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 5520 gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 5580 ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 5640 tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 5700 aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 5760 tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 5820 tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 5880 g 5881 <210> 72 <211> 4915 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> GFP-Lox66-Cre expression plasmid <400> 72 agctctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga tggattgcac 60 gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca 120 atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt 180 gtcaagaccg acctgtccgg tgccctgaat gaactgcaag acgaggcagc gcggctatcg 240 tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga 300 agggactggc tgctattggg cgaagtgccg gggcaggatc tccatgtcat ctacaccttg 360 ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 420 cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 480 tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 540 ccgaactgtt cgccaggctc aaggcgagca tgcccgacgg cgaggatctc gtcgtgaccc 600 atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 660 actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 720 ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 780 ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaattatta 840 actcgagatc cactagagtg tggcggccgc attcttataa tcagcatcat gatgtggtac 900 cacatcatga tgctgattac ccccaactga gagaactcaa aggttacccc agttggggcg 960 ggcccacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 1020 ttctagttgt ggtttgtcca aactcatcga gctcgagatc tggcgaaggc gatgggggtc 1080 ttgaaggcgt gctggtactc cacgatgccc agctcggtgt tgctgtgcag ctcctccacg 1140 cggcggaagg cgaacatggg gcccccgttc tgcaggatgc tggggtggat ggcgctcttg 1200 aagtgcatgt ggctgtccac cacgaagctg tagtagccgc cgtcgcgcag gctgaaggtg 1260 cgggcgaagc tgcccaccag cacgttatcg cccatggggt gcaggtgctc cacggtggcg 1320 ttgctgcgga tgatcttgtc ggtgaagatc acgctgtcct cggggaagcc ggtgcccacc 1380 accttgaagt cgccgatcac gcggccggcc tcgtagcggt agctgaagct cacgtgcagc 1440 acgccgccgt cctcgtactt ctcgatgcgg gtgttggtgt agccgccgtt gttgatggcg 1500 tgcaggaagg ggttctcgta gccgctgggg taggtgccga agtggtagaa gccgtagccc 1560 atcacgtggc tcagcaggta ggggctgaag gtcagggcgc ctttggtgct cttcatcttg 1620 ttggtcatgc ggccctgctc gggggtgccc tctccgccgc ccaccagctc gaactccacg 1680 ccgttcaggg tgccggtgat gcggcactcg atcttcatgg cgggcatggt ggcgaccggt 1740 agcgctagcg gcttcggata acttcgtata gcatacatta tacgaacggt aagcgctacc 1800 gccggcatac ccaagtgaag ttgctcgcag cttatagtcg cgcccgggga gcccaagggc 1860 acgccctggc accgcggccg ctgagtctcg accatcatca tcatcatcat tgagtttatc 1920 tgggataaca gggtaatgtc atctagggat aacagggtat gtcatctggg ataacagggt 1980 aatgtatcta gggataacag ggtaatgtca tctgggataa cagggtaatg tcatctaggg 2040 ataacagggt atgtcatctg ggataacagg gtaatgtatc tagggataac agggtaatgt 2100 catctgggat aacagggtaa tgtcatctag ggataacagg gtatgtcatc tgggataaca 2160 gggtaatgta tctagggata acagggtaat gtcatctggg ataacagggt aatgtcatct 2220 agggataaca gggtatgtca tctgggataa cagggtaatg tatctaggga taacagggta 2280 atgtcatctg ggataacagg gtaatgtcat ctagggataa cagggtatgt catctgggat 2340 aacagggtaa tgtatctagg gataacaggg taatgtcatc tgggataaca gggtaatgtc 2400 atctagggat aacagggtat gtcatctggg ataacagggt aatgtatcta gggataacag 2460 ggtaatgtca tctgggataa cagggtaatg tcatctaggg ataacagggt aaatgtcatc 2520 tagggataac agggtaatgt catctaggga taacagggta atgtcatctg ggataacagg 2580 gtaatgtcat ctagggataa cagggtaatg tatcgccagc gtcgcacagc atgtttgctt 2640 gtcgccgtcg cgtctgtcac atcttttccg ccagcagtta gggattagcg tcttaagctg 2700 gcgcgaggac caacgtatca gccaggcgaa gctgcttttg agcaccaccc ggatgcctat 2760 cgccaccgtc ggtcgcaatg ttggttttga cgatcaactc tatttctcgc gggtatttaa 2820 aaaatgcacc ggggccagcc cgagcgagtt ccgtgccggt tgtgaagaaa aagtgaatga 2880 tgtagccgtc aagttgtcat aattggtaac gaatcagaca attgacggct tgacggagta 2940 gcatagggtt tgcagaatcc ctgcttcgtc catttgacag gcacattatg catgccgctt 3000 cgccttcgcg cgcgaattga tctgctgcct cgcgcgtttc ggtgatgacg gtgaaaacct 3060 ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 3120 acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag ccatgaccca 3180 gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga gcagattgta 3240 ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc 3300 atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 3360 cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 3420 gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 3480 ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 3540 agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 3600 tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 3660 ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 3720 gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 3780 ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 3840 gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 3900 aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 3960 aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 4020 ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 4080 gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 4140 gggattttgg tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 4200 ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 4260 agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 4320 cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 4380 aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 4440 tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 4500 tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 4560 ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 4620 caagctggag accgtttggc ccccctcgag cacgtagaaa gccagtccgc agaaacggtg 4680 ctgaccccgg atgaatgtca gctactgggc tatctggaca agggaaaacg caagcgcaaa 4740 gagaaagcag gtagcttgca gtgggcttac atggcgatag ctagactggg cggttttatg 4800 gacagcaagc gaaccggaat tgccagctgg ggcgccctct ggtaaggttg ggaagccctg 4860 caaagtaaac tggatggctt tctcgccgcc aaggatctga tggcgcaggg gatca 4915 <210> 73 <211> 10815 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> pCMV-PE2-P2A-Cre <400> 73 acgcgttgac attgattatt gactagttat taatagtaat caattacggg gtcattagtt 60 catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga 120 ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca 180 atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca 240 gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg 300 cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc 360 tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt 420 ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt 480 ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg 540 acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc tggtttagtg 600 aaccgtcaga tccgctagag atccgcggcc gctaatacga ctcactatag ggagagccgc 660 caccatgaaa cggacagccg acggaagcga gttcgagtca ccaaagaaga agcggaaagt 720 cgacaagaag tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat 780 caccgacgag tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca 840 cagcatcaag aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc 900 cacccggctg aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta 960 tctgcaagag atcttcagca acgagatggc caaggtggac gacagcttct tccacagact 1020 ggaagagtcc ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa 1080 catcgtggac gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa 1140 actggtggac agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat 1200 gatcaagttc cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt 1260 ggacaagctg ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat 1320 caacgccagc ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg 1380 gctggaaaat ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct 1440 gattgccctg agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga 1500 tgccaaactg cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca 1560 gatcggcgac cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct 1620 gctgagcgac atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat 1680 gatcaagaga tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca 1740 gcagctgcct gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg 1800 ctacattgac ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga 1860 aaagatggac ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa 1920 gcagcggacc ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc 1980 cattctgcgg cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga 2040 gaagatcctg accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag 2100 attcgcctgg atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt 2160 ggtggacaag ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa 2220 cctgcccaac gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta 2280 taacgagctg accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag 2340 cggcgagcag aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt 2400 gaagcagctg aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc 2460 cggcgtggaa gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat 2520 caaggacaag gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct 2580 gaccctgaca ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca 2640 cctgttcgac gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag 2700 gctgagccgg aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga 2760 tttcctgaag tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag 2820 cctgaccttt aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca 2880 cgagcacatt gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt 2940 gaaggtggtg gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat 3000 cgaaatggcc agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat 3060 gaagcggatc gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt 3120 ggaaaacacc cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga 3180 tatgtacgtg gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggacgctat 3240 cgtgcctcag agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga 3300 caagaaccgg ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa 3360 ctactggcgg cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac 3420 caaggccgag agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct 3480 ggtggaaacc cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac 3540 taagtacgac gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa 3600 gctggtgtcc gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta 3660 ccaccacgcc cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta 3720 ccctaagctg gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat 3780 gatcgccaag agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa 3840 catcatgaac tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc 3900 tctgatcgag acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc 3960 caccgtgcgg aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca 4020 gacaggcggc ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc 4080 cagaaagaag gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta 4140 ttctgtgctg gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa 4200 agagctgctg gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt 4260 tctggaagcc aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta 4320 ctccctgttc gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca 4380 gaagggaaac gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca 4440 ctatgagaag ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca 4500 gcacaagcac tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat 4560 cctggccgac gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc 4620 catcagagag caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc 4680 tgccgccttc aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga 4740 ggtgctggac gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga 4800 cctgtctcag ctgggaggtg actctggagg atctagcgga ggatcctctg gcagcgagac 4860 accaggaaca agcgagtcag caacaccaga gagcagtggc ggcagcagcg gcggcagcag 4920 caccctaaat atagaagatg agtatcggct acatgagacc tcaaaagagc cagatgtttc 4980 tctagggtcc acatggctgt ctgattttcc tcaggcctgg gcggaaaccg ggggcatggg 5040 actggcagtt cgccaagctc ctctgatcat acctctgaaa gcaacctcta cccccgtgtc 5100 cataaaacaa taccccatgt cacaagaagc cagactgggg atcaagcccc acatacagag 5160 actgttggac cagggaatac tggtaccctg ccagtccccc tggaacacgc ccctgctacc 5220 cgttaagaaa ccagggacta atgattatag gcctgtccag gatctgagag aagtcaacaa 5280 gcgggtggaa gacatccacc ccaccgtgcc caacccttac aacctcttga gcgggctccc 5340 accgtcccac cagtggtaca ctgtgcttga tttaaaggat gcctttttct gcctgagact 5400 ccaccccacc agtcagcctc tcttcgcctt tgagtggaga gatccagaga tgggaatctc 5460 aggacaattg acctggacca gactcccaca gggtttcaaa aacagtccca ccctgtttaa 5520 tgaggcactg cacagagacc tagcagactt ccggatccag cacccagact tgatcctgct 5580 acagtacgtg gatgacttac tgctggccgc cacttctgag ctagactgcc aacaaggtac 5640 tcgggccctg ttacaaaccc tagggaacct cgggtatcgg gcctcggcca agaaagccca 5700 aatttgccag aaacaggtca agtatctggg gtatcttcta aaagagggtc agagatggct 5760 gactgaggcc agaaaagaga ctgtgatggg gcagcctact ccgaagaccc ctcgacaact 5820 aagggagttc ctagggaagg caggcttctg tcgcctcttc atccctgggt ttgcagaaat 5880 ggcagccccc ctgtaccctc tcaccaaacc ggggactctg tttaattggg gcccagacca 5940 acaaaaggcc tatcaagaaa tcaagcaagc tcttctaact gccccagccc tggggttgcc 6000 agatttgact aagccctttg aactctttgt cgacgagaag cagggctacg ccaaaggtgt 6060 cctaacgcaa aaactgggac cttggcgtcg gccggtggcc tacctgtcca aaaagctaga 6120 cccagtagca gctgggtggc ccccttgcct acggatggta gcagccattg ccgtactgac 6180 aaaggatgca ggcaagctaa ccatgggaca gccactagtc attctggccc cccatgcagt 6240 agaggcacta gtcaaacaac cccccgaccg ctggctttcc aacgcccgga tgactcacta 6300 tcaggccttg cttttggaca cggaccgggt ccagttcgga ccggtggtag ccctgaaccc 6360 ggctacgctg ctcccactgc ctgaggaagg gctgcaacac aactgccttg atatcctggc 6420 cgaagcccac ggaacccgac ccgacctaac ggaccagccg ctcccagacg ccgaccacac 6480 ctggtacacg gatggaagca gtctcttaca agagggacag cgtaaggcgg gagctgcggt 6540 gaccaccgag accgaggtaa tctgggctaa agccctgcca gccgggacat ccgctcagcg 6600 ggctgaactg atagcactca cccaggccct aaagatggca gaaggtaaga agctaaatgt 6660 ttatactgat agccgttatg cttttgctac tgcccatatc catggagaaa tatacagaag 6720 gcgtgggtgg ctcacatcag aaggcaaaga gatcaaaaat aaagacgaga tcttggccct 6780 actaaaagcc ctctttctgc ccaaaagact tagcataatc cattgtccag gacatcaaaa 6840 gggacacagc gccgaggcta gaggcaaccg gatggctgac caagcggccc gaaaggcagc 6900 catcacagag actccagaca cctctaccct cctcatagaa aattcatcac cctctggcgg 6960 ctcaaaaaga accgccgacg gcagcgaatt cgagcccaag aagaagagga aagtcggaag 7020 cggagctact aacttcagcc tgctgaagca ggctggcgac gtggaggaga accctggacc 7080 taatttactg accgtacacc aaaatttgcc tgcattaccg gtcgatgcaa cgagtgatga 7140 ggttcgcaag aacctgatgg acatgttcag ggatcgccag gcgttttctg agcatacctg 7200 gaaaatgctt ctgtccgttt gccggtcgtg ggcggcatgg tgcaagttga ataaccggaa 7260 atggtttccc gcagaacctg aagatgttcg cgattatctt ctatatcttc aggcgcgcgg 7320 tctggcagta aaaactatcc agcaacattt gggccagcta aacatgcttc atcgtcggtc 7380 cgggctgcca cgaccaagtg acagcaatgc tgtttcactg gttatgcggc ggatccgaaa 7440 agaaaacgtt gatgccggtg aacgtgcaaa acaggctcta gcgttcgaac gcactgattt 7500 cgaccaggtt cgttcactca tggaaaatag cgatcgctgc caggatatac gtaatctggc 7560 atttctgggg attgcttata acaccctgtt acgtatagcc gaaattgcca ggatcagggt 7620 taaagatatc tcacgtactg acggtgggag aatgttaatc catattggca gaacgaaaac 7680 gctggttagc accgcaggtg tagagaaggc acttagcctg ggggtaacta aactggtcga 7740 gcgatggatt tccgtctctg gtgtagctga tgatccgaat aactacctgt tttgccgggt 7800 cagaaaaaat ggtgttgccg cgccatctgc caccagccag ctatcaactc gcgccctgga 7860 agggattttt gaagcaactc atcgattgat ttacggcgct aaggatgact ctggtcagag 7920 atacctggcc tggtctggac acagtgcccg tgtcggagcc gcgcgagata tggcccgcgc 7980 tggagtttca ataccggaga tcatgcaagc tggtggctgg accaatgtaa atattgtcat 8040 gaactatatc cgtaacctgg atagtgaaac aggggcaatg gtgcgcctgc tggaagatgg 8100 cgattaattt aaacccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 8160 gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 8220 taataaaatg agaaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 8280 ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 8340 gcggtgggct ctatggcttc tgaggcggaa agaaccagct ggggctcgat accgtcgacc 8400 tctagctaga gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg 8460 ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagccta gggtgcctaa 8520 tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac 8580 ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 8640 gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 8700 gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 8760 ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 8820 ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 8880 cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 8940 ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 9000 tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 9060 gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 9120 tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 9180 gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 9240 tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 9300 ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 9360 agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 9420 gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 9480 attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 9540 agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 9600 atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 9660 cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 9720 ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 9780 agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 9840 tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 9900 gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 9960 caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 10020 ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 10080 gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 10140 tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 10200 tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 10260 cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 10320 cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 10380 gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 10440 atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 10500 agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 10560 ccccgaaaag tgccacctga cgtcgacgga tcgggagatc gatctcccga tcccctaggg 10620 tcgactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatct gctccctgct 10680 tgtgtgttgg aggtcgctga gtagtgcgcg agcaaaattt aagctacaac aaggcaaggc 10740 ttgaccgaca attgcatgaa gaatctgctt agggttaggc gttttgcgct gcttcgcgat 10800 gtacgggcca gatat 10815 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> +90ngRNA guide sequence <400> 74 gtcaaccagt atcccggtgc 20 <210> 75 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> +90ngRNA <400> 75 gtcaaccagt atcccggtgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 76 <211> 4968 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> GFP minicircle template (before cleavage) <400> 76 tgatcccctg cgccatcaga tccttggcgg cgagaaagcc atccagttta ctttgcaggg 60 cttcccaacc ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa 120 aaccgcccag tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc 180 gcttgcgttt tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg 240 tttctgcgga ctggctttct acgtgctcga ggggggccaa acggtctcca gcttggctgt 300 tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 360 ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 420 aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 480 gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 540 tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 600 gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 660 gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc tacaaactct 720 tttgtttatt tttctaaata cattcaaata tgtatccgct catgaccaaa atcccttaac 780 gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 840 atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 900 tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 960 gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 1020 actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 1080 gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 1140 agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 1200 ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 1260 aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 1320 cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 1380 gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 1440 cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 1500 cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 1560 gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 1620 attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 1680 tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 1740 catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 1800 cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 1860 ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 1920 gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 1980 cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 2040 cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 2100 tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 2160 catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 2220 taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 2280 aacatgctgt gcgacgctgg cgatacatta ccctgttatc cctagatgac attaccctgt 2340 tatcccagat gacattaccc tgttatccct agatgacatt accctgttat ccctagatga 2400 catttaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 2460 atccctagat acattaccct gttatcccag atgacatacc ctgttatccc tagatgacat 2520 taccctgtta tcccagatga cattaccctg ttatccctag atacattacc ctgttatccc 2580 agatgacata ccctgttatc cctagatgac attaccctgt tatcccagat gacattaccc 2640 tgttatccct agatacatta ccctgttatc ccagatgaca taccctgtta tccctagatg 2700 acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 2760 tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 2820 accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 2880 gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 2940 gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagataa 3000 actcaatgat gatgatgatg atggtcgaga ctcagcggcc gcggtgccag ggcgtgccct 3060 tgggctcccc gggcgcgact ataagctgcg agcaacttca cttgggtatg ccggcggtag 3120 cgcttaccgt tcgtataatg tatgctatac gaagttatcc gaagccgcta gcggtggttt 3180 gtctggtcaa ccaccgcggt ctcagtggtg tacggtacaa acccagctac cggtcgccac 3240 catgcccgcc atgaagatcg agtgccgcat caccggcacc ctgaacggcg tggagttcga 3300 gctggtgggc ggcggagagg gcacccccga gcagggccgc atgaccaaca agatgaagag 3360 caccaaaggc gccctgacct tcagccccta cctgctgagc cacgtgatgg gctacggctt 3420 ctaccacttc ggcacctacc ccagcggcta cgagaacccc ttcctgcacg ccatcaacaa 3480 cggcggctac accaacaccc gcatcgagaa gtacgaggac ggcggcgtgc tgcacgtgag 3540 cttcagctac cgctacgagg ccggccgcgt gatcggcgac ttcaaggtgg tgggcaccgg 3600 cttccccgag gacagcgtga tcttcaccga caagatcatc cgcagcaacg ccaccgtgga 3660 gcacctgcac cccatgggcg ataacgtgct ggtgggcagc ttcgcccgca ccttcagcct 3720 gcgcgacggc ggctactaca gcttcgtggt ggacagccac atgcacttca agagcgccat 3780 ccaccccagc atcctgcaga acgggggccc catgttcgcc ttccgccgcg tggaggagct 3840 gcacagcaac accgagctgg gcatcgtgga gtaccagcac gccttcaaga cccccatcgc 3900 cttcgccaga tctcgagctc gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3960 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtgggcccg ccccaactgg 4020 ggtaaccttt gagttctctc agttgggggt aatcagcatc atgatgtggt accacatcat 4080 gatgctgatt ataagaatgc ggccgccaca ctctagtgga tctcgagtta ataattcaga 4140 agaactcgtc aagaaggcga tagaaggcga tgcgctgcga atcgggagcg gcgataccgt 4200 aaagcacgag gaagcggtca gcccattcgc cgccaagctc ttcagcaata tcacgggtag 4260 ccaacgctat gtcctgatag cggtccgcca cacccagccg gccacagtcg atgaatccag 4320 aaaagcggcc attttccacc atgatattcg gcaagcaggc atcgccatgg gtcacgacga 4380 gatcctcgcc gtcgggcatg ctcgccttga gcctggcgaa cagttcggct ggcgcgagcc 4440 cctgatgctc ttcgtccaga tcatcctgat cgacaagacc ggcttccatc cgagtacgtg 4500 ctcgctcgat gcgatgtttc gcttggtggt cgaatgggca ggtagccgga tcaagcgtat 4560 gcagccgccg cattgcatca gccatgatgg atactttctc ggcaggagca aggtgtagat 4620 gacatggaga tcctgccccg gcacttcgcc caatagcagc cagtcccttc ccgcttcagt 4680 gacaacgtcg agcacagctg cgcaaggaac gcccgtcgtg gccagccacg atagccgcgc 4740 tgcctcgtct tgcagttcat tcagggcacc ggacaggtcg gtcttgacaa aaagaaccgg 4800 gcgcccctgc gctgacagcc ggaacacggc ggcatcagag cagccgattg tctgttgtgc 4860 ccagtcatag ccgaatagcc tctccaccca agcggccgga gaacctgcgt gcaatccatc 4920 ttgttcaatc atgcgaaacg atcctcatcc tgtctcttga tcagagct 4968 <210> 77 <211> 4855 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> GLuc minicircle template <400> 77 tgatcccctg cgccatcaga tccttggcgg cgagaaagcc atccagttta ctttgcaggg 60 cttcccaacc ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa 120 aaccgcccag tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc 180 gcttgcgttt tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg 240 tttctgcgga ctggctttct acgtgctcga ggggggccaa acggtctcca gcttggctgt 300 tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 360 ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 420 aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 480 gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 540 tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 600 gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 660 gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc tacaaactct 720 tttgtttatt tttctaaata cattcaaata tgtatccgct catgaccaaa atcccttaac 780 gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 840 atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 900 tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 960 gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 1020 actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 1080 gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 1140 agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 1200 ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 1260 aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 1320 cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 1380 gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 1440 cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 1500 cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 1560 gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 1620 attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 1680 tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 1740 catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 1800 cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 1860 ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 1920 gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 1980 cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 2040 cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 2100 tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 2160 catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 2220 taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 2280 aacatgctgt gcgacgctgg cgatacatta ccctgttatc cctagatgac attaccctgt 2340 tatcccagat gacattaccc tgttatccct agatgacatt accctgttat ccctagatga 2400 catttaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 2460 atccctagat acattaccct gttatcccag atgacatacc ctgttatccc tagatgacat 2520 taccctgtta tcccagatga cattaccctg ttatccctag atacattacc ctgttatccc 2580 agatgacata ccctgttatc cctagatgac attaccctgt tatcccagat gacattaccc 2640 tgttatccct agatacatta ccctgttatc ccagatgaca taccctgtta tccctagatg 2700 acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 2760 tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 2820 accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 2880 gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 2940 gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagataa 3000 actcaatgat gatgatgatg atggtcgaga ctcagcggcc gcggtgccag ggcgtgccct 3060 tgggctcccc gggcgcgact ataagctgcg agcaacttca cttgggtatg ccggcggtag 3120 cgcttaccgt tcgtataatg tatgctatac gaagttatcc gaagccgcta gcggtggttt 3180 gtctggtcaa ccaccgcggt ctcagtggtg tacggtacaa acccactacc ggtcgccacc 3240 atgggagtca aagttctgtt tgccctgatc tgcatcgctg tggccgaggc caagcccacc 3300 gagaacaacg aagacttcaa catcgtggcc gtggccagca acttcgcgac cacggatctc 3360 gatgctgacc gcgggaagtt gcccggcaag aagctgccgc tggaggtgct caaagagatg 3420 gaagccaatg cccggaaagc tggctgcacc aggggctgtc tgatctgcct gtcccacatc 3480 aagtgcacgc ccaagatgaa gaagttcatc ccaggacgct gccacaccta cgaaggcgac 3540 aaagagtccg cacagggcgg cataggcgag gcgatcgtcg acattcctga gattcctggg 3600 ttcaaggact tggagcccat ggagcagttc atcgcacagg tcgatctgtg tgtggactgc 3660 acaactggct gcctcaaagg gcttgccaac gtgcagtgtt ctgacctgct caagaagtgg 3720 ctgccgcaac gctgtgcgac ctttgccagc aagatccagg gccaggtgga caagatcaag 3780 ggggccggtg gtgactaagc ggagctcgat gagtttggac aaaccacaac tagaatgcag 3840 tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt gggcccgccc 3900 caactggggt aacctttgag ttctctcagt tgggggtaat cagcatcatg atgtggtacc 3960 acatcatgat gctgattata agaatgcggc cgccacactc tagtggatct cgagttaata 4020 attcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 4080 ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 4140 cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 4200 aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 4260 acgacgagat cctcgccgtc gggcatgctc gccttgagcc tggcgaacag ttcggctggc 4320 gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 4380 gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 4440 agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 4500 tgtagatgac atggagatcc tgccccggca cttcgcccaa tagcagccag tcccttcccg 4560 cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc agccacgata 4620 gccgcgctgc ctcgtcttgc agttcattca gggcaccgga caggtcggtc ttgacaaaaa 4680 gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag ccgattgtct 4740 gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa cctgcgtgca 4800 atccatcttg ttcaatcatg cgaaacgatc ctcatcctgt ctcttgatca gagct 4855 <210> 78 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> pseudo-attP <400> 78 ccccaactgg ggtaaccttt gagttctctc agttgggg 38 <210> 79 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Albumin-pegRNA-SERPIN <400> 79 gactgaaact tcacagaata gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttgg gatagttatg aattcaatct 120 tcaaccctat ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctctg 180 tgaagtttca gtca 194 <210> 80 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Albumin-pegRNA-CPS1 <400> 80 gactgaaact tcacagaata gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttgg gatagttatg aattcaatct 120 tcaaccctat ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctctg 180 tgaagtttc 189 <210> 81 <211> 177 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> 34bp lox71 pegRNA <400> 81 ggcccagact gagcacgtga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgga ggaagcaggg cttcctttcc 120 tctgccatca taccgttcgt atagcataca ttatacgaag ttatcgtgct cagtctg 177 <210> 82 <211> 177 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> 34bp lox66 pegRNA <400> 82 ggcccagact gagcacgtga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgga ggaagcaggg cttcctttcc 120 tctgccatca ataacttcgt atagcataca ttatacgaac ggtacgtgct cagtctg 177 <210> 83 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> gRNA2 <400> 83 ggcccagact gagcacgtga 20 <210> 84 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 84 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctgagctgcg 180 agaa 184 <210> 85 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 85 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagt cggtgcgacg agcgcggcga 120 tatcatcatc catggcacaa ttaacatctc aatcaaggta aatgcttgag ctgcgagaa 179 <210> 86 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 86 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagt cggtgcgacg agcgcggcga 120 tatcatcatc catggagcat ttaccttgat tgagatgtta attgtgtgag ctgcgagaa 179 <210> 87 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 87 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagt cggtgcgacg agcgcggcga 120 tatcatcatc catggcaggt ttttgacgaa agtgatccag atgatccagt gagctgcgag 180 aa 182 <210> 88 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 88 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagt cggtgcgacg agcgcggcga 120 tatcatcatc catggctgga tcatctggat cactttcgtc aaaaacctgt gagctgcgag 180 aa 182 <210> 89 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 89 gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 90 <211> 164 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 90 gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat catcatccat ggtaccgttc 120 gtatagcata cattatacga agttattgag ctgcgagaat agcc 164 <210> 91 <211> 172 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 91 gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggtaccg ttcgtatagc atacattata cgaagttatt gagctgcgag aa 172 <210> 92 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 92 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcga cgacgagcgc ggcgatatca 120 tcatccatgg ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctgag 180 ctgcgagaa 189 <210> 93 <211> 181 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 93 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagc gcggcgatat catcatccat 120 ggccggatga tcctgacgac ggagaccgcc gtcgtcgaca agccggcctg agctgcgaga 180 a 181 <210> 94 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 94 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgccgcg gcgatatcat catccatggc 120 cggatgatcc tgacgacgga gaccgccgtc gtcgacaagc cggcctgagc tgcgagaa 178 <210> 95 <211> 175 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 95 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcg atatcatcat ccatggccgg 120 atgatcctga cgacggagac cgccgtcgtc gacaagccgg cctgagctgc gagaa 175 <210> 96 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 96 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat catcatccat ggccggatga 120 tcctgacgac ggagaccgcc gtcgtcgaca agccggcctg agctgcgaga a 171 <210> 97 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 97 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcga cgacgagcgc ggcgatatca 120 tcatccatgg ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctgag 180 ctgcgagaat agcc 194 <210> 98 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 98 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctgagctgcg 180 agaatagcc 189 <210> 99 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 99 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat catcatccat ggccggatga 120 tcctgacgac ggagaccgcc gtcgtcgaca agccggcctg agctgcgaga atagcc 176 <210> 100 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 100 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcctgc ccatccgcgg cggcacgggg 120 gtcgcagtcg ccatgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc 180 ccgggcggcg gaga 194 <210> 101 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 101 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgccatc cgcggcggca cgggggtcgc 120 agtcgccatg ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcccggg 180 cggcggaga 189 <210> 102 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 102 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120 ccatgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ccgggcggcg 180 gaga 184 <210> 103 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 103 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggca cgggggtcgc agtcgccatg 120 ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcccggg cggcggaga 179 <210> 104 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 104 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgggg gtcgcagtcg ccatgccgga 120 tgatcctgac gacggagacc gccgtcgtcg acaagccggc ccgggcggcg gaga 174 <210> 105 <211> 199 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 105 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcctgc ccatccgcgg cggcacgggg 120 gtcgcagtcg ccatgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc 180 ccgggcggcg gagacagcg 199 <210> 106 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 106 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgccatc cgcggcggca cgggggtcgc 120 agtcgccatg ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcccggg 180 cggcggagac agcg 194 <210> 107 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 107 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120 ccatgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ccgggcggcg 180 gagacagcg 189 <210> 108 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 108 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggca cgggggtcgc agtcgccatg 120 ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcccggg cggcggagac 180 agcg 184 <210> 109 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 109 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgggg gtcgcagtcg ccatgccgga 120 tgatcctgac gacggagacc gccgtcgtcg acaagccggc ccgggcggcg gagacagcg 179 <210> 110 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 110 gcgtggtggg gccgccagcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 111 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 111 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggggatg atcctgacga cggagaccgc cgtcgtcgac aagccggtga gctgcgagaa 180 <210> 112 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 112 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catgggatga tcctgacgac ggagaccgcc gtcgtcgaca agccgtgagc tgcgagaa 178 <210> 113 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 113 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggatgat cctgacgacg gagaccgccg tcgtcgacaa gcctgagctg cgagaa 176 <210> 114 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 114 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggtgatc ctgacgacgg agaccgccgt cgtcgacaag ctgagctgcg agaa 174 <210> 115 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 115 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120 ccatgcggat gatcctgacg acggagaccg ccgtcgtcga caagccggcc gggcggcgga 180 ga 182 <210> 116 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 116 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120 ccatgggatg atcctgacga cggagaccgc cgtcgtcgac aagccggcgg gcggcggaga 180 <210> 117 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 117 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120 ccatggatga tcctgacgac ggagaccgcc gtcgtcgaca agccgcgggc ggcggaga 178 <210> 118 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 118 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120 ccatgatgat cctgacgacg gagaccgccg tcgtcgacaa gcccgggcgg cggaga 176 <210> 119 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 119 gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120 ccgccccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctcctccagg 180 caatacgcg 189 <210> 120 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 120 gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120 ccgccccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctcctccagg 180 caat 184 <210> 121 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 121 gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120 ccgcccggat gatcctgacg acggagaccg ccgtcgtcga caagccggct cctccaggca 180 at 182 <210> 122 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 122 gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120 ccgccggatg atcctgacga cggagaccgc cgtcgtcgac aagccggtcc tccaggcaat 180 <210> 123 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 123 gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120 ccgccgatga tcctgacgac ggagaccgcc gtcgtcgaca agccgtcctc caggcaat 178 <210> 124 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 124 gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120 ccgccatgat cctgacgacg gagaccgccg tcgtcgacaa gcctcctcca ggcaat 176 <210> 125 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 125 gagccgagca cgaggggata cgttttagag ctagaaatag caagttaaaa taaggctagt 60 ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97 <210> 126 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 126 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcg atatcatcat ccatggatga 120 tcctgacgac ggagaccgcc gtcgtcgaca agcctgagct gcgagaa 167 <210> 127 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 127 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctatc atcatccatg gatgatcctg 120 acgacggaga ccgccgtcgt cgacaagcct gagctgcgag aa 162 <210> 128 <211> 157 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 128 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcat ccatggatga tcctgacgac 120 ggagaccgcc gtcgtcgaca agcctgagct gcgagaa 157 <210> 129 <211> 163 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 129 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcg atatcatcat ccatggatga 120 tcctgacgac ggagaccgcc gtcgtcgaca agcctgagct gcg 163 <210> 130 <211> 158 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 130 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctatc atcatccatg gatgatcctg 120 acgacggaga ccgccgtcgt cgacaagcct gagctgcg 158 <210> 131 <211> 153 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 131 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcat ccatggatga tcctgacgac 120 ggagaccgcc gtcgtcgaca agcctgagct gcg 153 <210> 132 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 132 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgccggg ggtcgcagtc gccatgatga 120 tcctgacgac ggagaccgcc gtcgtcgaca agcccgggcg gcggaga 167 <210> 133 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 133 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgtcg cagtcgccat gatgatcctg 120 acgacggaga ccgccgtcgt cgacaagccc gggcggcgga ga 162 <210> 134 <211> 157 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 134 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagtc gccatgatga tcctgacgac 120 ggagaccgcc gtcgtcgaca agcccgggcg gcggaga 157 <210> 135 <211> 163 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 135 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgccggg ggtcgcagtc gccatgatga 120 tcctgacgac ggagaccgcc gtcgtcgaca agcccgggcg gcg 163 <210> 136 <211> 158 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 136 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgtcg cagtcgccat gatgatcctg 120 acgacggaga ccgccgtcgt cgacaagccc gggcggcg 158 <210> 137 <211> 153 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 137 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagtc gccatgatga tcctgacgac 120 ggagaccgcc gtcgtcgaca agcccgggcg gcg 153 <210> 138 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 138 gagaagcggc gtccggggct agttttagag ctagaaatag caagttaaaa taaggctagt 60 ccgttatcaa cttgaaaaag tggcaccgag tcggtgctct ttgtccagag tcacagccat 120 accggatgat cctgacgacg gagaccgccg tcgtcgacaa gccggccccc cggacgccgc 180 <210> 139 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 139 gggcacgggg ccatgtacaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcg tcggcagccc gatcccgttg 120 ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctaca tggccccgt 179 <210> 140 <211> 185 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 140 gtgtcaggtg gggcggggct agttttagag ctagaaatag caagttaaaa taaggctagt 60 ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgct ggctcctccc ctggcaccat 120 accggatgat cctgacgacg gagaccgccg tcgtcgacaa gccggccccc cgccccacct 180 gacac 185 <210> 141 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 141 gagtgggtca gacgagcagg agttttagag ctagaaatag caagttaaaa taaggctagt 60 ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgat ggagggctgc atgggggagg 120 agtcgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctgctcgtct 180 gacc 184 <210> 142 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 142 gcagccaccc gctctcggcc cgttttagag ctagaaatag caagttaaaa taaggctagt 60 ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97 <210> 143 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 143 gtgtagtcag gccgctcacc cgttttagag ctagaaatag caagttaaaa taaggctagt 60 ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97 <210> 144 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 144 gctgacaagt ctacggaacc tgttttagag ctagaaatag caagttaaaa taaggctagt 60 ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97 <210> 145 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 145 gctcctccag cgccttgacc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 146 gctattctcg cagctcacca 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 147 agaagcggcg tccggggcta 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 148 gggcacgggg ccatgtacaa 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 149 gcgtattgcc tggaggatgg 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 150 tgtcaggtgg ggcggggcta 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 151 agtgggtcag acgagcagga 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 152 gctgtctccg ccgcccgcca 20 <210> 153 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 153 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 154 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (148)..(149) <223> CG, GC, AT, TA, GG, TT, GA, AG, CC, TC, CT, AA, TG, GT, CA, or AC <400> 154 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggccgga tgatcctgac gacggagnnc gccgtcgtcg acaagccggc ctgagctgcg 180 agaa 184 <210> 155 <211> 183 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 155 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catgccggat gatcctgacg acggagaccg ccgtcgtcga caagccggcc tgagctgcga 180 gaa 183 <210> 156 <211> 183 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 156 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catgccggat gatcctgacg acggagagcg ccgtcgtcga caagccggcc tgagctgcga 180 gaa 183 <210> 157 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 157 gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120 ccgccccgga tgatcctgac gacggagtcc gccgtcgtcg acaagccggc ctcctccagg 180 caatacgcg 189 <210> 158 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 158 gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120 ccatgccgga tgatcctgac gacggagctc gccgtcgtcg acaagccggc ccgggcggcg 180 gagacagcg 189 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 gtcacctcca atgactaggg 20 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 160 gggcaaccac aaacccacga 20 <210> 161 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 161 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggctatg ccggatgatc ctgacgacgg agtccgccgt cgtcgacaag ccggccctag 180 ctgagctgcg agaa 194 <210> 162 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 162 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggtgccg gatgatcctg acgacggagt ccgccgtcgt cgacaagccg gccctatgag 180 ctgcgagaa 189 <210> 163 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 163 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggccgga tgatcctgac gacggagtcc gccgtcgtcg acaagccggc ctgagctgcg 180 agaa 184 <210> 164 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 164 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggggatg atcctgacga cggagtccgc cgtcgtcgac aagccgtgag ctgcgagaa 179 <210> 165 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 165 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggtgatc ctgacgacgg agtccgccgt cgtcgacaag ctgagctgcg agaa 174 <210> 166 <211> 169 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 166 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggatcct gacgacggag tccgccgtcg tcgacatgag ctgcgagaa 169 <210> 167 <211> 164 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 167 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggcctga cgacggagtc cgccgtcgtc gtgagctgcg agaa 164 <210> 168 <211> 159 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 168 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggtgacg acggagtccg ccgtcgtgag ctgcgagaa 159 <210> 169 <211> 154 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 169 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggacgac ggagtccgcc gtgagctgcg agaa 154 <210> 170 <211> 149 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 170 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catgggacgg agtccgtgag ctgcgagaa 149 <210> 171 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 171 gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggcggag ttgagctgcg agaa 144 <210> 172 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 172 gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcga cgacgagcgc ggcgatatca 120 tcatccatgg taccgttcgt atagcataca ttatacgaag ttattgagct gcgagaatag 180 cc 182 <210> 173 <211> 177 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 173 gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120 catggtaccg ttcgtatagc atacattata cgaagttatt gagctgcgag aatagcc 177 <210> 174 <211> 177 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 174 gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcga cgacgagcgc ggcgatatca 120 tcatccatgg taccgttcgt atagcataca ttatacgaag ttattgagct gcgagaa 177 <210> 175 <211> 159 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 175 gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat catcatccat ggtaccgttc 120 gtatagcata cattatacga agttattgag ctgcgagaa 159 <210> 176 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 176 ccccacgatg gaggggaaga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 177 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 177 ccttctcctg gagccgcgac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 178 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 178 gtggtttgtc tggtcaacca ccgcggtctc agtggtgtac ggtacaaacc ca 52 <210> 179 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 179 tgggtttgta ccgtacacca ctgagaccgc ggtggttgac cagacaaacc ac 52 <210> 180 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 180 gtggtttgtc tggtcaacca ccgcgcgctc agtggtgtac ggtacaaacc ca 52 <210> 181 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 181 tgggtttgta ccgtacacca ctgagcgcgc ggtggttgac cagacaaacc ac 52 <210> 182 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 182 gtggtttgtc tggtcaacca ccgcggcctc agtggtgtac ggtacaaacc ca 52 <210> 183 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 183 tgggtttgta ccgtacacca ctgaggccgc ggtggttgac cagacaaacc ac 52 <210> 184 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 184 gtggtttgtc tggtcaacca ccgcgatctc agtggtgtac ggtacaaacc ca 52 <210> 185 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 185 tgggtttgta ccgtacacca ctgagatcgc ggtggttgac cagacaaacc ac 52 <210> 186 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 186 gtggtttgtc tggtcaacca ccgcgtactc agtggtgtac ggtacaaacc ca 52 <210> 187 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 187 tgggtttgta ccgtacacca ctgagtacgc ggtggttgac cagacaaacc ac 52 <210> 188 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 188 gtggtttgtc tggtcaacca ccgcgggctc agtggtgtac ggtacaaacc ca 52 <210> 189 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 189 tgggtttgta ccgtacacca ctgagcccgc ggtggttgac cagacaaacc ac 52 <210> 190 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 190 gtggtttgtc tggtcaacca ccgcgttctc agtggtgtac ggtacaaacc ca 52 <210> 191 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 191 tgggtttgta ccgtacacca ctgagaacgc ggtggttgac cagacaaacc ac 52 <210> 192 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 192 gtggtttgtc tggtcaacca ccgcggactc agtggtgtac ggtacaaacc ca 52 <210> 193 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 193 tgggtttgta ccgtacacca ctgagtccgc ggtggttgac cagacaaacc ac 52 <210> 194 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 194 gtggtttgtc tggtcaacca ccgcgagctc agtggtgtac ggtacaaacc ca 52 <210> 195 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 195 tgggtttgta ccgtacacca ctgagctcgc ggtggttgac cagacaaacc ac 52 <210> 196 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 196 gtggtttgtc tggtcaacca ccgcgccctc agtggtgtac ggtacaaacc ca 52 <210> 197 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 197 tgggtttgta ccgtacacca ctgagggcgc ggtggttgac cagacaaacc ac 52 <210> 198 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 198 gtggtttgtc tggtcaacca ccgcgtcctc agtggtgtac ggtacaaacc ca 52 <210> 199 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 199 tgggtttgta ccgtacacca ctgaggacgc ggtggttgac cagacaaacc ac 52 <210> 200 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 200 gtggtttgtc tggtcaacca ccgcgctctc agtggtgtac ggtacaaacc ca 52 <210> 201 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 201 tgggtttgta ccgtacacca ctgagagcgc ggtggttgac cagacaaacc ac 52 <210> 202 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 202 gtggtttgtc tggtcaacca ccgcgaactc agtggtgtac ggtacaaacc ca 52 <210> 203 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 203 tgggtttgta ccgtacacca ctgagttcgc ggtggttgac cagacaaacc ac 52 <210> 204 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 204 gtggtttgtc tggtcaacca ccgcgcactc agtggtgtac ggtacaaacc ca 52 <210> 205 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 205 tgggtttgta ccgtacacca ctgagtgcgc ggtggttgac cagacaaacc ac 52 <210> 206 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 206 gtggtttgtc tggtcaacca ccgcgacctc agtggtgtac ggtacaaacc ca 52 <210> 207 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 207 tgggtttgta ccgtacacca ctgaggtcgc ggtggttgac cagacaaacc ac 52 <210> 208 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 208 gtggtttgtc tggtcaacca ccgcgtgctc agtggtgtac ggtacaaacc ca 52 <210> 209 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 209 tgggtttgta ccgtacacca ctgagcacgc ggtggttgac cagacaaacc ac 52 <210> 210 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 210 ggccggcttg tcgacgacgg cggtctccgt cgtcaggatc atccgg 46 <210> 211 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 211 ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcc 46 <210> 212 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 212 ggccggcttg tcgacgacgg cgaactccgt cgtcaggatc atccgg 46 <210> 213 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 213 ccggatgatc ctgacgacgg agttcgccgt cgtcgacaag ccggcc 46 <210> 214 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 214 ggccggcttg tcgacgacgg cggactccgt cgtcaggatc atccgg 46 <210> 215 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 215 ccggatgatc ctgacgacgg agtccgccgt cgtcgacaag ccggcc 46 <210> 216 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 216 ggccggcttg tcgacgacgg cgcactccgt cgtcaggatc atccgg 46 <210> 217 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 217 ccggatgatc ctgacgacgg agtgcgccgt cgtcgacaag ccggcc 46 <210> 218 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 218 ggccggcttg tcgacgacgg cgtactccgt cgtcaggatc atccgg 46 <210> 219 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 219 ccggatgatc ctgacgacgg agtacgccgt cgtcgacaag ccggcc 46 <210> 220 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 220 ggccggcttg tcgacgacgg cgagctccgt cgtcaggatc atccgg 46 <210> 221 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 221 ccggatgatc ctgacgacgg agctcgccgt cgtcgacaag ccggcc 46 <210> 222 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 222 ggccggcttg tcgacgacgg cgggctccgt cgtcaggatc atccgg 46 <210> 223 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 223 ccggatgatc ctgacgacgg agcccgccgt cgtcgacaag ccggcc 46 <210> 224 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 224 ggccggcttg tcgacgacgg cgcgctccgt cgtcaggatc atccgg 46 <210> 225 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 225 ccggatgatc ctgacgacgg agcgcgccgt cgtcgacaag ccggcc 46 <210> 226 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 226 ggccggcttg tcgacgacgg cgtgctccgt cgtcaggatc atccgg 46 <210> 227 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 227 ccggatgatc ctgacgacgg agcacgccgt cgtcgacaag ccggcc 46 <210> 228 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 228 ggccggcttg tcgacgacgg cgacctccgt cgtcaggatc atccgg 46 <210> 229 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 229 ccggatgatc ctgacgacgg aggtcgccgt cgtcgacaag ccggcc 46 <210> 230 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 230 ggccggcttg tcgacgacgg cggcctccgt cgtcaggatc atccgg 46 <210> 231 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 231 ccggatgatc ctgacgacgg aggccgccgt cgtcgacaag ccggcc 46 <210> 232 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 232 ggccggcttg tcgacgacgg cgccctccgt cgtcaggatc atccgg 46 <210> 233 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 233 ccggatgatc ctgacgacgg agggcgccgt cgtcgacaag ccggcc 46 <210> 234 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 234 ggccggcttg tcgacgacgg cgtcctccgt cgtcaggatc atccgg 46 <210> 235 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 235 ccggatgatc ctgacgacgg aggacgccgt cgtcgacaag ccggcc 46 <210> 236 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 236 ggccggcttg tcgacgacgg cgatctccgt cgtcaggatc atccgg 46 <210> 237 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 237 ccggatgatc ctgacgacgg agatcgccgt cgtcgacaag ccggcc 46 <210> 238 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 238 ggccggcttg tcgacgacgg cgctctccgt cgtcaggatc atccgg 46 <210> 239 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 239 ccggatgatc ctgacgacgg agagcgccgt cgtcgacaag ccggcc 46 <210> 240 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 240 ggccggcttg tcgacgacgg cgttctccgt cgtcaggatc atccgg 46 <210> 241 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 241 ccggatgatc ctgacgacgg agaacgccgt cgtcgacaag ccggcc 46 <210> 242 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 242 ggcttgtcga cgacggcggt ctccgtcgtc aggatcat 38 <210> 243 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 243 atgatcctga cgacggagac cgccgtcgtc gacaagcc 38 <210> 244 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 244 ggcttgtcga cgacggcgaa ctccgtcgtc aggatcat 38 <210> 245 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 245 atgatcctga cgacggagtt cgccgtcgtc gacaagcc 38 <210> 246 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 246 ggcttgtcga cgacggcgga ctccgtcgtc aggatcat 38 <210> 247 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 247 atgatcctga cgacggagtc cgccgtcgtc gacaagcc 38 <210> 248 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 248 ggcttgtcga cgacggcgca ctccgtcgtc aggatcat 38 <210> 249 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 249 atgatcctga cgacggagtg cgccgtcgtc gacaagcc 38 <210> 250 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 250 ggcttgtcga cgacggcgta ctccgtcgtc aggatcat 38 <210> 251 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 251 atgatcctga cgacggagta cgccgtcgtc gacaagcc 38 <210> 252 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 252 ggcttgtcga cgacggcgag ctccgtcgtc aggatcat 38 <210> 253 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 253 atgatcctga cgacggagct cgccgtcgtc gacaagcc 38 <210> 254 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 254 ggcttgtcga cgacggcggg ctccgtcgtc aggatcat 38 <210> 255 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 255 atgatcctga cgacggagcc cgccgtcgtc gacaagcc 38 <210> 256 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 256 ggcttgtcga cgacggcgcg ctccgtcgtc aggatcat 38 <210> 257 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 257 atgatcctga cgacggagcg cgccgtcgtc gacaagcc 38 <210> 258 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 258 ggcttgtcga cgacggcgtg ctccgtcgtc aggatcat 38 <210> 259 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 259 atgatcctga cgacggagca cgccgtcgtc gacaagcc 38 <210> 260 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 260 ggcttgtcga cgacggcgac ctccgtcgtc aggatcat 38 <210> 261 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 261 atgatcctga cgacggaggt cgccgtcgtc gacaagcc 38 <210> 262 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 262 ggcttgtcga cgacggcggc ctccgtcgtc aggatcat 38 <210> 263 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 263 atgatcctga cgacggaggc cgccgtcgtc gacaagcc 38 <210> 264 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 264 ggcttgtcga cgacggcgcc ctccgtcgtc aggatcat 38 <210> 265 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 265 atgatcctga cgacggaggg cgccgtcgtc gacaagcc 38 <210> 266 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 266 ggcttgtcga cgacggcgtc ctccgtcgtc aggatcat 38 <210> 267 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 267 atgatcctga cgacggagga cgccgtcgtc gacaagcc 38 <210> 268 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 268 ggcttgtcga cgacggcgat ctccgtcgtc aggatcat 38 <210> 269 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 269 atgatcctga cgacggagat cgccgtcgtc gacaagcc 38 <210> 270 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 270 ggcttgtcga cgacggcgct ctccgtcgtc aggatcat 38 <210> 271 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 271 atgatcctga cgacggagag cgccgtcgtc gacaagcc 38 <210> 272 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 272 ggcttgtcga cgacggcgtt ctccgtcgtc aggatcat 38 <210> 273 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 273 atgatcctga cgacggagaa cgccgtcgtc gacaagcc 38 <210> 274 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 274 taccgttcgt ataatgtatg ctatacgaag ttat 34 <210> 275 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 275 ataacttcgt atagcataca ttatacgaac ggta 34 <210> 276 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 276 ataacttcgt ataatgtatg ctatacgaac ggta 34 <210> 277 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 277 taccgttcgt atagcataca ttatacgaag ttat 34 <210> 278 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 278 tttaccttga ttgagatgtt aattgtg 27 <210> 279 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 279 cacaattaac atctcaatca aggtaaa 27 <210> 280 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 280 gcgagttttt atttcgttta tttcaattaa ggtaactaaa aaactccttt 50 <210> 281 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 281 aaaggagttt tttagttacc ttaattgaaa taaacgaaat aaaaactcgc 50 <210> 282 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 282 ctggatcatc tggatcactt tcgtcaaaaa cctg 34 <210> 283 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 283 caggtttttg acgaaagtga tccagatgat ccag 34 <210> 284 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 284 ttcgggtgct gggttgttgt ctctggacag tgatccatgg gaaactactc agcacca 57 <210> 285 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 285 tggtgctgag tagtttccca tggatcactg tccagagaca acaacccagc acccgaa 57 <210> 286 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 286 aaaagtgtgg gctgcaggat ctga 24 <210> 287 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 287 ggagctggca gctgtcaatg cc 22 <210> 288 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 288 agtcaatgcc gctctcgtgg a 21 <210> 289 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 289 cagcgggctc agctgatagc a 21 <210> 290 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 290 cggatggcta accaagcggc c 21 <210> 291 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 291 cccggcttcc tttgtcc 17 <210> 292 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 292 gaactccacg ccgttca 17 <210> 293 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 293 cccggcttcc tttgtcc 17 <210> 294 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 294 aaccacaact agaatgcagt ga 22 <210> 295 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 295 cccggcttcc tttgtcc 17 <210> 296 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 296 gaactccacg ccgttca 17 <210> 297 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 297 cccggcttcc tttgtcc 17 <210> 298 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 298 aaccacaact agaatgcagt ga 22 <210> 299 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 299 cccggcttcc tttgtcc 17 <210> 300 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 300 gaactccacg ccgttca 17 <210> 301 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 301 tccttatcac ggtcccgctc g 21 <210> 302 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 302 gaactccacg ccgttca 17 <210> 303 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 303 cgtcgacaac ggtagtg 17 <210> 304 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 304 gaactccacg ccgttca 17 <210> 305 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 305 tcgcgtgatt ctcggaac 18 <210> 306 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 306 gaactccacg ccgttca 17 <210> 307 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 307 gggcggtaag tggttagttt 20 <210> 308 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 308 gaactccacg ccgttca 17 <210> 309 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 309 aagaggcgga gccagta 17 <210> 310 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 310 gaactccacg ccgttca 17 <210> 311 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 311 ctcccttctc ccggtgccc 19 <210> 312 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 312 gaactccacg ccgttca 17 <210> 313 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 313 cccggcttcc tttgtcc 17 <210> 314 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 314 gaactccacg ccgttca 17 <210> 315 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 315 gggcggtaag tggttagttt 20 <210> 316 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 316 gaactccacg ccgttca 17 <210> 317 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 317 cgtcgacaac ggtagtg 17 <210> 318 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 318 gaactccacg ccgttca 17 <210> 319 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 319 aagaggcgga gccagta 17 <210> 320 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 320 gaactccacg ccgttca 17 <210> 321 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 321 ctcccttctc ccggtgccc 19 <210> 322 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 322 gaactccacg ccgttca 17 <210> 323 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 323 tccttatcac ggtcccgctc g 21 <210> 324 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 324 gaactccacg ccgttca 17 <210> 325 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 325 cccggcttcc tttgtcc 17 <210> 326 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 326 ggcctgccag caggagga 18 <210> 327 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 327 cccggcttcc tttgtcc 17 <210> 328 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 328 ggtgtgcagt cacattggta aagcc 25 <210> 329 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 329 cccggcttcc tttgtcc 17 <210> 330 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 330 gatgggtcta gtccagctaa ag 22 <210> 331 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 331 cccggcttcc tttgtcc 17 <210> 332 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 332 gagagacaag gctgcaca 18 <210> 333 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 333 ccaggtgaga gtcagggtag tgttca 26 <210> 334 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 334 gaactccacg ccgttca 17 <210> 335 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 335 agggaccttt gcctgtgtga gtc 23 <210> 336 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 336 gaactccacg ccgttca 17 <210> 337 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 337 tcagctctgt gctgaggcga a 21 <210> 338 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 338 gaactccacg ccgttca 17 <210> 339 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 339 aagccatctc ccagaatatc tgcttagaaa tg 32 <210> 340 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 340 gaactccacg ccgttca 17 <210> 341 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 341 gagaggagca acagtgagca tgatg 25 <210> 342 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 342 gaactccacg ccgttca 17 <210> 343 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 343 aagccatctc ccagaatatc tgcttagaaa tg 32 <210> 344 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 344 gaactccacg ccgttca 17 <210> 345 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 345 gagaggagca acagtgagca tgatg 25 <210> 346 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 346 gaactccacg ccgttca 17 <210> 347 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 347 cccggcttcc tttgtcc 17 <210> 348 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 348 ggctatgaac taatgacccc gt 22 <210> 349 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 349 cccggcttcc tttgtcc 17 <210> 350 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 350 ggcctgccag caggagga 18 <210> 351 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 351 cccggcttcc tttgtcc 17 <210> 352 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 352 ggtgtgcagt cacattggta aagcc 25 <210> 353 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 353 acactctttc cctacacgac gctcttccga tctccgacct cggctcacag cg 52 <210> 354 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 354 acactctttc cctacacgac gctcttccga tctaccgacc tcggctcaca gcg 53 <210> 355 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 355 acactctttc cctacacgac gctcttccga tctgaccgac ctcggctcac agcg 54 <210> 356 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 356 acactctttc cctacacgac gctcttccga tcttgaccga cctcggctca cagcg 55 <210> 357 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 357 acactctttc cctacacgac gctcttccga tctctgaccg acctcggctc acagcg 56 <210> 358 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 358 acactctttc cctacacgac gctcttccga tctactgacc gacctcggct cacagcg 57 <210> 359 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 359 acactctttc cctacacgac gctcttccga tcttactgac cgacctcggc tcacagcg 58 <210> 360 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 360 acactctttc cctacacgac gctcttccga tctgtactga ccgacctcgg ctcacagcg 59 <210> 361 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 361 gtgactggag ttcagacgtg tgctcttccg atctccaccc agccagctcc c 51 <210> 362 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 362 acactctttc cctacacgac gctcttccga tctccggtgg cgcattgcca c 51 <210> 363 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 363 acactctttc cctacacgac gctcttccga tctaccggtg gcgcattgcc ac 52 <210> 364 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 364 acactctttc cctacacgac gctcttccga tctgaccggt ggcgcattgc cac 53 <210> 365 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 365 acactctttc cctacacgac gctcttccga tcttgaccgg tggcgcattg ccac 54 <210> 366 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 366 acactctttc cctacacgac gctcttccga tctctgaccg gtggcgcatt gccac 55 <210> 367 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 367 acactctttc cctacacgac gctcttccga tctactgacc ggtggcgcat tgccac 56 <210> 368 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 368 acactctttc cctacacgac gctcttccga tcttactgac cggtggcgca ttgccac 57 <210> 369 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 369 acactctttc cctacacgac gctcttccga tctgtactga ccggtggcgc attgccac 58 <210> 370 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 370 gtgactggag ttcagacgtg tgctcttccg atctcagagt ccagcttggg ccca 54 <210> 371 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 371 gatattttcc cagctcacca 20 <210> 372 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 372 tctattctcc cagctcccca 20 <210> 373 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 373 agcggcttct gtctctgtga gtgagctggc ggtctccgtc 40 <210> 374 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 374 gactagccca cgctccggtt ctgagccgcg acggcggtct ccg 43 <210> 375 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 375 cccagggtcc catgcgctcc ccggccctga cggcggtctc c 41 <210> 376 <211> 2560 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 376 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn 20 25 30 Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys 35 40 45 Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn 50 55 60 Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr 65 70 75 80 Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg 85 90 95 Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp 100 105 110 Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp 115 120 125 Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val 130 135 140 Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu 145 150 155 160 Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu 165 170 175 Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu 180 185 190 Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln 195 200 205 Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val 210 215 220 Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu 225 230 235 240 Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe 245 250 255 Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser 260 265 270 Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr 275 280 285 Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr 290 295 300 Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu 305 310 315 320 Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser 325 330 335 Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu 340 345 350 Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile 355 360 365 Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly 370 375 380 Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys 385 390 395 400 Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu 405 410 415 Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile 420 425 430 His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr 435 440 445 Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe 450 455 460 Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe 465 470 475 480 Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe 485 490 495 Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg 500 505 510 Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys 515 520 525 His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys 530 535 540 Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly 545 550 555 560 Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys 565 570 575 Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys 580 585 590 Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser 595 600 605 Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe 610 615 620 Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr 625 630 635 640 Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr 645 650 655 Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg 660 665 670 Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile 675 680 685 Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp 690 695 700 Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 705 710 715 720 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp 725 730 735 Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys 740 745 750 Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val 755 760 765 Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu 770 775 780 Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys 785 790 795 800 Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu 805 810 815 His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr 820 825 830 Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 835 840 845 Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe 850 855 860 Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys 865 870 875 880 Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys 885 890 895 Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln 900 905 910 Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu 915 920 925 Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln 930 935 940 Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 945 950 955 960 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu 965 970 975 Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys 980 985 990 Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 995 1000 1005 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1010 1015 1020 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1025 1030 1035 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1040 1045 1050 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1055 1060 1065 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1070 1075 1080 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1085 1090 1095 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1100 1105 1110 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1115 1120 1125 Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1130 1135 1140 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala 1145 1150 1155 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1160 1165 1170 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1175 1180 1185 Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1190 1195 1200 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1205 1210 1215 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1220 1225 1230 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser 1235 1240 1245 Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 1250 1255 1260 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu 1265 1270 1275 Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu 1280 1285 1290 Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val 1295 1300 1305 Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln 1310 1315 1320 Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala 1325 1330 1335 Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg 1340 1345 1350 Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln 1355 1360 1365 Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu 1370 1375 1380 Gly Gly Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu 1385 1390 1395 Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser 1400 1405 1410 Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly 1415 1420 1425 Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 1430 1435 1440 Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu 1445 1450 1455 Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly 1460 1465 1470 Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly 1475 1480 1485 Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu 1490 1495 1500 Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser 1505 1510 1515 Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu 1520 1525 1530 Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro 1535 1540 1545 Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 1550 1555 1560 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 1565 1570 1575 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Pro Pro Pro Ser 1580 1585 1590 His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 1595 1600 1605 Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp 1610 1615 1620 Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg 1625 1630 1635 Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala 1640 1645 1650 Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu 1655 1660 1665 Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser 1670 1675 1680 Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu 1685 1690 1695 Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys 1700 1705 1710 Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln 1715 1720 1725 Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro 1730 1735 1740 Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala 1745 1750 1755 Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala 1760 1765 1770 Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly 1775 1780 1785 Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 1790 1795 1800 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 1805 1810 1815 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr 1820 1825 1830 Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 1835 1840 1845 Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met 1850 1855 1860 Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr 1865 1870 1875 Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala 1880 1885 1890 Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met 1895 1900 1905 Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe 1910 1915 1920 Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro 1925 1930 1935 Glu Glu Gly Leu Gln His Asn Cys Leu Asp Gly Thr Gly Gly Gly 1940 1945 1950 Gly Val Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Leu Glu Val 1955 1960 1965 Asp Ile Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile 1970 1975 1980 Ser Phe Thr Tyr Asp Asp Asn Gly Lys Thr Gly Arg Gly Ala Val 1985 1990 1995 Ser Glu Lys Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys 2000 2005 2010 Ser Gly Lys Lys Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser 2015 2020 2025 Glu Phe Glu Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser 2030 2035 2040 Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val Pro Asp Tyr 2045 2050 2055 Ala Gly Ser Arg Ala Leu Val Val Ile Arg Leu Ser Arg Val Thr 2060 2065 2070 Asp Ala Thr Thr Ser Pro Glu Arg Gln Leu Glu Ser Cys Gln Gln 2075 2080 2085 Leu Cys Ala Gln Arg Gly Trp Asp Val Val Gly Val Ala Glu Asp 2090 2095 2100 Leu Asp Val Ser Gly Ala Val Asp Pro Phe Asp Arg Lys Arg Arg 2105 2110 2115 Pro Asn Leu Ala Arg Trp Leu Ala Phe Glu Glu Gln Pro Phe Asp 2120 2125 2130 Val Ile Val Ala Tyr Arg Val Asp Arg Leu Thr Arg Ser Ile Arg 2135 2140 2145 His Leu Gln Gln Leu Val His Trp Ala Glu Asp His Lys Lys Leu 2150 2155 2160 Val Val Ser Ala Thr Glu Ala His Phe Asp Thr Thr Thr Pro Phe 2165 2170 2175 Ala Ala Val Val Ile Ala Leu Met Gly Thr Val Ala Gln Met Glu 2180 2185 2190 Leu Glu Ala Ile Lys Glu Arg Asn Arg Ser Ala Ala His Phe Asn 2195 2200 2205 Ile Arg Ala Gly Lys Tyr Arg Gly Ser Leu Pro Pro Trp Gly Tyr 2210 2215 2220 Leu Pro Thr Arg Val Asp Gly Glu Trp Arg Leu Val Pro Asp Pro 2225 2230 2235 Val Gln Arg Glu Arg Ile Leu Glu Val Tyr His Arg Val Val Asp 2240 2245 2250 Asn His Glu Pro Leu His Leu Val Ala His Asp Leu Asn Arg Arg 2255 2260 2265 Gly Val Leu Ser Pro Lys Asp Tyr Phe Ala Gln Leu Gln Gly Arg 2270 2275 2280 Glu Pro Gln Gly Arg Glu Trp Ser Ala Thr Ala Leu Lys Arg Ser 2285 2290 2295 Met Ile Ser Glu Ala Met Leu Gly Tyr Ala Thr Leu Asn Gly Lys 2300 2305 2310 Thr Val Arg Asp Asp Asp Gly Ala Pro Leu Val Arg Ala Glu Pro 2315 2320 2325 Ile Leu Thr Arg Glu Gln Leu Glu Ala Leu Arg Ala Glu Leu Val 2330 2335 2340 Lys Thr Ser Arg Ala Lys Pro Ala Val Ser Thr Pro Ser Leu Leu 2345 2350 2355 Leu Arg Val Leu Phe Cys Ala Val Cys Gly Glu Pro Ala Tyr Lys 2360 2365 2370 Phe Ala Gly Gly Gly Arg Lys His Pro Arg Tyr Arg Cys Arg Ser 2375 2380 2385 Met Gly Phe Pro Lys His Cys Gly Asn Gly Thr Val Ala Met Ala 2390 2395 2400 Glu Trp Asp Ala Phe Cys Glu Glu Gln Val Leu Asp Leu Leu Gly 2405 2410 2415 Asp Ala Glu Arg Leu Glu Lys Val Trp Val Ala Gly Ser Asp Ser 2420 2425 2430 Ala Val Glu Leu Ala Glu Val Asn Ala Glu Leu Val Asp Leu Thr 2435 2440 2445 Ser Leu Ile Gly Ser Pro Ala Tyr Arg Ala Gly Ser Pro Gln Arg 2450 2455 2460 Glu Ala Leu Asp Ala Arg Ile Ala Ala Leu Ala Ala Arg Gln Glu 2465 2470 2475 Glu Leu Glu Gly Leu Glu Ala Arg Pro Ser Gly Trp Glu Trp Arg 2480 2485 2490 Glu Thr Gly Gln Arg Phe Gly Asp Trp Trp Arg Glu Gln Asp Thr 2495 2500 2505 Ala Ala Lys Asn Thr Trp Leu Arg Ser Met Asn Val Arg Leu Thr 2510 2515 2520 Phe Asp Val Arg Gly Gly Leu Thr Arg Thr Ile Asp Phe Gly Asp 2525 2530 2535 Leu Gln Glu Tyr Glu Gln His Leu Arg Leu Gly Ser Val Val Glu 2540 2545 2550 Arg Leu His Thr Gly Met Ser 2555 2560 <210> 377 <211> 7680 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 377 atgaaacgga cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtcgac 60 aagaagtaca gcatcggcct ggacatcggc accaactctg tgggctgggc cgtgatcacc 120 gacgagtaca aggtgcccag caagaaattc aaggtgctgg gcaacaccga ccggcacagc 180 atcaagaaga acctgatcgg agccctgctg ttcgacagcg gcgaaacagc cgaggccacc 240 cggctgaaga gaaccgccag aagaagatac accagacgga agaaccggat ctgctatctg 300 caagagatct tcagcaacga gatggccaag gtggacgaca gcttcttcca cagactggaa 360 gagtccttcc tggtggaaga ggataagaag cacgagcggc accccatctt cggcaacatc 420 gtggacgagg tggcctacca cgagaagtac cccaccatct accacctgag aaagaaactg 480 gtggacagca ccgacaaggc cgacctgcgg ctgatctatc tggccctggc ccacatgatc 540 aagttccggg gccacttcct gatcgagggc gacctgaacc ccgacaacag cgacgtggac 600 aagctgttca tccagctggt gcagacctac aaccagctgt tcgaggaaaa ccccatcaac 660 gccagcggcg tggacgccaa ggccatcctg tctgccagac tgagcaagag cagacggctg 720 gaaaatctga tcgcccagct gcccggcgag aagaagaatg gcctgttcgg aaacctgatt 780 gccctgagcc tgggcctgac ccccaacttc aagagcaact tcgacctggc cgaggatgcc 840 aaactgcagc tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc 900 ggcgaccagt acgccgacct gtttctggcc gccaagaacc tgtccgacgc catcctgctg 960 agcgacatcc tgagagtgaa caccgagatc accaaggccc ccctgagcgc ctctatgatc 1020 aagagatacg acgagcacca ccaggacctg accctgctga aagctctcgt gcggcagcag 1080 ctgcctgaga agtacaaaga gattttcttc gaccagagca agaacggcta cgccggctac 1140 attgacggcg gagccagcca ggaagagttc tacaagttca tcaagcccat cctggaaaag 1200 atggacggca ccgaggaact gctcgtgaag ctgaacagag aggacctgct gcggaagcag 1260 cggaccttcg acaacggcag catcccccac cagatccacc tgggagagct gcacgccatt 1320 ctgcggcggc aggaagattt ttacccattc ctgaaggaca accgggaaaa gatcgagaag 1380 atcctgacct tccgcatccc ctactacgtg ggccctctgg ccaggggaaa cagcagattc 1440 gcctggatga ccagaaagag cgaggaaacc atcaccccct ggaacttcga ggaagtggtg 1500 gacaagggcg cttccgccca gagcttcatc gagcggatga ccaacttcga taagaacctg 1560 cccaacgaga aggtgctgcc caagcacagc ctgctgtacg agtacttcac cgtgtataac 1620 gagctgacca aagtgaaata cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc 1680 gagcagaaaa aggccatcgt ggacctgctg ttcaagacca accggaaagt gaccgtgaag 1740 cagctgaaag aggactactt caagaaaatc gagtgcttcg actccgtgga aatctccggc 1800 gtggaagatc ggttcaacgc ctccctgggc acataccacg atctgctgaa aattatcaag 1860 gacaaggact tcctggacaa tgaggaaaac gaggacattc tggaagatat cgtgctgacc 1920 ctgacactgt ttgaggacag agagatgatc gaggaacggc tgaaaaccta tgcccacctg 1980 ttcgacgaca aagtgatgaa gcagctgaag cggcggagat acaccggctg gggcaggctg 2040 agccggaagc tgatcaacgg catccgggac aagcagtccg gcaagacaat cctggatttc 2100 ctgaagtccg acggcttcgc caacagaaac ttcatgcagc tgatccacga cgacagcctg 2160 acctttaaag aggacatcca gaaagcccag gtgtccggcc agggcgatag cctgcacgag 2220 cacattgcca atctggccgg cagccccgcc attaagaagg gcatcctgca gacagtgaag 2280 gtggtggacg agctcgtgaa agtgatgggc cggcacaagc ccgagaacat cgtgatcgaa 2340 atggccagag agaaccagac cacccagaag ggacagaaga acagccgcga gagaatgaag 2400 cggatcgaag agggcatcaa agagctgggc agccagatcc tgaaagaaca ccccgtggaa 2460 aacacccagc tgcagaacga gaagctgtac ctgtactacc tgcagaatgg gcgggatatg 2520 tacgtggacc aggaactgga catcaaccgg ctgtccgact acgatgtgga cgctatcgtg 2580 cctcagagct ttctgaagga cgactccatc gacaacaagg tgctgaccag aagcgacaag 2640 aaccggggca agagcgacaa cgtgccctcc gaagaggtcg tgaagaagat gaagaactac 2700 tggcggcagc tgctgaacgc caagctgatt acccagagaa agttcgacaa tctgaccaag 2760 gccgagagag gcggcctgag cgaactggat aaggccggct tcatcaagag acagctggtg 2820 gaaacccggc agatcacaaa gcacgtggca cagatcctgg actcccggat gaacactaag 2880 tacgacgaga atgacaagct gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg 2940 gtgtccgatt tccggaagga tttccagttt tacaaagtgc gcgagatcaa caactaccac 3000 cacgcccacg acgcctacct gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct 3060 aagctggaaa gcgagttcgt gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc 3120 gccaagagcg agcaggaaat cggcaaggct accgccaagt acttcttcta cagcaacatc 3180 atgaactttt tcaagaccga gattaccctg gccaacggcg agatccggaa gcggcctctg 3240 atcgagacaa acggcgaaac cggggagatc gtgtgggata agggccggga ttttgccacc 3300 gtgcggaaag tgctgagcat gccccaagtg aatatcgtga aaaagaccga ggtgcagaca 3360 ggcggcttca gcaaagagtc tatcctgccc aagaggaaca gcgataagct gatcgccaga 3420 aagaaggact gggaccctaa gaagtacggc ggcttcgaca gccccaccgt ggcctattct 3480 gtgctggtgg tggccaaagt ggaaaagggc aagtccaaga aactgaagag tgtgaaagag 3540 ctgctgggga tcaccatcat ggaaagaagc agcttcgaga agaatcccat cgactttctg 3600 gaagccaagg gctacaaaga agtgaaaaag gacctgatca tcaagctgcc taagtactcc 3660 ctgttcgagc tggaaaacgg ccggaagaga atgctggcct ctgccggcga actgcagaag 3720 ggaaacgaac tggccctgcc ctccaaatat gtgaacttcc tgtacctggc cagccactat 3780 gagaagctga agggctcccc cgaggataat gagcagaaac agctgtttgt ggaacagcac 3840 aagcactacc tggacgagat catcgagcag atcagcgagt tctccaagag agtgatcctg 3900 gccgacgcta atctggacaa agtgctgtcc gcctacaaca agcaccggga taagcccatc 3960 agagagcagg ccgagaatat catccacctg tttaccctga ccaatctggg agcccctgcc 4020 gccttcaagt actttgacac caccatcgac cggaagaggt acaccagcac caaagaggtg 4080 ctggacgcca ccctgatcca ccagagcatc accggcctgt acgagacacg gatcgacctg 4140 tctcagctgg gaggtgactc tggaggatct agcggaggat cctctggcag cgagacacca 4200 ggaacaagcg agtcagcaac accagagagc tctggtagcg agacacccgg taccagtgaa 4260 agcgccacgc cagaaagcag tgggagtgag actccgggta catctgaatc agcgacaccg 4320 gaatcaagtg gcggcagcag cggcggcagc agcaccctaa atatagaaga tgagtatcgg 4380 ctacatgaga cctcaaaaga gccagatgtt tctctagggt ccacatggct gtctgatttt 4440 cctcaggcct gggcggaaac cgggggcatg ggactggcag ttcgccaagc tcctctgatc 4500 atacctctga aagcaacctc tacccccgtg tccataaaac aataccccat gtcacaagaa 4560 gccagactgg ggatcaagcc ccacatacag agactgttgg accagggaat actggtaccc 4620 tgccagtccc cctggaacac gcccctgcta cccgttaaga aaccagggac taatgattat 4680 aggcctgtcc aggatctgag agaagtcaac aagcgggtgg aagacatcca ccccaccgtg 4740 cccaaccctt acaacctctt gagcgggccc ccaccgtccc accagtggta cactgtgctt 4800 gatttaaagg atgccttttt ctgcctgaga ctccacccca ccagtcagcc tctcttcgcc 4860 tttgagtgga gagatccaga gatgggaatc tcaggacaat tgacctggac cagactccca 4920 cagggtttca aaaacagtcc caccctgttt aatgaggcac tgcacagaga cctagcagac 4980 ttccggatcc agcacccaga cttgatcctg ctacagtacg tggatgactt actgctggcc 5040 gccacttctg agctagactg ccaacaaggt actcgggccc tgttacaaac cctagggaac 5100 ctcgggtatc gggcctcggc caagaaagcc caaatttgcc agaaacaggt caagtatctg 5160 gggtatcttc taaaagaggg tcagagatgg ctgactgagg ccagaaaaga gactgtgatg 5220 gggcagccta ctccgaagac ccctcgacaa ctaagggagt tcctagggaa ggcaggcttc 5280 tgtcgcctct tcatccctgg gtttgcagaa atggcagccc ccctgtaccc tctcaccaaa 5340 ccggggactc tgtttaattg gggcccagac caacaaaagg cctatcaaga aatcaagcaa 5400 gctcttctaa ctgccccagc cctggggttg ccagatttga ctaagccctt tgaactcttt 5460 gtcgacgaga agcagggcta cgccaaaggt gtcctaacgc aaaaactggg accttggcgt 5520 cggccggtgg cctacctgtc caaaaagcta gacccagtag cagctgggtg gcccccttgc 5580 ctacggatgg tagcagccat tgccgtactg acaaaggatg caggcaagct aaccatggga 5640 cagccactag tcattctggc cccccatgca gtagaggcac tagtcaaaca accccccgac 5700 cgctggcttt ccaacgcccg gatgactcac tatcaggcct tgcttttgga cacggaccgg 5760 gtccagttcg gaccggtggt agccctgaac ccggctacgc tgctcccact gcctgaggaa 5820 gggctgcaac acaactgcct tgatgggaca ggtggcggtg gtgtcaccgt caagttcaag 5880 tacaagggtg aggaacttga agttgatatt agcaaaatca agaaggtttg gcgcgttggt 5940 aaaatgatat cttttactta tgacgacaac ggcaagacag gtagaggggc agtgtctgag 6000 aaagacgccc ccaaggagct gttgcaaatg ttggaaaagt ctgggaaaaa gtctggcggc 6060 tcaaaaagaa ccgccgacgg cagcgaattc gagcccaaga agaagaggaa agtcggaggt 6120 ggcgggagcc caaaaaagaa aagaaaagtg tatccctatg atgtccccga ttatgccggt 6180 tcaagagccc tggtcgtgat tagactgagc cgagtgacag acgccaccac aagtcccgag 6240 agacagctgg aatcatgcca gcagctctgt gctcagcggg gttgggatgt ggtcggcgtg 6300 gcagaggatc tggacgtgag cggggccgtc gatccattcg acagaaagag gaggcccaac 6360 ctggcaagat ggctcgcttt cgaggaacag ccctttgatg tgatcgtcgc ctacagagtg 6420 gaccggctga cccgctcaat tcgacatctc cagcagctgg tgcattgggc tgaggaccac 6480 aagaaactgg tggtcagcgc aacagaagcc cacttcgata ctaccacacc ttttgccgct 6540 gtggtcatcg cactgatggg cactgtggcc cagatggagc tcgaagctat caaggagcga 6600 aacaggagcg cagcccattt caatattagg gccggtaaat acagaggctc cctgccccct 6660 tggggatatc tccctaccag ggtggatggg gagtggagac tggtgccaga ccccgtccag 6720 agagagcgga ttctggaagt gtaccacaga gtggtcgata accacgaacc actccatctg 6780 gtggcacacg acctgaatag acgcggcgtg ctctctccaa aggattattt tgctcagctg 6840 cagggaagag agccacaggg aagagaatgg agtgctactg cactgaagag atctatgatc 6900 agtgaggcta tgctgggtta cgcaacactc aatggcaaaa ctgtccggga cgatgacgga 6960 gcccctctgg tgagggctga gcctattctc accagagagc agctcgaagc tctgcgggca 7020 gaactggtca agactagtcg cgccaaacct gccgtgagca ccccaagcct gctcctgagg 7080 gtgctgttct gcgccgtctg tggagagcca gcatacaagt ttgccggcgg agggcgcaaa 7140 catccccgct atcgatgcag gagcatgggg ttccctaagc actgtggaaa cgggacagtg 7200 gccatggctg agtgggacgc cttttgcgag gaacaggtgc tggatctcct gggtgacgct 7260 gagcggctgg aaaaagtgtg ggtggcagga tctgactccg ctgtggagct ggcagaagtc 7320 aatgccgagc tcgtggatct gacttccctc atcggatctc ctgcatatag agctgggtcc 7380 ccacagagag aagctctgga cgcacgaatt gctgcactcg ctgctagaca ggaggaactg 7440 gagggcctgg aggccaggcc ctctggatgg gagtggcgag aaaccggaca gaggtttggg 7500 gattggtgga gggagcagga caccgcagcc aagaacacat ggctgagatc catgaatgtc 7560 cggctcacat tcgacgtgcg cggtggcctg actcgaacca tcgattttgg cgacctgcag 7620 gagtatgaac agcacctgag actggggtcc gtggtcgaaa gactgcacac tgggatgtcc 7680 <210> 378 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 378 Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 379 <211> 576 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 379 Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu Pro 1 5 10 15 Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp 20 25 30 Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile 35 40 45 Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro 50 55 60 Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu 65 70 75 80 Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro 85 90 95 Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln 100 105 110 Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val 115 120 125 Pro Asn Pro Tyr Asn Leu Leu Ser Gly Pro Pro Pro Ser His Gln Trp 130 135 140 Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His 145 150 155 160 Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met 165 170 175 Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys 180 185 190 Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala Asp 195 200 205 Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp 210 215 220 Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg 225 230 235 240 Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys 245 250 255 Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu 260 265 270 Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met 275 280 285 Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly 290 295 300 Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala 305 310 315 320 Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly 325 330 335 Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr 340 345 350 Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe 355 360 365 Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu 370 375 380 Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro 385 390 395 400 Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala 405 410 415 Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val 420 425 430 Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp 435 440 445 Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu 450 455 460 Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala 465 470 475 480 Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp 485 490 495 Gly Thr Gly Gly Gly Gly Val Thr Val Lys Phe Lys Tyr Lys Gly Glu 500 505 510 Glu Leu Glu Val Asp Ile Ser Lys Ile Lys Lys Val Trp Arg Val Gly 515 520 525 Lys Met Ile Ser Phe Thr Tyr Asp Asp Asn Gly Lys Thr Gly Arg Gly 530 535 540 Ala Val Ser Glu Lys Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu 545 550 555 560 Lys Ser Gly Lys Lys Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser 565 570 575 <210> 380 <211> 500 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 380 Ser Arg Ala Leu Val Val Ile Arg Leu Ser Arg Val Thr Asp Ala Thr 1 5 10 15 Thr Ser Pro Glu Arg Gln Leu Glu Ser Cys Gln Gln Leu Cys Ala Gln 20 25 30 Arg Gly Trp Asp Val Val Gly Val Ala Glu Asp Leu Asp Val Ser Gly 35 40 45 Ala Val Asp Pro Phe Asp Arg Lys Arg Arg Pro Asn Leu Ala Arg Trp 50 55 60 Leu Ala Phe Glu Glu Gln Pro Phe Asp Val Ile Val Ala Tyr Arg Val 65 70 75 80 Asp Arg Leu Thr Arg Ser Ile Arg His Leu Gln Gln Leu Val His Trp 85 90 95 Ala Glu Asp His Lys Lys Leu Val Val Ser Ala Thr Glu Ala His Phe 100 105 110 Asp Thr Thr Thr Pro Phe Ala Ala Val Val Ile Ala Leu Met Gly Thr 115 120 125 Val Ala Gln Met Glu Leu Glu Ala Ile Lys Glu Arg Asn Arg Ser Ala 130 135 140 Ala His Phe Asn Ile Arg Ala Gly Lys Tyr Arg Gly Ser Leu Pro Pro 145 150 155 160 Trp Gly Tyr Leu Pro Thr Arg Val Asp Gly Glu Trp Arg Leu Val Pro 165 170 175 Asp Pro Val Gln Arg Glu Arg Ile Leu Glu Val Tyr His Arg Val Val 180 185 190 Asp Asn His Glu Pro Leu His Leu Val Ala His Asp Leu Asn Arg Arg 195 200 205 Gly Val Leu Ser Pro Lys Asp Tyr Phe Ala Gln Leu Gln Gly Arg Glu 210 215 220 Pro Gln Gly Arg Glu Trp Ser Ala Thr Ala Leu Lys Arg Ser Met Ile 225 230 235 240 Ser Glu Ala Met Leu Gly Tyr Ala Thr Leu Asn Gly Lys Thr Val Arg 245 250 255 Asp Asp Asp Gly Ala Pro Leu Val Arg Ala Glu Pro Ile Leu Thr Arg 260 265 270 Glu Gln Leu Glu Ala Leu Arg Ala Glu Leu Val Lys Thr Ser Arg Ala 275 280 285 Lys Pro Ala Val Ser Thr Pro Ser Leu Leu Leu Arg Val Leu Phe Cys 290 295 300 Ala Val Cys Gly Glu Pro Ala Tyr Lys Phe Ala Gly Gly Gly Arg Lys 305 310 315 320 His Pro Arg Tyr Arg Cys Arg Ser Met Gly Phe Pro Lys His Cys Gly 325 330 335 Asn Gly Thr Val Ala Met Ala Glu Trp Asp Ala Phe Cys Glu Glu Gln 340 345 350 Val Leu Asp Leu Leu Gly Asp Ala Glu Arg Leu Glu Lys Val Trp Val 355 360 365 Ala Gly Ser Asp Ser Ala Val Glu Leu Ala Glu Val Asn Ala Glu Leu 370 375 380 Val Asp Leu Thr Ser Leu Ile Gly Ser Pro Ala Tyr Arg Ala Gly Ser 385 390 395 400 Pro Gln Arg Glu Ala Leu Asp Ala Arg Ile Ala Ala Leu Ala Ala Arg 405 410 415 Gln Glu Glu Leu Glu Gly Leu Glu Ala Arg Pro Ser Gly Trp Glu Trp 420 425 430 Arg Glu Thr Gly Gln Arg Phe Gly Asp Trp Trp Arg Glu Gln Asp Thr 435 440 445 Ala Ala Lys Asn Thr Trp Leu Arg Ser Met Asn Val Arg Leu Thr Phe 450 455 460 Asp Val Arg Gly Gly Leu Thr Arg Thr Ile Asp Phe Gly Asp Leu Gln 465 470 475 480 Glu Tyr Glu Gln His Leu Arg Leu Gly Ser Val Val Glu Arg Leu His 485 490 495 Thr Gly Met Ser 500 <210> 381 <211> 11344 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 381 ccgaaaagtg ccacctgacg tcgacggatc gggagatcga tctcccgatc ccctagggtc 60 gactctcagt acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg 120 tgtgttggag gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt 180 gaccgacaat tgcatgaaga atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt 240 acgggccaga tatacgcgtt gacattgatt attgactagt tattaatagt aatcaattac 300 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 360 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 420 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 480 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 540 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 600 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 660 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 720 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 780 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 840 agctggttta gtgaaccgtc agatccgcta gagatccgcg gccgctaata cgactcacta 900 tagggagagc cgccaccatg aaacggacag ccgacggaag cgagttcgag tcaccaaaga 960 agaagcggaa agtcgacaag aagtacagca tcggcctgga catcggcacc aactctgtgg 1020 gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag gtgctgggca 1080 acaccgaccg gcacagcatc aagaagaacc tgatcggagc cctgctgttc gacagcggcg 1140 aaacagccga ggccacccgg ctgaagagaa ccgccagaag aagatacacc agacggaaga 1200 accggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg gacgacagct 1260 tcttccacag actggaagag tccttcctgg tggaagagga taagaagcac gagcggcacc 1320 ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc accatctacc 1380 acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgcggctg atctatctgg 1440 ccctggccca catgatcaag ttccggggcc acttcctgat cgagggcgac ctgaaccccg 1500 acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac cagctgttcg 1560 aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc catcctgtct gccagactga 1620 gcaagagcag acggctggaa aatctgatcg cccagctgcc cggcgagaag aagaatggcc 1680 tgttcggaaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag agcaacttcg 1740 acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac gacctggaca 1800 acctgctggc ccagatcggc gaccagtacg ccgacctgtt tctggccgcc aagaacctgt 1860 ccgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc aaggcccccc 1920 tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc ctgctgaaag 1980 ctctcgtgcg gcagcagctg cctgagaagt acaaagagat tttcttcgac cagagcaaga 2040 acggctacgc cggctacatt gacggcggag ccagccagga agagttctac aagttcatca 2100 agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg aacagagagg 2160 acctgctgcg gaagcagcgg accttcgaca acggcagcat cccccaccag atccacctgg 2220 gagagctgca cgccattctg cggcggcagg aagattttta cccattcctg aaggacaacc 2280 gggaaaagat cgagaagatc ctgaccttcc gcatccccta ctacgtgggc cctctggcca 2340 ggggaaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc accccctgga 2400 acttcgagga agtggtggac aagggcgctt ccgcccagag cttcatcgag cggatgacca 2460 acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt 2520 acttcaccgt gtataacgag ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc 2580 ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc 2640 ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag tgcttcgact 2700 ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc cctgggcaca taccacgatc 2760 tgctgaaaat tatcaaggac aaggacttcc tggacaatga ggaaaacgag gacattctgg 2820 aagatatcgt gctgaccctg acactgtttg aggacagaga gatgatcgag gaacggctga 2880 aaacctatgc ccacctgttc gacgacaaag tgatgaagca gctgaagcgg cggagataca 2940 ccggctgggg caggctgagc cggaagctga tcaacggcat ccgggacaag cagtccggca 3000 agacaatcct ggatttcctg aagtccgacg gcttcgccaa cagaaacttc atgcagctga 3060 tccacgacga cagcctgacc tttaaagagg acatccagaa agcccaggtg tccggccagg 3120 gcgatagcct gcacgagcac attgccaatc tggccggcag ccccgccatt aagaagggca 3180 tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg 3240 agaacatcgt gatcgaaatg gccagagaga accagaccac ccagaaggga cagaagaaca 3300 gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga gctgggcagc cagatcctga 3360 aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg tactacctgc 3420 agaatgggcg ggatatgtac gtggaccagg aactggacat caaccggctg tccgactacg 3480 atgtggacgc tatcgtgcct cagagctttc tgaaggacga ctccatcgac aacaaggtgc 3540 tgaccagaag cgacaagaac cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga 3600 agaagatgaa gaactactgg cggcagctgc tgaacgccaa gctgattacc cagagaaagt 3660 tcgacaatct gaccaaggcc gagagaggcg gcctgagcga actggataag gccggcttca 3720 tcaagagaca gctggtggaa acccggcaga tcacaaagca cgtggcacag atcctggact 3780 cccggatgaa cactaagtac gacgagaatg acaagctgat ccgggaagtg aaagtgatca 3840 ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac aaagtgcgcg 3900 agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc 3960 tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac aaggtgtacg 4020 acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc gccaagtact 4080 tcttctacag caacatcatg aactttttca agaccgagat taccctggcc aacggcgaga 4140 tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg 4200 gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa 4260 agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag aggaacagcg 4320 ataagctgat cgccagaaag aaggactggg accctaagaa gtacggcggc ttcgacagcc 4380 ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac 4440 tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc ttcgagaaga 4500 atcccatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac ctgatcatca 4560 agctgcctaa gtactccctg ttcgagctgg aaaacggccg gaagagaatg ctggcctctg 4620 ccggcgaact gcagaaggga aacgaactgg ccctgccctc caaatatgtg aacttcctgt 4680 acctggccag ccactatgag aagctgaagg gctcccccga ggataatgag cagaaacagc 4740 tgtttgtgga acagcacaag cactacctgg acgagatcat cgagcagatc agcgagttct 4800 ccaagagagt gatcctggcc gacgctaatc tggacaaagt gctgtccgcc tacaacaagc 4860 accgggataa gcccatcaga gagcaggccg agaatatcat ccacctgttt accctgacca 4920 atctgggagc ccctgccgcc ttcaagtact ttgacaccac catcgaccgg aagaggtaca 4980 ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc ggcctgtacg 5040 agacacggat cgacctgtct cagctgggag gtgactctgg aggatctagc ggaggatcct 5100 ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt ggcggcagca 5160 gcggcggcag cagcacccta aatatagaag atgagtatcg gctacatgag acctcaaaag 5220 agccagatgt ttctctaggg tccacatggc tgtctgattt tcctcaggcc tgggcggaaa 5280 ccgggggcat gggactggca gttcgccaag ctcctctgat catacctctg aaagcaacct 5340 ctacccccgt gtccataaaa caatacccca tgtcacaaga agccagactg gggatcaagc 5400 cccacataca gagactgttg gaccagggaa tactggtacc ctgccagtcc ccctggaaca 5460 cgcccctgct acccgttaag aaaccaggga ctaatgatta taggcctgtc caggatctga 5520 gagaagtcaa caagcgggtg gaagacatcc accccaccgt gcccaaccct tacaacctct 5580 tgagcgggct cccaccgtcc caccagtggt acactgtgct tgatttaaag gatgcctttt 5640 tctgcctgag actccacccc accagtcagc ctctcttcgc ctttgagtgg agagatccag 5700 agatgggaat ctcaggacaa ttgacctgga ccagactccc acagggtttc aaaaacagtc 5760 ccaccctgtt taatgaggca ctgcacagag acctagcaga cttccggatc cagcacccag 5820 acttgatcct gctacagtac gtggatgact tactgctggc cgccacttct gagctagact 5880 gccaacaagg tactcgggcc ctgttacaaa ccctagggaa cctcgggtat cgggcctcgg 5940 ccaagaaagc ccaaatttgc cagaaacagg tcaagtatct ggggtatctt ctaaaagagg 6000 gtcagagatg gctgactgag gccagaaaag agactgtgat ggggcagcct actccgaaga 6060 cccctcgaca actaagggag ttcctaggga aggcaggctt ctgtcgcctc ttcatccctg 6120 ggtttgcaga aatggcagcc cccctgtacc ctctcaccaa accggggact ctgtttaatt 6180 ggggcccaga ccaacaaaag gcctatcaag aaatcaagca agctcttcta actgccccag 6240 ccctggggtt gccagatttg actaagccct ttgaactctt tgtcgacgag aagcagggct 6300 acgccaaagg tgtcctaacg caaaaactgg gaccttggcg tcggccggtg gcctacctgt 6360 ccaaaaagct agacccagta gcagctgggt ggcccccttg cctacggatg gtagcagcca 6420 ttgccgtact gacaaaggat gcaggcaagc taaccatggg acagccacta gtcattctgg 6480 ccccccatgc agtagaggca ctagtcaaac aaccccccga ccgctggctt tccaacgccc 6540 ggatgactca ctatcaggcc ttgcttttgg acacggaccg ggtccagttc ggaccggtgg 6600 tagccctgaa cccggctacg ctgctcccac tgcctgagga agggctgcaa cacaactgcc 6660 ttgatatcct ggccgaagcc cacggaaccc gacccgacct aacggaccag ccgctcccag 6720 acgccgacca cacctggtac acggatggaa gcagtctctt acaagaggga cagcgtaagg 6780 cgggagctgc ggtgaccacc gagaccgagg taatctgggc taaagccctg ccagccggga 6840 catccgctca gcgggctgaa ctgatagcac tcacccaggc cctaaagatg gcagaaggta 6900 agaagctaaa tgtttatact gatagccgtt atgcttttgc tactgcccat atccatggag 6960 aaatatacag aaggcgtggg tggctcacat cagaaggcaa agagatcaaa aataaagacg 7020 agatcttggc cctactaaaa gccctctttc tgcccaaaag acttagcata atccattgtc 7080 caggacatca aaagggacac agcgccgagg ctagaggcaa ccggatggct gaccaagcgg 7140 cccgaaaggc agccatcaca gagactccag acacctctac cctcctcata gaaaattcat 7200 caccctctgg cggctcaaaa agaaccgccg acggcagcga attcgagccc aagaagaaga 7260 ggaaagtcgg aagcggagct actaacttca gcctgctgaa gcaggctggc gacgtggagg 7320 agaaccctgg acctccaaaa aagaaaagaa aagtgtatcc ctatgatgtc cccgattatg 7380 ccggttcaag agccctggtc gtgattagac tgagccgagt gacagacgcc accacaagtc 7440 ccgagagaca gctggaatca tgccagcagc tctgtgctca gcggggttgg gatgtggtcg 7500 gcgtggcaga ggatctggac gtgagcgggg ccgtcgatcc attcgacaga aagaggaggc 7560 ccaacctggc aagatggctc gctttcgagg aacagccctt tgatgtgatc gtcgcctaca 7620 gagtggaccg gctgacccgc tcaattcgac atctccagca gctggtgcat tgggctgagg 7680 accacaagaa actggtggtc agcgcaacag aagcccactt cgatactacc acaccttttg 7740 ccgctgtggt catcgcactg atgggcactg tggcccagat ggagctcgaa gctatcaagg 7800 agcgaaacag gagcgcagcc catttcaata ttagggccgg taaatacaga ggctccctgc 7860 ccccttgggg atatctccct accagggtgg atggggagtg gagactggtg ccagaccccg 7920 tccagagaga gcggattctg gaagtgtacc acagagtggt cgataaccac gaaccactcc 7980 atctggtggc acacgacctg aatagacgcg gcgtgctctc tccaaaggat tattttgctc 8040 agctgcaggg aagagagcca cagggaagag aatggagtgc tactgcactg aagagatcta 8100 tgatcagtga ggctatgctg ggttacgcaa cactcaatgg caaaactgtc cgggacgatg 8160 acggagcccc tctggtgagg gctgagccta ttctcaccag agagcagctc gaagctctgc 8220 gggcagaact ggtcaagact agtcgcgcca aacctgccgt gagcacccca agcctgctcc 8280 tgagggtgct gttctgcgcc gtctgtggag agccagcata caagtttgcc ggcggagggc 8340 gcaaacatcc ccgctatcga tgcaggagca tggggttccc taagcactgt ggaaacggga 8400 cagtggccat ggctgagtgg gacgcctttt gcgaggaaca ggtgctggat ctcctgggtg 8460 acgctgagcg gctggaaaaa gtgtgggtgg caggatctga ctccgctgtg gagctggcag 8520 aagtcaatgc cgagctcgtg gatctgactt ccctcatcgg atctcctgca tatagagctg 8580 ggtccccaca gagagaagct ctggacgcac gaattgctgc actcgctgct agacaggagg 8640 aactggaggg cctggaggcc aggccctctg gatgggagtg gcgagaaacc ggacagaggt 8700 ttggggattg gtggagggag caggacaccg cagccaagaa cacatggctg agatccatga 8760 atgtccggct cacattcgac gtgcgcggtg gcctgactcg aaccatcgat tttggcgacc 8820 tgcaggagta tgaacagcac ctgagactgg ggtccgtggt cgaaagactg cacactggga 8880 tgtcctaggt ttaaacccgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg 8940 ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 9000 cctaataaaa tgagaaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 9060 gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg 9120 atgcggtggg ctctatggct tctgaggcgg aaagaaccag ctggggctcg ataccgtcga 9180 cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 9240 cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tagggtgcct 9300 aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 9360 acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 9420 ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 9480 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 9540 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 9600 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 9660 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 9720 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 9780 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 9840 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 9900 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 9960 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 10020 agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 10080 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 10140 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 10200 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 10260 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 10320 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 10380 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 10440 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 10500 tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 10560 gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 10620 gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 10680 ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 10740 cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 10800 tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 10860 cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 10920 agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 10980 cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 11040 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 11100 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 11160 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 11220 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 11280 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 11340 ttcc 11344 <210> 382 <211> 9753 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 382 ccgaaaagtg ccacctgacg tcgacggatc gggagatcga tctcccgatc ccctagggtc 60 gactctcagt acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg 120 tgtgttggag gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt 180 gaccgacaat tgcatgaaga atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt 240 acgggccaga tatacgcgtt gacattgatt attgactagt tattaatagt aatcaattac 300 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 360 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 420 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 480 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 540 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 600 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 660 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 720 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 780 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 840 agctggttta gtgaaccgtc agatccgcta gagatccgcg gccgctaata cgactcacta 900 tagggagagc cgccaccatg aaacggacag ccgacggaag cgagttcgag tcaccaaaga 960 agaagcggaa agtcgacaag aagtacagca tcggcctgga catcggcacc aactctgtgg 1020 gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag gtgctgggca 1080 acaccgaccg gcacagcatc aagaagaacc tgatcggagc cctgctgttc gacagcggcg 1140 aaacagccga ggccacccgg ctgaagagaa ccgccagaag aagatacacc agacggaaga 1200 accggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg gacgacagct 1260 tcttccacag actggaagag tccttcctgg tggaagagga taagaagcac gagcggcacc 1320 ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc accatctacc 1380 acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgcggctg atctatctgg 1440 ccctggccca catgatcaag ttccggggcc acttcctgat cgagggcgac ctgaaccccg 1500 acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac cagctgttcg 1560 aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc catcctgtct gccagactga 1620 gcaagagcag acggctggaa aatctgatcg cccagctgcc cggcgagaag aagaatggcc 1680 tgttcggaaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag agcaacttcg 1740 acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac gacctggaca 1800 acctgctggc ccagatcggc gaccagtacg ccgacctgtt tctggccgcc aagaacctgt 1860 ccgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc aaggcccccc 1920 tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc ctgctgaaag 1980 ctctcgtgcg gcagcagctg cctgagaagt acaaagagat tttcttcgac cagagcaaga 2040 acggctacgc cggctacatt gacggcggag ccagccagga agagttctac aagttcatca 2100 agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg aacagagagg 2160 acctgctgcg gaagcagcgg accttcgaca acggcagcat cccccaccag atccacctgg 2220 gagagctgca cgccattctg cggcggcagg aagattttta cccattcctg aaggacaacc 2280 gggaaaagat cgagaagatc ctgaccttcc gcatccccta ctacgtgggc cctctggcca 2340 ggggaaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc accccctgga 2400 acttcgagga agtggtggac aagggcgctt ccgcccagag cttcatcgag cggatgacca 2460 acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt 2520 acttcaccgt gtataacgag ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc 2580 ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc 2640 ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag tgcttcgact 2700 ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc cctgggcaca taccacgatc 2760 tgctgaaaat tatcaaggac aaggacttcc tggacaatga ggaaaacgag gacattctgg 2820 aagatatcgt gctgaccctg acactgtttg aggacagaga gatgatcgag gaacggctga 2880 aaacctatgc ccacctgttc gacgacaaag tgatgaagca gctgaagcgg cggagataca 2940 ccggctgggg caggctgagc cggaagctga tcaacggcat ccgggacaag cagtccggca 3000 agacaatcct ggatttcctg aagtccgacg gcttcgccaa cagaaacttc atgcagctga 3060 tccacgacga cagcctgacc tttaaagagg acatccagaa agcccaggtg tccggccagg 3120 gcgatagcct gcacgagcac attgccaatc tggccggcag ccccgccatt aagaagggca 3180 tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg 3240 agaacatcgt gatcgaaatg gccagagaga accagaccac ccagaaggga cagaagaaca 3300 gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga gctgggcagc cagatcctga 3360 aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg tactacctgc 3420 agaatgggcg ggatatgtac gtggaccagg aactggacat caaccggctg tccgactacg 3480 atgtggacgc tatcgtgcct cagagctttc tgaaggacga ctccatcgac aacaaggtgc 3540 tgaccagaag cgacaagaac cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga 3600 agaagatgaa gaactactgg cggcagctgc tgaacgccaa gctgattacc cagagaaagt 3660 tcgacaatct gaccaaggcc gagagaggcg gcctgagcga actggataag gccggcttca 3720 tcaagagaca gctggtggaa acccggcaga tcacaaagca cgtggcacag atcctggact 3780 cccggatgaa cactaagtac gacgagaatg acaagctgat ccgggaagtg aaagtgatca 3840 ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac aaagtgcgcg 3900 agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc 3960 tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac aaggtgtacg 4020 acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc gccaagtact 4080 tcttctacag caacatcatg aactttttca agaccgagat taccctggcc aacggcgaga 4140 tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg 4200 gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa 4260 agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag aggaacagcg 4320 ataagctgat cgccagaaag aaggactggg accctaagaa gtacggcggc ttcgacagcc 4380 ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac 4440 tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc ttcgagaaga 4500 atcccatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac ctgatcatca 4560 agctgcctaa gtactccctg ttcgagctgg aaaacggccg gaagagaatg ctggcctctg 4620 ccggcgaact gcagaaggga aacgaactgg ccctgccctc caaatatgtg aacttcctgt 4680 acctggccag ccactatgag aagctgaagg gctcccccga ggataatgag cagaaacagc 4740 tgtttgtgga acagcacaag cactacctgg acgagatcat cgagcagatc agcgagttct 4800 ccaagagagt gatcctggcc gacgctaatc tggacaaagt gctgtccgcc tacaacaagc 4860 accgggataa gcccatcaga gagcaggccg agaatatcat ccacctgttt accctgacca 4920 atctgggagc ccctgccgcc ttcaagtact ttgacaccac catcgaccgg aagaggtaca 4980 ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc ggcctgtacg 5040 agacacggat cgacctgtct cagctgggag gtgactctgg aggatctagc ggaggatcct 5100 ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt ggcggcagca 5160 gcggcggcag cagcacccta aatatagaag atgagtatcg gctacatgag acctcaaaag 5220 agccagatgt ttctctaggg tccacatggc tgtctgattt tcctcaggcc tgggcggaaa 5280 ccgggggcat gggactggca gttcgccaag ctcctctgat catacctctg aaagcaacct 5340 ctacccccgt gtccataaaa caatacccca tgtcacaaga agccagactg gggatcaagc 5400 cccacataca gagactgttg gaccagggaa tactggtacc ctgccagtcc ccctggaaca 5460 cgcccctgct acccgttaag aaaccaggga ctaatgatta taggcctgtc caggatctga 5520 gagaagtcaa caagcgggtg gaagacatcc accccaccgt gcccaaccct tacaacctct 5580 tgagcgggct cccaccgtcc caccagtggt acactgtgct tgatttaaag gatgcctttt 5640 tctgcctgag actccacccc accagtcagc ctctcttcgc ctttgagtgg agagatccag 5700 agatgggaat ctcaggacaa ttgacctgga ccagactccc acagggtttc aaaaacagtc 5760 ccaccctgtt taatgaggca ctgcacagag acctagcaga cttccggatc cagcacccag 5820 acttgatcct gctacagtac gtggatgact tactgctggc cgccacttct gagctagact 5880 gccaacaagg tactcgggcc ctgttacaaa ccctagggaa cctcgggtat cgggcctcgg 5940 ccaagaaagc ccaaatttgc cagaaacagg tcaagtatct ggggtatctt ctaaaagagg 6000 gtcagagatg gctgactgag gccagaaaag agactgtgat ggggcagcct actccgaaga 6060 cccctcgaca actaagggag ttcctaggga aggcaggctt ctgtcgcctc ttcatccctg 6120 ggtttgcaga aatggcagcc cccctgtacc ctctcaccaa accggggact ctgtttaatt 6180 ggggcccaga ccaacaaaag gcctatcaag aaatcaagca agctcttcta actgccccag 6240 ccctggggtt gccagatttg actaagccct ttgaactctt tgtcgacgag aagcagggct 6300 acgccaaagg tgtcctaacg caaaaactgg gaccttggcg tcggccggtg gcctacctgt 6360 ccaaaaagct agacccagta gcagctgggt ggcccccttg cctacggatg gtagcagcca 6420 ttgccgtact gacaaaggat gcaggcaagc taaccatggg acagccacta gtcattctgg 6480 ccccccatgc agtagaggca ctagtcaaac aaccccccga ccgctggctt tccaacgccc 6540 ggatgactca ctatcaggcc ttgcttttgg acacggaccg ggtccagttc ggaccggtgg 6600 tagccctgaa cccggctacg ctgctcccac tgcctgagga agggctgcaa cacaactgcc 6660 ttgatatcct ggccgaagcc cacggaaccc gacccgacct aacggaccag ccgctcccag 6720 acgccgacca cacctggtac acggatggaa gcagtctctt acaagaggga cagcgtaagg 6780 cgggagctgc ggtgaccacc gagaccgagg taatctgggc taaagccctg ccagccggga 6840 catccgctca gcgggctgaa ctgatagcac tcacccaggc cctaaagatg gcagaaggta 6900 agaagctaaa tgtttatact gatagccgtt atgcttttgc tactgcccat atccatggag 6960 aaatatacag aaggcgtggg tggctcacat cagaaggcaa agagatcaaa aataaagacg 7020 agatcttggc cctactaaaa gccctctttc tgcccaaaag acttagcata atccattgtc 7080 caggacatca aaagggacac agcgccgagg ctagaggcaa ccggatggct gaccaagcgg 7140 cccgaaaggc agccatcaca gagactccag acacctctac cctcctcata gaaaattcat 7200 caccctctgg cggctcaaaa agaaccgccg acggcagcga attcgagccc aagaagaaga 7260 ggaaagtcta accggtcatc atcaccatca ccattgagtt taaacccgct gatcagcctc 7320 gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 7380 cctggaaggt gccactccca ctgtcctttc ctaataaaat gagaaaattg catcgcattg 7440 tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 7500 ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga 7560 aagaaccagc tggggctcga taccgtcgac ctctagctag agcttggcgt aatcatggtc 7620 atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 7680 aagcataaag tgtaaagcct agggtgccta atgagtgagc taactcacat taattgcgtt 7740 gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 7800 ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 7860 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 7920 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 7980 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 8040 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 8100 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 8160 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 8220 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 8280 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 8340 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 8400 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 8460 aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 8520 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 8580 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 8640 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 8700 cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 8760 gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 8820 tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 8880 gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 8940 agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 9000 tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 9060 agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 9120 gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 9180 catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 9240 ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 9300 atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 9360 tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 9420 cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 9480 cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 9540 atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 9600 aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 9660 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 9720 aaataaacaa ataggggttc cgcgcacatt tcc 9753 <210> 383 <211> 11433 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 383 ccgaaaagtg ccacctgacg tcgacggatc gggagatcga tctcccgatc ccctagggtc 60 gactctcagt acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg 120 tgtgttggag gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt 180 gaccgacaat tgcatgaaga atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt 240 acgggccaga tatacgcgtt gacattgatt attgactagt tattaatagt aatcaattac 300 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 360 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 420 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 480 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 540 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 600 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 660 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 720 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 780 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 840 agctggttta gtgaaccgtc agatccgcta gagatccgcg gccgctaata cgactcacta 900 tagggagagc cgccaccatg cccgcggcta agagggtgaa gcttgacggt ggaaaacgga 960 cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtcgac aagaagtaca 1020 gcatcggcct ggacatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca 1080 aggtgcccag caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga 1140 acctgatcgg agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga 1200 gaaccgccag aagaagatac accagacgga agaaccggat ctgctatctg caagagatct 1260 tcagcaacga gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc 1320 tggtggaaga ggataagaag cacgagcggc accccatctt cggcaacatc gtggacgagg 1380 tggcctacca cgagaagtac cccaccatct accacctgag aaagaaactg gtggacagca 1440 ccgacaaggc cgacctgcgg ctgatctatc tggccctggc ccacatgatc aagttccggg 1500 gccacttcct gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca 1560 tccagctggt gcagacctac aaccagctgt tcgaggaaaa ccccatcaac gccagcggcg 1620 tggacgccaa ggccatcctg tctgccagac tgagcaagag cagacggctg gaaaatctga 1680 tcgcccagct gcccggcgag aagaagaatg gcctgttcgg aaacctgatt gccctgagcc 1740 tgggcctgac ccccaacttc aagagcaact tcgacctggc cgaggatgcc aaactgcagc 1800 tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt 1860 acgccgacct gtttctggcc gccaagaacc tgtccgacgc catcctgctg agcgacatcc 1920 tgagagtgaa caccgagatc accaaggccc ccctgagcgc ctctatgatc aagagatacg 1980 acgagcacca ccaggacctg accctgctga aagctctcgt gcggcagcag ctgcctgaga 2040 agtacaaaga gattttcttc gaccagagca agaacggcta cgccggctac attgacggcg 2100 gagccagcca ggaagagttc tacaagttca tcaagcccat cctggaaaag atggacggca 2160 ccgaggaact gctcgtgaag ctgaacagag aggacctgct gcggaagcag cggaccttcg 2220 acaacggcag catcccccac cagatccacc tgggagagct gcacgccatt ctgcggcggc 2280 aggaagattt ttacccattc ctgaaggaca accgggaaaa gatcgagaag atcctgacct 2340 tccgcatccc ctactacgtg ggccctctgg ccaggggaaa cagcagattc gcctggatga 2400 ccagaaagag cgaggaaacc atcaccccct ggaacttcga ggaagtggtg gacaagggcg 2460 cttccgccca gagcttcatc gagcggatga ccaacttcga taagaacctg cccaacgaga 2520 aggtgctgcc caagcacagc ctgctgtacg agtacttcac cgtgtataac gagctgacca 2580 aagtgaaata cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc gagcagaaaa 2640 aggccatcgt ggacctgctg ttcaagacca accggaaagt gaccgtgaag cagctgaaag 2700 aggactactt caagaaaatc gagtgcttcg actccgtgga aatctccggc gtggaagatc 2760 ggttcaacgc ctccctgggc acataccacg atctgctgaa aattatcaag gacaaggact 2820 tcctggacaa tgaggaaaac gaggacattc tggaagatat cgtgctgacc ctgacactgt 2880 ttgaggacag agagatgatc gaggaacggc tgaaaaccta tgcccacctg ttcgacgaca 2940 aagtgatgaa gcagctgaag cggcggagat acaccggctg gggcaggctg agccggaagc 3000 tgatcaacgg catccgggac aagcagtccg gcaagacaat cctggatttc ctgaagtccg 3060 acggcttcgc caacagaaac ttcatgcagc tgatccacga cgacagcctg acctttaaag 3120 aggacatcca gaaagcccag gtgtccggcc agggcgatag cctgcacgag cacattgcca 3180 atctggccgg cagccccgcc attaagaagg gcatcctgca gacagtgaag gtggtggacg 3240 agctcgtgaa agtgatgggc cggcacaagc ccgagaacat cgtgatcgaa atggccagag 3300 agaaccagac cacccagaag ggacagaaga acagccgcga gagaatgaag cggatcgaag 3360 agggcatcaa agagctgggc agccagatcc tgaaagaaca ccccgtggaa aacacccagc 3420 tgcagaacga gaagctgtac ctgtactacc tgcagaatgg gcgggatatg tacgtggacc 3480 aggaactgga catcaaccgg ctgtccgact acgatgtgga cgctatcgtg cctcagagct 3540 ttctgaagga cgactccatc gacaacaagg tgctgaccag aagcgacaag aaccggggca 3600 agagcgacaa cgtgccctcc gaagaggtcg tgaagaagat gaagaactac tggcggcagc 3660 tgctgaacgc caagctgatt acccagagaa agttcgacaa tctgaccaag gccgagagag 3720 gcggcctgag cgaactggat aaggccggct tcatcaagag acagctggtg gaaacccggc 3780 agatcacaaa gcacgtggca cagatcctgg actcccggat gaacactaag tacgacgaga 3840 atgacaagct gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg gtgtccgatt 3900 tccggaagga tttccagttt tacaaagtgc gcgagatcaa caactaccac cacgcccacg 3960 acgcctacct gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct aagctggaaa 4020 gcgagttcgt gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg 4080 agcaggaaat cggcaaggct accgccaagt acttcttcta cagcaacatc atgaactttt 4140 tcaagaccga gattaccctg gccaacggcg agatccggaa gcggcctctg atcgagacaa 4200 acggcgaaac cggggagatc gtgtgggata agggccggga ttttgccacc gtgcggaaag 4260 tgctgagcat gccccaagtg aatatcgtga aaaagaccga ggtgcagaca ggcggcttca 4320 gcaaagagtc tatcctgccc aagaggaaca gcgataagct gatcgccaga aagaaggact 4380 gggaccctaa gaagtacggc ggcttcgaca gccccaccgt ggcctattct gtgctggtgg 4440 tggccaaagt ggaaaagggc aagtccaaga aactgaagag tgtgaaagag ctgctgggga 4500 tcaccatcat ggaaagaagc agcttcgaga agaatcccat cgactttctg gaagccaagg 4560 gctacaaaga agtgaaaaag gacctgatca tcaagctgcc taagtactcc ctgttcgagc 4620 tggaaaacgg ccggaagaga atgctggcct ctgccggcga actgcagaag ggaaacgaac 4680 tggccctgcc ctccaaatat gtgaacttcc tgtacctggc cagccactat gagaagctga 4740 agggctcccc cgaggataat gagcagaaac agctgtttgt ggaacagcac aagcactacc 4800 tggacgagat catcgagcag atcagcgagt tctccaagag agtgatcctg gccgacgcta 4860 atctggacaa agtgctgtcc gcctacaaca agcaccggga taagcccatc agagagcagg 4920 ccgagaatat catccacctg tttaccctga ccaatctggg agcccctgcc gccttcaagt 4980 actttgacac caccatcgac cggaagaggt acaccagcac caaagaggtg ctggacgcca 5040 ccctgatcca ccagagcatc accggcctgt acgagacacg gatcgacctg tctcagctgg 5100 gaggtgactc tggaggatct agcggaggat cctctggcag cgagacacca ggaacaagcg 5160 agtcagcaac accagagagc agtggcggca gcagcggcgg cagcagcacc ctaaatatag 5220 aagatgagta tcggctacat gagacctcaa aagagccaga tgtttctcta gggtccacat 5280 ggctgtctga ttttcctcag gcctgggcgg aaaccggggg catgggactg gcagttcgcc 5340 aagctcctct gatcatacct ctgaaagcaa cctctacccc cgtgtccata aaacaatacc 5400 ccatgtcaca agaagccaga ctggggatca agccccacat acagagactg ttggaccagg 5460 gaatatggta ccctgccagt ccccctggaa cacgcccctg ctacccgtta agaaaccagg 5520 gactaatgat tataggcctg tccaggatct gagagaagtc aacaagcggg tggaagacat 5580 ccaccccacc gtgcccaacc cttacaacct cttgagcggg ctcccaccgt cccaccagtg 5640 gtacactgtg cttgatttaa aggatgcctt tttctgcctg agactccacc ccaccagtca 5700 gcctctcttc gcctttgagt ggagagatcc agagatggga atctcaggac aattgacctg 5760 gaccagactc ccacagggtt tcaaaaacag tcccaccctg tttaatgagg cactgcacag 5820 agacctagca gacttccgga tccagcaccc agacttgatc ctgctacagt acgtggatga 5880 cttactgctg gccgccactt ctgagctaga ctgccaacaa ggtactcggg ccctgttaca 5940 aaccctaggg aacctcgggt atcgggcctc ggccaagaaa gcccaaattt gccagaaaca 6000 ggtcaagtat ctggggtatc ttctaaaaga gggtcagaga tggctgactg aggccagaaa 6060 agagactgtg atggggcagc ctactccgaa gacccctcga caactaaggg agttcctagg 6120 gaaggcaggc ttctgtcgcc tcttcatccc tgggtttgca gaaatggcag cccccctgta 6180 ccctctcacc aaaccgggga ctctgtttaa ttggggccca gaccaacaaa aggcctatca 6240 agaaatcaag caagctcttc taactgcccc agccctgggg ttgccagatt tgactaagcc 6300 ctttgaactc tttgtcgacg agaagcaggg ctacgccaaa ggtgtcctaa cgcaaaaact 6360 gggaccttgg cgtcggccgg tggcctacct gtccaaaaag ctagacccag tagcagctgg 6420 gtggccccct tgcctacgga tggtagcagc cattgccgta ctgacaaagg atgcaggcaa 6480 gctaaccatg ggacagccac tagtcattct ggccccccat gcagtagagg cactagtcaa 6540 acaacccccc gaccgctggc tttccaacgc ccggatgact cactatcagg ccttgctttt 6600 ggacacggac cgggtccagt tcggaccggt ggtagccctg aacccggcta cgctgctccc 6660 actgcctgag gaagggctgc aacacaactg ccttgatatc ctggccgaag cccacggaac 6720 ccgacccgac ctaacggacc agccgctccc agacgccgac cacacctggt acacggatgg 6780 aagcagtctc ttacaagagg gacagcgtaa ggcgggagct gcggtgacca ccgagaccga 6840 ggtaatctgg gctaaagccc tgccagccgg gacatccgct cagcgggctg aactgatagc 6900 actcacccag gccctaaaga tggcagaagg taagaagcta aatgtttata ctgatagccg 6960 ttatgctttt gctactgccc atatccatgg agaaatatac agaaggcgtg ggtggctcac 7020 atcagaaggc aaagagatca aaaataaaga cgagatcttg gccctactaa aagccctctt 7080 tctgcccaaa agacttagca taatccattg tccaggacat caaaagggac acagcgccga 7140 ggctagaggc aaccggatgg ctgaccaagc ggcccgaaag gcagccatca cagagactcc 7200 agacacctct accctcctca tagaaaattc atcaccctct ggcggctcaa aaagaaccgc 7260 cgacggcagc gaaaaaagaa ccgctgactc tcaacattcc acacctccaa aaaccaagcg 7320 aaaagtggaa ttcgagccca agaagaagag gaaagtcgga agcggagcta ctaacttcag 7380 cctgctgaag caggctggcg acgtggagga gaaccctgga cctccaaaaa agaaaagaaa 7440 agtgtatccc tatgatgtcc ccgattatgc cggttcaaga gccctggtcg tgattagact 7500 gagccgagtg acagacgcca ccacaagtcc cgagagacag ctggaatcat gccagcagct 7560 ctgtgctcag cggggttggg atgtggtcgg cgtggcagag gatctggacg tgagcggggc 7620 cgtcgatcca ttcgacagaa agaggaggcc caacctggca agatggctcg ctttcgagga 7680 acagcccttt gatgtgatcg tcgcctacag agtggaccgg ctgacccgct caattcgaca 7740 tctccagcag ctggtgcatt gggctgagga ccacaagaaa ctggtggtca gcgcaacaga 7800 agcccacttc gatactacca caccttttgc cgctgtggtc atcgcactga tgggcactgt 7860 ggcccagatg gagctcgaag ctatcaagga gcgaaacagg agcgcagccc atttcaatat 7920 tagggccggt aaatacagag gctccctgcc cccttgggga tatctcccta ccagggtgga 7980 tggggagtgg agactggtgc cagaccccgt ccagagagag cggattctgg aagtgtacca 8040 cagagtggtc gataaccacg aaccactcca tctggtggca cacgacctga atagacgcgg 8100 cgtgctctct ccaaaggatt attttgctca gctgcaggga agagagccac agggaagaga 8160 atggagtgct actgcactga agagatctat gatcagtgag gctatgctgg gttacgcaac 8220 actcaatggc aaaactgtcc gggacgatga cggagcccct ctggtgaggg ctgagcctat 8280 tctcaccaga gagcagctcg aagctctgcg ggcagaactg gtcaagacta gtcgcgccaa 8340 acctgccgtg agcaccccaa gcctgctcct gagggtgctg ttctgcgccg tctgtggaga 8400 gccagcatac aagtttgccg gcggagggcg caaacatccc cgctatcgat gcaggagcat 8460 ggggttccct aagcactgtg gaaacgggac agtggccatg gctgagtggg acgccttttg 8520 cgaggaacag gtgctggatc tcctgggtga cgctgagcgg ctggaaaaag tgtgggtggc 8580 aggatctgac tccgctgtgg agctggcaga agtcaatgcc gagctcgtgg atctgacttc 8640 cctcatcgga tctcctgcat atagagctgg gtccccacag agagaagctc tggacgcacg 8700 aattgctgca ctcgctgcta gacaggagga actggagggc ctggaggcca ggccctctgg 8760 atgggagtgg cgagaaaccg gacagaggtt tggggattgg tggagggagc aggacaccgc 8820 agccaagaac acatggctga gatccatgaa tgtccggctc acattcgacg tgcgcggtgg 8880 cctgactcga accatcgatt ttggcgacct gcaggagtat gaacagcacc tgagactggg 8940 gtccgtggtc gaaagactgc acactgggat gtcctaggtt taaacccgct gatcagcctc 9000 gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 9060 cctggaaggt gccactccca ctgtcctttc ctaataaaat gagaaaattg catcgcattg 9120 tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 9180 ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga 9240 aagaaccagc tggggctcga taccgtcgac ctctagctag agcttggcgt aatcatggtc 9300 atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 9360 aagcataaag tgtaaagcct agggtgccta atgagtgagc taactcacat taattgcgtt 9420 gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 9480 ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 9540 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 9600 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 9660 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 9720 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 9780 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 9840 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 9900 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 9960 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 10020 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 10080 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 10140 aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 10200 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 10260 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 10320 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 10380 cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 10440 gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 10500 tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 10560 gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 10620 agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 10680 tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 10740 agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 10800 gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 10860 catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 10920 ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 10980 atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 11040 tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 11100 cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 11160 cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 11220 atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 11280 aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 11340 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 11400 aaataaacaa ataggggttc cgcgcacatt tcc 11433 <210> 384 <211> 11056 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 384 ccgaaaagtg ccacctgacg tcgacggatc gggagatcga tctcccgatc ccctagggtc 60 gactctcagt acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg 120 tgtgttggag gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt 180 gaccgacaat tgcatgaaga atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt 240 acgggccaga tatacgcgtt gacattgatt attgactagt tattaatagt aatcaattac 300 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 360 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 420 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 480 tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 540 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 600 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 660 catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 720 cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 780 ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 840 agctggttta gtgaaccgtc agatccgcta gagatccgcg gccgctaata cgactcacta 900 tagggagagc cgccaccatg aaacggacag ccgacggaag cgagttcgag tcaccaaaga 960 agaagcggaa agtcgacaag aagtacagca tcggcctgga catcggcacc aactctgtgg 1020 gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag gtgctgggca 1080 acaccgaccg gcacagcatc aagaagaacc tgatcggagc cctgctgttc gacagcggcg 1140 aaacagccga ggccacccgg ctgaagagaa ccgccagaag aagatacacc agacggaaga 1200 accggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg gacgacagct 1260 tcttccacag actggaagag tccttcctgg tggaagagga taagaagcac gagcggcacc 1320 ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc accatctacc 1380 acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgcggctg atctatctgg 1440 ccctggccca catgatcaag ttccggggcc acttcctgat cgagggcgac ctgaaccccg 1500 acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac cagctgttcg 1560 aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc catcctgtct gccagactga 1620 gcaagagcag acggctggaa aatctgatcg cccagctgcc cggcgagaag aagaatggcc 1680 tgttcggaaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag agcaacttcg 1740 acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac gacctggaca 1800 acctgctggc ccagatcggc gaccagtacg ccgacctgtt tctggccgcc aagaacctgt 1860 ccgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc aaggcccccc 1920 tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc ctgctgaaag 1980 ctctcgtgcg gcagcagctg cctgagaagt acaaagagat tttcttcgac cagagcaaga 2040 acggctacgc cggctacatt gacggcggag ccagccagga agagttctac aagttcatca 2100 agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg aacagagagg 2160 acctgctgcg gaagcagcgg accttcgaca acggcagcat cccccaccag atccacctgg 2220 gagagctgca cgccattctg cggcggcagg aagattttta cccattcctg aaggacaacc 2280 gggaaaagat cgagaagatc ctgaccttcc gcatccccta ctacgtgggc cctctggcca 2340 ggggaaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc accccctgga 2400 acttcgagga agtggtggac aagggcgctt ccgcccagag cttcatcgag cggatgacca 2460 acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt 2520 acttcaccgt gtataacgag ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc 2580 ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc 2640 ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag tgcttcgact 2700 ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc cctgggcaca taccacgatc 2760 tgctgaaaat tatcaaggac aaggacttcc tggacaatga ggaaaacgag gacattctgg 2820 aagatatcgt gctgaccctg acactgtttg aggacagaga gatgatcgag gaacggctga 2880 aaacctatgc ccacctgttc gacgacaaag tgatgaagca gctgaagcgg cggagataca 2940 ccggctgggg caggctgagc cggaagctga tcaacggcat ccgggacaag cagtccggca 3000 agacaatcct ggatttcctg aagtccgacg gcttcgccaa cagaaacttc atgcagctga 3060 tccacgacga cagcctgacc tttaaagagg acatccagaa agcccaggtg tccggccagg 3120 gcgatagcct gcacgagcac attgccaatc tggccggcag ccccgccatt aagaagggca 3180 tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg 3240 agaacatcgt gatcgaaatg gccagagaga accagaccac ccagaaggga cagaagaaca 3300 gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga gctgggcagc cagatcctga 3360 aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg tactacctgc 3420 agaatgggcg ggatatgtac gtggaccagg aactggacat caaccggctg tccgactacg 3480 atgtggacgc tatcgtgcct cagagctttc tgaaggacga ctccatcgac aacaaggtgc 3540 tgaccagaag cgacaagaac cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga 3600 agaagatgaa gaactactgg cggcagctgc tgaacgccaa gctgattacc cagagaaagt 3660 tcgacaatct gaccaaggcc gagagaggcg gcctgagcga actggataag gccggcttca 3720 tcaagagaca gctggtggaa acccggcaga tcacaaagca cgtggcacag atcctggact 3780 cccggatgaa cactaagtac gacgagaatg acaagctgat ccgggaagtg aaagtgatca 3840 ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac aaagtgcgcg 3900 agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc 3960 tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac aaggtgtacg 4020 acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc gccaagtact 4080 tcttctacag caacatcatg aactttttca agaccgagat taccctggcc aacggcgaga 4140 tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg 4200 gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa 4260 agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag aggaacagcg 4320 ataagctgat cgccagaaag aaggactggg accctaagaa gtacggcggc ttcgacagcc 4380 ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac 4440 tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc ttcgagaaga 4500 atcccatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac ctgatcatca 4560 agctgcctaa gtactccctg ttcgagctgg aaaacggccg gaagagaatg ctggcctctg 4620 ccggcgaact gcagaaggga aacgaactgg ccctgccctc caaatatgtg aacttcctgt 4680 acctggccag ccactatgag aagctgaagg gctcccccga ggataatgag cagaaacagc 4740 tgtttgtgga acagcacaag cactacctgg acgagatcat cgagcagatc agcgagttct 4800 ccaagagagt gatcctggcc gacgctaatc tggacaaagt gctgtccgcc tacaacaagc 4860 accgggataa gcccatcaga gagcaggccg agaatatcat ccacctgttt accctgacca 4920 atctgggagc ccctgccgcc ttcaagtact ttgacaccac catcgaccgg aagaggtaca 4980 ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc ggcctgtacg 5040 agacacggat cgacctgtct cagctgggag gtgactctgg aggatctagc ggaggatcct 5100 ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagctct ggtagcgaga 5160 cacccggtac cagtgaaagc gccacgccag aaagcagtgg gagtgagact ccgggtacat 5220 ctgaatcagc gacaccggaa tcaagtggcg gcagcagcgg cggcagcagc accctaaata 5280 tagaagatga gtatcggcta catgagacct caaaagagcc agatgtttct ctagggtcca 5340 catggctgtc tgattttcct caggcctggg cggaaaccgg gggcatggga ctggcagttc 5400 gccaagctcc tctgatcata cctctgaaag caacctctac ccccgtgtcc ataaaacaat 5460 accccatgtc acaagaagcc agactgggga tcaagcccca catacagaga ctgttggacc 5520 agggaatact ggtaccctgc cagtccccct ggaacacgcc cctgctaccc gttaagaaac 5580 cagggactaa tgattatagg cctgtccagg atctgagaga agtcaacaag cgggtggaag 5640 acatccaccc caccgtgccc aacccttaca acctcttgag cgggccccca ccgtcccacc 5700 agtggtacac tgtgcttgat ttaaaggatg cctttttctg cctgagactc caccccacca 5760 gtcagcctct cttcgccttt gagtggagag atccagagat gggaatctca ggacaattga 5820 cctggaccag actcccacag ggtttcaaaa acagtcccac cctgtttaat gaggcactgc 5880 acagagacct agcagacttc cggatccagc acccagactt gatcctgcta cagtacgtgg 5940 atgacttact gctggccgcc acttctgagc tagactgcca acaaggtact cgggccctgt 6000 tacaaaccct agggaacctc gggtatcggg cctcggccaa gaaagcccaa atttgccaga 6060 aacaggtcaa gtatctgggg tatcttctaa aagagggtca gagatggctg actgaggcca 6120 gaaaagagac tgtgatgggg cagcctactc cgaagacccc tcgacaacta agggagttcc 6180 tagggaaggc aggcttctgt cgcctcttca tccctgggtt tgcagaaatg gcagcccccc 6240 tgtaccctct caccaaaccg gggactctgt ttaattgggg cccagaccaa caaaaggcct 6300 atcaagaaat caagcaagct cttctaactg ccccagccct ggggttgcca gatttgacta 6360 agccctttga actctttgtc gacgagaagc agggctacgc caaaggtgtc ctaacgcaaa 6420 aactgggacc ttggcgtcgg ccggtggcct acctgtccaa aaagctagac ccagtagcag 6480 ctgggtggcc cccttgccta cggatggtag cagccattgc cgtactgaca aaggatgcag 6540 gcaagctaac catgggacag ccactagtca ttctggcccc ccatgcagta gaggcactag 6600 tcaaacaacc ccccgaccgc tggctttcca acgcccggat gactcactat caggccttgc 6660 ttttggacac ggaccgggtc cagttcggac cggtggtagc cctgaacccg gctacgctgc 6720 tcccactgcc tgaggaaggg ctgcaacaca actgccttga tgggacaggt ggcggtggtg 6780 tcaccgtcaa gttcaagtac aagggtgagg aacttgaagt tgatattagc aaaatcaaga 6840 aggtttggcg cgttggtaaa atgatatctt ttacttatga cgacaacggc aagacaggta 6900 gaggggcagt gtctgagaaa gacgccccca aggagctgtt gcaaatgttg gaaaagtctg 6960 ggaaaaagtc tggcggctca aaaagaaccg ccgacggcag cgaattcgag cccaagaaga 7020 agaggaaagt cggaggtggc gggagcccaa aaaagaaaag aaaagtgtat ccctatgatg 7080 tccccgatta tgccggttca agagccctgg tcgtgattag actgagccga gtgacagacg 7140 ccaccacaag tcccgagaga cagctggaat catgccagca gctctgtgct cagcggggtt 7200 gggatgtggt cggcgtggca gaggatctgg acgtgagcgg ggccgtcgat ccattcgaca 7260 gaaagaggag gcccaacctg gcaagatggc tcgctttcga ggaacagccc tttgatgtga 7320 tcgtcgccta cagagtggac cggctgaccc gctcaattcg acatctccag cagctggtgc 7380 attgggctga ggaccacaag aaactggtgg tcagcgcaac agaagcccac ttcgatacta 7440 ccacaccttt tgccgctgtg gtcatcgcac tgatgggcac tgtggcccag atggagctcg 7500 aagctatcaa ggagcgaaac aggagcgcag cccatttcaa tattagggcc ggtaaataca 7560 gaggctccct gcccccttgg ggatatctcc ctaccagggt ggatggggag tggagactgg 7620 tgccagaccc cgtccagaga gagcggattc tggaagtgta ccacagagtg gtcgataacc 7680 acgaaccact ccatctggtg gcacacgacc tgaatagacg cggcgtgctc tctccaaagg 7740 attattttgc tcagctgcag ggaagagagc cacagggaag agaatggagt gctactgcac 7800 tgaagagatc tatgatcagt gaggctatgc tgggttacgc aacactcaat ggcaaaactg 7860 tccgggacga tgacggagcc cctctggtga gggctgagcc tattctcacc agagagcagc 7920 tcgaagctct gcgggcagaa ctggtcaaga ctagtcgcgc caaacctgcc gtgagcaccc 7980 caagcctgct cctgagggtg ctgttctgcg ccgtctgtgg agagccagca tacaagtttg 8040 ccggcggagg gcgcaaacat ccccgctatc gatgcaggag catggggttc cctaagcact 8100 gtggaaacgg gacagtggcc atggctgagt gggacgcctt ttgcgaggaa caggtgctgg 8160 atctcctggg tgacgctgag cggctggaaa aagtgtgggt ggcaggatct gactccgctg 8220 tggagctggc agaagtcaat gccgagctcg tggatctgac ttccctcatc ggatctcctg 8280 catatagagc tgggtcccca cagagagaag ctctggacgc acgaattgct gcactcgctg 8340 ctagacagga ggaactggag ggcctggagg ccaggccctc tggatgggag tggcgagaaa 8400 ccggacagag gtttggggat tggtggaggg agcaggacac cgcagccaag aacacatggc 8460 tgagatccat gaatgtccgg ctcacattcg acgtgcgcgg tggcctgact cgaaccatcg 8520 attttggcga cctgcaggag tatgaacagc acctgagact ggggtccgtg gtcgaaagac 8580 tgcacactgg gatgtcctag gtttaaaccc gctgatcagc ctcgactgtg ccttctagtt 8640 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 8700 ccactgtcct ttcctaataa aatgagaaaa ttgcatcgca ttgtctgagt aggtgtcatt 8760 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 8820 ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc agctggggct 8880 cgataccgtc gacctctagc tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt 8940 gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 9000 cctagggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 9060 tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 9120 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 9180 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 9240 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 9300 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 9360 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 9420 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 9480 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 9540 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 9600 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 9660 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 9720 cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 9780 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 9840 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 9900 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 9960 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 10020 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 10080 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 10140 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 10200 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 10260 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 10320 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 10380 acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 10440 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 10500 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 10560 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 10620 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 10680 gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 10740 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 10800 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 10860 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 10920 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 10980 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 11040 ttccgcgcac atttcc 11056 <210> 385 <211> 2367 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 385 tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 60 ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 120 taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 180 tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 240 aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtcgct agctgtacaa 300 aaaagcaggc tttaaaggaa ccaattcagt cgactggatc cggtaccaag gtcgggcagg 360 aagagggcct atttcccatg attccttcat atttgcatat acgatacaag gctgttagag 420 agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat acgtgacgta 480 gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa atggactatc 540 atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc ttgtggaaag 600 gacgaaacac cgctattctc gcagctcacc agttttagag ctagaaatag caagttaaaa 660 taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgac gagcgcggcg 720 atatcatcat ccatggccgg atgatcctga cgacggagac cgccgtcgtc gacaagccgg 780 cctgagctgc gagaattttt ttaagcttgg gccgctcgag gtacctctct acatatgaca 840 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 900 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 960 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 1020 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 1080 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 1140 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 1200 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 1260 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 1320 actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 1380 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 1440 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 1500 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 1560 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 1620 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 1680 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 1740 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 1800 atccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 1860 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 1920 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 1980 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 2040 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 2100 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 2160 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 2220 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 2280 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 2340 ggcgaaaact ctcaaggatc ttaccgc 2367 <210> 386 <211> 2280 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 386 ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 60 tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 120 ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 180 caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 240 gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 300 atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 360 accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 420 aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 480 gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 540 tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 600 aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 660 ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 720 aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtcgcta gctgtacaaa 780 aaagcaggct ttaaaggaac caattcagtc gactggatcc ggtaccaagg tcgggcagga 840 agagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 900 gataattaga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 960 aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 1020 tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 1080 acgaaacacc gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat 1140 aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgttt ttttaagctt 1200 gggccgctcg aggtacctct ctacatatga catgtgagca aaaggccagc aaaaggccag 1260 gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 1320 tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 1380 ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 1440 atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 1500 gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 1560 tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 1620 cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 1680 cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt 1740 tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 1800 cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 1860 cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 1920 gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 1980 gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 2040 gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 2100 ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 2160 atctggcccc agtgctgcaa tgataccgcg agatccacgc tcaccggctc cagatttatc 2220 agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 2280 <210> 387 <211> 6386 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 387 tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt 60 tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120 cagctatgac catgaggcgc gccggattcg acattgatta ttgactagtt attaatagta 180 atcaattacg gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac 240 ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac 300 gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt 360 acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat 420 tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga 480 ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgg tcgaggtgag 540 ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa ttttgtattt 600 atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc 660 rggsggggsg gggsggggsg rggggsgggg sggggsgagg cggagaggtg cggcggcagc 720 caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc 780 ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc 840 ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt tactcccaca 900 ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg tttaatgacg 960 gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg gccctttgtg 1020 cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg 1080 ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg 1140 cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg ggggctgcga 1200 ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg gtgtgggcgc 1260 gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc acggcccggc 1320 ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg 1380 gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga 1440 ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg 1500 ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga 1560 gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg 1620 cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct 1680 tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg 1740 cagggcgggg ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt 1800 tcatgccttc ttctttttcc tacagatcct taattaataa tacgactcac tatagggggt 1860 cgacccgcca ccatgccaaa aaagaaaaga aaagtgtatc cctatgatgt ccccgattat 1920 gccggttcaa gagccctggt cgtgattaga ctgagccgag tgacagacgc caccacaagt 1980 cccgagagac agctggaatc atgccagcag ctctgtgctc agcggggttg ggatgtggtc 2040 ggcgtggcag aggatctgga cgtgagcggg gccgtcgatc cattcgacag aaagaggagg 2100 cccaacctgg caagatggct cgctttcgag gaacagccct ttgatgtgat cgtcgcctac 2160 agagtggacc ggctgacccg ctcaattcga catctccagc agctggtgca ttgggctgag 2220 gaccacaaga aactggtggt cagcgcaaca gaagcccact tcgatactac cacacctttt 2280 gccgctgtgg tcatcgcact gatgggcact gtggcccaga tggagctcga agctatcaag 2340 gagcgaaaca ggagcgcagc ccatttcaat attagggccg gtaaatacag aggctccctg 2400 cccccttggg gatatctccc taccagggtg gatggggagt ggagactggt gccagacccc 2460 gtccagagag agcggattct ggaagtgtac cacagagtgg tcgataacca cgaaccactc 2520 catctggtgg cacacgacct gaatagacgc ggcgtgctct ctccaaagga ttattttgct 2580 cagctgcagg gaagagagcc acagggaaga gaatggagtg ctactgcact gaagagatct 2640 atgatcagtg aggctatgct gggttacgca acactcaatg gcaaaactgt ccgggacgat 2700 gacggagccc ctctggtgag ggctgagcct attctcacca gagagcagct cgaagctctg 2760 cgggcagaac tggtcaagac tagtcgcgcc aaacctgccg tgagcacccc aagcctgctc 2820 ctgagggtgc tgttctgcgc cgtctgtgga gagccagcat acaagtttgc cggcggaggg 2880 cgcaaacatc cccgctatcg atgcaggagc atggggttcc ctaagcactg tggaaacggg 2940 acagtggcca tggctgagtg ggacgccttt tgcgaggaac aggtgctgga tctcctgggt 3000 gacgctgagc ggctggaaaa agtgtgggtg gcaggatctg actccgctgt ggagctggca 3060 gaagtcaatg ccgagctcgt ggatctgact tccctcatcg gatctcctgc atatagagct 3120 gggtccccac agagagaagc tctggacgca cgaattgctg cactcgctgc tagacaggag 3180 gaactggagg gcctggaggc caggccctct ggatgggagt ggcgagaaac cggacagagg 3240 tttggggatt ggtggaggga gcaggacacc gcagccaaga acacatggct gagatccatg 3300 aatgtccggc tcacattcga cgtgcgcggt ggcctgactc gaaccatcga ttttggcgac 3360 ctgcaggagt atgaacagca cctgagactg gggtccgtgg tcgaaagact gcacactggg 3420 atgtcctagg tcagagctcg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 3480 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 3540 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 3600 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 3660 gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc gagatccact 3720 agttctagcc tcgaggctag agcggccgcc actggccgtc gttttacaac gtcgtgactg 3780 ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg 3840 gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 3900 cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 3960 cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 4020 tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 4080 ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 4140 tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 4200 taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 4260 tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 4320 aaaatttaac gcgaatttta acaaaatatt aacgcttacr mktymsrtks smcwttymgg 4380 sgaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 4440 ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 4500 attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 4560 gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 4620 ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 4680 cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 4740 gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 4800 tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 4860 gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 4920 ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 4980 tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 5040 gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 5100 caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 5160 cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 5220 atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 5280 gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 5340 attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 5400 cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 5460 atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 5520 tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 5580 ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 5640 ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta gttaggccac 5700 cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 5760 gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 5820 gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 5880 acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 5940 gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 6000 agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 6060 tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 6120 agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 6180 cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 6240 gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 6300 ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 6360 aggtttcccg actggaaagc gggcag 6386 <210> 388 <211> 6317 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 388 gattcgacat tgattattga ctagttatta atagtaatca attacggggt cattagttca 60 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 120 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 180 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 240 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 300 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 360 cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 420 catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 480 agcgatgggg gcgggggggg ggggggggcg cgcgccrggs ggggsggggs ggggsgrggg 540 gsggggsggg gsgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 600 gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 660 ggcgggagtc gctgcgcgct gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg 720 cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg acggcccttc 780 tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc tgtggctgcg 840 tgaaagcctt gaggggctcc gggagggccc tttgtgcggg gggagcggct cggggggtgc 900 gtgcgtgtgt gtgtgcgtgg ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga 960 gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc 1020 cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg 1080 tgtgtgcgtg ggggggtgag cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct 1140 gcacccccct ccccgagttg ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg 1200 gcgtggcgcg gggctcgccg tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg 1260 ggcggggccg cctcgggccg gggagggctc gggggagggg cgcggcggcc cccggagcgc 1320 cggcggctgt cgaggcgcgg cgagccgcag ccattgcctt ttatggtaat cgtgcgagag 1380 ggcgcaggga cttcctttgt cccaaatctg tgcggagccg aaatctggga ggcgccgccg 1440 caccccctct agcgggcgcg gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg 1500 ggagggcctt cgtgcgtcgc cgcgccgccg tccccttctc cctctccagc ctcggggctg 1560 tccgcggggg gacggctgcc ttcggggggg acggggcagg gcggggttcg gcttctggcg 1620 tgtgaccggc ggctctagag cctctgctaa ccatgttcat gccttcttct ttttcctaca 1680 gatccttaat taataatacg actcactata gggggtcgac ccgccaccat gacagcgcca 1740 aagaaaaaga ggaaggtcat gaccaagaaa gtggccatct atactagagt gagcacaacg 1800 aatcaggccg aggaggggtt ctctattgac gagcaaatcg atcgtctgac caagtacgcg 1860 gaagcaatgg gctggcaagt cagcgacact tacaccgatg ctgggttctc cggcgccaaa 1920 ctggaaaggc ctgccatgca gcggctgatt aacgacattg agaacaaggc ctttgataca 1980 gtgctcgtat acaagctcga caggctcagc cgatctgtgc gggacacgct ttacctcgta 2040 aaggatgttt tcactaagaa taaaatcgac ttcattagcc tgaacgaatc cattgacacc 2100 agctcagcta tgggctctct gttcctgacc atcctgagcg ctatcaatga gtttgagagg 2160 gagaatataa aggagcgcat gacaatggga aagctgggta gagcgaagtc cgggaaatct 2220 atgatgtgga ccaagaccgc ttttggatac taccacaata ggaagacggg cattctggag 2280 atcgtgccct tgcaggcaac catcgttgag cagatcttca ccgactacct gagcggaata 2340 tctctcacga agttgcgaga taagctgaat gagagcggac acattggcaa ggatattcct 2400 tggtcatata gaaccctccg ccaaactctg gataatccgg tgtactgcgg ttacatcaag 2460 ttcaaagaca gcctcttcga gggaatgcat aaacctatca ttccatacga gacatacctg 2520 aaagtccaaa aggaactcga agagcgccag caacagactt acgaacggaa taataatccc 2580 aggcctttcc aggccaaata tatgctgtcc ggcatggcaa gatgcggata ctgcggggca 2640 ccactcaaga ttgtgcttgg ccataaacgg aaggatggaa gcagaaccat gaaatatcac 2700 tgcgcaaacc gctttccaag gaaaacgaag gggattaccg tgtacaatga caacaaaaaa 2760 tgtgatagcg gaacctacga tctgtccaac ttggaaaaca ccgtcattga caatttaatt 2820 ggatttcagg aaaataatga cagccttctg aagattatca acgggaacaa tcagccgatt 2880 ctggacactt catctttcaa aaaacagatc tctcagattg ataagaaaat tcagaaaaat 2940 tccgatttat acctcaatga tttcataacg atggatgagc tgaaggaccg gaccgacagt 3000 ttgcaggccg agaagaaact gctgaaagca aagatctccg agaacaagtt caatgacagt 3060 accgatgtct tcgagttggt gaagacccag ctgggtagta tcccaatcaa cgagttgagc 3120 tatgacaata agaagaagat tgttaataac ctggtgagca aagtggacgt gaccgctgat 3180 aacgtggata ttatcttcaa gttccagctg gcctgagtca gagctcgctg atcagcctcg 3240 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3300 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3360 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3420 tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 3480 agaaccagct ggggctcgag atccactagt tctagcctcg aggctagagc ggccgccact 3540 ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 3600 tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 3660 ttcccaacag ttgcgcagcc tgaatggcga atgggacgcg ccctgtagcg gcgcattaag 3720 cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 3780 cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 3840 tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 3900 aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 3960 ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 4020 actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 4080 ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 4140 gcttacrmkt ymsrtkssmc wttymggsga aatgtgcgcg gaacccctat ttgtttattt 4200 ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa 4260 taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt 4320 tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat 4380 gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag 4440 atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg 4500 ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata 4560 cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat 4620 ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc 4680 aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg 4740 ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac 4800 gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact 4860 ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa 4920 gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct 4980 ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc 5040 tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga 5100 cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac 5160 tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag 5220 atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 5280 tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 5340 tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 5400 ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt 5460 cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 5520 ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 5580 gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 5640 tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 5700 gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 5760 ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 5820 tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 5880 ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 5940 tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt 6000 attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag 6060 tcagtgagcg aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg 6120 ccgattcatt aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc 6180 aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt 6240 ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat 6300 gaccatgagg cgcgccg 6317 <210> 389 <211> 6638 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 389 gattcgacat tgattattga ctagttatta atagtaatca attacggggt cattagttca 60 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 120 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 180 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 240 acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 300 cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 360 cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 420 catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 480 agcgatgggg gcgggggggg ggggggggcg cgcgccrggs ggggsggggs ggggsgrggg 540 gsggggsggg gsgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 600 gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 660 ggcgggagtc gctgcgcgct gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg 720 cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg acggcccttc 780 tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc tgtggctgcg 840 tgaaagcctt gaggggctcc gggagggccc tttgtgcggg gggagcggct cggggggtgc 900 gtgcgtgtgt gtgtgcgtgg ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga 960 gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc 1020 cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg 1080 tgtgtgcgtg ggggggtgag cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct 1140 gcacccccct ccccgagttg ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg 1200 gcgtggcgcg gggctcgccg tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg 1260 ggcggggccg cctcgggccg gggagggctc gggggagggg cgcggcggcc cccggagcgc 1320 cggcggctgt cgaggcgcgg cgagccgcag ccattgcctt ttatggtaat cgtgcgagag 1380 ggcgcaggga cttcctttgt cccaaatctg tgcggagccg aaatctggga ggcgccgccg 1440 caccccctct agcgggcgcg gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg 1500 ggagggcctt cgtgcgtcgc cgcgccgccg tccccttctc cctctccagc ctcggggctg 1560 tccgcggggg gacggctgcc ttcggggggg acggggcagg gcggggttcg gcttctggcg 1620 tgtgaccggc ggctctagag cctctgctaa ccatgttcat gccttcttct ttttcctaca 1680 gatccttaat taataatacg actcactata gggggtcgac ccgccaccat gcccaagaag 1740 aaacggaaag tgatgagccc ctttatcgcc ccggacgtgc ccgagcacct cctggacact 1800 gtgcgcgtct ttctgtacgc ccgtcagagt aaaggacggt cagatggatc tgacgtgtcc 1860 accgaagcac agctcgctgc cggacgggcc cttgttgcct caagaaacgc acaaggggga 1920 gctagatggg tggtggcggg cgaattcgtg gatgtgggca gatcagggtg ggacccgaat 1980 gtgacacgcg ccgacttcga aagaatgatg ggcgaggtgc gcgccggtga gggagacgta 2040 gtggtggtta atgaactgag tcgccttacg aggaagggcg cccacgacgc tctggagatc 2100 gataacgaac tcaaaaaaca cggtgtgcgg ttcatgagcg tgctggaacc attcctggat 2160 accagcaccc caatcggtgt cgcgatcttt gccctgattg ccgcgctcgc taaacaggat 2220 tcagacctta aagctgagcg gctgaagggg gctaaagatg agatcgctgc cttggggggt 2280 gtgcacagct catctgcgcc attcggcatg agggcggtca gaaagaaagt ggataacctg 2340 gtcatatctg ttctggagcc tgatgaggac aacccggacc acgttgagct tgtggaacgg 2400 atggctaaga tgtctttcga aggcgtcagc gataacgcaa ttgccacaac atttgagaag 2460 gagaaaatcc cctctccggg gatggctgag agacgagcca cggagaagag gcttgcttct 2520 attaaggcac ggaggctcaa tggcgccgaa aagccgatca tgtggcgggc gcagacagtt 2580 agatggattc ttaaccatcc cgcgattggt ggattcgcat tcgagcgggt gaaacacgga 2640 aaagcccaca tcaacgtgat acgaagagat cccggcggca aaccccttac ccctcacact 2700 ggtatcctgt ctggatccaa gtggttggaa ctccaggaga agagaagcgg gaaaaatctc 2760 tccgaccgca aaccaggtgc cgaagtggaa cctacgctgc tttccgggtg gagatttctg 2820 ggatgtcgga tatgcggtgg gtcaatgggc cagtcccaag ggggccgtaa gaggaatggg 2880 gacttggctg agggcaatta catgtgtgca aacccaaagg ggcacggcgg tctgagcgtc 2940 aagaggtctg agcttgatga attcgtggca tcaaaagtct gggccaggtt gcgcacggct 3000 gacatggagg atgaacatga ccaagcatgg attgcagctg cagctgaacg gtttgctttg 3060 cagcacgacc tggcgggggt agctgacgag cgacgggagc aacaagctca cctggataac 3120 gttcggagat caataaaaga tctccaggcg gataggaagg caggtctcta cgtgggacgc 3180 gaagaactgg agacctggcg cagtaccgtc ctgcaatata ggagctacga ggctgagtgt 3240 actactaggt tggctgagct ggatgaaaaa atgaatggat ccacccgggt gccttcagaa 3300 tggtttagcg gcgaggaccc aaccgcggaa ggaggcatat gggcgagctg ggatgtctat 3360 gagcgccggg agtttctcag cttttttttg gactccgtaa tggttgacag gggcagacat 3420 cctgaaacca agaaatatat accattgaaa gaccgggtga ccttaaagtg ggcggagctg 3480 ttaaaggaag aggatgaagc aagcgaggcc acagaacggg agctggcagc tctttaggtc 3540 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 3600 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 3660 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 3720 caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 3780 tctatggctt ctgaggcgga aagaaccagc tggggctcga gatccactag ttctagcctc 3840 gaggctagag cggccgccac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 3900 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 3960 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc 4020 gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 4080 acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 4140 cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 4200 tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 4260 gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 4320 cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 4380 gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 4440 gaattttaac aaaatattaa cgcttacrmk tymsrtkssm cwttymggsg aaatgtgcgc 4500 ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 4560 taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 4620 cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 4680 acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 4740 ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 4800 atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 4860 gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 4920 acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 4980 atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 5040 accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 5100 ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 5160 acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 5220 gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 5280 tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 5340 ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 5400 actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 5460 taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 5520 tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 5580 gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 5640 cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 5700 gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 5760 gcgcagatac caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac 5820 tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 5880 ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 5940 cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 6000 gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 6060 gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 6120 gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 6180 cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 6240 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 6300 cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 6360 cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 6420 ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac 6480 tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt agctcactca ttaggcaccc 6540 caggctttac actttatgct tccggctcgt atgttgtgtg gaattgtgag cggataacaa 6600 tttcacacag gaaacagcta tgaccatgag gcgcgccg 6638 <210> 390 <211> 9530 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 390 taatcagcat catgatgtgg taccacatca tgatgctgat tataagaatg cggccgccac 60 actctagtgg atctcgagtt aataattcag aagaactcgt caagaaggcg atagaaggcg 120 atgcgctgcg aatcgggagc ggcgataccg taaagcacga ggaagcggtc agcccattcg 180 ccgccaagct cttcagcaat atcacgggta gccaacgcta tgtcctgata gcggtccgcc 240 acacccagcc ggccacagtc gatgaatcca gaaaagcggc cattttccac catgatattc 300 ggcaagcagg catcgccatg ggtcacgacg agatcctcgc cgtcgggcat gctcgccttg 360 agcctggcga acagttcggc tggcgcgagc ccctgatgct cttcgtccag atcatcctga 420 tcgacaagac cggcttccat ccgagtacgt gctcgctcga tgcgatgttt cgcttggtgg 480 tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc gcattgcatc agccatgatg 540 gatactttct cggcaggagc aaggtgtaga tgacatggag atcctgcccc ggcacttcgc 600 ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa 660 cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac 720 cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg 780 cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc 840 aagcggccgg agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc 900 ctgtctcttg atcagagctt gatcccctgc gccatcagat ccttggcggc gagaaagcca 960 tccagtttac tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg 1020 gttcgcttgc tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag 1080 ctacctgctt tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat 1140 tcatccgggg tcagcaccgt ttctgcggac tggctttcta cgtgctcgag gggggccaaa 1200 cggtctccag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa 1260 atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt 1320 cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg 1380 gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga 1440 aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa 1500 atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac 1560 gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt 1620 ttgcgtttct acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc 1680 atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 1740 atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 1800 aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 1860 aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 1920 ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 1980 ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 2040 tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 2100 ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 2160 acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 2220 gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 2280 cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 2340 aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 2400 atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 2460 gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 2520 gaagagcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata 2580 tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc 2640 tatcgctacg tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc 2700 cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 2760 gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt 2820 cgcgcgcgaa ggcgaagcgg catgcataat gtgcctgtca aatggacgaa gcagggattc 2880 tgcaaaccct atgctactcc gtcaagccgt caattgtctg attcgttacc aattatgaca 2940 acttgacggc tacatcattc actttttctt cacaaccggc acggaactcg ctcgggctgg 3000 ccccggtgca ttttttaaat acccgcgaga aatagagttg atcgtcaaaa ccaacattgc 3060 gaccgacggt ggcgataggc atccgggtgg tgctcaaaag cagcttcgcc tggctgatac 3120 gttggtcctc gcgccagctt aagacgctaa tccctaactg ctggcggaaa agatgtgaca 3180 gacgcgacgg cgacaagcaa acatgctgtg cgacgctggc gatacattac cctgttatcc 3240 ctagatgaca ttaccctgtt atcccagatg acattaccct gttatcccta gatgacatta 3300 ccctgttatc cctagatgac atttaccctg ttatccctag atgacattac cctgttatcc 3360 cagatgacat taccctgtta tccctagata cattaccctg ttatcccaga tgacataccc 3420 tgttatccct agatgacatt accctgttat cccagatgac attaccctgt tatccctaga 3480 tacattaccc tgttatccca gatgacatac cctgttatcc ctagatgaca ttaccctgtt 3540 atcccagatg acattaccct gttatcccta gatacattac cctgttatcc cagatgacat 3600 accctgttat ccctagatga cattaccctg ttatcccaga tgacattacc ctgttatccc 3660 tagatacatt accctgttat cccagatgac ataccctgtt atccctagat gacattaccc 3720 tgttatccca gatgacatta ccctgttatc cctagataca ttaccctgtt atcccagatg 3780 acataccctg ttatccctag atgacattac cctgttatcc cagatgacat taccctgtta 3840 tccctagata cattaccctg ttatcccaga tgacataccc tgttatccct agatgacatt 3900 accctgttat cccagataaa ctcaatgatg atgatgatga tggtcgagac tcagcggccg 3960 cggtgccagg gcgtgccctt gggctccccg ggcgcgacta taagctgcga gcaacttcac 4020 ttgggtatgc cggcggtagc gctgagggcc tatttcccat gattccttca tatttgcata 4080 tacgatacaa ggctgttaga gagataattg gaattaattt gactgtaaac acaaagatat 4140 tagtacaaaa tacgtgacgt agaaagtaat aatttcttgg gtagtttgca gttttaaaat 4200 tatgttttaa aatggactat catatgctta ccgtaacttg aaagtatttc gatttcttgg 4260 ctttatatat cttgtggaaa ggacgaaaca ccgggtcttc gagaagacct gttttagagc 4320 tagaaatcgt ggttcgcacc gactcggtgc cacagcaagt taaaataagg ctagtccgtt 4380 atcaacttga aaaagtggca ccgagtcggt gcttttttga attcgctagc taggtcttga 4440 aaggagtggg aattggctcc ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc 4500 ccgagaagtt ggggggaggg gtcggcaatt gatccggtgc ctagagaagg tggcgcgggg 4560 taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt gggggagaac 4620 cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt gccgccagaa 4680 cacaggaccg gttctagagc gctgccacca tggacaagaa gtacagcatc ggcctggaca 4740 tcggcaccaa ctctgtgggc tgggccgtga tcaccgacga gtacaaggtg cccagcaaga 4800 aattcaaggt gctgggcaac accgaccggc acagcatcaa gaagaacctg atcggagccc 4860 tgctgttcga cagcggcgaa acagccgagg ccacccggct gaagagaacc gccagaagaa 4920 gatacaccag acggaagaac cggatctgct atctgcaaga gatcttcagc aacgagatgg 4980 ccaaggtgga cgacagcttc ttccacagac tggaagagtc cttcctggtg gaagaggata 5040 agaagcacga gcggcacccc atcttcggca acatcgtgga cgaggtggcc taccacgaga 5100 agtaccccac catctaccac ctgagaaaga aactggtgga cagcaccgac aaggccgacc 5160 tgcggctgat ctatctggcc ctggcccaca tgatcaagtt ccggggccac ttcctgatcg 5220 agggcgacct gaaccccgac aacagcgacg tggacaagct gttcatccag ctggtgcaga 5280 cctacaacca gctgttcgag gaaaacccca tcaacgccag cggcgtggac gccaaggcca 5340 tcctgtctgc cagactgagc aagagcagac ggctggaaaa tctgatcgcc cagctgcccg 5400 gcgagaagaa gaatggcctg ttcggaaacc tgattgccct gagcctgggc ctgaccccca 5460 acttcaagag caacttcgac ctggccgagg atgccaaact gcagctgagc aaggacacct 5520 acgacgacga cctggacaac ctgctggccc agatcggcga ccagtacgcc gacctgtttc 5580 tggccgccaa gaacctgtcc gacgccatcc tgctgagcga catcctgaga gtgaacaccg 5640 agatcaccaa ggcccccctg agcgcctcta tgatcaagag atacgacgag caccaccagg 5700 acctgaccct gctgaaagct ctcgtgcggc agcagctgcc tgagaagtac aaagagattt 5760 tcttcgacca gagcaagaac ggctacgccg gctacattga cggcggagcc agccaggaag 5820 agttctacaa gttcatcaag cccatcctgg aaaagatgga cggcaccgag gaactgctcg 5880 tgaagctgaa cagagaggac ctgctgcgga agcagcggac cttcgacaac ggcagcatcc 5940 cccaccagat ccacctggga gagctgcacg ccattctgcg gcggcaggaa gatttttacc 6000 cattcctgaa ggacaaccgg gaaaagatcg agaagatcct gaccttccgc atcccctact 6060 acgtgggccc tctggccagg ggaaacagca gattcgcctg gatgaccaga aagagcgagg 6120 aaaccatcac cccctggaac ttcgaggaag tggtggacaa gggcgcttcc gcccagagct 6180 tcatcgagcg gatgaccaac ttcgataaga acctgcccaa cgagaaggtg ctgcccaagc 6240 acagcctgct gtacgagtac ttcaccgtgt ataacgagct gaccaaagtg aaatacgtga 6300 ccgagggaat gagaaagccc gccttcctga gcggcgagca gaaaaaggcc atcgtggacc 6360 tgctgttcaa gaccaaccgg aaagtgaccg tgaagcagct gaaagaggac tacttcaaga 6420 aaatcgagtg cttcgactcc gtggaaatct ccggcgtgga agatcggttc aacgcctccc 6480 tgggcacata ccacgatctg ctgaaaatta tcaaggacaa ggacttcctg gacaatgagg 6540 aaaacgagga cattctggaa gatatcgtgc tgaccctgac actgtttgag gacagagaga 6600 tgatcgagga acggctgaaa acctatgccc acctgttcga cgacaaagtg atgaagcagc 6660 tgaagcggcg gagatacacc ggctggggca ggctgagccg gaagctgatc aacggcatcc 6720 gggacaagca gtccggcaag acaatcctgg atttcctgaa gtccgacggc ttcgccaaca 6780 gaaacttcat gcagctgatc cacgacgaca gcctgacctt taaagaggac atccagaaag 6840 cccaggtgtc cggccagggc gatagcctgc acgagcacat tgccaatctg gccggcagcc 6900 ccgccattaa gaagggcatc ctgcagacag tgaaggtggt ggacgagctc gtgaaagtga 6960 tgggccggca caagcccgag aacatcgtga tcgaaatggc cagagagaac cagaccaccc 7020 agaagggaca gaagaacagc cgcgagagaa tgaagcggat cgaagagggc atcaaagagc 7080 tgggcagcca gatcctgaaa gaacaccccg tggaaaacac ccagctgcag aacgagaagc 7140 tgtacctgta ctacctgcag aatgggcggg atatgtacgt ggaccaggaa ctggacatca 7200 accggctgtc cgactacgat gtggaccata tcgtgcctca gagctttctg aaggacgact 7260 ccatcgacaa caaggtgctg accagaagcg acaagaaccg gggcaagagc gacaacgtgc 7320 cctccgaaga ggtcgtgaag aagatgaaga actactggcg gcagctgctg aacgccaagc 7380 tgattaccca gagaaagttc gacaatctga ccaaggccga gagaggcggc ctgagcgaac 7440 tggataaggc cggcttcatc aagagacagc tggtggaaac ccggcagatc acaaagcacg 7500 tggcacagat cctggactcc cggatgaaca ctaagtacga cgagaatgac aagctgatcc 7560 gggaagtgaa agtgatcacc ctgaagtcca agctggtgtc cgatttccgg aaggatttcc 7620 agttttacaa agtgcgcgag atcaacaact accaccacgc ccacgacgcc tacctgaacg 7680 ccgtcgtggg aaccgccctg atcaaaaagt accctaagct ggaaagcgag ttcgtgtacg 7740 gcgactacaa ggtgtacgac gtgcggaaga tgatcgccaa gagcgagcag gaaatcggca 7800 aggctaccgc caagtacttc ttctacagca acatcatgaa ctttttcaag accgagatta 7860 ccctggccaa cggcgagatc cggaagcggc ctctgatcga gacaaacggc gaaaccgggg 7920 agatcgtgtg ggataagggc cgggattttg ccaccgtgcg gaaagtgctg agcatgcccc 7980 aagtgaatat cgtgaaaaag accgaggtgc agacaggcgg cttcagcaaa gagtctatcc 8040 tgcccaagag gaacagcgat aagctgatcg ccagaaagaa ggactgggac cctaagaagt 8100 acggcggctt cgacagcccc accgtggcct attctgtgct ggtggtggcc aaagtggaaa 8160 agggcaagtc caagaaactg aagagtgtga aagagctgct ggggatcacc atcatggaaa 8220 gaagcagctt cgagaagaat cccatcgact ttctggaagc caagggctac aaagaagtga 8280 aaaaggacct gatcatcaag ctgcctaagt actccctgtt cgagctggaa aacggccgga 8340 agagaatgct ggcctctgcc ggcgaactgc agaagggaaa cgaactggcc ctgccctcca 8400 aatatgtgaa cttcctgtac ctggccagcc actatgagaa gctgaagggc tcccccgagg 8460 ataatgagca gaaacagctg tttgtggaac agcacaagca ctacctggac gagatcatcg 8520 agcagatcag cgagttctcc aagagagtga tcctggccga cgctaatctg gacaaagtgc 8580 tgtccgccta caacaagcac cgggataagc ccatcagaga gcaggccgag aatatcatcc 8640 acctgtttac cctgaccaat ctgggagccc ctgccgcctt caagtacttt gacaccacca 8700 tcgaccggaa gaggtacacc agcaccaaag aggtgctgga cgccaccctg atccaccaga 8760 gcatcaccgg cctgtacgag acacggatcg acctgtctca gctgggaggc gacaagcgac 8820 ctgccgccac aaagaaggct ggacaggcta agaagaagaa agattacaaa gacgatgacg 8880 ataagtaact agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt 8940 tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 9000 ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 9060 tggggtgggg caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga 9120 ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg 9180 ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg 9240 aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc 9300 aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca 9360 ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc 9420 ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa 9480 gcttgggccc gccccaactg gggtaacctt tgagttctct cagttggggg 9530 <210> 391 <211> 5722 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 391 tgatcccctg cgccatcaga tccttggcgg cgagaaagcc atccagttta ctttgcaggg 60 cttcccaacc ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa 120 aaccgcccag tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc 180 gcttgcgttt tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg 240 tttctgcgga ctggctttct acgtgctcga ggggggccaa acggtctcca gcttggctgt 300 tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 360 ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 420 aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 480 gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 540 tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 600 gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 660 gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc tacaaactct 720 tttgtttatt tttctaaata cattcaaata tgtatccgct catgaccaaa atcccttaac 780 gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 840 atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 900 tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 960 gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 1020 actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 1080 gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 1140 agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 1200 ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 1260 aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 1320 cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 1380 gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 1440 cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 1500 cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 1560 gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 1620 attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 1680 tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 1740 catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 1800 cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 1860 ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 1920 gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 1980 cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 2040 cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 2100 tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 2160 catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 2220 taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 2280 aacatgctgt gcgacgctgg cgatacatta ccctgttatc cctagatgac attaccctgt 2340 tatcccagat gacattaccc tgttatccct agatgacatt accctgttat ccctagatga 2400 catttaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 2460 atccctagat acattaccct gttatcccag atgacatacc ctgttatccc tagatgacat 2520 taccctgtta tcccagatga cattaccctg ttatccctag atacattacc ctgttatccc 2580 agatgacata ccctgttatc cctagatgac attaccctgt tatcccagat gacattaccc 2640 tgttatccct agatacatta ccctgttatc ccagatgaca taccctgtta tccctagatg 2700 acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 2760 tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 2820 accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 2880 gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 2940 gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagataa 3000 actcaatgat gatgatgatg atggtcgaga ctcagcggcc gcggtgccag ggcgtgccct 3060 tgggctcccc gggcgcggtc ctttgggcgc taactgcgtg cgcgctggga attggcgcta 3120 attgcgcgtg cgcgctggga ctcaaggcgc taactgcgcg tgcgttctgg ggcccggggt 3180 gccgcggcct gggctggggc gaaggcgggc tcggccggaa ggggtggggt cgccgcggct 3240 cccgggcgct tgcgcgcact tcctgcccga gccgctggcc gcccgagggt gtggccgctg 3300 cgtgcgcgcg cgccgacccg gcgctgtttg aaccgggcgg aggcggggct ggcgcccggt 3360 tgggaggggg ttggggcctg gcttcctgcc gcgcgccgcg gggacgcctc cgaccagtgt 3420 ttgcctttta tggtaataac gcggccggcc cggcttcctt tgtccccaat ctgggcgcgc 3480 gccggcgccc cctggcggcc taaggactcg gcgcgccgga agtggccagg gcgggggcga 3540 cctcggctca cagcgcgccc ggctattctc gcagctcgcc accatgcccg ccatgaagat 3600 cgagtgccgc atcaccggca ccctgaacgg cgtggagttc gagctggtgg gcggcggaga 3660 gggcaccccc gagcagggcc gcatgaccaa caagatgaag agcaccaaag gcgccctgac 3720 cttcagcccc tacctgctga gccacgtgat gggctacggc ttctaccact tcggcaccta 3780 ccccagcggc tacgagaacc ccttcctgca cgccatcaac aacggcggct acaccaacac 3840 ccgcatcgag aagtacgagg acggcggcgt gctgcacgtg agcttcagct accgctacga 3900 ggccggccgc gtgatcggcg acttcaaggt ggtgggcacc ggcttccccg aggacagcgt 3960 gatcttcacc gacaagatca tccgcagcaa cgccaccgtg gagcacctgc accccatggg 4020 cgataacgtg ctggtgggca gcttcgcccg caccttcagc ctgcgcgacg gcggctacta 4080 cagcttcgtg gtggacagcc acatgcactt caagagcgcc atccacccca gcatcctgca 4140 gaacgggggc cccatgttcg ccttccgccg cgtggaggag ctgcacagca acaccgagct 4200 gggcatcgtg gagtaccagc acgccttcaa gacccccatc gccttcgcca gatctcgagc 4260 tcgaaccatg gatgatgata tcgccgcgct cgtcgtcgac aacggctccg gcatgtgcaa 4320 ggccggcttc gcgggcgacg atgccccccg ggccgtcttc ccctccatcg tggggcgccc 4380 caggcaccag gtaggggagc tggctgggtg gggcagcccc gggagcgggc gggaggcaag 4440 ggcgctttct ctgcacagga gcctcccggt ttccggggtg ggggctgcgc ccgtgctcag 4500 ggcttcttgt cctttccttc ccagggcgtg atggtgggca tgggtcagaa ggattcctat 4560 gtgggcgacg aggcccagag caagagaggc atcctcaccc tgaagtaccc catcgagcac 4620 ggcatcgtca ccaactggga cgacatggag aaaatctggc accacacctt ctacaatgag 4680 ctgcgtgtgg ctcccgagga gcaccccgtg ctgctgaccg aggcccccct gaaccccaag 4740 gccaaccgcg agaagatgac ccagccccaa ctggggtaac ctttgagttc tctcagttgg 4800 gggtaatcag catcatgatg tggtaccaca tcatgatgct gattataaga atgcggccgc 4860 cacactctag tggatctcga gttaataatt cagaagaact cgtcaagaag gcgatagaag 4920 gcgatgcgct gcgaatcggg agcggcgata ccgtaaagca cgaggaagcg gtcagcccat 4980 tcgccgccaa gctcttcagc aatatcacgg gtagccaacg ctatgtcctg atagcggtcc 5040 gccacaccca gccggccaca gtcgatgaat ccagaaaagc ggccattttc caccatgata 5100 ttcggcaagc aggcatcgcc atgggtcacg acgagatcct cgccgtcggg catgctcgcc 5160 ttgagcctgg cgaacagttc ggctggcgcg agcccctgat gctcttcgtc cagatcatcc 5220 tgatcgacaa gaccggcttc catccgagta cgtgctcgct cgatgcgatg tttcgcttgg 5280 tggtcgaatg ggcaggtagc cggatcaagc gtatgcagcc gccgcattgc atcagccatg 5340 atggatactt tctcggcagg agcaaggtgt agatgacatg gagatcctgc cccggcactt 5400 cgcccaatag cagccagtcc cttcccgctt cagtgacaac gtcgagcaca gctgcgcaag 5460 gaacgcccgt cgtggccagc cacgatagcc gcgctgcctc gtcttgcagt tcattcaggg 5520 caccggacag gtcggtcttg acaaaaagaa ccgggcgccc ctgcgctgac agccggaaca 5580 cggcggcatc agagcagccg attgtctgtt gtgcccagtc atagccgaat agcctctcca 5640 cccaagcggc cggagaacct gcgtgcaatc catcttgttc aatcatgcga aacgatcctc 5700 atcctgtctc ttgatcagag ct 5722 <210> 392 <211> 15424 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 392 tcgacggtat cgataagctt gatatcgaat tcctgcagcc cgggggatcc actagttcta 60 gagcggccgc caccgcggtg gagctccagc ttttgttccc tttagtgagg gttaatttcg 120 agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 180 ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 240 taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 300 cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 360 tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 420 gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 480 atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 540 ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 600 cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 660 tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 720 gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 780 aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 840 tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 900 aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 960 aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 1020 ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 1080 ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 1140 atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 1200 atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 1260 tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 1320 gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 1380 tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 1440 gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 1500 cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 1560 gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 1620 atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 1680 aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 1740 atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 1800 aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 1860 aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 1920 gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 1980 gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 2040 gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 2100 ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 2160 ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 2220 atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 2280 gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 2340 atcacgaggc cctttcgtct tcaagaattc tcatgtttga cagcttatca tcgataagct 2400 ttaatgcggt agtttatcac agttaaattg ctaacgcagt caggcaccgt gtatgaaatc 2460 taacaatgcg ctcatcgtca tcctcggcac cgtcaccctg gatgctgtag gcataggctt 2520 ggttatgccg gtactgccgg gcctcttgcg ggatatcgtc cattccgaca gcatcgccag 2580 tcactatggc gtgctgctag cgctatatgc gttgatgcaa tttctatgcg cacccgttct 2640 cggagcactg tccgaccgct ttggccgccg cccagtcctg ctcgcttcgc tacttggagc 2700 cactatcgac tacgcgatca tggcgaccac acccgtcctg tggatccggc gcacaccaaa 2760 aacgtcactt ttgccacatc cgtcgcttac atgtgttccg ccacacttgc aacatcacac 2820 ttccgccaca ctactacgtc acccgccccg ttcccacgcc ccgcgccacg tcacaaactc 2880 caccccctca ttatcatatt ggcttcaatc caaaataaat catcaataat ataccttatt 2940 ttggattgaa gccaatatga taatgagggg gtggagtttg tgacgtggcg cggggcgtgg 3000 gaacggggcg ggtgacgtag gttttagggc ggagtaactt gtatgtgttg ggaattgtag 3060 ttttcttaaa atgggaagtt acgtaacgtg ggaaaacgga agtgacgatt tgaggaagtt 3120 gtgggttttt tggctttcgt ttctgggcgt aggttcgcgt gcggttttct gggtgttttt 3180 tgtggacttt aaccgttacg tcatttttta gtcctatata tactcgctct gcacttggcc 3240 cttttttaca ctgtgactga ttgagctggt gccgtgtcga gtggtgtttt tttaataggt 3300 tttctttttt actggtaagg ctgactgtta ggctgccgct gtgaagcgct gtatgttgtt 3360 ctggagcggg agggtgctat tttgcctagg caggagggtt tttcaggtgt ttatgtgttt 3420 ttctctccta ttaattttgt tatacctcct atgggggctg taatgttgtc tctacgcctg 3480 cgggtatgta ttcccccggg ctatttcggt cgctttttag cactgaccga tgaatcaacc 3540 tgatgtgttt accgagtctt acattatgac tccggacatg accgaggagc tgtcggtggt 3600 gctttttaat cacggtgacc agttttttta cggtcacgcc ggcatggccg tagtccgtct 3660 tatgcttata agggttgttt ttcctgttgt aagacaggct tctaatgttt aaatgttttt 3720 ttgttatttt attttgtgtt tatgcagaaa cccgcagaca tgtttgagag aaaaatggtg 3780 tctttttctg tggtggttcc ggagcttacc tgcctttatc tgcatgagca tgactacgat 3840 gtgctttctt ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata 3900 tcgccgccca tgcaacaaag cttacatcgg ggctacgctg gttagcatag ctccgagtat 3960 gcgtgtcata atcagtgtgg gttcttttgt caaggttcct ggcggggaag tggccgcgct 4020 ggtccgtgca gacctgcacg attatgttca gctggccctg cgaagggacc tacgggatcg 4080 cggtattttt gttaatgttc cgcttttgaa tcttatacag gtctgtgagg aacctgaatt 4140 tttgcaatca tgattcgctg cttgaggctg aaggtggagg gcgctctgga gcagattttt 4200 acaatggccg gacttaatat tcgggatttg cttagagata tattgagaag gtggcgagat 4260 gagaattatt tgggcatggt tgaaggtgct ggaatgttta tagaggagat tcaccctgaa 4320 gggtttagcc tttacgtcca cttggacgtg agggccgttt gccttttgga agccattgtg 4380 caacatctta caaatgccat tatctgttct ttggctgtag agtttgacca cgccaccgga 4440 ggggagcgcg ttcacttaat agatcttcat tttgaggttt tggataatct tttggaataa 4500 aaaaaaaaac atggttcttc cagctcttcc cgctcctccc gtgtgtgact cgcagaacga 4560 atgtgtaggt tggctgggtg tggcttattc tgcggtggtg gatgttatca gggcagcggc 4620 gcatgaagga gtttacatag aacccgaagc cagggggcgc ctggatgctt tgagagagtg 4680 gatatactac aactactaca cagagcgatc taagcggcga gaccggagac gcagatctgt 4740 ttgtcacgcc cgcacctggt tttgcttcag gaaatatgac tacgtccggc gttccatttg 4800 gcatgacact acgaccaaca cgatctcggt tgtctcggcg cactccgtac agtagggatc 4860 gtctacctcc ttttgagaca gaaacccgcg ctaccatact ggaggatcat ccgctgctgc 4920 ccgaatgtaa cactttgaca atgcacaacg tgagttacgt gcgaggtctt ccctgcagtg 4980 tgggatttac gctgattcag gaatgggttg ttccctggga tatggttcta acgcgggagg 5040 agcttgtaat cctgaggaag tgtatgcacg tgtgcctgtg ttgtgccaac attgatatca 5100 tgacgagcat gatgatccat ggttacgagt cctgggctct ccactgtcat tgttccagtc 5160 ccggttccct gcagtgtata gccggcgggc aggttttggc cagctggttt aggatggtgg 5220 tggatggcgc catgtttaat cagaggttta tatggtaccg ggaggtggtg aattacaaca 5280 tgccaaaaga ggtaatgttt atgtccagcg tgtttatgag gggtcgccac ttaatctacc 5340 tgcgcttgtg gtatgatggc cacgtgggtt ctgtggtccc cgccatgagc tttggataca 5400 gcgccttgca ctgtgggatt ttgaacaata ttgtggtgct gtgctgcagt tactgtgctg 5460 atttaagtga gatcagggtg cgctgctgtg cccggaggac aaggcgcctt atgctgcggg 5520 cggtgcgaat catcgctgag gagaccactg ccatgttgta ttcctgcagg acggagcggc 5580 ggcggcagca gtttattcgc gcgctgctgc agcaccaccg ccctatcctg atgcacgatt 5640 atgactctac ccccatgtag gcgtggactt ctccttcgcc gcccgttaag caaccgcaag 5700 ttggacagca gcctgtggct cagcagctgg acagcgacat gaacttaagt gagctgcccg 5760 gggagtttat taatatcact gatgagcgtt tggctcgaca ggaaaccgtg tggaatataa 5820 cacctaagaa tatgtctgtt acccatgata tgatgctttt taaggccagc cggggagaaa 5880 ggactgtgta ctctgtgtgt tgggagggag gtggcaggtt gaatactagg gttctgtgag 5940 tttgattaag gtacggtgat ctgtataagc tatgtggtgg tggggctata ctactgaatg 6000 aaaaatgact tgaaattttc tgcaattgaa aaataaacac gttgaaacat aacacaaacg 6060 attctttatt cttgggcaat gtatgaaaaa gtgtaagagg atgtggcaaa tatttcatta 6120 atgtagttgt ggccagacca gtcccatgaa aatgacatag agtatgcact tggagttgtg 6180 tctcctgttt cctgtgtacc gtttagtgta atggttagtg ttacaggttt agttttgtct 6240 ccgtttaagt aaacttgact gacaatgtta cttttggcag ttttaccgtg agattttgga 6300 taagctgata ggttaggcat aaatccaaca gcgtttgtat aggctgtgcc ttcagtaaga 6360 tctccatttc taaagttcca atattctggg tccaggaagg aattgtttag tagcactcca 6420 ttttcgtcaa atcttataat aagatgagca ctttgaactg ttccagatat tggagccaaa 6480 ctgcctttaa cagccaaaac tgaaactgta gcaagtattt gactgccaca ttttgttaag 6540 accaaagtga gtttagcatc tttctctgca tttagtctac agttaggaga tggagctggt 6600 gtggtccaca aagttagctt atcattattt ttgtttccta ctgtaatggc acctgtgctg 6660 tcaaaactaa ggccagttcc tagtttagga accatagcct tgtttgaatc aaattctagg 6720 ccatggccaa tttttgtttt gaggggattt gtgtttggtg cattaggtga accaaattca 6780 agcccatctc ctgcattaat ggctatggct gtagcgtcaa acatcaaccc cttggcagtg 6840 cttaggttaa cctcaagctt tttggaattg tttgaagctg taaacaagta aaggcctttg 6900 ttgtagttaa tatccaagtt gtgggctgag tttataaaaa gagggccctg tcctagtctt 6960 agatttagtt ggttttgagc atcaaacgga taactaacat caagtataag gcgtctgttt 7020 tgagaatcaa tccttagtcc tcctgctaca ttaagttgca tattgccttg tgaatcaaaa 7080 cccaaggctc cagtaacttt agtttgcaag gaagtattat taatagtcac acctggacca 7140 gttgctacgg tcaaagtgtt taggtcgtct gttacatgca aaggagcccc gtactttagt 7200 cctagttttc cattttgtgt ataaatgggc tctttcaagt caatgcccaa gctaccagtg 7260 gcagtagtta gagggggtga ggcagtgata gtaagggtac tgctatcggt ggtggtgagg 7320 gggcctgatg tttgcagggc tagctttcct tctgacactg tgaggggtcc ttgggtggca 7380 atgctaagtt tggagtcgtg cacggttagc ggggcctgtg attgcatggt gagtgtgttg 7440 cccgcgacca ttagaggtgc ggcggcagcc acagttaggg cttctgaggt aactgtgagg 7500 ggtgcagata tttccaggtt tatgtttgac ttggtttttt tgagaggtgg gctcacagtg 7560 gttacatttt gggaggtaag gttgccggcc tcgtccagag agaggccgtt gcccattttg 7620 agcgcaagca tgccattgga ggtaactaga ggttcggata ggcgcaaaga gagtacccca 7680 gggggactct cttgaaaccc attgggggat acaaagggag gagtaagaaa aggcacagtt 7740 ggaggaccgg tttccgtgtc atatggatac acggggttga aggtatcttc agacggtctt 7800 gcgcgcttca tctgcaacaa catgaagata gtgggtgcgg atggacagga acaggaggaa 7860 actgacattc catttagatt gtggagaaag tttgcagcca ggaggaagct gcaataccag 7920 agctgggagg agggcaagga ggtgctgctg aataaactgg acagaaattt gctaactgat 7980 tttaagtaag tgatgcttta ttattttttt ttattagtta aagggaataa gatccccggg 8040 tactctagtt aattaactag aggatcttga tgtaatccaa ggttaggaca gttgcaaatc 8100 acagtgagaa cacagggtcc cctgtcccgc tcaactagca gggggcgctg ggtaaactcc 8160 cgaatcaggc tacgggcaag ctctccctgg gcggtaagcc ggacgccgtg cgccgggccc 8220 tcgatatgat cctcgggcaa ttcaaagtag caaaactcac cggagtcgcg ggcaaagcac 8280 ttgtggcggc gacagtggac caggtgtttc aggcgcagtt gctctgcctc tccacttaac 8340 attcagtcgt agccgtccgc cgagtccttt accgcgtcaa agttaggaat aaattgatcc 8400 ggatagtggc cgggaggtcc cgagaagggg ttaaagtaga ccgatggcac aaactcctca 8460 ataaattgca gagttccaat gcctccagag cgcggctcag aggacgaggt ctgcagagtt 8520 aggattgcct gacgaggcgt gaatgaagga cggccggcgc cgccgatctg aaatgtcccg 8580 tccggacgga gaccaagcga ggagctcacc gactcgtcgt tgagctgaat acctcgccct 8640 ctgattgtca ggtgagttat accctgcccg ggcgaccgca ccctgtgacg aaagccgccc 8700 gcaagctgcg cccctgagtt agtcatctga acttcggcct gggcgtctct gggaagtacc 8760 acagtggtgg gagcgggact ttcctggtac accagggcag cgggccaact acggggatta 8820 aggttattac gaggtgtggt ggtaatagcc gcctgttcca agagaattcg gtttcggtgg 8880 gcgcggattc cgttgacccg ggatatcatg tggggtcccg cgctcatgta gtttattcgg 8940 gttgagtagt cttgggcagc tccagccgca agtcccattt gtggctggta actccacatg 9000 tagggcgtgg gaatttcctt gctcataatg gcgctgacga caggtgctgg cgccgggtgt 9060 ggccgctgga gatgacgtag ttttcgcgct taaatttgag aaagggcgcg aaactagtcc 9120 ttaagagtca gcgcgcagta tttactgaag agagcctccg cgtcttccag cgtgcgccga 9180 agctgatctt cgcttttgtg atacaggcag ctgcgggtga gggatcgcag agacctgttt 9240 tttattttca gctcttgttc ttggcccctg ctctgttgaa atatagcata cagagtggga 9300 aaaatcctgt ttctaagctc gcgggtcgat acgggttcgt tgggcgccag acgcagcgct 9360 cctcctcctg ctgctgccgc cgctgtggat ttcttgggct ttgtcagagt cttgctatcc 9420 ggtcgccttt gcttctgtgt ggccgctgct gttgctgccg ctgccgctgc cgccggtgca 9480 gtatgggctg tagagatgac ggtagtaatg caggatgtta cgggggaagg ccacgccgtg 9540 atggtagaga agaaagcggc gggcgaagga gatgttgccc ccacagtctt gcaagcaagc 9600 aactatggcg ttcttgtgcc cgcgccatga gcggtagcct tggcgctgtt gttgctcttg 9660 ggctaacggc ggcggctgct tggacttacc ggccctggtt ccagtggtgt cccatctacg 9720 gttgggtcgg cgaacgggca gtgccggcgg cgcctgagga gcggaggttg tagccatgct 9780 ggaaccggtt gccgatttct ggggcgccgg cgaggggaat gcgaccgagg gtgacggtgt 9840 ttcgtctgac acctcttcga cctcggaagc ttcctcgtct aggctctccc agtcttccat 9900 catgtcctcc tcctcctcgt ccaaaacctc ctctgcctga ctgtcccagt attcctcctc 9960 gtccgtgggt ggcggcggca gctgcagctt ctttttgggt gccatcctgg gaagcaaggg 10020 cccgcggctg ctgctgatag ggctgcggcg gcggggggat tgggttgagc tcctcgccgg 10080 actgggggtc caagtaaacc ccccgtccct ttcgtagcag aaactcttgg cgggctttgt 10140 tgatggcttg caattggcca agaatgtggc cctgggtaat gacgcaggcg gtaagctccg 10200 catttggcgg gcgggattgg tcttcgtaga acctaatctc gtgggcgtgg tagtcctcag 10260 gtacaaattt gcgaaggtaa gccgacgtcc acagccccgg agtgagtttc aaccccggag 10320 ccgcggactt ttcgtcaggc gagggaccct gcagctcaaa ggtaccgata atttgacttt 10380 cgttaagcag ctgcgaattg caaaccaggg agcggtgcgg ggtgcatagg ttgcagcgac 10440 agtgacactc cagtagaccg tcaccgctca cgtcttccat tatgtcagag tggtaggcaa 10500 ggtagttggc tagctgcaga aggtagcagt ggccccaaag cggcggaggg cattcgcggt 10560 acttaatggg cacaaagtcg ctaggaagtg cacagcaggt ggcgggcaag attcctgagc 10620 gctctaggat aaagttccta aagttctgca acatgctttg actggtgaag tctggcagac 10680 cctgttgcag ggttttaagc aggcgttcgg ggaaaatgat gtccgccagg tgcgcggcca 10740 cggagcgctc gttgaaggcc gtccataggt ccttcaagtt ttgctttagc agtttctgca 10800 gctccttgag gttgcactcc tccaagcact gctgccaaac gcccatggcc gtctgccagg 10860 tgtagcatag aaataagtaa acgcagtcgc ggacgtagtc gcggcgcgcc tcgcccttga 10920 gcgtggaatg aagcacgttt tgcccaaggc ggttttcgtg caaaattcca aggtaggaga 10980 ccaggttgca gagctccacg ttggagatct tgcaggcctg gcgtacgtag ccctgtcgaa 11040 aggtgtagtg caatgtttcc tctagcttgc gctgcatctc cgggtcagca aagaaccgct 11100 gcatgcactc aagctccacg gtaacgagca ctgcggccat cattagtttg cgtcgctcct 11160 ccaagtcggc aggctcgcgc gtttgaagcc agcgcgctag ctgctcgtcg ccaactgcgg 11220 gtaggccctc ctctgtttgt tcttgcaaat ttgcatccct ctccaggggc tgcgcacggc 11280 gcacgatcag ctcactcatg actgtgctca tgaccttggg gggtaggtta agtgccgggt 11340 aggcaaagtg ggtgacctcg atgctgcgtt ttagtacggc taggcgcgcg ttgtcaccct 11400 cgagttccac caacactcca gagtgacttt cattttcgct gttttcctgt tgcagagcgt 11460 ttgccgcgcg cttctcgtcg cgtccaagac cctcaaagat ttttggcact tcgttgagcg 11520 aggcgatatc aggtatgaca gcgccctgcc gcaaggccag ctgcttgtcc gctcggctgc 11580 ggttggcacg gcaggatagg ggtatcttgc agttttggaa aaagatgtga taggtggcaa 11640 gcacctctgg cacggcaaat acggggtaga agttgaggcg cgggttgggc tcgcatgtgc 11700 cgttttcttg gcgtttgggg ggtacgcgcg gtgagaatag gtggcgttcg taggcaaggc 11760 tgacatccgc tatggcgagg ggcacatcgc tgcgctcttg caacgcgtcg cagataatgg 11820 cgcactggcg ctgcagatgc ttcaacagca cgtcgtctcc cacatctagg tagtcgccat 11880 gcctttcgtc cccccgcccg acttgttcct cgtttgcctc tgcgttgtcc tggtcttgct 11940 ttttatcctc tgttggtact gagcggtcct cgtcgtcttc gcttacaaaa cctgggtcct 12000 gctcgataat cacttcctcc tcctcaagcg ggggtgcctc gacggggaag gtggtaggcg 12060 cgttggcggc atcggtggag gcggtggtgg cgaactcaga gggggcggtt aggctgtcct 12120 tcttctcgac tgactccatg atctttttct gcctatagga gaaggaaatg gccagtcggg 12180 aagaggagca gcgcgaaacc acccccgagc gcggacgcgg tgcggcgcga cgtcccccaa 12240 ccatggagga cgtgtcgtcc ccgtccccgt cgccgccgcc tccccgggcg cccccaaaaa 12300 agcggatgag gcggcgtatc gagtccgagg acgaggaaga ctcatcacaa gacgcgctgg 12360 tgccgcgcac acccagcccg cggccatcga cctcggcggc ggatttggcc attgcgccca 12420 agaagaaaaa gaagcgccct tctcccaagc ccgagcgccc gccatcacca gaggtaatcg 12480 tggacagcga ggaagaaaga gaagatgtgg cgctacaaat ggtgggtttc agcaacccac 12540 cggtgctaat caagcatggc aaaggaggta agcgcacagt gcggcggctg aatgaagacg 12600 acccagtggc gcgtggtatg cggacgcaag aggaagagga agagcccagc gaagcggaaa 12660 gtgaaattac ggtgatgaac ccgctgagtg tgccgatcgt gtctgcgtgg gagaagggca 12720 tggaggctgc gcgcgcgctg atggacaagt accacgtgga taacgatcta aaggcgaact 12780 tcaaactact gcctgaccaa gtggaagctc tggcggccgt atgcaagacc tggctgaacg 12840 aggagcaccg cgggttgcag ctgaccttca ccagcaacaa gacctttgtg acgatgatgg 12900 ggcgattcct gcaggcgtac ctgcagtcgt ttgcagaggt gacctacaag catcacgagc 12960 ccacgggctg cgcgttgtgg ctgcaccgct gcgctgagat cgaaggcgag cttaagtgtc 13020 tacacggaag cattatgata aataaggagc acgtgattga aatggatgtg acgagcgaaa 13080 acgggcagcg cgcgctgaag gagcagtcta gcaaggccaa gatcgtgaag aaccggtggg 13140 gccgaaatgt ggtgcagatc tccaacaccg acgcaaggtg ctgcgtgcac gacgcggcct 13200 gtccggccaa tcagttttcc ggcaagtctt gcggcatgtt cttctctgaa ggcgcaaagg 13260 ctcaggtggc ttttaagcag atcaaggctt ttatgcaggc gctgtatcct aacgcccaga 13320 ccgggcacgg tcaccttttg atgccactac ggtgcgagtg caactcaaag cctgggcacg 13380 cgcccttttt gggaaggcag ctaccaaagt tgactccgtt cgccctgagc aacgcggagg 13440 acctggacgc ggatctgatc tccgacaaga gcgtgctggc cagcgtgcac cacccggcgc 13500 tgatagtgtt ccagtgctgc aaccctgtgt atcgcaactc gcgcgcgcag ggcggaggcc 13560 ccaactgcga cttcaagata tcggcgcccg acctgctaaa cgcgttggtg atggtgcgca 13620 gcctgtggag tgaaaacttc accgagctgc cgcggatggt tgtgcctgag tttaagtgga 13680 gcactaaaca ccagtatcgc aacgtgtccc tgccagtggc gcatagcgat gcgcggcaga 13740 acccctttga tttttaaacg gcgcagacgg caagggtggg ggtaaataat cacccgagag 13800 tgtacaaata aaagcatttg cctttattga aagtgtctct agtacattat ttttacatgt 13860 ttttcaagtg acaaaaagaa gtggcgctcc taatctgcgc actgtggctg cggaagtagg 13920 gcgagtggcg ctccaggaag ctgtagagct gttcctggtt gcgacgcagg gtgggctgta 13980 cctggggact gttgagcatg gagttgggta ccccggtaat aaggttcatg gtggggttgt 14040 gatccatggg agtttggggc cagttggcaa aggcgtggag aaacatgcag cagaatagtc 14100 cacaggcggc cgagttgggc ccctgtacgc tttgggtgga cttttccagc gttatacagc 14160 ggtcggggga agaagcaatg gcgctacggc gcaggagtga ctcgtactca aactggtaaa 14220 cctgcttgag tcgctggtca gaaaagccaa agggctcaaa gaggtagcat gtttttgagt 14280 gcgggttcca ggcaaaggcc atccagtgta cgcccccagt ctcggtccga gactcgaacc 14340 gggggtcccg cgactcaacc cttggaaaat aaccctccgg ctacagggag cgagccactt 14400 aatgctttcg ctttccagcc taaccgctta cgctgcgcgc ggccagtggc caaaaaagct 14460 agcgcagcag ccgccgcgcc tggaaggaag ccaaaaggag cactcccccg ttgtctgacg 14520 tcgcacacct gggttcgaca cgcgggcggt aaccgcatgg atcacggcgg acggccggat 14580 acggggctcg aaccccggtc gtccgccatg atacccttgc gaatttatcc accagaccac 14640 ggaagagtgc ccgcttacag gctctccttt tgcacggtag agcgtcaacg attgcgcgcg 14700 cctgaccggc cagagcgtcc cgaccatgga gcactttttg ccgctgcgca acatctggaa 14760 ccgcgtccgc gactttccgc gcgcctccac caccgccgcc ggcatcacct ggatgtccag 14820 gtacatctac ggatatcatc gccttatgtt ggaagatctc gcccccggag ccccggccac 14880 cctacgctgg cccctctacc gccagccgcc gccgcacttt ttggtgggat accagtacct 14940 ggtgcggact tgcaacgact acgtatttga ctcgagggct tactcgcgtc tcaggtacac 15000 cgagctctcg cagccgggtc accagaccgt taactggtcc gttatggcca actgcactta 15060 caccatcaac acgggcgcat accaccgctt tgtggacatg gatgacttcc agtctaccct 15120 cacgcaggtg cagcaggcca tattagccga gcgcgttgtc gccgacctag ccctgcttca 15180 gccgatgagg ggcttcgggg tcacacgcat gggaggaaga gggcgccacc tacggccaaa 15240 ctccgccgcc gccgcagcga tagatgcaag agatgcagga caagaggaag gagaagaaga 15300 agtgccggta gaaaggctca tgcaagacta ctacaaagac ctgcgccgat gtcaaaacga 15360 agcctggggc atggccgacc gcctgcgcat tcagcaggcc ggacccaagg acatggtgct 15420 tctg 15424 <210> 393 <211> 3849 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 393 cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 60 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 120 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 180 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 240 gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 300 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 360 catttccccg aaaagtgcca cctaaattgt aagcgttaat attttgttaa aattcgcgtt 420 aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta 480 taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc 540 actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg 600 cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact 660 aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt 720 ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc 780 ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc 840 ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 900 attacgccag ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 960 ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 1020 ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta 1080 gccatgctct aggaagagta ccattgacgt caataatgac gtatgttccc atagtaacgc 1140 caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 1200 cagtacatca agtgtatcag tggtttgtct ggtcaaccac cgcggtctca gtggtgtacg 1260 gtacaaaccc agctaccggt cgccaccatg cccgccatga agatcgagtg ccgcatcacc 1320 ggcaccctga acggcgtgga gttcgagctg gtgggcggcg gagagggcac ccccgagcag 1380 ggccgcatga ccaacaagat gaagagcacc aaaggcgccc tgaccttcag cccctacctg 1440 ctgagccacg tgatgggcta cggcttctac cacttcggca cctaccccag cggctacgag 1500 aaccccttcc tgcacgccat caacaacggc ggctacacca acacccgcat cgagaagtac 1560 gaggacggcg gcgtgctgca cgtgagcttc agctaccgct acgaggccgg ccgcgtgatc 1620 ggcgacttca aggtggtggg caccggcttc cccgaggaca gcgtgatctt caccgacaag 1680 atcatccgca gcaacgccac cgtggagcac ctgcacccca tgggcgataa cgtgctggtg 1740 ggcagcttcg cccgcacctt cagcctgcgc gacggcggct actacagctt cgtggtggac 1800 agccacatgc acttcaagag cgccatccac cccagcatcc tgcagaacgg gggccccatg 1860 ttcgccttcc gccgcgtgga ggagctgcac agcaacaccg agctgggcat cgtggagtac 1920 cagcacgcct tcaagacccc catcgccttc gccagatctc gagctcgatg agtttggaca 1980 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2040 tttatttgtg ggcccgggat cttcctagag catggctacg tagataagta gcatggcggg 2100 ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct 2160 cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 2220 gcctcagtga gcgagcgagc gcgcagctgc attaatgaat cggccaacgc gcggggagag 2280 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 2340 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 2400 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 2460 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 2520 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 2580 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 2640 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 2700 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 2760 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 2820 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 2880 cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 2940 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 3000 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 3060 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 3120 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 3180 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 3240 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 3300 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 3360 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 3420 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 3480 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 3540 acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 3600 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 3660 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 3720 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 3780 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 3840 gctcttgcc 3849 <210> 394 <211> 7336 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 394 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggctct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 caacctctct gagggcattc gcgagtggtg ggcgctgaaa cctggagccc cgaagcccaa 1980 agccaaccag caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct 2040 cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct 2100 cgagcacgac aaggcctacg accagcagct gcaggcgggt gacaatccgt acctgcggta 2160 taaccacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220 cctcgggcga gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga 2280 ggaaggcgct aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc 2340 tccagactcc tctacgggca tcggcaagaa aggccaacag cccgccagaa aaagactcaa 2400 ttttggtcag actggcgact cagagtcagt tccagaccct caacctctcg gagaacctcc 2460 agcagcgccc tctggtgtgg gacctaatac aatggctgca ggcggtggcg caccaatggc 2520 agacaataac gaaggcgccg acggagtggg tagttcctcg ggaaattggc attgcgattc 2580 cacatggctg ggcgacagag tcatcaccac cagcacccga acctgggccc tgcccaccta 2640 caacaaccac ctctacaagc aaatctccaa cgggacatcg ggaggagcca ccaacgacaa 2700 cacctacttc ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca 2760 cttttcacca cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag 2820 actcagcttc aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa 2880 gaccatcgcc aataacctca ccagcaccat ccaggtgttt acggactcgg agtaccagct 2940 gccgtacgtt ctcggctctg cccaccaggg ctgcctgcct ccgttcccgg cggacgtgtt 3000 catgattccc cagtacggct acctaacact caacaacggt agtcaggccg tgggacgctc 3060 ctccttctac tgcctggaat actttccttc gcagatgctg agaaccggca acaacttcca 3120 gtttacttac accttcgagg acgtgccttt ccacagcagc tacgcccaca gccagagctt 3180 ggaccggctg atgaatcctc tgattgacca gtacctgtac tacttgtctc ggactcaaac 3240 aacaggaggc acggcaaata cgcagactct gggcttcagc caaggtgggc ctaatacaat 3300 ggccaatcag gcaaagaact ggctgccagg accctgttac cgccaacaac gcgtctcaac 3360 gacaaccggg caaaacaaca atagcaactt tgcctggact gctgggacca aataccatct 3420 gaatggaaga aattcattgg ctaatcctgg catcgctatg gcaacacaca aagacgacga 3480 ggagcgtttt tttcccagta acgggatcct gatttttggc aaacaaaatg ctgccagaga 3540 caatgcggat tacagcgatg tcatgctcac cagcgaggaa gaaatcaaaa ccactaaccc 3600 tgtggctaca gaggaatacg gtatcgtggc agataacttg cagcagcaaa acacggctcc 3660 tcaaattgga actgtcaaca gccagggggc cttacccggt atggtctggc agaaccggga 3720 cgtgtacctg cagggtccca tctgggccaa gattcctcac acggacggca acttccaccc 3780 gtctccgctg atgggcggct ttggcctgaa acatcctccg cctcagatcc tgatcaagaa 3840 cacgcctgta cctgcggatc ctccgaccac cttcaaccag tcaaagctga actctttcat 3900 cacgcaatac agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaggaaaa 3960 cagcaagcgc tggaaccccg agatccagta cacctccaac tactacaaat ctacaagtgt 4020 ggactttgct gttaatacag aaggcgtgta ctctgaaccc cgccccattg gcacccgtta 4080 cctcacccgt aatctgtaat tgcctgttaa tcaataaacc ggttgattcg tttcagttga 4140 actttggtct ctgcgaaggg cgaattcgtt taaacctgca ggactagagg tcctgtatta 4200 gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct gggtatttaa 4260 gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc gcagccgcca 4320 agccgaattc tgcagatatc catcacactg gcggccgctc gactagagcg gccgccaccg 4380 cggtggagct ccagcttttg ttccctttag tgagggttaa ttgcgcgctt ggcgtaatca 4440 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 4500 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 4560 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 4620 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 4680 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 4740 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 4800 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 4860 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4920 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4980 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 5040 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 5100 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5160 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 5220 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 5280 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 5340 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 5400 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 5460 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 5520 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 5580 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5640 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 5700 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 5760 gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 5820 gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5880 tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5940 tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 6000 tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 6060 aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 6120 atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 6180 tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 6240 catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 6300 aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 6360 tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 6420 gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 6480 tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 6540 tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctaaattg 6600 taagcgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta 6660 accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt 6720 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 6780 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa 6840 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 6900 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 6960 gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 7020 ccgcgcttaa tgcgccgcta cagggcgcgt cccattcgcc attcaggctg cgcaactgtt 7080 gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg 7140 ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga 7200 cggccagtga gcgcgcgtaa tacgactcac tatagggcga attgggtacc gggccccccc 7260 tcgatcgagg tcgacggtat cgggggagct cgcagggtct ccattttgaa gcgggaggtt 7320 tgaacgcgca gccgcc 7336 <210> 395 <211> 969 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 395 ccccaactgg ggtaaccttt gggctccccg ggcgcgacta taagctgcga gcaacttcac 60 ttgggtatgc cggcggtagc gcttaccgtt cgtataatgt atgctatacg aagttatccg 120 aagccgctag cggtggtttg tctggtcaac caccgcggtc tcagtggtgt acggtacaaa 180 cccagctacc ggtcgccacc atgcccgcca tgaagatcga gtgccgcatc accggcaccc 240 tgaacggcgt ggagttcgag ctggtgggcg gcggagaggg cacccccgag cagggccgca 300 tgaccaacaa gatgaagagc accaaaggcg ccctgacctt cagcccctac ctgctgagcc 360 acgtgatggg ctacggcttc taccacttcg gcacctaccc cagcggctac gagaacccct 420 tcctgcacgc catcaacaac ggcggctaca ccaacacccg catcgagaag tacgaggacg 480 gcggcgtgct gcacgtgagc ttcagctacc gctacgaggc cggccgcgtg atcggcgact 540 tcaaggtggt gggcaccggc ttccccgagg acagcgtgat cttcaccgac aagatcatcc 600 gcagcaacgc caccgtggag cacctgcacc ccatgggcga taacgtgctg gtgggcagct 660 tcgcccgcac cttcagcctg cgcgacggcg gctactacag cttcgtggtg gacagccaca 720 tgcacttcaa gagcgccatc caccccagca tcctgcagaa cgggggcccc atgttcgcct 780 tccgccgcgt ggaggagctg cacagcaaca ccgagctggg catcgtggag taccagcacg 840 ccttcaagac ccccatcgcc ttcgccagat ctcgagctcg atgagtttgg acaaaccaca 900 actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 960 gtgggcccg 969 <210> 396 <211> 4769 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 396 tgatcccctg cgccatcaga tccttggcgg cgagaaagcc atccagttta ctttgcaggg 60 cttcccaacc ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa 120 aaccgcccag tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc 180 gcttgcgttt tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg 240 tttctgcgga ctggctttct acgtgctcga ggggggccaa acggtctcca gcttggctgt 300 tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 360 ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 420 aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 480 gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 540 tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 600 gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 660 gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc tacaaactct 720 tttgtttatt tttctaaata cattcaaata tgtatccgct catgaccaaa atcccttaac 780 gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 840 atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 900 tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 960 gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 1020 actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 1080 gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 1140 agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 1200 ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 1260 aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 1320 cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 1380 gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 1440 cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 1500 cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 1560 gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 1620 attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 1680 tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 1740 catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 1800 cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 1860 ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 1920 gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 1980 cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 2040 cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 2100 tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 2160 catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 2220 taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 2280 aacatgctgt gcgacgctgg cgatacatta ccctgttatc cctagatgac attaccctgt 2340 tatcccagat gacattaccc tgttatccct agatgacatt accctgttat ccctagatga 2400 catttaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 2460 atccctagat acattaccct gttatcccag atgacatacc ctgttatccc tagatgacat 2520 taccctgtta tcccagatga cattaccctg ttatccctag atacattacc ctgttatccc 2580 agatgacata ccctgttatc cctagatgac attaccctgt tatcccagat gacattaccc 2640 tgttatccct agatacatta ccctgttatc ccagatgaca taccctgtta tccctagatg 2700 acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 2760 tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 2820 accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 2880 gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 2940 gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagataa 3000 actcaatgat gatgatgatg atggtcgaga ctcagcggcc gcggtgccag ggcgtgccct 3060 tgggctcccc gggcgcgatg cccgccatga agatcgagtg ccgcatcacc ggcaccctga 3120 acggcgtgga gttcgagctg gtgggcggcg gagagggcac ccccgagcag ggccgcatga 3180 ccaacaagat gaagagcacc aaaggcgccc tgaccttcag cccctacctg ctgagccacg 3240 tgatgggcta cggcttctac cacttcggca cctaccccag cggctacgag aaccccttcc 3300 tgcacgccat caacaacggc ggctacacca acacccgcat cgagaagtac gaggacggcg 3360 gcgtgctgca cgtgagcttc agctaccgct acgaggccgg ccgcgtgatc ggcgacttca 3420 aggtggtggg caccggcttc cccgaggaca gcgtgatctt caccgacaag atcatccgca 3480 gcaacgccac cgtggagcac ctgcacccca tgggcgataa cgtgctggtg ggcagcttcg 3540 cccgcacctt cagcctgcgc gacggcggct actacagctt cgtggtggac agccacatgc 3600 acttcaagag cgccatccac cccagcatcc tgcagaacgg gggccccatg ttcgccttcc 3660 gccgcgtgga ggagctgcac agcaacaccg agctgggcat cgtggagtac cagcacgcct 3720 tcaagacccc catcgccttc gccagatctc gagctcgagg tggtttgtct ggtcaaccac 3780 cgcggtctca gtggtgtacg gtacaaaccc accccaactg gggtaacctt tgagttctct 3840 cagttggggg taatcagcat catgatgtgg taccacatca tgatgctgat tataagaatg 3900 cggccgccac actctagtgg atctcgagtt aataattcag aagaactcgt caagaaggcg 3960 atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga ggaagcggtc 4020 agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta tgtcctgata 4080 gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc cattttccac 4140 catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcctcgc cgtcgggcat 4200 gctcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct cttcgtccag 4260 atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga tgcgatgttt 4320 cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc gcattgcatc 4380 agccatgatg gatactttct cggcaggagc aaggtgtaga tgacatggag atcctgcccc 4440 ggcacttcgc ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct 4500 gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ttgcagttca 4560 ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc 4620 cggaacacgg cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc 4680 ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat catgcgaaac 4740 gatcctcatc ctgtctcttg atcagagct 4769 <210> 397 <211> 797 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 397 ccccaactgg ggtaaccttt gggctccccg ggcgcgatgg tgagcaaggg cgaggaggat 60 aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg ctccgtgaac 120 ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 180 gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat cctgtcccct 240 cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc cgactacttg 300 aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 360 gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta caaggtgaag 420 ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac catgggctgg 480 gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga gatcaagcag 540 aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac ctacaaggcc 600 aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga catcacctcc 660 cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg ccactccacc 720 ggcggcatgg acgagctgta caagggtggt ttgtctggtc aaccaccgcg agctcagtgg 780 tgtacggtac aaaccca 797 <210> 398 <211> 815 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 398 ccccaactgg ggtaaccttt gggctccccg ggcgcggccg ccaccatggt gtccaagggt 60 gaggaacttt ttaccggagt ggtgccgata ctggtagagc tggatggcga cgtaaacggg 120 cacaagttca gtgtacgggg agagggcgag ggcgacgcta cgaatgggaa attgactttg 180 aaatttattt gcaccacggg caaattgccg gtcccgtggc caactttggt tacgaccttg 240 acctatggcg ttcagtgttt ctcacggtac ccagaccaca tgaaacagca tgactttttt 300 aagtcagcga tgccggaggg atatgtgcaa gaacggacta tctcatttaa agatgatggc 360 acatataaga caagagcgga agtcaaattc gaaggggaca ccctcgtcaa tcgaatagaa 420 ctcaagggaa tagacttcaa agaagatggt aatatactgg ggcacaaact cgaatacaat 480 ttcaacagtc ataacgtcta catcactgcc gacaaacaaa aaaatgggat caaagcgaac 540 ttcaaaatcc gacataatgt cgaggatggg agcgtccaac tggcagacca ttaccagcaa 600 aatactccaa taggtgatgg tccagtgctt ttgccagata atcattatct tagctatcag 660 agcaagttga gtaaggatcc gaatgaaaag cgagatcaca tggtcttgct ggagtttgtt 720 acggcggctg gtatcacact tggtatggat gaattgtaca agggtggttt gtctggtcaa 780 ccaccgcgga ctcagtggtg tacggtacaa accca 815 <210> 399 <211> 1660 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 399 ccccaactgg ggtaaccttt gggctccccg ggcgcggcca ccatgaaatg ggttactttc 60 atatctctgt tgtttttgtt ttcctctagt tccagggcca tgccgtcttc tgtctcgtgg 120 ggcatcctcc tgctggcagg cctgtgctgc ctggtccctg tctccctggc tgaggatccc 180 cagggagatg ctgcccagaa gacagataca tcccaccatg atcaggatca cccaaccttc 240 aacaagatca cccccaacct ggctgagttc gccttcagcc tataccgcca gctggcacac 300 cagtccaaca gcaccaatat cttcttctcc ccagtgagca tcgctacagc ctttgcaatg 360 ctctccctgg ggaccaaggc tgacactcac gatgaaatcc tggagggcct gaatttcaac 420 ctcacggaga ttccggaggc tcagatccat gaaggcttcc aggaactcct ccgtaccctc 480 aaccagccag acagccagct ccagctgacc accggcaatg gcctgttcct cagcgagggc 540 ctgaagctag tggataagtt tttggaggat gttaaaaagt tgtaccactc agaagccttc 600 actgtcaact tcggggacac cgaagaggcc aagaaacaga tcaacgatta cgtggagaag 660 ggtactcaag ggaaaattgt ggatttggtc aaggagcttg acagagacac agtttttgct 720 ctggtgaatt acatcttctt taaaggcaaa tgggagagac cctttgaagt caaggacacc 780 gaggaagagg acttccacgt ggaccaggtg accaccgtga aggtgcctat gatgaagcgt 840 ttaggcatgt ttaacatcca gcactgtaag aagctgtcca gctgggtgct gctgatgaaa 900 tacctgggca atgccaccgc catcttcttc ctgcctgatg aggggaaact acagcacctg 960 gaaaatgaac tcacccacga tatcatcacc aagttcctgg aaaatgaaga cagaaggtct 1020 gccagcttac atttacccaa actgtccatt actggaacct atgatctgaa gagcgtcctg 1080 ggtcaactgg gcatcactaa ggtcttcagc aatggggctg acctctccgg ggtcacagag 1140 gaggcacccc tgaagctctc caaggccgtg cataaggctg tgctgaccat cgacgagaaa 1200 gggactgaag ctgctggggc catgttttta gaggccatac ccatgtctat cccccccgag 1260 gtcaagttca acaaaccctt tgtcttctta atgattgaac aaaataccaa gtctcccctc 1320 ttcatgggaa aagtggtgaa tcccacccaa aaataagaat tctaactaga gctcgctgat 1380 cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 1440 ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 1500 cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 1560 gggaggattg ggaagagaat agcaggcatg ctggggagcg agctcgaggt ggtttgtctg 1620 gtcaaccacc gcggtctcag tggtgtacgg tacaaaccca 1660 <210> 400 <211> 4906 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 400 ccccaactgg ggtaaccttt gggctccccg ggcgcggcca ccatgaaatg ggttactttc 60 atatctctgt tgtttttgtt ttcctctagt tccagggcca tgacgaggat tttgacagct 120 ttcaaagtgg tgaggacact gaagactggt tttggcttta ccaatgtgac tgcacaccaa 180 aaatggaaat tttcaagacc tggcatcagg ctcctttctg tcaaggcaca gacagcacac 240 attgtcctgg aagatggaac taagatgaaa ggttactcct ttggccatcc atcctctgtt 300 gctggtgaag tggtttttaa tactggcctg ggagggtacc cagaagctat tactgaccct 360 gcctacaaag gacagattct cacaatggcc aaccctatta ttgggaatgg tggagctcct 420 gatactactg ctctggatga actgggactt agcaaatatt tggagtctaa tggaatcaag 480 gtttcaggtt tgctggtgct ggattatagt aaagactaca accactggct ggctaccaag 540 agtttagggc aatggctaca ggaagaaaag gttcctgcaa tttatggagt ggacacaaga 600 atgctgacta aaataattcg ggataagggt accatgcttg ggaagattga atttgaaggt 660 cagcctgtgg attttgtgga tccaaataaa cagaatttga ttgctgaggt ttcaaccaag 720 gatgtcaaag tgtacggcaa aggaaacccc acaaaagtgg tagctgtaga ctgtgggatt 780 aaaaacaatg taatccgcct gctagtaaag cgaggagctg aagtgcactt agttccctgg 840 aaccatgatt tcaccaagat ggagtatgat gggattttga tcgcgggagg accggggaac 900 ccagctcttg cagaaccact aattcagaat gtcagaaaga ttttggagag tgatcgcaag 960 gagccattgt ttggaatcag tacaggaaac ttaataacag gattggctgc tggtgccaaa 1020 acctacaaga tgtccatggc caacagaggg cagaatcagc ctgttttgaa tatcacaaac 1080 aaacaggctt tcattactgc tcagaatcat ggctatgcct tggacaacac cctccctgct 1140 ggctggaaac cactttttgt gaatgtcaac gatcaaacaa atgaggggat tatgcatgag 1200 agcaaaccct tcttcgctgt gcagttccac ccagaggtca ccccggggcc aatagacact 1260 gagtacctgt ttgattcctt tttctcactg ataaagaaag gaaaagctac caccattaca 1320 tcagtcttac cgaagccagc actagttgca tctcgggttg aggtttccaa agtccttatt 1380 ctaggatcag gaggtctgtc cattggtcag gctggagaat ttgattactc aggatctcaa 1440 gctgtaaaag ccatgaagga agaaaatgtc aaaactgttc tgatgaaccc aaacattgca 1500 tcagtccaga ccaatgaggt gggcttaaag caagcggata ctgtctactt tcttcccatc 1560 acccctcagt ttgtcacaga ggtcatcaag gcagaacagc cagatgggtt aattctgggc 1620 atgggtggcc agacagctct gaactgtgga gtggaactat tcaagagagg tgtgctcaag 1680 gaatatggtg tgaaagtcct gggaacttca gttgagtcca ttatggctac ggaagacagg 1740 cagctgtttt cagataaact aaatgagatc aatgaaaaga ttgctccaag ttttgcagtg 1800 gaatcgattg aggatgcact gaaggcagca gacaccattg gctacccagt gatgatccgt 1860 tccgcctatg cactgggtgg gttaggctca ggcatctgtc ccaacagaga gactttgatg 1920 gacctcagca caaaggcctt tgctatgacc aaccaaattc tggtggagaa gtcagtgaca 1980 ggttggaaag aaatagaata tgaagtggtt cgagatgctg atgacaattg tgtcactgtc 2040 tgtaacatgg aaaatgttga tgccatgggt gttcacacag gtgactcagt tgttgtggct 2100 cctgcccaga cactctccaa tgccgagttt cagatgttga gacgtacttc aatcaatgtt 2160 gttcgccact tgggcattgt gggtgaatgc aacattcagt ttgcccttca tcctacctca 2220 atggaatact gcatcattga agtgaatgcc agactgtccc gaagctctgc tctggcctca 2280 aaagccactg gctacccatt ggcattcatt gctgcaaaga ttgccctagg aatcccactt 2340 ccagaaatta agaacgtcgt atccgggaag acatcagcct gttttgaacc tagcctggat 2400 tacatggtca ccaagattcc ccgctgggat cttgaccgtt ttcatggaac atctagccga 2460 attggtagct ctatgaaaag tgtaggagag gtcatggcta ttggtcgtac ctttgaggag 2520 agtttccaga aagctttacg gatgtgccac ccatctatag aaggtttcac tccccgtctc 2580 ccaatgaaca aagaatggcc atctaattta gatcttagaa aagagttgtc tgaaccaagc 2640 agcacgcgta tctatgccat tgccaaggcc attgatgaca acatgtccct tgatgagatt 2700 gagaagctca catacattga caagtggttt ttgtataaga tgcgtgatat tttaaacatg 2760 gaaaagacac tgaaaggcct caacagtgag tccatgacag aagaaaccct gaaaagggca 2820 aaggagattg ggttctcaga taagcagatt tcaaaatgcc ttgggctcac tgaggcccag 2880 acaagggagc tgaggttaaa gaaaaacatc cacccttggg ttaaacagat tgatacactg 2940 gctgcagaat acccatcagt aacaaactat ctctatgtta cctacaatgg tcaggagcat 3000 gatgtcaatt ttgatgacca tggaatgatg gtgctaggct gtggtccata tcacattggc 3060 agcagtgtgg aatttgattg gtgtgctgtc tctagtatcc gcacactgcg tcaacttggc 3120 aagaagacgg tggtggtgaa ttgcaatcct gagactgtga gcacagactt tgatgagtgt 3180 gacaaactgt actttgaaga gttgtccttg gagagaatcc tagacatcta ccatcaggag 3240 gcatgtggtg gctgcatcat atcagttgga ggccagattc caaacaacct ggcagttcct 3300 ctatacaaga atggtgtcaa gatcatgggc acaagccccc tgcagatcga cagggctgag 3360 gatcgctcca tcttctcagc tgtcttggat gagctgaagg tggctcaggc accttggaaa 3420 gctgttaata ctttgaatga agcactggaa tttgcaaagt ctgtggacta cccctgcttg 3480 ttgaggcctt cctatgtttt gagtgggtct gctatgaatg tggtattctc tgaggatgag 3540 atgaaaaaat tcctagaaga ggcgactaga gtttctcagg agcacccagt ggtgctgaca 3600 aaatttgttg aaggggcccg agaagtagaa atggacgctg ttggcaaaga tggaagggtt 3660 atctctcatg ccatctctga acatgttgaa gatgcaggtg tccactcggg agatgccact 3720 ctgatgctgc ccacacaaac catcagccaa ggggccattg aaaaggtgaa ggatgctacc 3780 cggaagattg caaaggcttt tgccatctct ggtccattca acgtccaatt tcttgtcaaa 3840 ggaaatgatg tcttggtgat tgagtgtaac ttgagagctt ctcgatcctt cccctttgtt 3900 tccaagactc ttggggttga cttcattgat gtggccacca aggtgatgat tggagagaat 3960 gttgatgaga aacatcttcc aacattggac catcccataa ttcctgctga ctatgttgca 4020 attaaggctc ccatgttttc ctggccccgg ttgagggatg ctgaccccat tctgagatgt 4080 gagatggctt ccactggaga ggtggcttgc tttggtgaag gtattcatac agccttccta 4140 aaggcaatgc tttccacagg atttaagata ccccagaaag gcatcctgat aggcatccag 4200 caatcattcc ggccaagatt ccttggtgtg gctgaacaat tacacaatga aggtttcaag 4260 ctgtttgcca cggaagccac atcagactgg ctcaacgcca acaatgtccc tgccacccca 4320 gtggcatggc cgtctcaaga aggacagaat cccagcctct cttccatcag aaaattgatt 4380 agagatggca gcattgacct agtgattaac cttcccaaca acaacactaa atttgtccat 4440 gataattatg tgattcggag gacagctgtt gatagtggaa tccctctcct cactaatttt 4500 caggtgacca aactttttgc tgaagctgtg cagaaatctc gcaaggtgga ctccaagagt 4560 cttttccact acaggcagta cagtgctgga aaagcagcat aggaattcta actagagctc 4620 gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 4680 tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 4740 ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 4800 gcaaggggga ggattgggaa gagaatagca ggcatgctgg ggagcgagct cgaggtggtt 4860 tgtctggtca accaccgcgg tctcagtggt gtacggtaca aaccca 4906 <210> 401 <211> 4882 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 401 ccccaactgg ggtaaccttt gggctccccg ggcgcgacta taagctgcga gcaacttcac 60 ttgggtatgc cggcggtagc gcttaccgtt cgtataatgt atgctatacg aagttatccg 120 aagccgctag cggtggtttg tctggtcaac caccgcggtc tcagtggtgt acggtacaaa 180 cccacccgag agaccatgca gaggtcgcct ctggaaaagg ccagcgttgt ctccaaactt 240 ttctttagct ggactagacc catccttcgt aaaggataca gacagcgcct ggaattgtca 300 gacatatacc aaatcccttc tgttgattct gctgacaatc tatctgaaaa attggaaaga 360 gaatgggata gagagctggc ttcaaagaaa aatcctaaac tcattaatgc ccttcggcga 420 tgttttttct ggagatttat gttctatgga atctttttat atttagggga agtcaccaaa 480 gcagtacagc ctctcttact gggaagaatc atagcttcct atgacccgga taacaaggag 540 gaacgctcta tcgcgattta tctaggcata ggcttatgcc ttctctttat tgtgaggaca 600 ctgctcctac acccagccat ttttggcctt catcacattg gaatgcagat gagaatagct 660 atgtttagtt tgatttataa gaagacttta aagctgtcaa gccgtgttct agataaaata 720 agtattggac aacttgttag tctcctttcc aacaacctga acaaatttga tgaaggactt 780 gcattggcac atttcgtgtg gatcgctcct ttgcaagtgg cactcctcat ggggctaatc 840 tgggagttgt tacaggcgtc tgccttctgt ggacttggtt tcctgatagt ccttgccctt 900 tttcaggctg ggctagggag aatgatgatg aagtacagag atcagagagc tgggaagatc 960 agtgaaagac ttgtgattac ctcagaaatg attgaaaata tccaatctgt taaggcatac 1020 tgctgggaag aagcaatgga aaaaatgatt gaaaacttaa gacaaacaga actgaaactg 1080 actcggaagg cagcctatgt gagatacttc aatagctcag ccttcttctt ctcagggttc 1140 tttgtggtgt ttttatctgt gcttccctat gcactaatca aaggaatcat cctccggaaa 1200 atattcacca ccatctcatt ctgcattgtt ctgcgcatgg cggtcactcg gcaatttccc 1260 tgggctgtac aaacatggta tgactctctt ggagcaataa acaaaataca ggatttctta 1320 caaaagcaag aatataagac attggaatat aacttaacga ctacagaagt agtgatggag 1380 aatgtaacag ccttctggga ggagggattt ggggaattat ttgagaaagc aaaacaaaac 1440 aataacaata gaaaaacttc taatggtgat gacagcctct tcttcagtaa tttctcactt 1500 cttggtactc ctgtcctgaa agatattaat ttcaagatag aaagaggaca gttgttggcg 1560 gttgctggat ccactggagc aggcaagact tcacttctaa tggtgattat gggagaactg 1620 gagccttcag agggtaaaat taagcacagt ggaagaattt cattctgttc tcagttttcc 1680 tggattatgc ctggcaccat taaagaaaat atcatctttg gtgtttccta tgatgaatat 1740 agatacagaa gcgtcatcaa agcatgccaa ctagaagagg acatctccaa gtttgcagag 1800 aaagacaata tagttcttgg agaaggtgga atcacactga gtggaggtca acgagcaaga 1860 atttctttag caagagcagt atacaaagat gctgatttgt atttattaga ctctcctttt 1920 ggatacctag acgtattgac tgagaaggag atcttcgagt cctgcgtttg caagcttatg 1980 gccaataaga caagaatcct ggttacaagt aagatggagc acctgaagaa ggccgataag 2040 attctgatcc tgcacgaggg atcttcatac ttctacggca ctttcagcga gcttcagaac 2100 ttgcaacctg atttctctag caagcttatg ggctgcgact cctttgatca gttctctgcc 2160 gagcgtcgca actccattct gaccgaaaca ctgcataggt tttccctcga gggcgacgca 2220 ccagtgtctt ggactgagac taagaagcag agcttcaagc aaaccggcga attcggtgag 2280 aagagaaaga acagtatcct gaaccccatt aattcaattc ggaagttcag tatcgttcag 2340 aaaacgcctc ttcagatgaa cgggattgag gaagactcag acgaaccgct tgaaaggcga 2400 ctctcattgg ttcctgacag tgaacaaggg gaagctattc tcccccggat ttcagtaatt 2460 tccacaggtc cgactctgca agcccggaga agacaatccg tgttgaatct tatgacccat 2520 tccgtgaatc aggggcaaaa tatccataga aagactactg cctctacgag gaaggtatcc 2580 cttgcacccc aagccaatct gacggagctc gacatctact ctcgccgcct gtcccaggag 2640 acaggactgg agattagcga ggagatcaat gaagaggatc tgaaagaatg tttcttcgac 2700 gacatggaat ccatccctgc cgtcacgacg tggaatacct atttgcgtta catcacggta 2760 cataaaagtc tgatattcgt cctgatctgg tgtcttgtga tcttcctcgc tgaagtcgca 2820 gccagcctgg tcgttctttg gctgctcggg aataccccct tgcaggataa gggaaactcc 2880 acccactctc ggaacaatag ttacgccgtc atcattactt ccacttcctc atactacgta 2940 ttctatatat atgtcggggt cgctgataca ctgctggcca tgggcttctt tcgcggcctg 3000 ccgctcgtcc acacgctgat aactgtctcc aagatcttgc atcataagat gctgcactca 3060 gtgctgcagg ctccaatgag tacactgaat actcttaagg ctggcggcat cctgaaccgc 3120 tttagtaagg acatcgccat acttgacgat ctcttgcccc tgacaatctt cgattttatt 3180 caactccttt tgatcgttat cggggcgatc gctgtggttg ctgtgttgca gccatatata 3240 ttcgtagcta ctgttcccgt catcgtcgcg ttcatcatgc tccgtgccta ctttctgcag 3300 acgtcccaac agctgaagca gctcgagagc gagggacggt cccccatatt tacgcacttg 3360 gtaactagtc tgaaggggct gtggactctg agagcatttg gtcgacaacc atatttcgag 3420 accctctttc ataaggccct caacctgcac accgcgaatt ggtttctgta tttgagtacg 3480 ttgcggtggt ttcagatgcg catcgagatg atattcgtga tattctttat cgcagtcaca 3540 tttatcagca tcctgactac gggcgaggga gagggtcgcg tgggcatcat actcacgctc 3600 gctatgaaca ttatgagcac cctgcaatgg gccgtgaata gctctatcga cgttgacagt 3660 cttatgcgat ctgtgagccg agtctttaag ttcattgaca tgccaacaga aggtaaacct 3720 accaagtcaa ccaaaccata caagaatggc caactctcga aagttatgat tattgagaat 3780 tcacacgtga agaaagatga catctggccc tcagggggcc aaatgactgt caaagatctc 3840 acagcaaaat acacagaagg tggaaatgcc atattagaga acatttcctt ctcaataagt 3900 cctggccaga gggtgggcct cttgggaaga actggatcag ggaagagtac tttgttatca 3960 gcttttttga gactactgaa cactgaagga gaaatccaga tcgatggtgt gtcttgggat 4020 tcaataactt tgcaacagtg gaggaaagcc tttggagtga taccacagaa agtatttatt 4080 ttttctggaa catttagaaa aaacttggat ccctatgaac agtggagtga tcaagaaata 4140 tggaaagttg cagatgaggt tgggctcaga tctgtgatag aacagtttcc tgggaagctt 4200 gactttgtcc ttgtggatgg gggctgtgtc ctaagccatg gccacaagca gttgatgtgc 4260 ttggctagat ctgttctcag taaggcgaag atcttgctgc ttgatgaacc cagtgctcat 4320 ttggatccag taacatacca aataattaga agaactctaa aacaagcatt tgctgattgc 4380 acagtaattc tctgtgaaca caggatagaa gcaatgctgg aatgccaaca atttttggtc 4440 atagaagaga acaaagtgcg gcagtacgat tccatccaga aactgctgaa cgagaggagc 4500 ctcttccggc aagccatcag cccctccgac agggtgaagc tctttcccca ccggaactca 4560 agcaagtgca agtctaagcc ccagattgct gctctgaaag aggagacaga agaagaggtg 4620 caagatacaa ggctttagac ccgctgatca gcctcgactg tgccttctag ttgccagcca 4680 tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 4740 ctttcctaat aaaatgagaa aattgcatcg cattgtctga gtaggtgtca ttctattctg 4800 gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 4860 ggggatgcgg tgggctctat gg 4882 <210> 402 <211> 1594 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 402 ccccaactgg ggtaaccttt gggctccccg ggcgcggttc cggatccgga gagggcaggg 60 gatctctcct tacttgtggc gacgtggagg agaaccccgg ccccatgagc atcggcctcc 120 tgtgctgtgc agccttgtct ctcctgtggg caggtccagt gaatgctggt gtcactcaga 180 ccccaaaatt ccaggtcctg aagacaggac agagcatgac actgcagtgt gcccaggata 240 tgaaccatga atacatgtcc tggtatcgac aagacccagg catggggctg aggctgattc 300 attactcagt tggtgctggt atcactgacc aaggagaagt ccccaatggc tacaatgtct 360 ccagatcaac cacagaggat ttcccgctca ggctgctgtc ggctgctccc tcccagacat 420 ctgtgtactt ctgtgccagc agttacgtcg ggaacaccgg ggagctgttt tttggagaag 480 gctctaggct gaccgtactg gaggacctga aaaacgtgtt cccacccgag gtcgctgtgt 540 ttgagccatc agaagcagag atctcccaca cccaaaaggc cacactggta tgcctggcca 600 caggcttcta ccccgaccac gtggagctga gctggtgggt gaatgggaag gaggtgcaca 660 gtggggtcag cacagacccg cagcccctca aggagcagcc cgccctcaat gactccagat 720 actgcctgag cagccgcctg agggtctcgg ccaccttctg gcagaacccc cgcaaccact 780 tccgctgtca agtccagttc tacgggctct cggagaatga cgagtggacc caggataggg 840 ccaaacccgt cacccagatc gtcagcgccg aggcctgggg tagagcagac tgtggcttca 900 cctccgagtc ttaccagcaa ggggtcctgt ctgccaccat cctctatgag atcttgctag 960 ggaaggccac cttgtatgcc gtgctggtca gtgccctcgt gctgatggct atggtcaaga 1020 gaaaggattc cagaggccgg gccaagcggt ccggatccgg agccaccaac ttcagcctgc 1080 tgaagcaggc cggcgacgtg gaggagaacc ccggccccat ggagaccctc ttgggcctgc 1140 ttatcctttg gctgcagctg caatgggtga gcagcaaaca ggaggtgacg cagattcctg 1200 cagctctgag tgtcccagaa ggagaaaact tggttctcaa ctgcagtttc actgatagcg 1260 ctatttacaa cctccagtgg tttaggcagg accctgggaa aggtctcaca tctctgttgc 1320 ttattcagtc aagtcagaga gagcaaacaa gtggaagact taatgcctcg ctggataaat 1380 catcaggacg tagtacttta tacattgcag cttctcagcc tggtgactca gccacctacc 1440 tctgtgctgt gaggcccctg tacggaggaa gctacatacc tacatttgga agaggaacca 1500 gccttattgt tcatccgtat atccagaacc ctgaccctgc gggtggtttg tctggtcaac 1560 caccgcggtc tcagtggtgt acggtacaaa ccca 1594 <210> 403 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 403 ttgagcgggc ccccaccgt 19 <210> 404 <211> 393 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 404 atgactcact atcaggcctt gcttttggac acggaccggg tccagttcgg accggtggta 60 gccctgaacc cggctacgct gctcccactg cctgaggaag ggctgcaaca caactgcctt 120 gatgggacag gtggcggtgg tgtcaccgtc aagttcaagt acaagggtga ggaacttgaa 180 gttgatatta gcaaaatcaa gaaggtttgg cgcgttggta aaatgatatc ttttacttat 240 gacgacaacg gcaagacagg tagaggggca gtgtctgaga aagacgcccc caaggagctg 300 ttgcaaatgt tggaaaagtc tgggaaaaag tctggcggct caaaaagaac cgccgacggc 360 agcgaattcg agcccaagaa gaagaggaaa gtc 393 <210> 405 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 405 cgacgacggc g 11 <210> 406 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 406 tttatttgtg ggcccg 16 <210> 407 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 407 tcgagtgccg catca 15 <210> 408 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 408 aaagtggtga ggacact 17 <210> 409 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 409 aacccacccg agaga 15 <210> 410 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 410 ggaagcggag ctactaactt cagcctgctg aagcaggctg gcgacgtgga ggagaaccct 60 ggacct 66 <210> 411 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 411 gggggaggag gttctggagg cggaggctcc ggaggcggag ggtca 45 <210> 412 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 412 ggaggtggcg ggagc 15 <210> 413 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 413 cccgcaccag cgcct 15 <210> 414 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 414 gaggcagctg ccaaggaagc cgctgccaag gaggcggccg caaag 45 <210> 415 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 415 agtgggagcg agacccctgg gactagcgag tcagctacac ccgaaagc 48 <210> 416 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 416 ggggggtcag gtggatccgg cggaagtggc ggatccggtg gatctggcgg cagt 54 <210> 417 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 417 gaagctgctg ctaag 15 <210> 418 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 418 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 419 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 419 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 420 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 420 Gly Gly Gly Gly Ser 1 5 <210> 421 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 421 Pro Ala Pro Ala Pro 1 5 <210> 422 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 422 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys 1 5 10 15 <210> 423 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 423 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 424 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 424 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 1 5 10 15 Gly Ser <210> 425 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 425 Glu Ala Ala Ala Lys 1 5 <210> 426 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 426 Gly Leu Ser Gly Gln Pro Pro Arg Ser Pro Ser Ser Gly Ser Ser Gly 1 5 10 15 <210> 427 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 427 Gly Gly Leu Ser Gly Gln Pro Pro Arg Ser Pro Ser Ser Gly Ser Ser 1 5 10 15 Gly <210> 428 <211> 88 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 428 gacgagcgcg gcgauaucau cauccauggc cggaugaucc ugacgacgga gaccgccguc 60 gucgacaagc cggccugagc ugcgagaa 88 <210> 429 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 429 gaagccggcc uugcacaugc 20 <210> 430 <211> 95 <212> DNA <213> Homo sapiens <400> 430 gcgcgcccgg ctattctcgc agctcaccat ggatgatgat atcgccgcgc tcgtcgtcga 60 caacggctcc ggcatgtgca aggccggctt cgcgg 95 <210> 431 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 431 accacucgac gcucuuaucg 20

Claims (91)

  1. 핵산을 세포 게놈(cell genome)으로 부위 특이적으로 통합(site-specific integration)하는 방법으로서, 상기 방법이
    (a) 세포에
    i. 역전사 효소 도메인(reverse transcriptase domain)에 연결된 DNA 결합 뉴클레아제로서, 상기 DNA 결합 뉴클레아제가 니카아제 활성을 포함하는, DNA 결합 뉴클레아제; 및
    ii. 통합 서열에 연결된 프라이머 결합 서열을 포함하는 가이드 RNA(gRNA)로서, 상기 gRNA가 DNA 결합 뉴클레아제와 상호작용하고 세포 게놈에서 목적하는 위치를 표적화(targeting)하며, 상기 DNA 결합 뉴클레아제가 세포 게놈의 가닥을 니킹(nicking)하고 상기 역전사 효소 도메인이 gRNA의 통합 서열을 니킹된 부위에 혼입하여 세포 게놈의 목적하는 위치에 통합 부위를 제공하는, 가이드 RNA(gRNA)를 도입함으로써 세포 게놈의 목적하는 위치에 통합 부위를 혼입하는 단계; 및
    (b) 세포에
    i. 상기 통합 부위에 상보적이거나 회합(associating)되는 서열에 연결된 핵산을 포함하는 DNA 또는 RNA 가닥; 및
    ii. 통합 효소로서, 상기 통합 효소가 통합 부위에 상보적이거나 회합되는 서열의 통합, 재조합, 또는 역전사에 의해 통합 부위에서 핵산을 세포 게놈에 혼입하여 핵산을 세포의 세포 게놈의 목적하는 위치에 도입하는, 통합 효소를 도입함으로써 세포 게놈에 핵산을 통합하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 gRNA가 DNA 결합 뉴클레아제에 의해 니킹된 게놈 가닥에 대한 세포 게놈의 상보적인 가닥에 혼성화되는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 통합 효소가 통합 효소를 암호화(encoding)하는 펩티드 또는 핵산으로서 도입되는, 방법.
  4. 제1항 내제 제3항 중 어느 한 항에 있어서, 상기 DNA 결합 뉴클레아제가 DNA 결합 뉴클레아제를 암호화하는 펩티드 또는 핵산으로서 도입되는, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA 또는 RNA 가닥이 미니서클(minicircle), 플라스미드, mRNA 또는 선형 DNA로서 세포에 도입되는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA 또는 RNA 가닥이 1000 bp 내지 36,000 bp인, 방법.
  7. 제1항 내지 제5항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA 또는 RNA 가닥이 36,000 bp 초과인, 방법.
  8. 제1항 내지 제5항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA 또는 RNA 가닥이 1000 bp 미만인, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA가 미니서클로서 세포에 도입되는, 방법.
  10. 제9항에 있어서, 상기 미니서클이 박테리아 기원의 서열을 포함하지 않는, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 역전사 효소 도메인에 연결된 상기 DNA 결합 뉴클레아제와 상기 통합 효소가 링커(linker)를 통해 연결되는, 방법.
  12. 제11항에 있어서, 상기 링커가 절단 가능한, 방법.
  13. 제11항에 있어서, 상기 링커가 절단 가능하지 않은, 방법.
  14. 제11항에 있어서, 상기 링커가 역전사 효소에 연결된 DNA 결합 뉴클레아제의 2개의 회합 결합 도메인으로 대체될 수 있는, 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1,
    Figure pct00119
    C31, RDF, FLP,
    Figure pct00120
    BT1, R1, R2, R3, R4, R5, TP901-1, A118,
    Figure pct00121
    FC1,
    Figure pct00122
    C1, MR11, TG1,
    Figure pct00123
    370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, 베네딕트, KSSJEB, 패티P, 둠(Doom), 스카울(Scowl), 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
    Figure pct00124
    RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스에 의해 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택되는, 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 통합 효소가 Bxb1 또는 이의 돌연변이체인, 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 통합 부위가 attB 부위, attP 부위, attL 부위, attR 부위, lox71 부위, Vox 부위, 또는 FRT 부위인, 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A 및 Cas12a/b 니카아제로부터 선택되는, 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 역전사 효소 도메인이 몰로니 뮤린(Moloney Murine) 백혈병 바이러스(M-MLV) 역전사 효소 도메인, 전사 제노폴리머라제(RTX), 조류 골수모세포증 바이러스 역전사 효소(AMV-RT) 및 유박테리움 렉탈레 마투라제 RT (마라톤RT)로 이루어진 그룹으로부터 선택되는, 방법.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 역전사 효소 도메인이 야생형 서열에 대한 돌연변이를 포함하는, 방법.
  21. 제19항에 있어서, 상기 M-MLV 역전사 효소 도메인이 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함하는, 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 제2 니킹 가이드 RNA(ngRNA)를 도입하는 단계를 추가로 포함하는, 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 gRNA, DNA 결합 뉴클레아제를 암호화하는 상기 핵산, 상기 역전사 효소, 상보적 또는 회합된 통합 부위에 연결된 핵산을 포함하는 상기 DNA, 상기 통합 효소 및 임의로 상기 ngRNA가 단일 반응으로 세포에 도입되는, 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 gRNA, DNA 결합 뉴클레아제를 암호화하는 상기 핵산, 상기 역전사 효소, 상보적 통합 부위에 연결된 핵산을 포함하는 상기 DNA, 상기 통합 효소 및 임의로 상기 ngRNA가 바이러스, RNP, mRNA, 지질, 또는 중합체성 나노 입자를 사용하여 도입되는, 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 핵산이 리포터 유전자(reporter gene)인, 방법.
  26. 제25항에 있어서, 상기 리포터 유전자가 형광 단백질인, 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 세포가 분열 세포(dividing cell)인, 방법.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 세포가 비분열 세포인, 방법.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 세포 게놈에서 목적하는 위치가 돌연변이된 유전자의 유전자좌(locus)인, 방법.
  30. 제1항에 있어서, 상기 핵산이 소분자의 존재하에 단백질의 프로그램 가능한 녹다운을 위한 분해 태그(degradation tag)인, 방법.
  31. 제1항에 있어서, 상기 세포가 포유류 세포, 박테리아 세포 또는 식물 세포인, 방법.
  32. 제1항에 있어서, 상기 핵산이 T-세포 또는 자연 살해(NK) 세포에 통합하기 위한 T-세포 수용체(TCR), 키메라 항원 수용체(CAR), 인터류킨, 사이토카인, 또는 면역 체크포인트 유전자(immune checkpoint gene)인, 방법.
  33. 제32항에 있어서, 상기 TCR, 상기 CAR, 상기 인터류킨, 상기 사이토카인 또는 상기 면역 체크포인트 유전자가 미니서클 DNA를 사용하여 T-세포 또는 NK 세포 게놈의 표적 부위로 혼입되는, 방법.
  34. 제1항에 있어서, 상기 핵산이 베타 헤모글로빈(HBB) 유전자이고, 상기 세포가 조혈 줄기 세포(HSC)인, 방법.
  35. 제34항에 있어서, 상기 HBB 유전자가 미니서클 DNA를 사용하여 HSC 게놈에서 표적 부위에 혼입되는, 방법.
  36. 제34항에 있어서, 상기 핵산이 베타 지중해 빈혈(beta thalassemia) 또는 겸상 적혈구 빈혈(sickle cell anemia)을 담당하는 유전자인, 방법.
  37. 제1항에 있어서, 상기 핵산이 대사 유전자인, 방법.
  38. 제37항에 있어서, 상기 대사 유전자가 알파-1 항트립신 결핍 또는 오르니틴 트랜스카르바밀라제(OTC) 결핍에 관여하는, 방법.
  39. 제37항 또는 제38항에 있어서, 상기 대사 유전자가 유전된 질환에 관여하는 유전자인, 방법.
  40. 제1항에 있어서, 상기 핵산이 유전된 질환 또는 유전된 증후군에 관여하는 유전자인, 방법.
  41. 제40항에 있어서, 상기 유전된 질환이 낭포성 섬유증(cystic fibrosis), 가족성 고콜레스테롤혈증(familial hypercholesterolemia), 아데노신 데아미나제(ADA) 결핍, X-연결 SCID(X-SCID), 위스콧-알드리치 증후군(Wiskott-Aldrich syndrome; WAS), 혈색소 침착증(hemochromatosis), 테이-삭스병(Tay-Sachs), 취약 X 증후군(fragile X syndrome), 헌팅턴병(Huntington's disease), 마르판 증후군(Marfan syndrome), 페닐케톤뇨증(phenylketonuria), 또는 근위축증(muscular dystrophy)인, 방법.
  42. 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터(vector).
  43. 제42항에 있어서, 상기 링커가 절단 가능한, 벡터.
  44. 제42항에 있어서, 상기 링커가 절단 가능하지 않은, 벡터.
  45. 제42항에 있어서, 상기 링커가 역전사 효소에 연결된 DNA 결합 뉴클레아제의 두 개의 회합 결합 도메인을 포함하는, 벡터.
  46. 제42항에 있어서, 상기 통합 효소가 조건부 활성화 도메인 또는 조건부 발현 도메인을 포함하는, 벡터.
  47. 제46항에 있어서, 상기 통합 효소가 에스트로겐 수용체에 융합되는, 벡터.
  48. 제42항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택되는, 벡터.
  49. 제42항에 있어서, 상기 역전사 효소가 M-MLV 역전사 효소, AMV-RT, 마라톤RT (MarathonRT) 또는 RTX인, 벡터.
  50. 제49항에 있어서, 상기 역전사 효소가 야생형 M-MLV 역전사 효소에 대해 변형된(modified) M-MLV 역전사 효소인, 벡터.
  51. 제49항에 있어서, 상기 M-MLV 역전사 효소 도메인이 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함하는, 벡터.
  52. 제42항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1,
    Figure pct00125
    C31, RDF, FLP,
    Figure pct00126
    BT1, R1, R2, R3, R4, R5, TP901-1, A118,
    Figure pct00127
    FC1,
    Figure pct00128
    C1, MR11, TG1,
    Figure pct00129
    370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
    Figure pct00130
    RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 돌연변이체로 이루어진 그룹으로부터 선택되는, 벡터.
  53. 제52항에 있어서, 상기 재조합 효소 또는 인테그라제가 Bxb1 또는 이의 돌연변이체인, 벡터.
  54. 다음을 포함하는 세포:
    (a) 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터;
    (b) 프라이머 결합 서열, 통합 서열 및 가이드 서열을 포함하는 gRNA로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, gRNA;
    (c) 핵산 및 상기 암호화된 인테그라제, 재조합 효소 또는 역전사 효소에 의해 인식된 서열을 포함하는 DNA 미니서클 및
    (d) 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합할 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA).
  55. 제54항에 있어서, 상기 미니서클이 박테리아 기원의 서열을 포함하지 않는, 세포.
  56. 제54항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1,
    Figure pct00131
    C31, RDF, FLP,
    Figure pct00132
    BT1, R1, R2, R3, R4, R5, TP901-1, A118,
    Figure pct00133
    FC1,
    Figure pct00134
    C1, MR11, TG1,
    Figure pct00135
    370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰(Sheen), 문드레아(Mundrea), BxZ2,
    Figure pct00136
    RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르(Himar) 1), 마리너(모스(mos) 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택되는, 세포.
  57. 제54항에 있어서, 상기 통합 효소가 Bxb1 또는 이의 돌연변이체인, 세포.
  58. 제54항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A 및 Cas12a로 이루어진 그룹으로부터 선택되는, 세포.
  59. 제54항에 있어서, 상기 역전사 효소가 M-MLV 역전사 효소인, 세포.
  60. 제59항에 있어서, 상기 역전사 효소가 변형된 M-MLV 역전사 효소인, 세포.
  61. 제59항에 있어서, M-MLV 역전사 효소의 상기 아미노산 서열이 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함하는, 세포.
  62. 제54항 내지 제61항 중 어느 한 항에 있어서, ngRNA를 추가로 포함하는, 세포.
  63. 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 포함하는 폴리펩티드.
  64. 제63항에 있어서, 상기 링커가 절단 가능한, 폴리펩티드.
  65. 제63항에 있어서, 상기 링커가 절단 가능하지 않은, 폴리펩티드.
  66. 제63항에 있어서, 상기 통합 효소가 에스트로겐 수용체에 융합되는, 폴리펩티드.
  67. 제63항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A, 및 Cas12a/b/c/d/e/f/g/h/i/j로 이루어진 그룹으로부터 선택되는, 폴리펩티드.
  68. 제63항에 있어서, 상기 역전사 효소가 M-MLV 역전사 효소, AMV-RT, 마라톤RT, 또는 XRT인, 폴리펩티드.
  69. 제68항에 있어서, 상기 역전사 효소가 야생형 M-MLV 역전사 효소에 대해 변형된 M-MLV인, 폴리펩티드.
  70. 제69항에 있어서, 상기 M-MLV 역전사 효소 도메인이 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함하는, 폴리펩티드.
  71. 제63항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1,
    Figure pct00137
    C31, RDF, FLP,
    Figure pct00138
    BT1, R1, R2, R3, R4, R5, TP901-1, A118,
    Figure pct00139
    FC1,
    Figure pct00140
    C1, MR11, TG1,
    Figure pct00141
    370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
    Figure pct00142
    RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택되는, 폴리펩티드.
  72. 제63항에 있어서, 상기 통합 효소가 Bxb1 또는 이의 돌연변이체인, 폴리펩티드.
  73. 니카아제 활성을 포함하는 DNA 결합 뉴클레아제에 특이적으로 결합하는 gRNA로서, 상기 gRNA가
    (a) 니킹된 DNA 가닥에 혼성화되는 프라이머 결합 부위;
    (b) 통합 효소에 대한 인식 부위; 및
    (c) 세포 게놈에서 표적 부위를 인식하고 DNA 결합 뉴클레아제에 의해 니킹된 가닥에 상보적인 게놈 가닥에 혼성화되는 표적 인식 서열을 포함하는, gRNA.
  74. 제73항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A, 및 Cas12a/b/c/d/e/f/g/h/i/j로 이루어진 그룹으로부터 선택되는, gRNA.
  75. 제73항에 있어서, 상기 프라이머 결합 부위가 니킹된 DNA 가닥의 3' 말단에 혼성화되는, gRNA.
  76. 제73항에 있어서, 통합 효소에 대한 상기 인식 부위가 attB 부위, attP 부위, attL 부위, attR 부위, lox71 부위 및 FRT 부위로부터 선택되는, gRNA.
  77. 제73항에 있어서, 통합 효소에 대한 상기 인식 부위가 Bxb1 부위인, gRNA.
  78. 둘 이상의 핵산을 세포 게놈으로 부위 특이적으로 통합하는 방법으로서, 상기 방법이
    (a) 세포에
    i. 역전사 효소 도메인에 연결된 DNA 결합 뉴클레아제로서, 상기 DNA 결합 뉴클레아제가 니카아제 활성을 포함하는, DNA 결합 뉴클레아제; 및
    ii. 각각 프라이머 결합 서열을 포함하고, 고유한 통합 서열에 연결된 두 개의 가이드 RNA(gRNA)로서, 상기 gRNA가 DNA 결합 뉴클레아제와 상호작용하고 세포 게놈에서 목적하는 위치를 표적화하며, 상기 DNA 결합 뉴클레아제가 세포 게놈의 가닥을 니킹하고 상기 역전사 효소 도메인이 gRNA의 통합 서열 각각을 니킹된 부위에 혼입하여 세포 게놈의 목적하는 위치에 통합 부위를 제공하는, 두 개의 가이드 RNA(gRNA)를 도입함으로써 세포 게놈의 목적하는 위치에 두 개의 통합 부위를 혼입하는 단계; 및
    (b) 세포에
    i. 핵산을 포함하는 2개 이상의 DNA 또는 RNA로서, 각 DNA가 직교 통합 부위(orthogonal integration site)에 의해 측면에 있는(flanked), 2개 이상의 DNA 또는 RNA; 및
    ii. 통합 효소로서, 상기 통합 효소가 통합 부위에 상보적이거나 회합되는 서열의 인테그라제, 재조합 효소, 또는 역전사 효소에 의해 통합 부위에서 핵산을 세포 게놈에 혼입하여 핵산을 세포의 세포 게놈의 목적하는 위치에 도입하는, 통합 효소를 도입함으로써 핵산을 통합하는 단계를 포함하는, 방법.
  79. 제78항에 있어서, 세포 게놈에 삽입된 상기 두 개의 상이한 통합 부위 각각이 상이한 회문(palindromic) 또는 비회문 중심 디뉴클레오티드를 포함하는 attB 서열인, 방법.
  80. 제78항에 있어서, 세포 게놈에 삽입된 상기 두 개의 상이한 통합 부위 각각이 상이한 회문 또는 비회문 중심 디뉴클레오티드를 포함하는 attP 서열인, 방법.
  81. 제78항에 있어서, 상기 통합 효소가 핵산을 포함하는 2개 이상의 DNA 또는 RNA 각각이 한 쌍의 직교 attB 부위 서열 및 attP 부위 서열의 재조합을 통해 게놈으로 핵산의 통합을 방향적으로 가능하게 하도록 하는, 방법.
  82. 제78항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1,
    Figure pct00143
    C31, RDF, FLP,
    Figure pct00144
    BT1, TP901-1, A118,
    Figure pct00145
    FC1,
    Figure pct00146
    C1, MR11, TG1,
    Figure pct00147
    370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2,
    Figure pct00148
    RV, R1, R2, R3, R4, R5, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택되는, 방법.
  83. 제78항에 있어서, 상기 통합 효소가 Bxb1 또는 이의 돌연변이체인, 방법.
  84. 제78항에 있어서, 유전자를 포함하는 상기 DNA가 세포 유지 경로, 세포 분열 또는 신호 전달 경로에 관여하는 유전자인, 방법.
  85. 제78항에 있어서, 상기 역전사 효소 도메인이 몰로니 뮤린 백혈병 바이러스(M-MLV) 역전사 효소 도메인, 전사 제노폴리머라제(RTX) 또는 조류 골수모세포증 바이러스 역전사 효소(AMV-RT)를 포함하는, 방법.
  86. 제78항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택되는, 방법.
  87. 제78항에 있어서, 상기 attB 부위 서열 및 attP 부위 서열의 쌍이 서열번호 5 및 서열번호 6, 서열번호 7 및 서열번호 8, 서열번호 9 및 서열번호 10, 서열번호 11 및 서열번호 12, 서열번호 13 및 서열번호 14, 서열번호 15 및 서열번호 16, 서열번호 17 및 서열번호 18, 서열번호 19 및 서열번호 20, 서열번호 21 및 서열번호 22, 서열번호 23 및 서열번호 24, 서열번호 25 및 서열번호 26, 서열번호 27 및 서열번호 28, 서열번호 29 및 서열번호 30, 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 34, 및 서열번호 35 및 서열번호 36으로 이루어진 그룹으로부터 선택되는, 방법.
  88. 다음을 포함하는 세포:
    (a) 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되며, 상기 역전사 효소가 링커를 통해 재조합 효소 또는 인테그라제에 연결되는, 벡터;
    (b) 프라이머 결합 서열, 통합 서열 및 가이드 서열을 포함하는 두 개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 DNA 결합 뉴클레아제와 상호작용할 수 있는, 두 개의 가이드 RNA(gRNA);
    (c) 핵산 및 상기 암호화된 인테그라제 또는 재조합 효소에 의해 인식된 측면에 있는 attB 부위 서열 및 attP 부위 서열의 쌍을 포함하는 2개 이상의 DNA 또는 RNA 가닥; 및 임의로
    (d) 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합할 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA).
  89. 변형된 게놈을 포함하는 세포로서, 상기 변형이 상기 세포에
    (a) 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되는, 벡터;
    (b) 각각 프라이머 결합 서열, 게놈 통합 서열, 및 가이드 서열을 포함하는 2개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, 2개의 가이드 RNA(gRNA); 및 임의로,
    (c) 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합할 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA)를 도입함으로써 세포 게놈 내에 두 개의 직교 통합 부위의 혼입을 포함하는, 세포.
  90. 둘 이상의 핵산을 제90항의 세포의 세포 게놈에 통합하는 방법으로서, 상기 방법이 상기 세포에
    (a) 각각 핵산 및 한 쌍의 측면에 있는 직교 통합 부위 서열을 포함하는 두 개 이상의 DNA;
    (b) 핵산을 포함한 두 개 이상의 DNA의 방향적 연결을 가능하게 하는 통합 부위 서열을 인식할 수 있는 통합 효소; 및
    (c) 제1 DNA의 5' 직교 통합 서열을 제1 게놈 통합 서열과 통합하고, 마지막 DNA의 3' 직교 통합 서열을 마지막 게놈 통합 서열과 통합하여 둘 이상의 핵산을 세포 게놈에 혼입함으로써 핵산을 세포 게놈에 도입할 수 있도록 함을 포함하는, 방법.
  91. 변형된 게놈을 포함하는 세포로서, 상기 변형된 게놈의 변형이 상기 세포에
    (a) 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되는, 벡터;
    (b) 각각 프라이머 결합 서열, 게놈 통합 서열 및 가이드 서열을 포함하는 2개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, 2개의 가이드 RNA(gRNA); 및 임의로
    (c) 니카아제 활성을 포함하는 암호화된 뉴클레아제에 결합할 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA);
    (d) 핵산을 포함하는 2개 이상의 DNA 또는 RNA로서, 각각의 DNA가 직교 통합 부위에 의해 측면에 있는, 2개 이상의 DNA 또는 RNA; 및
    (e) 통합 효소로서, 상기 통합 효소가 핵산을 통합 부위에서 세포 게놈 내로 혼입하는, 통합 효소를 도입함으로써 세포 게놈 내에 2개의 직교 통합 부위의 혼입을 포함하는, 세포.
KR1020237013187A 2020-10-21 2021-10-21 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 KR20230091894A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063094803P 2020-10-21 2020-10-21
US63/094,803 2020-10-21
US202163222550P 2021-07-16 2021-07-16
US63/222,550 2021-07-16
PCT/US2021/056006 WO2022087235A1 (en) 2020-10-21 2021-10-21 Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)

Publications (1)

Publication Number Publication Date
KR20230091894A true KR20230091894A (ko) 2023-06-23

Family

ID=78821040

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237013187A KR20230091894A (ko) 2020-10-21 2021-10-21 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물

Country Status (10)

Country Link
US (6) US20220145293A1 (ko)
EP (1) EP4232583A1 (ko)
JP (1) JP2023546597A (ko)
KR (1) KR20230091894A (ko)
CN (1) CN116419975A (ko)
AU (1) AU2021364781A1 (ko)
CA (1) CA3196116A1 (ko)
IL (1) IL301368A (ko)
MX (1) MX2023004383A (ko)
WO (1) WO2022087235A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2021364781A1 (en) 2020-10-21 2023-06-01 Massachusetts Institute Of Technology Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
GB202113933D0 (en) * 2021-09-29 2021-11-10 Genome Res Ltd Methods for gene editing
WO2023076898A1 (en) * 2021-10-25 2023-05-04 The Broad Institute, Inc. Methods and compositions for editing a genome with prime editing and a recombinase
AU2022375820A1 (en) * 2021-11-01 2024-06-13 Tome Biosciences, Inc. Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo
WO2023114992A1 (en) * 2021-12-17 2023-06-22 Massachusetts Institute Of Technology Programmable insertion approaches via reverse transcriptase recruitment
WO2023122764A1 (en) 2021-12-22 2023-06-29 Tome Biosciences, Inc. Co-delivery of a gene editor construct and a donor template
WO2023205744A1 (en) * 2022-04-20 2023-10-26 Tome Biosciences, Inc. Programmable gene insertion compositions
US20230407280A1 (en) 2022-04-20 2023-12-21 Massachusetts Institute Of Technology Programmable gene editing using guide rna pair
US20230383274A1 (en) 2022-04-20 2023-11-30 Massachusetts Institute Of Technology Site specific genetic engineering utilizing trans-template rnas
WO2023215831A1 (en) * 2022-05-04 2023-11-09 Tome Biosciences, Inc. Guide rna compositions for programmable gene insertion
WO2023225670A2 (en) * 2022-05-20 2023-11-23 Tome Biosciences, Inc. Ex vivo programmable gene insertion
WO2024020346A2 (en) 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
WO2024020587A2 (en) * 2022-07-22 2024-01-25 Tome Biosciences, Inc. Pleiopluripotent stem cell programmable gene insertion
WO2024100604A1 (en) 2022-11-09 2024-05-16 Juno Therapeutics Gmbh Methods for manufacturing engineered immune cells
WO2024138194A1 (en) 2022-12-22 2024-06-27 Tome Biosciences, Inc. Platforms, compositions, and methods for in vivo programmable gene insertion
CN117720672B (zh) * 2024-02-07 2024-04-30 深锐(天津)生物医学有限公司 先导编辑系统及其应用

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
DK2800811T3 (en) 2012-05-25 2017-07-17 Univ Vienna METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION
US8993233B2 (en) 2012-12-12 2015-03-31 The Broad Institute Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
MY170059A (en) 2012-12-17 2019-07-02 Harvard College Rna-guided human genome engineering
NZ712727A (en) 2013-03-14 2017-05-26 Caribou Biosciences Inc Compositions and methods of nucleic acid-targeting nucleic acids
US20140349400A1 (en) * 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9388430B2 (en) * 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
CA2952613A1 (en) 2014-06-17 2015-12-23 Poseida Therapeutics, Inc. A method for directing proteins to specific loci in the genome and uses thereof
US10059940B2 (en) 2015-01-27 2018-08-28 Minghong Zhong Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents
WO2016205728A1 (en) 2015-06-17 2016-12-22 Massachusetts Institute Of Technology Crispr mediated recording of cellular events
US11447768B2 (en) 2016-03-01 2022-09-20 University Of Florida Research Foundation, Incorporated Molecular cell diary system
EP3443088B1 (en) 2016-04-13 2024-09-18 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
EP4431607A2 (en) 2016-09-09 2024-09-18 The Board of Trustees of the Leland Stanford Junior University High-throughput precision genome editing
US11274033B2 (en) 2016-09-12 2022-03-15 MEMS Drive (Nanjing) Co., Ltd. MEMS actuation systems and methods
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
WO2019051097A1 (en) 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
US11578323B2 (en) 2017-12-14 2023-02-14 Bayer Healthcare Llc RNA-programmable endonuclease systems and their use in genome editing and other applications
BR112021003380A2 (pt) 2018-08-28 2021-05-18 Flagship Pioneering Innovations Vi, Llc métodos e composições para modulação de um genoma
WO2020191249A1 (en) * 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
US10837021B1 (en) 2019-06-06 2020-11-17 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
MX2022002613A (es) 2019-09-03 2022-06-02 Myeloid Therapeutics Inc Metodos y composiciones para la integracion del genoma.
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
EP4085141A4 (en) * 2019-12-30 2024-03-06 The Broad Institute, Inc. GENOME EDITING USING ACTIVATED, FULLY ACTIVE CRISPR COMPLEXES OF REVERSE TRANSCRIPTASE
AU2021236683A1 (en) 2020-03-19 2022-11-17 Intellia Therapeutics, Inc. Methods and compositions for directed genome editing
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
US11299731B1 (en) * 2020-09-15 2022-04-12 Inscripta, Inc. CRISPR editing to embed nucleic acid landing pads into genomes of live cells
JP2023543803A (ja) 2020-09-24 2023-10-18 ザ ブロード インスティテュート,インコーポレーテッド プライム編集ガイドrna、その組成物、及びその使用方法
AU2021364781A1 (en) 2020-10-21 2023-06-01 Massachusetts Institute Of Technology Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
JP2023549125A (ja) 2020-11-05 2023-11-22 ユニバーシティ オブ ワシントン プライム編集に基づく精密なゲノムの削除と置換方法

Also Published As

Publication number Publication date
US20220154224A1 (en) 2022-05-19
US20230279391A1 (en) 2023-09-07
US11952571B2 (en) 2024-04-09
US11572556B2 (en) 2023-02-07
EP4232583A1 (en) 2023-08-30
JP2023546597A (ja) 2023-11-06
US11834658B2 (en) 2023-12-05
WO2022087235A1 (en) 2022-04-28
AU2021364781A1 (en) 2023-06-01
US20240067961A1 (en) 2024-02-29
US11827881B2 (en) 2023-11-28
US20240076662A1 (en) 2024-03-07
MX2023004383A (es) 2023-05-04
CN116419975A (zh) 2023-07-11
US20220145293A1 (en) 2022-05-12
US20230135673A1 (en) 2023-05-04
IL301368A (en) 2023-05-01
CA3196116A1 (en) 2022-04-28

Similar Documents

Publication Publication Date Title
KR20230091894A (ko) 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물
AU2018229561B2 (en) Recombinant adenoviruses and use thereof
US20030119104A1 (en) Chromosome-based platforms
US6156567A (en) Truncated transcriptionally active cytomegalovirus promoters
US6090393A (en) Recombinant canine adenoviruses, method for making and uses thereof
KR20230019843A (ko) 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
US10704061B2 (en) Lentiviral vectors
KR20210056329A (ko) 신규 cas12b 효소 및 시스템
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
DK2718440T3 (en) NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF
US20040003420A1 (en) Modified recombinase
KR102516697B1 (ko) 조작된 캐스케이드 구성성분 및 캐스케이드 복합체
CN110684804B (zh) 递送外源rnp的慢病毒载体及其制备方法
KR20210080375A (ko) 암 면역요법을 위한 재조합 폭스바이러스
AU782960B2 (en) Conditional gene trapping construct for the disruption of genes
KR102614328B1 (ko) T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스
KR20190138274A (ko) 클로스트리디움 박테리아의 변형을 위한 최적화된 유전 툴
KR102584628B1 (ko) T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
AU2017252409A1 (en) Compositions and methods for nucleic acid expression and protein secretion in bacteroides
JP2023025182A (ja) T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム
CN115968300A (zh) 用于体内转导的载体和方法
CN114729387A (zh) 遗传修饰真菌和与其相关方法和用途
EP1395612A2 (en) Modified recombinase
KR20240029020A (ko) Dna 변형을 위한 crispr-트랜스포손 시스템