KR20210006966A - 조작된 캐스케이드 구성성분 및 캐스케이드 복합체 - Google Patents

조작된 캐스케이드 구성성분 및 캐스케이드 복합체 Download PDF

Info

Publication number
KR20210006966A
KR20210006966A KR1020207035239A KR20207035239A KR20210006966A KR 20210006966 A KR20210006966 A KR 20210006966A KR 1020207035239 A KR1020207035239 A KR 1020207035239A KR 20207035239 A KR20207035239 A KR 20207035239A KR 20210006966 A KR20210006966 A KR 20210006966A
Authority
KR
South Korea
Prior art keywords
protein
cascade
crispr
sequence
complex
Prior art date
Application number
KR1020207035239A
Other languages
English (en)
Other versions
KR102516697B1 (ko
Inventor
피터 션 카메론
스콧 데이비드 그라디아
산느 에블린 클롬프
사무엘 헨리 스턴버그
매튜 스콧 톰슨
Original Assignee
카리부 바이오사이언시스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/104,875 external-priority patent/US10227576B1/en
Application filed by 카리부 바이오사이언시스 인코포레이티드 filed Critical 카리부 바이오사이언시스 인코포레이티드
Priority to KR1020237007018A priority Critical patent/KR20230035689A/ko
Publication of KR20210006966A publication Critical patent/KR20210006966A/ko
Application granted granted Critical
Publication of KR102516697B1 publication Critical patent/KR102516697B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21004Type II site-specific deoxyribonuclease (3.1.21.4)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 개시내용은 다중-단백질 이펙터 복합체, 유형 I CRISPR-Cas (캐스케이드) 서브유닛 단백질 및 핵산 가이드를 포함하는 핵단백질 복합체, 유형 I CRISPR-Cas 서브유닛 단백질을 코딩하는 폴리뉴클레오티드, 및 가이드 폴리뉴클레오티드를 포함하는 조작된 클래스 1 유형 I CRISPR-Cas 시스템을 제공한다. 또한, 본 발명의 조작된 클래스 1 유형 I CRISPR-Cas 시스템을 제조하고 사용하는 방법이 개시된다.

Description

조작된 캐스케이드 구성성분 및 캐스케이드 복합체
관련 출원에 대한 상호 참조
본 출원은 2019년 3월 12일에 등록된 미국 특허 번호 10,227,576인, 2018년 8월 17일에 출원된 미국 특허 출원 번호 16/104,875의 연속인, 2019년 1월 30일에 출원되고 현재 허여된 미국 특허 출원 번호 16/262,773의 연속인, 2019년 5월 22일에 출원되고 현재 계류중인 미국 특허 출원 번호 16/420,061의 부분 연속이고; 2018년 6월 13일에 출원되고 현재 계류중인 미국 가출원 번호 62/684,735, 및 2019년 2월 19일에 출원되고 현재 계류중인 미국 가출원 번호 62/807,717을 우선권 주장하며, 이들 가출원의 내용은 그 전체 내용이 본원에 참조로 포함된다.
연방 정부의 지원을 받는 연구 또는 개발에 관한 설명서
적용가능하지 않음.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출되었고 그 전체 내용이 본원에 참조로 포함되는 서열 목록을 함유한다. 2019년 6월 12일에 창출된, 상기 ASCII 카피는 CBI032-30_ST25.txt로 명명되고 그 크기가 3.1 MB이다.
기술 분야
본 개시내용은 일반적으로, 다중-단백질 이펙터 복합체, 유형 I CRISPR-Cas (캐스케이드) 서브유닛 단백질 및 핵산 가이드를 포함하는 핵단백질 복합체, 유형 I CRISPR-Cas 서브유닛 단백질을 코딩하는 폴리뉴클레오티드, 및 가이드 폴리뉴클레오티드를 포함하는 조작된 클래스 1 유형 I CRISPR-Cas 시스템에 관한 것이다. 본 개시내용은 또한 본 발명의 조작된 유형 I CRISPR-Cas 시스템을 제조하고 사용하기 위한 조성물 및 방법에 관한 것이다.
클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) 및 CRISPR-연합된 단백질 (Cas)이 CRISPR-Cas 시스템을 구성한다. 이러한 CRISPR-Cas 시스템은 박테리아 및 고세균에서 외래 폴리뉴클레오티드에 대항한 적응 면역을 제공한다 (예를 들어, 문헌 [Barrangou, R., et al., Science 315:1709-1712 (2007); Makarova, K.S., et al., Nature Reviews Microbiology 9:467-477 (2011); Garneau, J.E., et al., Nature 468:67-71 (2010); Sapranauskas, R., et al., Nucleic Acids Res. 39:9275-9282 (2011); Koonin, E.V., et al., Curr. Opin. Microbiol. 37:67-78 (2017)] 참조). 그의 천연 숙주에서의 다양한 CRISPR-Cas 시스템은 DNA 표적화 (클래스 1 유형 I; 클래스 2 유형 II 및 유형 V), RNA 표적화 (클래스 2 유형 VI), 및 조인트 DNA 및 RNA 표적화 (클래스 1 유형 III)가 가능하다 (예를 들어, 문헌 [Makarova, K.S., et al., Nat. Rev. Microbiol. 13:722-736 (2015); Shmakov, S., et al., Nat. Rev. Microbiol. 15:169-182 (2017); Abudayyeh, O.O., et al., Science 353:1-17 (2016)] 참조).
CRISPR-Cas 시스템의 분류는 여러 번 반복되어 왔다. 문헌 [Koonin, E.V., et al., (Curr. Opin. Microbiol. 37:67-78 (2017))]에서는 CRISPR-Cas 시스템의 개별 유형 및 하위유형에 특이적인 시그니처 cas 유전자를 고려하는 분류 시스템이 제안되었다. 분류는 또한 다수의 공유 Cas 단백질 사이의 서열 유사성, 가장 잘 보존된 Cas 단백질의 계통 발생, 유전자 조직 및 CRISPR 어레이의 구조를 고려하였다. 이러한 접근법은 CRISPR-Cas 시스템을 2개의 별개의 클래스로 나누는 분류 체계를 제공하였다: 다중단백질 이펙터 복합체 (유형 I (항바이러스 방어 ("캐스케이드") 이펙터 복합체를 위한 CRISPR-연합된 복합체), 유형 III (Cmr/Csm 이펙터 복합체), 및 유형 IV)를 포함하는 클래스 1; 및 단일 이펙터 단백질 (유형 II (Cas9), 유형 V (Cas12a; 이전에 Cpf1로서 지칭됨), 및 유형 VI (Cas13a; 이전에 C2c2로서 지칭됨))을 포함하는 클래스 2. 클래스 1 시스템에서, 유형 I은 가장 흔하고 다양하며, 유형 III은 박테리아보다 고세균에서 더 흔하며 유형 IV는 가장 흔하지 않다.
유형 I 시스템은 시그니처 Cas3 단백질을 포함한다. Cas3 단백질은 DNA 표적 서열 절단을 담당하는 헬리카제 및 DNase 도메인을 갖는다. 현재까지, 가변 수의 cas 유전자를 가지고 있는 유형 I 시스템의 7가지 하위유형 (즉, 유형 I-A, I-B, I-C, I-D, I-E, I-F (및 I-F에 대한 변이체 (예를 들어, I-Fv1, I-Fv2)), 및 I-U)이 확인되었다. 유형 I cas 유전자는 하기를 포함하나 이에 제한되지는 않는다: cas7, cas5, cas8, cse2, csa5, cas3, cas2, cas4, cas1, 및 cas6. 유형 I 시스템을 갖는 유기체의 예는 하기와 같다: I-A, 아르카에오글로부스 풀기두스(Archaeoglobus fulgidus); I-B, 클로스트리디움 클루이베리(Clostridium kluyveri); I-C, 바실루스 할로두란스(Bacillus halodurans); I-U, 게오박터 술푸르레두센스(Geobacter sulfurreducens); I-D, 시아노테세(Cyanothece) 종 8802; I-E, 에스케리키아 콜라이(Escherichia coli) K12 (이. 콜라이(E. coli) K12); I-F, 예르시니아 슈도투베르쿨로시스(Yersinia pseudo-tuberculosis); I-F 변이체, 슈와넬라 푸트레파시엔스(Shewanella putrefaciens) CN-32 (Koonin, E.V., et al., Curr. Opin. Microbiol. 37:67-78 (2017)). DNA의 Cas3 단백질 매개된 절단 및 점진적 분해의 특징이 기재되어 있다 (예를 들어, 문헌 [Plagens, A., et al., Nucleic Acids Res. 42:5125-5138 (2014); Maier, L., et al., RNA Biol. 10:865-874 (2013); Hochstrasser, M., et al., Proc. Natl. Acad. Sci. USA 111:6618-6623 (2014); Sinkunas, T., et al., EMBO J. 30:1335-1342 (2011); Westra, E., et al., Mol. Cell 46:595-605 (2012); Mulepati, S., et al., J. Biol. Chem. 288:22184-22192 (2013); Sinkunas, T., et al., EMBO J. 32:385-394 (2013); Mulepati, S., et al., J. Biol. Chem. 288:22184-22192 (2013); Redding, S., et al., Cell 163:854-865 (2015); Sinkunas, T., et al., EMBO J. 32:385-394 (2013); Westra, E., et al., Mol. Cell 46:595-605 (2012)] 참조).
유형 I 시스템은 전형적으로, CRISPR RNA (crRNA 또는 "가이드 RNA")와 조합하여 캐스케이드 복합체를 형성하는 단백질을 코딩한다. 이러한 복합체는 다수의 단백질 및 crRNA를 포함하며, 이들 둘 다가 이러한 CRISPR 로커스로부터 전사된다. 유형 I 시스템에서, 프리-crRNA의 1차 프로세싱은 Cas6에 의해 촉매된다. 이는 전형적으로, 8개 뉴클레오티드의 5' 핸들, 스페이서 영역 및 3' 핸들을 갖는 crRNA를 초래하며; 5' 핸들과 3' 핸들 둘 다는 반복부 서열로부터 유래된다. 일부 시스템에서, 3' 핸들은 스템 루프 구조를 형성하고; 다른 시스템에서, crRNA의 3' 단부의 2차 프로세싱은 리보뉴클레아제(들)에 의해 촉매된다 (예를 들어, 문헌 [van der Oost, J., et al., Nature Reviews Microbiology 12:479-492 (2014)] 참조).
유형 I CRISPR-Cas 시스템의 캐스케이드 이펙터 복합체는 RNA 인식 모티프 (RRM) 폴드 및 부가의 "대형" 및 "소형" 서브유닛 단백질을 함유하는 유사 반복부-연합된 신비한 단백질 (RAMP; 예를 들어, Cas7 및 Cas5 단백질)을 갖는 백본을 포함한다 (예를 들어, 문헌 [Koonin, E.V., et al., Curr. Opin. Microbiol. 37:67-78, (2017), 도 2] 참조). 이들 캐스케이드 이펙터 복합체는 전형적으로 Cas5 서브유닛 단백질 및 몇 가지 Cas7 서브유닛 단백질을 갖는다. 이러한 캐스케이드 이펙터 복합체는 또한 가이드 RNA를 포함한다. 캐스케이드 이펙터 복합체는 가이드 RNA의 길이를 따라 비대칭적 방식으로 배열된 다양한 서브유닛 단백질을 포함한다. Cas5 서브유닛 단백질과 대형 서브유닛 단백질 (Cas8 단백질)은 복합체의 한쪽 단부에 위치하여, 가이드 RNA의 5' 단부를 둘러싸고 있다. 소형 서브유닛 단백질의 몇 가지 카피는 Cas7 서브유닛 단백질의 다수의 카피에 결합되는 가이드 RNA 백본과 상호작용한다. 또 다른 RAMP 단백질인 Cas6 서브유닛 단백질은 주로 crRNA의 3' 핸들 (반복부 영역)과의 연합을 통해 캐스케이드 이펙터 복합체와 연합된다. Cas6 서브유닛 단백질은 통상적으로, 프리-crRNA 프로세싱에 관여하는 반복부-특이적 RNase로서 기능하지만; 유형 I-C 시스템에서는, Cas5가 반복부-특이적 RNase로서 기능하며, Cas6는 없다.
CRISPR-Cas 유형 I 캐스케이드 서브유닛 단백질의 1차 서열은 서열 동일성이 거의 없지만; 상동 RAMP 모듈의 존재와 다중단백질 이펙터 복합체의 전반적인 구조적 유사성은 이들 이펙터 복합체의 공통 기원을 지원한다 (예를 들어, 문헌 [Koonin, E.V., et al., Curr. Opin. Microbiol. 37:67-78 (2017)] 참조).
유형 I CRISPR-Cas 시스템의 적응 면역 메카니즘은 본질적으로 적응, 발현 및 간섭의 3가지 단계를 포함한다. 적응 단계에서는, 외래 DNA 또는 RNA가 숙주를 감염시키고, 다양한 cas 유전자에 의해 코딩된 단백질이 감염 DNA 또는 RNA의 영역과 결합한다. 이러한 영역은 프로토스페이서로 불린다. 프로토스페이서 인접 모티프 (PAM)는 프로토스페이서에 인접하는 짧은 뉴클레오티드 서열 (예를 들어, 2 내지 6개 염기 쌍 DNA 서열)이다. PAM 서열은 전형적으로, Cas1 서브유닛 단백질/Cas2 서브유닛 단백질 복합체에 의해 인식되며, 여기서 활성 PAM-센싱 부위가 Cas1 서브유닛 단백질과 연합된다 (예를 들어, 문헌 [Jackson, S. A., et al., Science 356:356(6333) (2017)] 참조).
발현 단계에서는, 다수의 스페이서-반복부 요소를 포함하는 CRISPR 어레이가 단일 전사체로서 전사된다. 개별 스페이서 반복부 요소는 엔도뉴클레아제 (예를 들어, Cas6 단백질인 유형 I; 및 Cas5 단백질인 유형 I-C)에 의해 개별 crRNA로 프로세싱된다. Cas 서브유닛 단백질이 발현되고, crRNA와 연합되어 캐스케이드 이펙터 복합체를 형성한다.
캐스케이드 이펙터 복합체는 숙주를 감염시키는 외래 폴리뉴클레오티드를 스캔하여 스페이서에 상보적인 DNA를 확인한다. 유형 I 시스템에서, 간섭은 이펙터 복합체가 PAM에 인접한 스페이서에 상보적인 서열을 확인할 때 발생하고; Cas3 단백질은 외래 폴리뉴클레오티드를 절단하고 이를 점진적으로 소화하기 위해 DNA 결합된 캐스케이드 이펙터 복합체에 동원된다.
문헌 [Makarova, K.S., et al., (Cell 168:946 (2017))]은 유형 I CRISPR-Cas 시스템에 대한 유전자, 상동체, 캐스케이드 복합체 및 작용 메카니즘의 요약을 제공한다.
따라서, 유형 I CRISPR-Cas 시스템은 부분적으로 캐스케이드 복합체의 이종 발현의 어려움과 유형 I CRISPR-Cas 시스템이 DNA 표적을 절단하는 방식으로 인해 지금까지 진핵 게놈 조작 적용에 제한적으로 사용되어 왔다.
본 발명은 일반적으로, 단백질 구성성분, 변형되거나 또는 별개로 변화된 가이드 폴리뉴클레오티드, 및 그의 조합을 포함한, 조작된 유형 I CRISPR-Cas 이펙터 복합체 및 그의 구성성분을 포함하는 조성물에 관한 것이다.
본 발명의 한 실시양태는 하기를 포함하는 조성물이다:
제1 Cse2 서브유닛 단백질, 제1 Cas5 서브유닛 단백질, 제1 Cas6 서브유닛 단백질, 및 제1 Cas7 서브유닛 단백질,
제1 Cas8 서브유닛 단백질 및 제1 FokI를 포함하며, 여기서 제1 Cas8 서브유닛 단백질의 N-말단 또는 제1 Cas8 서브유닛 단백질의 C-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 여기서 제1 링커 폴리펩티드가 10개 아미노산 내지 40개 아미노산의 길이를 갖는 것인 제1 융합 단백질, 및
제1 핵산 표적 서열에 결합할 수 있는 제1 스페이서를 포함하는 제1 가이드 폴리뉴클레오티드
를 포함하는 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체; 및
제2 Cse2 서브유닛 단백질, 제2 Cas5 서브유닛 단백질, 제2 Cas6 서브유닛 단백질, 및 제2 Cas7 서브유닛 단백질,
제2 Cas8 서브유닛 단백질 및 제2 FokI를 포함하며, 여기서 제2 Cas8 서브유닛 단백질의 N-말단 또는 제2 Cas8 단백질의 C-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 여기서 제2 링커 폴리펩티드가 10개 아미노산 내지 40개 아미노산의 길이를 갖는 것인 제2 융합 단백질, 및
제2 핵산 표적 서열에 결합할 수 있는 제2 스페이서를 포함하며, 여기서 제2 핵산 표적 서열의 프로토스페이서 인접 모티프 (PAM)와 제1 핵산 표적 서열의 PAM이 20개 염기 쌍 내지 42개 염기 쌍의 인터스페이서 거리를 갖는 것인 제2 가이드 폴리뉴클레오티드
를 포함하는 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체.
일부 실시양태에서, 제1 링커 폴리펩티드 및/또는 제2 링커 폴리펩티드의 길이는 15개 아미노산 내지 30개 아미노산, 또는 17개 아미노산 내지 20개 아미노산의 길이이다. 한 실시양태에서, 제1 링커 폴리펩티드와 제2 링커 폴리펩티드의 길이는 동일하다.
제2 핵산 표적 서열과 제1 핵산 표적 서열 사이의 인터스페이서 거리는 22개 염기 쌍 내지 40개 염기 쌍, 26개 염기 쌍 내지 36개 염기 쌍, 29개 염기 쌍 내지 35개 염기 쌍, 또는 30개 염기 쌍 내지 34개 염기 쌍을 포함하나 이에 제한되지는 않는다.
제1 FokI 및 제2 FokI는 연합하여 동종이량체를 형성할 수 있는 단량체성 서브유닛, 또는 연합하여 이종이량체를 형성할 수 있는 별개의 서브유닛일 수 있다.
일부 실시양태에서, 제1 Cas8 서브유닛 단백질의 N-말단은 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단에 공유적으로 연결되고, 제1 Cas8 서브유닛 단백질의 C-말단은 제1 링커 폴리펩티드에 의해 제1 FokI의 N-말단에 공유적으로 연결되며, 제2 Cas8 서브유닛 단백질의 N-말단은 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단에 공유적으로 연결되고, 제2 Cas8 서브유닛 단백질의 C-말단은 제2 링커 폴리펩티드에 의해 제2 FokI의 N-말단에 공유적으로 연결되며, 그의 조합이 있다. 제1 Cas8 서브유닛 단백질 및 제2 Cas8 서브유닛 단백질은 각각 상이한 서열을 갖는 Cas8 서브유닛 단백질을 포함할 수 있거나, 또는 제1 Cas8 서브유닛 단백질과 제2 Cas8 서브유닛 단백질 둘 다는 동일한 아미노산 서열을 포함할 수 있다.
유사하게, 제1 Cse2 서브유닛 단백질 및 제2 Cse2 서브유닛 단백질은 각각 상이하거나 동일한 Cse2 서브유닛 단백질 아미노산 서열을 포함할 수 있고, 제1 Cas5 서브유닛 단백질 및 제2 Cas5 서브유닛 단백질은 각각 상이하거나 동일한 Cas5 서브유닛 단백질 아미노산 서열을 포함할 수 있으며, 제1 Cas6 서브유닛 단백질 및 제2 Cas6 서브유닛 단백질은 각각 상이하거나 동일한 Cas6 서브유닛 단백질 아미노산 서열을 포함할 수 있고, 제1 Cas7 서브유닛 단백질 및 제2 Cas7 서브유닛 단백질은 각각 상이하거나 동일한 Cas7 서브유닛 단백질 아미노산 서열을 포함할 수 있으며, 그의 조합이 있다.
바람직한 실시양태에서, 가이드 폴리뉴클레오티드는 RNA를 포함한다.
부가 실시양태에서, 본 발명은 야생형 유형 I CRISPR Cas3 단백질 ("wtCas3 단백질")에 비해 DNA를 따라 이동하는 것을 감소시킬 수 있는 조작된 유형 I CRISPR Cas3 돌연변이체 단백질 ("mCas3 단백질")을 포함한다.
본 발명은 또한 세포에서 게놈 편집을 수행하기 위한 상기 조성물의 용도 뿐만 아니라 상기 조성물의 제조 방법을 포함한다.
본 발명의 추가 실시양태는 본원에서의 개시내용을 고려하여 관련 기술분야의 통상의 기술자에게 용이하게 명백할 것이다.
본 도면은 비례적으로 제시되지 않으며 크기가 조정되지도 않는다. 인디케이터의 위치는 대략적인 것이다.
도 1a는 유형 I CRISPR-Cas 이펙터 복합체의 일반화된 예시를 제시한다. 도 1b는 유형 I CRISPR-Cas crRNA의 일반화된 예시를 제시한다.
도 2a, 도 2b, 및 도 2c는 이웃한 스페이서 서열에 결합된 융합 도메인을 갖는 2개의 조작된 유형 I CRISPR-Cas 이펙터 복합체의 예시적 예를 제시한다.
도 3a도 3b는 순환적으로 순열된 단백질의 예를 제시한다.
도 4a, 도 4b, 도 5a, 도 5b, 도 6a, 도 6b, 도 6c, 도 7a, 도 7b, 도 8, 도 9, 도 10a, 및 도 10b는 본 발명의 조작된 유형 I CRISPR-Cas 이펙터 복합체의 다양한 예를 예시한다.
도 11a도 11b는 기질 채널의 예를 예시한다.
도 12a, 도 12b, 및 도 12c는 dCas9:NATNA 복합체에 의해 캐스케이드 서브유닛 단백질과 융합된 기능적 단백질 도메인의 부위-지정 동원의 일반화된 예시를 제시한다.
도 13a, 도 13b, 도 14a, 도 14b, 및 도 14c는 본 발명의 조작된 유형 I CRISPR-Cas 이펙터 복합체의 예를 예시한다.
도 15a, 도 15b, 도 15c, 도 16a, 도 16b, 도 16c, 도 17a, 도 17b, 도 17c, 도 18a, 도 18b, 도 18c, 도 18d, 도 19a, 도 19b, 도 20a, 및 도 20b는 본 발명의 조작된 유형 I CRISPR-Cas 이펙터 복합체 및 그의 사용 방법의 예를 제시한다.
도 21a, 도 21b, 도 21c, 도 21d, 도 22a, 도 22b, 도 22c, 및 도 22d는 활동적 엔도뉴클레아제 활성을 포함하는 Cas3 단백질을 사용하는 본 발명의 실시양태를 예시한다.
도 23a, 도 23b, 도 23c, 도 23d, 도 23e, 도 24, 도 25, 도 26, 및 도 27은 다양한 캐스케이드 구성성분 발현 시스템의 개략도를 제시한다.
도 28, 도 29, 도 30, 도 31a, 도 31b, 도 32, 도 33a, 도 33b, 및 도 34는 본 발명의 조작된 캐스케이드 시스템의 게놈 편집과 관련된 데이터를 제시한다.
도 35는 쌍형성된 가이드 RNA (gRNA)를 함유하는 최소 CRISPR 어레이의 예를 예시한다.
도 36a, 도 36b, 도 36c, 및 도 36d는 RNP를 통한 인간 세포에서의 게놈 편집 및 조작된 유형 I CRISPR-Cas 복합체의 플라스미드-기반 전달과 관련된 데이터를 제시한다.
도 37a, 도 37b, 도 37c, 도 37d, 도 37e, 도 37f, 및 도 37g는 복구 결과와 관련된 데이터를 제시한다.
도 38a, 도 38b, 및 도 38c는 gRNA와 표적 DNA 사이의 미스매치가, 조작된 유형 I CRISPR-Cas 복합체에 의한 게놈 편집을 어떻게 억제하는지와 관련된 데이터를 제시한다.
도 39a, 도 39b, 도 39c, 및 도 39d는 3가지 캐스케이드 상동체 변이체에 대한 PAM 선택성의 확장된 스크리닝과 관련된 데이터를 제시한다.
도 40a, 도 40b, 도 40c, 도 40d, 도 40e, 및 도 40f는 조작된 유형 I CRISPR-Cas 복합체의 편집 효율에 있어서의 예시적인 변화와 관련된 데이터를 제시한다.
도 41a, 도 41b, 및 도 41c는 3가지 캐스케이드 상동체 변이체에 대한 FokI-Cas8 링커 길이 및 인터스페이서 거리의 확장된 스크리닝과 관련된 데이터를 제시한다.
도 42a도 42b는 올리고-주형화 PCR 증폭의 예를 예시한다.
도 43은 퍼센트 게놈 편집에 대한 데이터가 FokI-캐스케이드 상동체 변이체 및 인터스페이서 거리의 함수로서 제시된다는 것을 제시한다.
도 44는 EcoCas3 단백질의 기능적 도메인 및 서열 내에서 만들어진 돌연변이체의 상대적 위치의 선형 표현을 제시한다.
도 45a, 도 45b, 도 45c, 및 도 45d는 야생형 또는 돌연변이체 EcoCas3 단백질을 포함하는 Eco캐스케이드 RNP 복합체를 사용한 게놈 편집과 관련된 데이터를 제시한다.
도 46a, 도 46b, 도 46c, 도 47a, 및 도 47b는 dCas9-VP64/sgRNA RNP 복합체 로드블록 및 Eco캐스케이드 RNP 복합체에 의한 표적 절단에 대한 그의 효과와 관련된 데이터를 제시한다.
도 48은 Cas3[D452A]/-Eco캐스케이드 또는 mCas3[D452A]-Eco캐스케이드에 대한 예시적인 편집 데이터를 제시한다.
도 49는 Pse캐스케이드 RNP 복합체를 이용한 8개 TRAC 표적 부위에서의 게놈 편집을 위한 데이터를 제시한다.
참조로 포함됨
본 명세서에 인용된 모든 특허, 간행물 및 특허 출원은 각각의 개별 특허, 간행물 또는 특허 출원이 모든 목적을 위해 그 전체 내용이 참조로 포함되는 것으로 구체적이고 개별적으로 표시된 것처럼 본원에 참조로 포함된다.
본원에 사용된 전문 용어는 단지 특별한 실시양태를 설명하기 위한 것이며 제한하려는 의도가 아님을 이해해야 한다. 본 명세서 및 청구범위에서 사용되는 바와 같이, 단수형은 문맥상 명백하게 달리 지시하지 않는 한 복수의 지시대상을 포함한다. 따라서, 예를 들어, "폴리뉴클레오티드"에 대한 언급은 하나 이상의 폴리뉴클레오티드를 포함하고 "벡터"에 대한 언급은 하나 이상의 벡터를 포함한다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기재된 것들과 유사하거나 동등한 다른 방법 및 물질이 본 발명에서 유용할 수 있지만, 바람직한 물질 및 방법이 본원에 기재된다.
본 명세서 및 실시예의 교시의 관점에서, 관련 기술분야의 통상의 기술자는, 예를 들어, 하기 표준 텍스트에 의해 교시된 바와 같이, 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈학 및 재조합 폴리뉴클레오티드의 통상적인 기술을 적용할 수 있다 (Cellular and Molecular Immunology, Ninth Edition, A. K. Abbas., et al., Elsevier (2017), ISBN 978-0323479783; Cancer Immunotherapy Principles and Practice, First Edition, L.H. Butterfield, et al., Demos Medical (2017), ISBN 978-1620700976; Janeway's Immunobiology, Ninth Edition, Kenneth Murphy, Garland Science (2016), ISBN 978-0815345053; Clinical Immunology and Serology: A Laboratory Perspective, Fourth Edition, C. Dorresteyn Stevens, et al., F.A. Davis Company (2016), ISBN 978-0803644663; Antibodies: A Laboratory Manual, Second edition, E.A. Greenfield, Cold Spring Harbor Laboratory Press (2014), ISBN 978-1-936113-81-1; Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, Seventh Edition, R.I. Freshney, Wiley-Blackwell (2016), ISBN 978-1118873656; Transgenic Animal Technology, Third Edition: A Laboratory Handbook, C.A. Pinkert, Elsevier (2014), ISBN 978-0124104907; The Laboratory Mouse, Second Edition, H. Hedrich, Academic Press (2012), ISBN 978-0123820082; Manipulating the Mouse Embryo: A Laboratory Manual, Fourth Edition, R. Behringer, et al., Cold Spring Harbor Laboratory Press (2013), ISBN 978-1936113019; PCR 2: A Practical Approach, M.J. McPherson, et al., IRL Press (1995), ISBN 978-0199634248; Methods in Molecular Biology (Series), J.M. Walker, ISSN 1064-3745, Humana Press; RNA: A Laboratory Manual, D.C. Rio, et al., Cold Spring Harbor Laboratory Press (2010), ISBN 978-0879698911; Methods in Enzymology (Series), Academic Press; Molecular Cloning: A Laboratory Manual (Fourth Edition), M.R. Green, et al., Cold Spring Harbor Laboratory Press (2012), ISBN 978-1605500560; Bioconjugate Techniques, Third Edition, G.T. Hermanson, Academic Press (2013), ISBN 978-0123822390; Methods in Plant Biochemistry and Molecular Biology, W.V. Dashek, CRC Press (1997), ISBN 978-0849394805; Plant Cell Culture Protocols (Methods in Molecular Biology), V.M. Loyola-Vargas, et al., Humana Press (2012), ISBN 978-1617798177; Plant Transformation Technologies, C.N. Stewart, et al., Wiley-Blackwell (2011), ISBN 978-0813821955; Recombinant Proteins from Plants (Methods in Biotechnology), C. Cunningham, et al., Humana Press (2010), ISBN 978-1617370212; Plant Genomics: Methods and Protocols (Methods in Molecular Biology), W. Busch, Humana Press (2017), ISBN 978-1493970018; Plant Biotechnology: Methods in Tissue Culture and Gene Transfer, R. Keshavachandran, et al., Orient Blackswan (2008), ISBN 978-8173716164).
클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) 및 관련된 CRISPR-연합된 단백질 (Cas 단백질)이 CRISPR-Cas 시스템을 구성한다 (예를 들어, 문헌 [Barrangou, R., et al., Science 315:1709-1712 (2007)] 참조).
본원에 사용된 바와 같은, "Cas 단백질", "CRISPR-Cas 단백질" 및 "CRISPR-Cas 서브유닛 단백질" 및 "Cas 서브유닛 단백질"은 달리 확인되지 않는 한, 모두 클래스 1 유형 I CRISPR-Cas 단백질을 지칭한다. 전형적으로, 본 발명의 측면에 사용하는 경우에, Cas 서브유닛 단백질은 하나 이상의 동족 폴리뉴클레오티드 (가장 전형적으로 crRNA)와 상호작용하여 유형 I 이펙터 복합체 (가장 전형적으로, RNP 복합체)를 형성할 수 있다.
유형 I-E CRISPR-Cas 시스템에서 캐스케이드를 코딩하는 유전자는 시간이 지남에 따라 다양한 협약으로 명명되었으며, 이는 최근 문헌과 오래된 문헌을 비교할 때 혼란스러운 지점이 될 수 있다. 전형적으로, 본 명세서는 문헌 [Koonin, E., et al. (Curr. Opin. Microbiol. 37: 67-78 (2017))]에 제시된 바와 같은 명명법을 사용하는데, 여기서 참조 이. 콜라이 K12 오페론의 유전자 순서가 cas3, cas8, cas11, cas7, cas5, cas6, cas1, 및 cas2이다. 간단하게 하기 위해, cas8e에서의 "e" 수식자는 유형 I 시스템 내에서의 상이한 하위유형 사이의 cas8 유전자를 구별하기 위해 종종 사용된다. 야생형 이. 콜라이 유형 I-E CRISPR-Cas의 화학량론은 Cas51-Cas61-Cas76-Cas81-Cas112-gRNA1이다.
그러나, 상호 참조 목적으로: cas8은 이전에 cse1casA로서 지칭되었고 "대형 서브유닛"으로서 공지되기도 하였으며; cas11은 이전에 cse2casB로서 지칭되었고 "소형 서브유닛"으로서 공지되기도 하였으며; cas7은 이전에 cse4casC로서 지칭되었고; cas5는 이전에 casD로서 지칭되었으며, 종종 수식자 cas5e가 제공되었고; cas6은 이전에 cse3casE로서 지칭되었고 종종 수식자 cas6e를 제공하였다. Cas 서브유닛 단백질을 코딩하는 유전자가 표 1에 열거된다.
Figure pct00001
*문헌 [Makarova, K.S., et al., Nat. Rev. Microbiol. 13:722-736 (2015); Koonin, E.V., et al., Curr Opin Microbiol. 37:67-78 (2017)]에 의해 정의된 바와 같음.
PAM 서열은 전형적으로, Cas1 서브유닛 단백질/Cas2 서브유닛 단백질 복합체에 의해 인식되며, 여기서 활성 PAM-센싱 부위가 Cas1 서브유닛 단백질과 연합된다 (예를 들어, 문헌 [Jackson, S. A., et al., Science 356:356(6333) (2017)] 참조). Cas1 단백질 및 Cas2 단백질은 대부분의 공지된 CRISPR-Cas 시스템에 존재하며, 스페이서를 CRISPR 카세트 내로 삽입하는데 충분하다 (예를 들어, 문헌 [Yosef, I, et al., Nucleic Acids Res. 40:5569-5576 (2012)] 참조). 이들 두 단백질은 적응 프로세스를 위한 복합체를 형성한다. Cas1 단백질의 엔도뉴클레아제 활성은 스페이서 통합에 필요한 반면, Cas2 단백질은 비-효소적 기능을 수행하는 것으로 보인다 (예를 들어, 문헌 [Nunez, J., et al., Nat Struct Mol Biol. 21:528-534 (2014); Richter, C., et al., PLoS One. 2012;7:e49549] 참조). Cas1-Cas2 단백질 복합체는 시스템의 나머지 부분에서 준 자율적인 것으로 보이는 CRISPR-Cas 시스템의 고도로 보존된 정보 처리 모듈을 나타낸다 (예를 들어, 문헌 [Makarova, K., et al., Methods Mol. Biol. 1311:47-75 (2015)] 참조). 엔도뉴클레아제 Cas1 단백질은 CRISPR 시스템이 이전에 감염원과의 만남을 기억할 수 있도록 하는 고유한 능력을 보장하는 필수 Cas 단백질이다.
용어 "유형 I CRISPR-Cas 이펙터 복합체", "유형 I CRISPR-Cas 핵단백질 (NP) 복합체", "캐스케이드 핵단백질 (NP) 복합체" 및 "유형 I 핵단백질 (NP) 복합체"는 본원에서 상호교환가능하게 사용되며, 전형적으로 가이드 폴리뉴클레오티드와 복합체를 형성하는 캐스케이드 단백질을 지칭한다. "캐스케이드 복합체" 및 "유형 I 복합체"는 전형적으로, 캐스케이드 NP 복합체의 단백질 구성성분을 지칭할 때 사용된다. 용어 "캐스케이드 RNP 복합체", "유형 I CRISPR-Cas RNP 복합체" 및 "유형 I RNP 복합체"는 보다 일반적인 가이드 폴리뉴클레오티드 (즉, 캐스케이드 NP 복합체에서와 같음)에 비해 crRNA를 포함하는 캐스케이드 복합체를 지칭한다. 야생형 유형 I CRISPR-Cas 이펙터 복합체의 예가 도 1a에 예시된다. 도 1a는 문헌 [Makarova, K.S., et al., (Cell 168:946 (2017); Makarova, K., et al., Nature Reviews Microbiology 13:722-736 (2015))]을 각색한 것이다. 도 1a는 캐스케이드 복합체로서 연합된 6개의 Cas7 단백질, Cas5 단백질, Cas8 단백질, 2개의 Cse2 단백질, Cas6 단백질, 및 crRNA를 예시한다 (도 1a: Cas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 헤어핀을 포함하는 흑색 선으로서 예시됨). 상기 복합체는 핵산 표적 서열에 결합할 수 있다. 복합체와 wtCas3 단백질 (도 1a, 파선 박스로 둘러싸인 Cas3)의 연합 후, 캐스케이드 복합체는 핵산 표적 서열을 절단할 수 있다. 표 1에 나타낸 바와 같이, 일부 Cas 서브유닛 단백질의 총 수는 캐스케이드 복합체에서 달라질 수 있다.
"Cas3" 및 "Cas3 단백질"은 유형 I CRISPR-Cas3 단백질, 그의 변형, 및 변이체를 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 유형 I CRISPR-Cas 이펙터 복합체는 crRNA 가이드에 상보적인 외래 DNA에 결합하고, 표적 분해에 필요한 트랜스-작용 뉴클레아제-헬리카제인 Cas3을 동원한다. Cas3 단백질은 슈퍼패밀리 2로부터의 헬리카제에 특징적인 모티프를 가지며, DEAD/DEAH 박스 영역 및 보존된 C-말단 도메인을 함유한다. Cas3 단백질 및 그의 변이체는 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Westra, E.R., et al., Mol. Cell. 46: 595-605 (2012); Sinkunas, T., et al., EMBO J. 30:1335-1342 (2011); Beloglazova, N., et al., EMBO J. 30:4616-4627 (2011); Mulepati, S., et al., J. Biol. Chem. 286:31896-31903 (2011)] 참조). 본원에 사용된 바와 같은, 용어 "mCas3 단백질"은 그의 상응하는 wtCas3 단백질에 비해 하나 이상의 돌연변이를 포함하는 Cas3 단백질을 지칭한다. mCas3 단백질은 mCas3 단백질 (예를 들어, 실시예 23A, 실시예 23B, 및 실시예 23C), dblmCas3 단백질 (예를 들어, 실시예 26A, 실시예 26B, 및 실시예 26C), 및 dCas3* (임의의 뉴클레아제 활성 및/또는 헬리카제 활성을 갖지 않는 돌연변이된 Cas3 단백질)을 포함하나 이에 제한되지는 않는다.
본원에 사용된 바와 같은, 용어 "뉴클레아제"는 포스포디에스테르 결합, 예컨대 이중-가닥 (ds) 핵산 (예를 들어, dsDNA, 게놈 DNA (gDNA), dsRNA), 단일-가닥 (ss) 핵산 (예를 들어, ssDNA, RNA) 또는 혼성체 dsRNA/DNA에서 발견되는 바와 같은, 두 뉴클레오티드를 연결하는 결합을 절단할 수 있는 효소를 지칭한다. "엔도뉴클레아제"는 전형적으로, 그의 표적 분자에서의 ss-파손 (닉) 또는 ds-파손에 영향을 미칠 수 있다. DNA 엔도뉴클레아제의 한 가지 예는 FokI 효소이다. "FokI 엔도뉴클레아제" 및 "FokI"는 본원에서 상호교환가능하게 사용되며, FokI 효소, FokI 상동체, FokI 효소의 효소적으로 활성인 도메인(들), 및 FokI 효소의 변이체를 지칭한다. DNA 절단을 위해서는 전형적으로 FokI 이량체화가 필요하다. FokI의 이량체는 연합하여 동종이량체를 형성하는 2개의 단량체성 서브유닛 또는 연합하여 이종이량체를 형성하는 2개의 별개의 단량체성 서브유닛을 포함할 수 있다 (예를 들어, 문헌 [Bitinaite, J., et al., Proc. Natl. Acad. Sci. USA 95:10570-10575 (1998); Ramalingam, S., et al., J. Mol. Biol. 405:630-641 (2011)] 참조). FokI 변이체의 한 가지 예는 문헌 [Guo, J., et al., J. Mol. Biol. 400:96-107 (2010)]에 기재된 샤키(Sharkey) 변이체이다. 부가의 DNA 및 RNA 뉴클레아제는 관련 기술분야에 공지되어 있다.
본원에 사용된 바와 같은, "CRISPR RNA", "crRNA" 및 "가이드 RNA"는 복합체가 (핵산 표적 서열을 포함하지 않는 폴리뉴클레오티드에 비해) 우선적으로 폴리뉴클레오티드 내의 핵산 표적 서열에 결합하도록 가이드하는 유형 I 이펙터 복합체를 형성하기 위해 Cas 서브유닛 단백질과 상호작용할 수 있는 하나 이상의 RNA를 지칭한다. 본원에 사용된 바와 같은, "가이드" 및 "가이드 폴리뉴클레오티드"는 합성 백본, 자연적으로 발생하는 백본, 비-자연적으로 발생하는 백본, 기본적으로 상이한 백본 잔기, 화학적으로 이질적인 잔기 또는 연결, 변형된 백본, 혼합물 (예를 들어, 백본의 리보스 및 데옥시리보스 구성성분) 등, 및 그의 조합에 덧붙여, 리보뉴클레오티드 염기 (예를 들어, RNA) 및 리보스 당을 포함하는 유형 I 이펙터 복합체의 폴리뉴클레오티드 구성성분 뿐만 아니라 데옥시리보뉴클레오티드 염기, 뉴클레오티드 유사체, 변형된 뉴클레오티드, 상이한 질소성 염기, 기본적으로 상이한 뉴클레오티드 염기, 화학적으로 이질적인 분자, 염기 (예를 들어, RNA 염기, DNA 염기, 및/또는 변형된 염기)의 혼합물 등, 뿐만 아니라 그의 조합을 포함하나 이에 제한되지는 않는 이질적인 구성성분 및 그의 조합을 지칭한다. 가이드 폴리뉴클레오티드의 일부 예가 본원에 기재되어 있다. crRNA 스페이서를 통해 핵산 표적 서열과 연합된 유형 I CRISPR-Cas crRNA의 예가 도 1b에 예시된다. 도 1b는 문헌 [Hochstrasser, M.L., et al., Mol. Cell 63:840-851 (2016)]을 각색한 것이다. 도 1b에서, PAM (도 1b, 104)이 핵산 표적 서열과 연합되고 이중-가닥 핵산의 5' 및 3' 가닥이 예시된다 (도 1b, 수직선은 수소 결합을 나타냄). 가이드 폴리뉴클레오티드 (도 1b, 106)는 전형적으로, 5' 핸들 영역 (도 1b, 101), 시드 영역을 포함하는 스페이서 영역 (도 1b, 103), 및 2개의 수소 결합된 반복부 영역을 포함하는 3' 헤어핀 (도 1b, 102)을 포함하며; 수평선은 수소 결합을 나타낸다. 다수의 유형 I 캐스케이드 상동체와 연합된 PAM 서열이 본원에 논의된다. PAM 서열은 인접한 프로토스페이서 서열 (도 1b, 105)이다. 도 1b는 핵산 표적 서열에 결합된 캐스케이드 복합체 스페이서를 예시한다 (도 1b, 수직선은 수소 결합을 나타냄). 도 1b는 또한 프로토스페이서 영역을 예시한다 (도 1b, 프로토스페이서). 스페이서는 약 6개 내지 약 56개 뉴클레오티드의 crRNA의 영역을 포함할 수 있으며, 여기서 스페이서는 폴리뉴클레오티드 내의 핵산 표적 서열에 상보적이다. 스페이서 길이는 유형 I-E CRISPR-Cas 시스템에서 캐스케이드 활성을 미세-조정하도록 변화될 수 있다. 캐스케이드 복합체는 crRNA 스페이서에 6개 뉴클레오티드가 부가된 여분의 Cas7 서브유닛과 스페이서에 12개 뉴클레오티드가 부가된 여분의 Cse2 서브유닛을 혼입할 수 있다 (예를 들어, 문헌 [Luo, M.L., et al., Nucleic Acids Res. 44(15):7385-7394 (2016)] 참조). 스페이서는 전형적으로, 약 32개 내지 약 36개 뉴클레오티드의 영역을 포함한다.
용어 "스페이서", "스페이서 서열" 및 "핵산 표적 결합 서열"은 본원에서 상호교환가능하게 사용된다.
"표적", "표적 서열", "핵산 표적 서열" 및 "표적-적중 서열"은 전부 또는 부분적으로, 캐스케이드 핵단백질 복합체 (예를 들어, 캐스케이드 RNP 복합체)의 가이드 (예를 들어, crRNA의 스페이서)의 핵산 표적 결합 서열에 상보적인 핵산 서열을 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 전형적으로, 핵산 표적 결합 서열은 캐스케이드 핵단백질 복합체의 결합이 지정하는 핵산 표적 서열에 100% 상보적이 되도록 선택되지만; 핵산 표적 서열에의 결합을 약화시키기 위해서는, 더 낮은 퍼센트 상보성이 사용될 수 있다. 표적 결합 서열이 표적 서열에 100% 상보적인 경우에, "표적-이탈" 서열 결합은 캐스케이드 핵단백질 복합체가 핵산 표적 결합 서열 (스페이서)과의 100% 미만 상보성을 갖는 핵산 서열에 결합하는 것을 지칭한다. 이중-가닥 DNA 서열은 전형적으로, 하나의 가닥 위에 핵산 표적 서열을 포함한다 (도 1b, 가이드 RNA와 수소 결합된 절편). "표적 영역"은 핵산 표적 서열을 포함한다.
본원에 사용된 바와 같은, "스템 요소" 또는 "스템 구조"는 이중-가닥 영역 ("스템 요소")을 형성하는 것으로 공지되어 있거나 이를 형성할 것으로 예측되는 핵산의 두 가닥을 지칭한다. "스템-루프 요소" 또는 "스템-루프 구조"는 한 가닥의 3'-말단 서열이 전형적으로 단일-가닥의 뉴클레오티드의 뉴클레오티드 서열 ("스템-루프 요소 뉴클레오티드 서열")에 의해 제2 가닥의 5'-말단 서열에 공유적으로 결합되는 스템 구조를 지칭한다. 일부 실시양태에서, 루프 요소는 약 3개 내지 약 20개 뉴클레오티드 길이, 바람직하게 약 4개 내지 약 10개 뉴클레오티드 길이의 루프 요소 뉴클레오티드 서열을 포함한다. 바람직한 실시양태에서, 루프 요소 뉴클레오티드 서열은 이러한 루프 요소 뉴클레오티드 서열 내에 스템 요소를 창출하기 위해 수소 결합 형성을 통해 상호작용하지 않는 비-쌍형성된 핵산 염기의 단일-가닥 뉴클레오티드 서열이다. 용어 "헤어핀 요소"가 또한, 스템-루프 구조를 지칭하기 위해 본원에 사용된다. 이러한 구조는 관련 기술분야에 널리 공지되어 있다. 염기 쌍형성은 정확할 수 있지만; 관련 기술분야에 공지된 바와 같이, 스템 요소는 정확한 염기 쌍형성을 필요로 하지 않는다. 따라서, 스템 요소는 하나 이상의 염기 미스매치 또는 비-쌍형성된 염기를 포함할 수 있다. 가이드 폴리뉴클레오티드에서의 스템-루프 구조의 예가 도 1b에 예시되어 있다.
"링커 요소 뉴클레오티드 서열", "링커 뉴클레오티드 서열" 및 "링커 폴리뉴클레오티드"는 본원에서 상호교환가능하게 사용되며, 제1 핵산 서열에 공유적으로 부착된 하나 이상의 뉴클레오티드의 단일-가닥 핵산 서열 또는 이중-가닥 핵산 서열을 지칭한다 (예를 들어, 5'-링커 뉴클레오티드 서열-제1 핵산 서열-3'). 일부 실시양태에서, 링커 뉴클레오티드 서열은 2개의 별도의 핵산 서열을 연결하여 단일 폴리뉴클레오티드를 형성한다 (예를 들어, 5'-제1 핵산 서열-링커 뉴클레오티드 서열-제2 핵산 서열-3'). 링커 뉴클레오티드 서열의 다른 예는 5'-제1 핵산 서열-링커 뉴클레오티드 서열-3' 및 5'-링커 뉴클레오티드 서열-제1 핵산 서열-링커 뉴클레오티드 서열-3'를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 링커 요소 뉴클레오티드 서열은 이러한 링커 요소 뉴클레오티드 서열 내에 2차 구조 (예를 들어, 스템-루프 구조)를 창출하기 위해 수소 결합 형성을 통해 서로 상호작용하지 않는 비-쌍형성된 핵산 염기의 단일-가닥 뉴클레오티드 서열일 수 있다. 일부 실시양태에서, 두 링커 요소 뉴클레오티드 서열은 이러한 두 링커 요소 뉴클레오티드 서열 사이의 수소 결합을 통해 서로 상호작용할 수 있다. 일부 실시양태에서, 링커 폴리뉴클레오티드는 "링커 폴리펩티드"를 코딩한다. 이러한 링커 폴리뉴클레오티드는 전형적으로, 제1 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드의 3' 단부를 제2 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드의 5' 단부에 연결하여, N-제1 폴리펩티드-링커 폴리펩티드-제2 폴리펩티드-C를 포함하는 융합 단백질을 코딩하는 단일 폴리뉴클레오티드를 형성시킨다. 본 발명의 일부 실시양태에서, 3개 이상의 폴리펩티드 서열이 링커 폴리펩티드에 의해 나란히 연결될 수 있다 (예를 들어, N-제1 폴리펩티드-제1 링커 폴리펩티드-제2 폴리펩티드-제2 링커 폴리펩티드-제3 폴리펩티드-C). "링커 폴리펩티드", "링커 폴리펩티드 서열", "아미노산 링커 서열" 및 "링커 서열"이 또한, 본원에서 상호교환가능하게 사용된다.
본원에 사용된 바와 같은, "뉴클레오티드 서열을 연결하는 것"은 제1 핵산 서열과 제2 핵산 서열을 공유적으로 연결하는 단일-가닥 핵산 서열 링커 서열을 지칭한다.
본원에 사용된 바와 같은, 용어 "인터스페이서", "인터스페이서 영역" 및 "인터스페이서 거리"는 상호교환가능하며, 전형적으로 PAM-인 배향에서 제1 핵산 표적 서열 (예를 들어, 제1 DNA 표적 서열)의 PAM과 제2 핵산 표적 서열 (예를 들어, 제2 DNA 표적 서열)의 PAM 사이의 거리를 지칭하며, 여기서 제1 유형 I CRISPR-Cas 이펙터 복합체는 제1 핵산 표적 서열에 결합할 수 있는 제1 스페이서를 포함하고, 제2 유형 I CRISPR-Cas 이펙터 복합체는 제2 핵산 표적 서열에 결합할 수 있는 제2 스페이서를 포함한다. 도 2a, 도 2b, 및 도 2c는 링커 폴리뉴클레오티드 (도 2a, "링커1" 및 "링커2")를 통해 각각의 캐스케이드 복합체와 연결된 융합 단백질 (도 2a, 원형 섹터로서 나타낸 "FP1" 및 "FP2"; 예를 들어, FP1 및 FP는 FokI일 수 있음)을 포함하는 2개의 유형 I CRISPR-Cas 이펙터 복합체 (도 2a: "crRNA1"을 포함하는 "캐스케이드1", 실선으로 윤곽을 나타낸 박스; 및 "crRNA2"를 포함하는 "캐스케이드2", 파선 박스)의 예시적인 예를 제시하며, 여기서 CRISPR-Cas 이펙터 복합체는 이중-가닥 DNA (도 2a, "dsDNA", 쌍형성된 수평 파선으로서 나타냄) 상의 이웃한 핵산 표적 서열에 결합된다. 각각의 핵산 표적 서열과 연합된 PAM 서열이 표시된다 (도 2a, "PAM1," 열린 박스, 및 "PAM2," 열린 박스). 도 2a는 PAM-인 (PAM-인/PAM-인) 입체 배치에서 2개의 표적 부위 사이의 인터스페이서 (도 2a의 상단에 수평 이중 화살촉 모양의 선으로서 제시됨)를 예시한다. 도 2b는 PAM-인/PAM-아웃 입체 배치에서 2개의 표적 부위 사이의 인터스페이서 (도 2b의 상단에 수평 이중 화살촉 모양의 선으로서 제시됨)를 예시한다. 도 2c는 PAM-아웃 (PAM-아웃/PAM-아웃) 입체 배치에서 2개의 표적 부위 사이의 인터스페이서 (도 2c의 상단에 수평 이중 화살촉 모양의 선으로서 제시됨)를 예시한다. 도 2a, 도 2b, 및 도 2c는 또한 dsDNA의 두 가닥의 분리를 예시한다. 캐스케이드 복합체는 PAM에 인접한 dsDNA 표적 서열을 인식한다. PAM 서열은 Cse1에 의해 인식된다. crRNA와 상보적 표적 DNA 가닥 사이의 염기 쌍형성은 대체된 비-상보적 표적 DNA 가닥이 있는 R-루프를 생성한다 (예를 들어, 문헌 [Beloglazova, N., et al., Nucleic Acids Res. 43:530-543 (2015)] 참조).
본원에 사용된 바와 같은, 용어 "동족"은 상호작용하는 생체 분자, 예컨대 세포 표면 수용체 (예를 들어, 케모카인 수용체)와 그의 리간드 (예를 들어, 종양 세포 상에 또는 종양 미세환경에서 발현된 케모카인); 부위-지정 폴리펩티드와 그의 가이드; 가이드 결합 서열에 상보적인 핵산 표적 서열에 부위-지정 결합할 수 있는 부위-지정 폴리펩티드/가이드 복합체 (즉, 핵단백질 복합체) 등을 지칭한다. 또한, 용어 "동족"은 하나 이상의 가이드 폴리뉴클레오티드 중 하나에 존재하는 스페이서에 상보적인 핵산 표적 서열에 부위-지정 결합할 수 있는 핵단백질 복합체를 형성할 수 있는 하나 이상의 가이드 폴리뉴클레오티드 (예를 들어, 유형 I CRISPR-Cas RNA)와 Cas 서브유닛 단백질 군 (예를 들어, Cse2, Cas5, Cas6, Cas7, 및 Cas8)을 지칭한다.
용어 "야생형", "자연적으로 발생하는" 및 "비변형된"은 자연에 존재하는 전형적인 (또는 가장 통상적인) 형태, 외관, 표현형 또는 균주를 의미하기 위해 본원에 사용되며; 예를 들어, 자연의 공급원에서 발생하고 그로부터 단리될 수 있는 바와 같은, 전형적인 형태의 세포, 유기체, 폴리뉴클레오티드, 단백질, 거대 분자 복합체, 유전자, RNA, DNA 또는 게놈이다. 야생형 형태, 외관, 표현형 또는 균주는 의도적인 변형, 변화, 돌연변이 및/또는 현저하게 상이한 구조적 변화 이전의 원래의 부모로서 제공된다. 따라서, 돌연변이체, 변이체, 조작된, 재조합 및 변형된 형태는 야생형 형태가 아니다.
용어 "조작된", "유전적으로 조작된", "유전적으로 변형된", "재조합", "변형된", "비-자연적으로 발생하는" 및 "비-천연"은 유기체 또는 세포의 게놈에 대한 의도적인 인간 또는 기계 조작을 나타낸다. 이러한 용어는 본원에 정의된 바와 같은 게놈 편집을 포함하는 게놈 변형 방법 뿐만 아니라 유전자 발현 또는 불활성화를 변경시키는 기술, 효소 공학, 유도 진화, 지식-기반 설계, 무작위 돌연변이 유발 방법, 유전자 셔플링, 코돈 최적화 등을 포괄한다. 유전 공학을 위한 방법은 관련 기술분야에 공지되어 있다.
"공유 결합", "공유적으로 부착된", "공유적으로 결합된", "공유적으로 연결된", "공유적으로 연결된" 및 "분자 결합"은 본원에서 상호교환가능하게 사용되며, 원자 사이의 전자 쌍 공유를 수반하는 화학 결합을 지칭한다. 공유 결합의 예는 포스포디에스테르 결합, 포스포로티오에이트 결합, 디술피드 결합 및 펩티드 결합 (-CO-NH-)을 포함하나 이에 제한되지는 않는다.
"비-공유 결합", "비-공유적으로 부착된", "비-공유적으로 결합된", "비-공유적으로 연결된", "비-공유 상호작용" 및 "비-공유적으로 연결된"은 본원에서 상호교환가능하게 사용되며, 한 쌍의 전자를 공유하는 것을 수반하지 않는 임의의 비교적 약한 화학 결합을 지칭한다. 다수의 비-공유 결합은 종종, 거대 분자의 입체 형태를 안정화시키고 분자 사이의 특이적 상호작용을 매개한다. 비-공유 결합의 예는 수소 결합, 이온 상호작용 (예를 들어, Na+Cl-), 반 데르 발스 상호작용 및 소수성 결합을 포함하나 이에 제한되지는 않는다.
본원에 사용된 바와 같은, "수소 결합", "수소-염기 쌍형성" 및 "수소 결합된"은 상호교환가능하며, "왓슨-크릭-수소 결합된 염기 쌍" (W-C-수소 결합된 염기 쌍 또는 W-C 수소 결합); "후그스틴-수소 결합된 염기 쌍" (후그스틴 수소 결합); 및 "워블-수소 결합된 염기 쌍" (워블 수소 결합)을 포함하나 이에 제한되지는 않는 표준 수소 결합 및 비-표준 수소 결합을 지칭한다. 역 W-C 수소 결합을 포함한 W-C 수소 결합은 퓨린-피리미딘 염기 쌍형성, 예를 들어, 아데닌:티민, 구아닌:시토신 및 우라실:아데닌을 지칭한다. 역 후그스틴 수소 결합을 포함한 후그스틴 수소 결합은 핵산에서 염기 쌍형성의 변이를 지칭하며, 여기서 각각의 가닥에 하나씩 2개의 핵염기가 주요 홈에서 수소 결합에 의해 결합된다. 이러한 비-W-C 수소 결합은 제3 가닥이 듀플렉스 주위를 감아 삼중-가닥 나선을 형성할 수 있게 한다. 역 워블 수소 결합을 포함한 워블 수소 결합은 왓슨-크릭 염기 쌍 규칙을 따르지 않는 RNA 분자 내의 두 뉴클레오티드 사이의 쌍형성을 지칭한다. 구아닌:우라실, 이노신 (히포크산틴):우라실, 이노신-아데닌 및 이노신-시토신의 4가지 주요 워블 염기 쌍이 있다. 표준 수소 결합 및 비-표준 수소 결합에 대한 규칙은 관련 기술분야의 통상의 기술자에게 공지되어 있다 (예를 들어, 문헌 [The RNA World, Third Edition (Cold Spring Harbor Monograph Series), R.F. Gesteland, Cold Spring Harbor Laboratory Press (2005), ISBN 978-0879697396; The RNA World, Second Edition (Cold Spring Harbor Monograph Series), R.F. Gesteland, et al., Cold Spring Harbor Laboratory Press (1999), ISBN 978-0879695613; The RNA World (Cold Spring Harbor Monograph Series), R.F. Gesteland, et al., Cold Spring Harbor Laboratory Press (1993), ISBN 978-0879694562 (예를 들어, Appendix 1: Structures of Base Pairs Involving at Least Two Hydrogen Bonds, I. Tinoco 참조); Principles of Nucleic Acid Structure, W. Saenger, Springer International Publishing AG (1988), ISBN 978-0-387-90761-1; Principles of Nucleic Acid Structure, First Edition, S. Neidle, Academic Press (2007), ISBN 978-01236950791] 참조).
"연결", "연결된" 및 "연결하는 것"은 본원에서 상호교환가능하게 사용되며, 2개의 거대 분자 (예를 들어, 폴리뉴클레오티드, 단백질 등) 사이의 공유 결합 또는 비-공유 결합을 지칭한다.
본원에 사용된 바와 같은, 용어 "핵산 서열", "뉴클레오티드 서열" 및 "올리고뉴클레오티드"는 상호교환가능하고, 뉴클레오티드의 중합체성 형태를 지칭한다. 본원에 사용된 바와 같은, 용어 "폴리뉴클레오티드"는 하나의 5' 단부 및 하나의 3' 단부를 갖고 하나 이상의 핵산 서열을 포함할 수 있는 뉴클레오티드의 중합체성 형태를 지칭한다. "원형 폴리뉴클레오티드"는 그의 5' 단부와 3' 단부 사이에 공유 결합을 가지므로, 원형 폴리뉴클레오티드를 형성하는 폴리뉴클레오티드를 지칭한다. 뉴클레오티드는 데옥시리보뉴클레오티드 (DNA), 리보뉴클레오티드 (RNA), 그의 유사체, 또는 그의 조합 (예를 들어, 가이드 폴리뉴클레오티드의 맥락에서 상기 기재된 바와 같음)일 수 있고, 임의의 길이의 것일 수 있다. 폴리뉴클레오티드는 임의의 기능을 수행할 수 있으며 다양한 2차 및 3차 구조를 가질 수 있다. 상기 용어는 염기, 당 및/또는 포스페이트 모이어티에 있어서 변형되는 뉴클레오티드 및 자연 뉴클레오티드의 공지된 유사체를 포괄한다. 특별한 뉴클레오티드의 유사체는 동일한 염기 쌍형성 특이성을 갖는다 (예를 들어, T와 A 염기 쌍의 유사체). 폴리뉴클레오티드는 하나의 변형된 뉴클레오티드 또는 다수의 변형된 뉴클레오티드를 포함할 수 있다. 변형된 뉴클레오티드의 예는 플루오린화 뉴클레오티드, 메틸화 뉴클레오티드, 및 뉴클레오티드 유사체를 포함하나 이에 제한되지는 않는다. 뉴클레오티드 구조는 중합체가 어셈블리되기 전 또는 후에 변형될 수 있다. 중합 후, 폴리뉴클레오티드는, 예를 들어, 표지화 구성성분 또는 표적 결합 구성성분과의 접합을 통해 부가적으로 변형될 수 있다. 뉴클레오티드 서열은 비-뉴클레오티드 구성성분을 혼입할 수 있다. 합성, 자연적으로 발생하는, 및/또는 비-자연적으로 발생하며 참조 폴리뉴클레오티드 (예를 들어, DNA 또는 RNA)와 유사한 결합 특성을 갖는, 변형된 백본 잔기 또는 연결을 포함하는 핵산이 또한 포괄된다. 이러한 유사체의 예는 포스포로티오에이트, 포스포르아미데이트, 메틸 포스포네이트, 키랄-메틸 포스포네이트, 2-O-메틸 리보뉴클레오티드, 펩티드-핵산 (PNA), 잠금 핵산 (LNA)™ (엑시콘, 인크. (Exiqon, Inc.; 미국 매사추세츠주 우번)) 뉴클레오시드, 글리콜 핵산, 브리지 핵산 및 모르폴리노 구조를 포함하나 이에 제한되지는 않는다.
펩티드-핵산 (PNA)은 폴리뉴클레오티드 포스페이트-당 백본이 가요성 슈도-펩티드 중합체로 대체되고, 핵염기가 이러한 중합체에 연결되는 핵산의 합성 상동체이다. PNA는 RNA 및 DNA의 상보적 서열과 높은 친화성 및 특이성으로 혼성화할 수 있는 능력을 가지고 있다.
포스포로티오에이트 핵산에서, 포스포로티오에이트 (PS) 결합은 폴리뉴클레오티드 포스페이트 백본에서 황 원자를 비-브리징 산소로 대체한다. 이러한 변형은 뉴클레아제 분해에 대해 저항성인 뉴클레오티드 간 연결을 만든다. 일부 실시양태에서, 포스포로티오에이트 결합은 엑소뉴클레아제 분해를 억제하기 위해 폴리뉴클레오티드 서열의 5'-말단 또는 3'-말단에서 마지막 3개 내지 5개 뉴클레오티드 사이에 도입된다. 전체 올리고뉴클레오티드 전반에 걸쳐 포스포로티오에이트 결합을 배치하는 것이, 엔도뉴클레아제에 의한 분해를 감소시키는데 또한 도움을 준다.
트레오스 핵산 (TNA)은 인공 유전적 중합체이다. TNA의 백본 구조는 포스포디에스테르 결합에 의해 연결된 반복 트레오스 당을 포함한다. TNA 중합체는 뉴클레아제 분해에 대해 저항성이다. TNA는 염기 쌍 수소 결합에 의해 듀플렉스 구조로 자기 어셈블리될 수 있다.
연결 반전은 "역전된 포스포르아미다이트"의 사용을 통해 폴리뉴클레오티드 내로 도입될 수 있다 (예를 들어, www.ucalgary.ca/dnalab/synthesis/-modifications/linkages 참조). 폴리뉴클레오티드의 말단에서의 3'-3' 연결은 2 개의 5'-OH 말단을 갖지만 3'-OH 말단이 결여된 올리고뉴클레오티드를 창출함으로써 엑소뉴클레아제 분해에 대해 폴리뉴클레오티드를 안정화시켜 준다. 전형적으로, 이러한 폴리뉴클레오티드는 5'-OH 위치 상에 포스포르아미다이트 기를 갖고 3'-OH 위치 상에 디메톡시트리틸 (DMT) 보호기를 갖는다. 정상적으로, DMT 보호기는 5'-OH 상에 있고, 포스포르아미다이트는 3'-OH 상에 있다.
폴리뉴클레오티드 서열은 달리 지시되지 않는 한 통상적인 5'에서 3' 배향으로 본원에 표시된다.
본원에 사용된 바와 같은, "서열 동일성"은 일반적으로, 다양한 가중치 파라미터를 갖는 알고리즘을 사용하여 제1 폴리뉴클레오티드 또는 폴리펩티드를 제2 폴리뉴클레오티드 또는 폴리펩티드와 비교하는 뉴클레오티드 염기 또는 아미노산의 퍼센트 동일성을 지칭한다. 두 폴리뉴클레오티드 또는 두 폴리펩티드 사이의 서열 동일성은 GENBANK (www.ncbi.nlm.nih.gov/genbank/) 및 EMBL-EBI (www.ebi.ac.uk)를 포함하나 이에 제한되지는 않는 월드와이드 웹 사이트를 통해 이용가능한 다양한 방법 및 컴퓨터 프로그램 (예를 들어, BLAST, CS-BLAST, PSI-BLAST, FASTA, HMMER, L-ALIGN 등)에 의한 서열 정렬을 사용하여 결정될 수 있다. 두 폴리뉴클레오티드 또는 두 폴리펩티드 서열 사이의 서열 동일성은 일반적으로, 다양한 방법 또는 컴퓨터 프로그램의 표준 디폴트 파라미터를 사용하여 계산된다. 본원에 사용된 바와 같은, 두 폴리뉴클레오티드 또는 두 폴리펩티드 사이의 높은 정도의 서열 동일성은 전형적으로, 약 90% 동일성 내지 100% 동일성, 예를 들어, 약 90% 이상의 동일성, 바람직하게 약 95% 이상의 동일성, 보다 바람직하게 약 98% 이상의 동일성이다. 본원에 사용된 바와 같은, 두 폴리뉴클레오티드 또는 두 폴리펩티드 사이의 중간 정도의 서열 동일성은 전형적으로, 약 80% 동일성 내지 약 85% 동일성, 예를 들어, 약 80% 이상의 동일성, 바람직하게 약 85% 동일성이다. 본원에 사용된 바와 같은, 두 폴리뉴클레오티드 또는 두 폴리펩티드 사이의 낮은 정도의 서열 동일성은 전형적으로, 약 50% 동일성 내지 75% 동일성, 예를 들어, 약 50% 동일성, 바람직하게 약 60% 동일성, 보다 바람직하게 약 75% 동일성이다. 예를 들어, 아미노산 치환을 포함하는 Cas 단백질 (예를 들어, 유형 I-E Cse2, Cas5, Cas6, Cas7, 및/또는 Cas8)은 그의 길이 전반에 걸쳐, 참조 Cas 단백질 (예를 들어, 각각 야생형 유형 I-E Cse2, Cas5, Cas6, Cas7, 및/또는 Cas8)과의 낮은 정도의 서열 동일성, 중간 정도의 서열 동일성, 또는 높은 정도의 서열 동일성을 가질 수 있다. 또 다른 예로서, 가이드 폴리뉴클레오티드는 참조 Cas 단백질과 복합체를 형성하는 참조 야생형 가이드 폴리뉴클레오티드 (예를 들어, 유형 I-E Cse2, Cas5, Cas6, Cas7, 및/또는 Cas8과 복합체를 형성하는 가이드 폴리뉴클레오티드)와 비교해서 그의 길이 전반에 걸쳐 낮은 정도의 서열 동일성, 중간 정도의 서열 동일성, 또는 높은 정도의 서열 동일성을 가질 수 있다.
본원에 사용된 바와 같은, "혼성화", "혼성화하다" 또는 "혼성화하는 것"은 2개의 상보적 단일-가닥 DNA 또는 RNA 분자를 조합하여, 수소 염기 쌍형성을 통해 단일 이중-가닥 분자 (DNA/DNA, DNA/RNA, RNA/RNA)를 형성하도록 하는 프로세스이다. 혼성화 엄격성은 전형적으로, 혼성화 온도 및 혼성화 완충제의 염 농도에 의해 결정되며; 예를 들어, 고온 및 저염은 높은 엄격성 혼성화 조건을 제공한다. 상이한 혼성화 조건에 대한 염 농도 범위 및 온도 범위의 예는 하기와 같다: 높은 엄격성, 대략 0.01 M 내지 대략 0.05 M 염, 혼성화 온도 5℃ 내지 10℃ 미만 Tm; 중간 정도의 엄격성, 대략 0.16 M 내지 대략 0.33 M 염, 혼성화 온도 20℃ 내지 29℃ 미만 Tm; 및 낮은 엄격성, 대략 0.33 M 내지 대략 0.82 M 염, 혼성화 온도 40℃ 내지 48℃ 미만 Tm. 듀플렉스 핵산 서열의 Tm은 관련 기술분야에 널리 공지된 표준 방법에 의해 계산된다 (예를 들어, 문헌 [Maniatis, T., et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press: New York (1982); Casey, J., et al., Nucleic Acids Res. 4:1539-1552 (1977); Bodkin, D.K., et al., J. Virological Methods 10:45-52 (1985); Wallace, R.B., et al., Nucleic Acids Res. 9:879-894 (1981)] 참조). Tm을 추정하는 알고리즘 예측 도구가 또한 널리 이용가능하다. 혼성화를 위한 높은 엄격성 조건은 전형적으로, 표적 서열에 상보적인 폴리뉴클레오티드가 주로 표적 서열과 혼성화하고 비-표적 서열과 실질적으로 혼성화하지 않는 조건을 지칭한다. 전형적으로, 혼성화 조건은 중간 정도의 엄격성, 바람직하게 높은 엄격성이다.
본원에 사용된 바와 같은, "상보성"은 핵산 서열이 또 다른 핵산 서열과 수소 결합(들)을 형성할 수 있는 능력을 지칭한다 (예를 들어, 표준 왓슨-크릭 염기 쌍형성을 통함). 퍼센트 상보성은 제2 핵산 서열과 수소 결합을 형성할 수 있는 핵산 서열 내의 잔기의 백분율을 나타낸다. 두 핵산 서열이 100% 상보성을 갖는 경우에, 두 서열은 완벽하게 상보적인데, 즉 제1 폴리뉴클레오티드의 연속되는 잔기 모두가 제2 폴리뉴클레오티드 내의 동일한 수의 연속되는 잔기와 수소 결합된다.
본원에 사용된 바와 같은, "결합하는 것"은 거대 분자 사이의 (예를 들어, 단백질과 폴리뉴클레오티드 사이의, 폴리뉴클레오티드와 폴리뉴클레오티드 사이의, 단백질과 단백질 사이의 등) 비-공유 상호작용을 지칭한다. 이러한 비-공유 상호작용은 "연합하는 것" 또는 "상호작용하는 것" (예를 들어, 제1 거대 분자가 제2 거대 분자와 상호작용하는 경우에, 제1 거대 분자는 비-공유 방식으로 제2 거대 분자에 결합함)으로서 지칭되기도 한다. 결합 상호작용의 일부 부분은 서열-특이적일 수 있다 (용어 "서열-특이적 결합", "서열-특이적으로 결합하다", "부위-특이적 결합" 및 "부위 특이적으로 결합하다"는 본원에서 상호교환가능하게 사용됨). 본원에 사용된 바와 같은, 서열-특이적 결합은 전형적으로, 핵산 표적 결합 서열 (예를 들어, DNA 표적 결합 서열)을 수반하지 않는 제2 핵산 서열 (예를 들어, 제2 DNA 서열)에 비해 우선적으로 핵산 표적 서열 (예를 들어, DNA 표적 서열)을 포함하는 핵산 서열 (예를 들어, DNA 서열)에 결합하도록 하기 위해 유형 I CRISPR-Cas 서브유닛 단백질 (예를 들어, Cse2, Cas5, Cas6, Cas7, 및 Cas8)과의 복합체를 형성할 수 있는 하나 이상의 가이드 폴리뉴클레오티드를 지칭한다. 결합 상호작용의 모든 구성성분이 서열 특이적일 필요는 없는데, 예컨대 단백질이 DNA 백본 내의 포스페이트 잔기와 접촉할 필요는 없다. 결합 상호작용은 해리 상수 (Kd)에 의해 특징규명될 수 있다. "결합 친화도"는 결합 상호작용의 강도를 지칭한다. 증가된 결합 친화도는 더 낮은 Kd와 상관이 있다.
본원에 사용된 바와 같은, 이펙터 복합체는 이러한 복합체가 폴리뉴클레오티드 내의 핵산 표적 서열에서의 폴리뉴클레오티드에 결합하거나 이를 절단하는 경우에, 상기 폴리뉴클레오티드를 "표적화한다"고 한다.
본원에 사용된 바와 같은, "이중-가닥 파손" (DSB)은 절단되는 DNA의 이중-가닥 세그먼트의 두 가닥을 지칭한다. 일부 경우에, 이러한 파손이 발생하면, 하나의 가닥은, 뉴클레오티드가 노출되고 다른 가닥 상의 뉴클레오티드에 수소 결합되지 않는 "점착성 단부"를 갖는다고 할 수 있다. 다른 경우에, 두 가닥이 서로 완전히 염기 쌍을 유지하고 있는 "평활 단부"가 발생할 수 있다.
"공여자 폴리뉴클레오티드", "공여자 올리고뉴클레오티드" 및 "공여자 주형"은 본원에서 상호교환가능하게 사용되고, 이중-가닥 폴리뉴클레오티드 (예를 들어, DNA), 단일-가닥 폴리뉴클레오티드 (예를 들어, DNA 또는 RNA), 또는 그의 조합일 수 있다. 공여자 폴리뉴클레오티드는 삽입 서열 (예를 들어, DNA 내의 DSB)을 플랭킹하는 상동성 아암(arm)을 포함할 수 있다. 각각의 측면 상의 상동성 아암은 그 길이가 다양할 수 있다 (예를 들어, 1-50개 염기, 50-100개 염기, 100-200개 염기, 200-300개 염기, 300-500개 염기, 500-1000개 염기). 상동성 아암은 그 길이가 대칭적 또는 비대칭적일 수 있다. 공여자 폴리뉴클레오티드의 설계 및 구축을 위한 파라미터는 관련 기술분야에 널리 공지되어 있다 (예를 들어, 문헌 [Ran, F., et al., Nature Protocols 8:2281-2308 (2013); Smithies, O., et al., Nature 317:230-234 (1985); Thomas, K., et al., Cell 44:419-428 (1986); Wu, S., et al., Nature Protocols 3:1056-1076 (2008); Singer, B., et al., Cell 31:25-33 (1982); Shen, P., et al., Genetics 112:441-457 (1986); Watt, V., et al., Proc. Natl. Acad. Sci. USA 82:4768-4772 (1985); Sugawara, N., et al., J. Mol. Bio. 12:563-575 (1992); Rubnitz, J., et al., J. Mol. Bio. 4:2253-2258 (1984); Ayares, D., et al., Proc. Natl. Acad. Sci. USA 83:5199-5203 (1986); Liskay, R., et al., Genetics 115:161-167 (1987)] 참조). 일부 실시양태에서, 공여자 폴리뉴클레오티드는 키메라 항원 수용체 (예를 들어, CAR)를 포함한다.
용어 "키메라 항원 수용체" 및 "CAR"은 본원에서 상호교환가능하게 사용되고, 전형적으로 적어도 2가지 구성성분, 즉 세포외 항원 인식 도메인 (표적 결합 도메인 또는 세포외 리간드 결합 도메인으로서 지칭되기도 함) 및 세포내 활성화 도메인 (예를 들어, 하나 이상의 세포내 시그널링 도메인 및 전형적으로 하나 이상의 공동-자극 시그널링 도메인을 포함함)을 포함하는, 실험실에서 창출된 폴리펩티드 분자를 지칭한다. CAR은 힌지 도메인 및 막횡단 도메인을 추가로 포함할 수 있다. 전형적인 CAR 폴리펩티드의 구조는 하기와 같다: N 말단-세포외-[항원 인식 도메인-힌지 도메인]-막횡단-[막횡단 도메인]-세포내-[세포내 활성화 도메인]-C 말단; 또는 N 말단-세포내-[세포내 활성화 도메인]-막횡단-[막횡단 도메인]- 세포외-[항원 인식 도메인-힌지 도메인]-C 말단.
세포외 항원 인식 도메인의 예는 항원에 결합하기 위해 사용되는 모이어티를 포함하며, 이는 단일 쇄 이뮤노글로불린 가변 단편 (scFv), 항원 결합 단편 (Fab; 전형적으로, 항원에 결합하고 중쇄 및 경쇄 각각의 하나의 불변 및 하나의 가변 도메인으로 구성되는 항체의 영역), 나노바디, 낙타과 유래 또는 상어 유래 단일 쇄 항체, 조작된 단백질 결합 스캐폴드 (예를 들어, DARPin 및 센티린(Centyrin)), 또는 동족 수용체(들)에 결합하는 자연 리간드(들)를 포함하나 이에 제한되지는 않는다.
힌지 도메인의 예는 가변 길이 (예를 들어, 하나 이상의 아미노산)의 폴리펩티드 힌지, CD8 알파의 힌지 영역, CD28의 힌지 영역, IgG4의 힌지 영역, 및 그의 조합을 포함하나 이에 제한되지는 않는다.
막횡단 도메인의 예는 막횡단 단백질, 예컨대, CD8 알파, CD28, DAP10, DAP12, NKG2D, 및 그의 조합으로부터 유래된 막횡단 영역을 포함하나 이에 제한되지는 않는다.
세포내 활성화 도메인의 예는 CD28, 4-1BB, CD3 제타, OX40, 2B4, DAP10, DAP12의 세포내 시그널링 도메인, 말단절단된 및 돌연변이된 시그널링 도메인 (예를 들어, CD3 제타의 3개의 ITAM 도메인 내의 돌연변이 및 말단절단), 또는 다른 세포내 시그널링 도메인, 및 그의 조합을 포함하나 이에 제한되지는 않는다.
세포외 리간드 결합 도메인이 동족 리간드에 결합할 때, CAR의 세포내 시그널링 도메인은 림프구를 활성화시킨다 (CAR-T 세포의 설명에 관해서는, 예를 들어, 문헌 [Brudno, J., et al., Nature Rev. Clin. Oncol. 15:31-46 (2018); Maude, S., et al., N. Engl. J. Med. 371:1507-1517 (2014); Sadelain, M., et al., Cancer Disc. 3:388-398 (2013)]; 미국 특허 번호 7,446,190; 미국 특허 번호 8,399,645을 참조) (CAR-NK 세포의 설명에 관해서는, 예를 들어, 문헌 [Rezvani, K., et al., Mol. Ther., 25:1769-1781 (2017); Siegler, E., et al., Cell Stem Cell. 23:160-161 (2018); Li, Y., et al., Cell Stem Cell. 23:181-192 (2018); Lin, C., et al., Biochim. Biophys. Acta. Rev. Cancer. 1869:200-215 (2018); Hu, Y., et al., Acta. Pharmacol. Sin. 39:167-176 (2018); Fang, F., et al., Semin. Immunol. 31:37-54 (2017); Glienke, W., et al., Front Pharmacol. 6:21 (2015)]을 참조).
표 2는 예시적인 세포성 표적 및 이러한 세포성 표적에 결합하는 scFv/결합 단백질을 제시한다. 이러한 scFv/결합 단백질 또는 그의 일부분이 CAR 구축물 내로 혼입될 수 있다.
Figure pct00002
Figure pct00003
본원에 사용된 바와 같은, "상동성-지정 복구" (HDR)는, 예를 들어, gDNA에서의 DSB를 복구하는 동안 세포에서 발생하는 DNA 복구를 지칭한다. HDR은 뉴클레오티드 서열 상동성을 필요로 하며, (예를 들어, DNA 표적 서열 내의) DSB가 발생한 서열을 복구하기 위해 공여자 또는 주형 폴리뉴클레오티드를 사용한다. 공여자 폴리뉴클레오티드는 일반적으로, DSB를 플랭킹하는 서열과의 필수적 서열 상동성을 가지므로, 공여자 폴리뉴클레오티드가 복구에 적합한 주형으로서 제공될 수 있다. HDR은 유전 정보를, 예를 들어, 공여자 폴리뉴클레오티드에서 DNA 표적 서열로 전달시켜 준다. HDR은 공여자 폴리뉴클레오티드 서열이 DNA 표적 서열과 상이하고 공여자 폴리뉴클레오티드의 일부 또는 전부가 DNA 표적 서열 내로 혼입되는 경우에, DNA 표적 서열의 변경 (예를 들어, 삽입, 결실 또는 돌연변이)을 초래할 수 있다. 일부 실시양태에서, 전체 공여자 폴리뉴클레오티드, 공여자 폴리뉴클레오티드의 일부분, 또는 공여자 폴리뉴클레오티드의 카피는 DNA 표적 서열의 부위에 통합된다. 예를 들어, 공여체 폴리뉴클레오티드는 DNA 표적 서열 내의 파손을 복구하는데 사용될 수 있으며, 여기서 복구는 DNA 내의 파손 부위 또는 파손에 근접한 부위에서 공여자 폴리뉴클레오티드로부터의 유전 정보의 전달을 초래한다. 따라서, 새로운 유전 정보가 DNA 표적 서열에 삽입되거나 또는 카피될 수 있다.
"게놈 영역"은 핵산 표적 서열 부위의 어느 한쪽에 존재하는 숙주 세포의 게놈 내의 염색체의 세그먼트이거나, 또는 또 다른 한편으론 또한, 핵산 표적 서열 부위의 일부분을 포함한다. 공여자 폴리뉴클레오티드의 상동성 아암은 상응하는 게놈 영역과의 상동 재조합을 수행하기에 충분한 상동성을 갖는다. 일부 실시양태에서, 공여자 폴리뉴클레오티드의 상동성 아암은 핵산 표적 서열 부위를 바로 플랭킹하는 게놈 영역과의 상당한 서열 상동성을 공유하고; 상동성 아암은 핵산 표적 서열 부위로부터 멀리 떨어진 게놈 영역과의 충분한 상동성을 갖도록 설계될 수 있는 것으로 인식된다.
본원에 사용된 바와 같은, "비-상동 단부 결합" (NHEJ)은 공여자 폴리뉴클레오티드에 대한 요구없이 파손의 한 말단을 파손의 다른 말단에 직접 라이게이션함으로써 DNA 내의 DSB를 복구하는 것을 지칭한다. NHEJ는 복구 주형을 사용하지 않고서도 DNA를 복구하기 위해 세포에 이용가능한 DNA 복구 경로이다. 공여자 폴리뉴클레오티드의 부재 하에서의 NHEJ는 종종, 뉴클레오티드가 DSB의 부위에 무작위로 삽입되거나 결실되는 결과를 초래한다.
"미세상동성-매개 단부 결합" (MMEJ)은 gDNA 내의 DSB를 복구하기 위한 경로이다. MMEJ는 DSB를 플랭킹하는 결실, 및 연결하기 전에 파손 부위 내부의 미세상동 서열의 정렬을 수반한다. MMEJ는 유전적으로 정의되어 있으며, 예를 들어, CtIP, 폴리(ADP-리보스) 폴리머라제 1 (PARP1), DNA 폴리머라제 세타 (Pol θ), DNA 리가제 1 (Lig 1), 또는 DNA 리가제 3 (Lig 3)의 활성을 필요로 한다. 부가의 유전적 구성성분은 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Sfeir, A., et al., Trends in Biochemical Sciences 40:701-714 (2015)] 참조).
본원에 사용된 바와 같은, "DNA 복구"는 세포성 기구가 세포에 함유된 DNA 분자에 대한 손상을 복구하는 임의의 프로세스를 포괄한다. 복구된 손상은 단일-가닥-파손 또는 DSB를 포함할 수 있다. DSB를 복구하기 위해 HDR, NHEJ 및 MMEJ의 적어도 3가지 메카니즘이 있다. "DNA 복구"는 또한 인간 또는 기계 조작으로부터 비롯되는 DNA 복구를 지칭하기 위해 본원에서 사용되며, 여기서 표적 로커스는, 예를 들어, 뉴클레오티드를 삽입, 결실 또는 치환함으로써 변형되는데, 이들 모두는 게놈 편집의 형태를 나타낸다.
본원에 사용된 바와 같은, "재조합"은 두 폴리뉴클레오티드 사이의 유전 정보의 교환 프로세스를 지칭한다.
본원에 사용된 바와 같은, 용어 "조절 서열", "조절 요소" 및 "제어 요소"는 상호교환가능하며, 발현될 폴리뉴클레오티드 표적의 상류 (5' 비-코딩 서열), 내부 또는 하류 (3' 비-번역 서열)인 폴리뉴클레오티드 서열을 지칭한다. 조절 서열은, 예를 들어, 전사의 시기; 전사의 양 또는 수준; RNA 프로세싱 또는 안정성; 및/또는 관련된 구조적 뉴클레오티드 서열의 번역에 영향을 미친다. 조절 서열은 활성화제 결합 서열, 인핸서, 인트론, 폴리아데닐화 인식 서열, 프로모터, 전사 시작 부위, 저해인자 결합 서열, 스템-루프 구조, 번역 개시 서열, 내부 리보솜 진입 부위 (IRES), 번역 리더 서열, 전사 종결 서열 (예를 들어, 폴리아데닐화 시그널 및 폴리-U 서열), 번역 종결 서열, 프라이머 결합 부위 등을 포함할 수 있다.
조절 요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적, 유도성 및 저해성 발현을 지시하는 요소와, 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 요소 (예를 들어, 조직-특이적 조절 서열)를 포함한다. 일부 실시양태에서, 벡터는 하나 이상의 pol III 프로모터, 하나 이상의 pol II 프로모터, 하나 이상의 pol I 프로모터, 또는 그의 조합을 포함한다. pol III 프로모터의 예는 U6 및 H1 프로모터를 포함하나 이에 제한되지는 않는다. pol II 프로모터의 예는 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터 (임의적으로 RSV 인핸서와 함께), 시토메갈로바이러스 (CMV) 프로모터 (임의적으로 CMV 인핸서와 함께; 예를 들어, 문헌 [Boshart, M., et al., Cell 41:521-530 (1985)] 참조), SV40 프로모터, 디히드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제 (PGK) 프로모터, 및 EF1α 프로모터 뿐만 아니라 조작된 인공 프로모터 (예를 들어, MND 프로모터 및 CAG 프로모터)를 포함하나 이에 제한되지는 않는다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 원하는 발현의 수준 등과 같은 인자에 의존할 수 있음을 관련 기술분야의 통상의 기술자는 인지할 것이다. 벡터는 숙주 세포 내로 도입됨으로써 RNA 전사체, 단백질, 또는 융합 단백질을 포함한 펩티드, 또는 본원에 기재된 바와 같은 핵산 서열에 의해 코딩된 펩티드를 생산할 수 있다.
본원에 사용된 바와 같은, "유전자"는 엑손(들) 및 관련 조절 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 유전자는 인트론(들) 및/또는 비번역 영역(들) (UTR(들))을 추가로 포함할 수 있다.
본원에 사용된 바와 같은, 용어 "작동가능하게 연결된"은 서로 기능적 관계로 배치된 폴리뉴클레오티드 서열 또는 아미노산 서열을 지칭한다. 예를 들어, 조절 서열 (예를 들어, 프로모터 또는 인핸서)은 조절 서열이, 유전자 산물을 코딩하는 폴리뉴클레오티드의 전사를 조절하거나 또는 이러한 폴리뉴클레오티드의 전사의 조정에 기여하는 경우에, 상기 유전자 산물을 코딩하는 폴리뉴클레오티드에 "작동가능하게 연결"된다. 작동가능하게 연결된 조절 요소는 전형적으로, 코딩 서열과 연속된다. 그러나, 인핸서는 프로모터로부터 수 킬로염기 이하 또는 그 초과 만큼 분리되는 경우에, 기능할 수 있다. 부가적으로, 멀티시스트론성 구축물은 2A 자기 절단 펩티드, IRES 요소 등을 포함함으로써 단 하나의 프로모터를 사용하는 다중 코딩 서열을 포함할 수 있다. 따라서, 일부 조절 요소는 폴리뉴클레오티드 서열에 작동가능하게 연결될 수 있지만, 폴리뉴클레오티드 서열과 연속되지 않을 수 있다. 유사하게, 번역 조절 요소는 폴리뉴클레오티드로부터의 단백질 발현의 조정에 기여한다.
본원에 사용된 바와 같은, "발현"은, 예를 들어, 메신저 RNA (mRNA) 또는 다른 RNA 전사체 (예를 들어, 비-코딩, 예컨대 구조적 또는 스캐폴딩 RNA)를 초래하는, DNA 주형으로부터의 폴리뉴클레오티드의 전사를 지칭한다. 상기 용어는 추가로, 전사된 mRNA가 펩티드, 폴리펩티드 또는 단백질로 번역되는 프로세스를 지칭한다. 전사체 및 코딩된 폴리펩티드는 집합적으로 "유전자 산물(들)"로서 지칭될 수 있다. 발현은 폴리뉴클레오티드가 gDNA로부터 유래되는 경우에, 진핵 세포에서 mRNA를 스플라이싱하는 것을 포함할 수 있다.
"코딩 서열" 또는 선택된 폴리펩티드를 "코딩"하는 서열은 적절한 조절 서열의 제어 하에 놓여질 때 시험관내 또는 생체내에서 폴리펩티드로 전사 (DNA의 경우) 및 번역 (mRNA의 경우)되는 핵산 분자이다. 코딩 서열의 경계는 5' 말단에서의 출발 코돈과 3' 말단에서의 번역 중지 코돈에 의해 결정된다.
본원에 사용된 바와 같은, "인공 전사 활성화제 (ATA)" 또는 "인공 전사 인자 (ATF)"는 RNA 폴리머라제 II 홀로엔자임을, 이들이 연합되어 있는 유전자에 동원함으로써 관심 유전자의 이소성 발현을 유발할 수 있는 복합체를 의미한다. 이러한 활성화제는 적어도 2가지 구성성분을 포함한다: (1) 동족 뉴클레오티드 서열을 직접 인식하고 이들 서열에 결합할 수 있는, 촉매적으로 불활성인 폴리뉴클레오티드 결합 도메인, 또는 결합을 위해 이러한 서열로 가이드되는 폴리뉴클레오티드 결합 도메인 (예를 들어, 본원에 기재된 바와 같은 핵산 결합 도메인 및 가이드를 포함하는 핵단백질 복합체); 및 (2) 전사를 상향조절하기 위해 전사 기구를 구성하는 다양한 단백질과 상호작용하는 활성화 도메인 ("이펙터 도메인"이라고도 함).
"촉매적으로 불활성인 폴리뉴클레오티드 결합 도메인"은 결합 도메인에 의해 결합된 핵산 표적 부위에 결합하지만 이를 절단하지는 않는 분자를 의미한다. 이러한 도메인의 대표적인 예가 본원에 상세히 기재된다.
본원에 사용된 바와 같은, 용어 "조정하다"는 특정 기능의 수량, 정도 또는 양에 있어서의 변화를 지칭한다. 예를 들어, 본원에 개시된 바와 같은 유형 I CRISPR 핵단백질 복합체는 프로모터 또는 전사 출발 부위 또는 조절인자 부위에서 또는 그 근처에서 핵산 표적 서열에 결합함으로써 프로모터 서열의 활성을 조정할 수 있다. 결합 후 발생하는 작용에 따라, 유형 I CRISPR 핵단백질 복합체는 프로모터 서열에 작동적으로 연결된 유전자의 전사를 유도, 증강, 저해 또는 억제할 수 있다. 따라서, 유전자 발현의 "조정"은 유전자 활성화와 유전자 저해 둘 다를 포함한다.
조정은 표적 유전자의 발현에 의해 직접 또는 간접적으로 영향을 받는 임의의 특징을 결정함으로써 검정될 수 있다. 이러한 특징은, 예를 들어, RNA 또는 단백질 수준, 단백질 활성, 산물 수준, 유전자의 발현, 또는 리포터 유전자의 활성 수준 상의 변화를 포함한다. 따라서, 용어 유전자의 "발현을 조정하는 것", "발현을 억제하는 것" 및 "발현을 활성화하는 것"은 유전자의 전사를 변화, 활성화 또는 억제할 수 있는 유형 I CRISPR 핵단백질 복합체의 능력을 지칭할 수 있다.
기능 (예를 들어, 효소적 기능)은 상향-조정될 수 있거나 (예를 들어, 기능을 증가, 강화, 증폭 또는 증강시킴) 또는 하향-조정될 수 있다 (예를 들어, 기능을 감소, 약화, 축소 또는 저하시킴). 한 실시양태에서, mCas3 단백질과 단일-가닥 DNA (ssDNA)의 결합 또는 mCas3 단백질에 의한 ATP 결합/가수분해는 상응하는 wtCas3 단백질에 비해 상향-조정되거나 또는 하향-조정될 수 있다.
본원에 사용된 바와 같은, "벡터" 및 "플라스미드"는 유전 물질을 세포 내로 도입하기 위한 폴리뉴클레오티드 비히클을 지칭한다. 벡터는 선형 또는 원형일 수 있다. 벡터는 적합한 숙주 세포에서 벡터의 복제를 수행할 수 있는 복제 서열 (예를 들어, 복제 기점)을 함유할 수 있다. 적합한 숙주의 형질전환 시, 벡터는 숙주 게놈과 독립적으로 복제 및 기능하거나 또는 숙주 게놈에 통합될 수 있다. 벡터 설계는 무엇보다도 벡터에 대한 의도된 용도 및 숙주 세포에 의존하고, 특별한 용도 및 숙주 세포를 위한 본 발명의 벡터의 설계는 관련 기술분야의 기술 수준 내에 있다. 4가지 주요 유형의 벡터는 플라스미드, 바이러스 벡터, 코스미드 및 인공 염색체이다. 전형적으로, 벡터는 복제 기점, 다중 클로닝 부위 및/또는 선택가능한 마커를 포함한다. 발현 벡터는 전형적으로 발현 카세트를 포함한다. "재조합 바이러스"는, 예를 들어, 바이러스 게놈 또는 그의 일부분 내로의 이종 핵산 구축물의 부가 또는 삽입에 의해 유전적으로 변경시킨 바이러스를 의미한다.
본원에 사용된 바와 같은, "발현 카세트"는 재조합 방법을 사용하거나 또는 합성 수단에 의해 생성되고 숙주 세포에서 선택된 폴리뉴클레오티드의 발현을 용이하게 하기 위해 선택된 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함하는 폴리뉴클레오티드 구축물을 지칭한다. 예를 들어, 조절 서열은 숙주 세포에서 선택된 폴리뉴클레오티드의 전사, 또는 숙주 세포에서 선택된 폴리뉴클레오티드의 전사와 번역을 용이하게 할 수 있다. 발현 카세트는, 예를 들어, 숙주 세포의 게놈에 통합되거나 또는 벡터에 존재하여 발현 벡터를 형성할 수 있다.
본원에 사용된 바와 같은, "표적화 벡터"는 표적 유전자 또는 핵산 표적 서열 (예를 들어, DSB)의 요소를 플랭킹하는, gDNA에 상동인 맞춤형 DNA 아암을 전형적으로 포함하는 재조합 DNA 구축물이다. 표적화 벡터는 공여자 폴리뉴클레오티드를 포함한다. 표적 유전자의 요소는 결실 및/또는 삽입을 포함한 다양한 방식으로 변형될 수 있다. 결함이 있는 표적 유전자는 기능적 표적 유전자로 대체될 수 있거나, 또는 그 대안에서는, 기능적 유전자가 녹아웃될 수 있다. 임의적으로, 표적화 벡터의 공여자 폴리뉴클레오티드는 표적 유전자 내로 도입되는 선택가능한 마커를 포함하는 선별 카세트를 포함한다. 표적 유전자에 인접하거나 또는 표적 유전자 내에 있는 표적화 영역 (핵산 표적 서열을 포함함)은 유전자 발현의 조절에 영향을 주기 위해 사용될 수 있다.
본원에 사용된 바와 같은, 용어 "내지"는 주어진 범위 내의 말단 값을 포함한다 (예를 들어, 1개 내지 50개 뉴클레오티드 길이는 1개 뉴클레오티드 및 50개 뉴클레오티드를 포함하고; 5개 아미노산 내지 50개 아미노산 길이는 5개 아미노산 및 50개 아미노산을 포함함).
본원에 사용된 바와 같은, 용어 "아미노산" (aa)은 아미노산 유사체, 변형된 아미노산, 펩티드 모방제, 글리신, 및 D 또는 L 광학 이성질체를 포함한 자연 및 합성 (비자연) 아미노산을 지칭한다.
본원에 사용된 바와 같은, 용어 "펩티드", "폴리펩티드", "단백질" 및 "서브유닛 단백질"은 상호교환가능하며 아미노산의 중합체를 지칭한다. 폴리펩티드는 임의의 길이일 수 있다. 이는 분지형 또는 선형일 수 있으며, 비-아미노산에 의해 중단될 수 있으며, 변형된 아미노산을 포함할 수 있다. 상기 용어는 또한, 예를 들어, 아세틸화, 디술피드 결합 형성, 글리코실화, 지질화, 인산화, 페길화, 비오티닐화, 가교-결합, 및/또는 접합 (예를 들어, 표지화 구성성분 또는 리간드를 이용함)을 통해 변형시킨 아미노산 중합체를 지칭한다. 폴리펩티드 서열은 달리 지시되지 않는 한, 통상적인 N-말단에서 C-말단 배향으로 본원에 표시된다.
폴리펩티드 및 폴리뉴클레오티드는 분자 생물학 분야의 일상적인 기술을 사용하여 만들 수 있다 (예를 들어, 상기 열거된 표준 텍스트 참조). 더욱이, 본질적으로 임의의 폴리펩티드 또는 폴리뉴클레오티드는 상업적 공급원으로부터 입수가능하다.
본원에 사용된 바와 같은, 용어 "융합 단백질" 및 "키메라 단백질"은 단일 단백질에서 자연적으로 함께 발생하지 않는 둘 이상의 단백질, 단백질 도메인, 단백질 단편 또는 순환 순열된 폴리펩티드를 연결함으로써 창출된 단일 단백질을 지칭한다. 일부 실시양태에서, 링커 폴리뉴클레오티드는 제1 단백질, 단백질 도메인, 또는 단백질 단편, 또는 순환 순열된 폴리펩티드를 제2 단백질, 단백질 도메인, 단백질 단편, 또는 순환 순열된 폴리펩티드에 연결하는데 사용될 수 있다. 예를 들어, 융합 단백질은 유형 I CRISPR-Cas 단백질 (예를 들어, Cas8, Cas3) 및 또 다른 단백질 (예를 들어, FokI; 예를 들어, 미국 특허 번호 9,885,026 참조)로부터의 기능적 도메인을 포함할 수 있다. 융합 단백질에 이러한 도메인을 포함시키는 변형은 조작된 유형 I CRISPR-Cas 단백질에 부가의 활성을 부여할 수 있다. 이러한 활성은 핵산 표적 서열과 연합된 폴리펩티드 (예를 들어, 히스톤)를 변형시키는, 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 디스무타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 리컴비나제 활성, 폴리머라제 활성, 리가제 활성, 헬리카제 활성, 포토리아제 활성, 글리코실라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 및/또는 미리스토일화 활성 또는 탈미리스토일화 활성을 포함할 수 있다.
일부 실시양태에서, 융합 단백질은 에피토프 태그 (예를 들어, 히스티딘 태그, HA 태그, 플래그(FLAG)® (시그마 알드리치 (Sigma Aldrich; 미국 미주리주 세인트 루이스)) 태그, Myc 태그, 핵 국재화 시그널 (NLS) 태그, SunTag, 리포터 단백질 서열 (예를 들어, 글루타티온-S-트랜스퍼라제, 베타-갈락토시다제, 루시페라제, 녹색 형광 단백질, 청록색 형광 단백질, 황색 형광 단백질) 및/또는 핵산 서열 결합 도메인 (예를 들어, DNA 결합 도메인 또는 RNA 결합 도메인)을 포함할 수 있다.
융합 단백질은 또한, 활성화제 도메인 (예를 들어, 열 충격 전사 인자, NFKB 활성화제) 또는 저해인자 도메인 (예를 들어, KRAB 도메인)을 포함할 수 있다. 문헌 [Lupo, A., et al., Current Genomics 14:268-278 (2013)]에 의해 기재된 바와 같이, KRAB 도메인은 강력한 전사 저해 모듈이며 대부분의 C2H2 징크 핑거 단백질의 아미노 말단 서열에 위치한다 (예를 들어, 문헌 [Margolin, J., et al., Proc. Natl. Acad. Sci. USA 91:4509-4513 (1994); Witzgall, R., et al., Proc. Natl. Acad. Sci. USA 91:4514-4518 (1994)] 참조). KRAB 도메인은 전형적으로, 단백질-단백질 상호작용을 통해 공동-저해인자 단백질 및/또는 전사 인자에 결합하여, KRAB 징크 핑거 단백질 (KRAB-ZFP)에 결합하는 유전자의 전사 저해를 유발한다 (예를 들어, 문헌 [Friedman, J.R., et al., Genes & Development 10:2067-2678 (1996)] 참조). 일부 실시양태에서, 링커 핵산 서열은 2개 이상의 단백질, 단백질 도메인 또는 단백질 단편을 연결하는데 사용된다.
본원에 사용된 바와 같은, "캐스케이드a" (캐스케이드 활성화)는 CRISPR 방법 또는 시스템으로서, 여기서 이러한 방법 또는 시스템은 캐스케이드 RNP 복합체의 표적 핵산 서열의 로커스와 연합된 유전자의 발현을 활성화시킨다. 일부 실시양태에서, 캐스케이드 복합체의 하나 이상의 단백질은 이펙터 도메인 (예를 들어, VP16 또는 VP64)과 융합되고, 융합 및 가이드 폴리뉴클레오티드를 포함하는 캐스케이드 RNP 복합체가 내인성 전사 인자의 동원에 사용된다. 일부 실시양태에서, 가이드 폴리뉴클레오티드는 뉴클레오티드 이펙터 도메인, 예컨대 전사 인자를 또한 동원하는 MS2 결합 RNA와 5' 또는 3' 융합될 수 있다.
본원에 사용된 바와 같은, "캐스케이드i" (캐스케이드 억제)는 CRISPR 방법 또는 시스템으로서, 여기서 CRISPR 방법 또는 시스템은 캐스케이드 RNP 복합체의 표적 핵산 서열의 로커스와 연합된 유전자의 발현을 하향조절한다 (즉, 캐스케이드 RNP 복합체는 유전자의 발현을 하향조절하는데 사용됨). 내인성 저해 인자의 동원을 위해, 캐스케이드 복합체의 하나 이상의 단백질은 전형적으로, 이펙터 도메인 (예를 들어, KRAB)과 융합된다. 일부 실시양태에서, 가이드 폴리뉴클레오티드는 내인성 전사 저해 이펙터 단백질을 또한 동원하는 뉴클레오티드 이펙터 도메인과 5' 또는 3' 융합될 수 있다.
본원에 사용된 바와 같은, "모이어티"는 분자의 일부분을 지칭한다. 모이어티는 작용기일 수 있거나 또는 다수의 작용기를 가진 분자의 일부분을 설명할 수 있다 (예를 들어, 통상의 구조적 측면을 공유함). 용어 "모이어티" 및 "작용기"는 전형적으로 본원에서 상호교환가능하게 사용되지만; "작용기"는 보다 구체적으로, 일부 통상의 화학적 행동을 포함하는 분자의 일부분을 지칭할 수 있다. "모이어티"는 종종 구조적 설명으로서 사용된다. 일부 실시양태에서, 5' 말단, 3' 말단, 또는 5' 말단과 3' 말단 (예를 들어, 제1 스템 요소에서 비-천연 5' 말단 및/또는 비-천연 3' 말단)은 하나 이상의 모이어티를 포함할 수 있다.
본원에 사용된 바와 같은, "입양 세포"는 암을 치료하고/거나 이식편 대 숙주 질환 (GvHD) 및 세포 요법의 다른 바람직하지 않은 부작용, 예컨대 시토카인 폭풍, 투여된 유전적으로 변형된 물질의 발암성 형질전환, 신경학적 장애 등이지만 이에 제한되지는 않는 부작용을 예방하기 위한 세포 요법 치료에 사용하기 위해 유전적으로 변형될 수 있는 세포를 지칭한다. 입양 세포는 줄기 세포, 유도 만능 줄기 세포 (iPSC), 제대혈 줄기 세포, 림프구, 대식세포, 적혈구, 섬유모세포, 내피 세포, 상피 세포 및 췌장 전구 세포를 포함하나 이에 제한되지는 않는다.
본원에 사용된 바와 같은, "세포 요법"은 유전적으로 변형된 세포를 활용하는 질환 또는 장애의 치료를 지칭한다. 유전적 변형은 본원에 기재된 방법, 예컨대 바이러스 벡터, 뉴클레오펙션, 유전자 총 전달, 소노포레이션, 세포 압착, 리포펙션, 또는 다른 화학 물질, 세포 침투 펩티드 등의 사용을 포함하는 방법을 사용하여 도입될 수 있다.
본원에 사용된 바와 같은, "입양 세포 요법 (ACT)"은 환자를 치료하기 위해, 특이적 환자에게 되돌아온 그 환자로부터 유래되거나 (자가 세포 요법) 또는 제3자 공여자로부터 유래된 (동종이계 세포 요법) 유전적으로 변형된 입양 세포를 사용하는 요법을 지칭한다. ACT는 골수 이식, 줄기 세포 이식, T 세포 요법, CAR-T 세포 요법 및 자연 살해 (NK) 세포 요법을 포함하나 이에 제한되지는 않는다.
본원에 사용된 바와 같은, "림프구"는 척추동물 면역 체계의 일부인 백혈구 (백혈구)를 지칭한다. 또한 용어 "림프구"에는 림프계 세포를 생성하는 조혈 줄기 세포 또는 유도 만능 줄기 세포 (iPSC)가 포괄된다. 림프구는 세포-매개된 세포독성 적응 면역을 위한 T 세포, 예컨대 CD4+ 및/또는 CD8+ 세포독성 T 세포; 알파/베타 T 세포 및 감마/델타 T 세포; 조절 T 세포, 예컨대 Treg 세포; 세포-매개된 세포독성 선천 면역에 있어서 기능하는 NK 세포; 체액성 항체 구동된 적응 면역을 위한 B 세포; NK/T 세포; 시토카인 유도된 살해 세포 (CIK 세포); 및 항원 제시 세포 (APC), 예컨대 수지상 세포를 포함한다. 림프구는 포유동물 세포, 예컨대 인간 (호모 사피엔스(Homo sapiens); 에이치. 사피엔스(H. sapiens)) 세포일 수 있다. 용어 "림프구"는 또한 T 또는 NK 세포 표면 상에 키메라 항원 수용체 (CAR)를 생산 (CAR-T 세포 및 CAR-NK 세포)하도록 변형된, 유전적으로 변형된 T 세포 및 NK 세포를 포괄한다. 이러한 CAR-T 세포는 특이적 가용성 항원을 인식하거나 또는 표적 세포 표면, 예컨대 종양 세포 표면 또는 종양 미세환경 내의 세포 상의 항원을 인식한다.
또한 본원에 사용된 바와 같은 용어 "림프구"는 주요 조직적합성 복합체 (MHC)에 의해 제시된 표적 세포의 단백질 또는 당(지질) 항원을 인식할 수 있는 하나 이상의 특이적인 자연적으로 발생하거나 또는 조작된 T-세포 수용체를 발현하도록 유전적으로 조작된 T-세포 수용체 조작된 T 세포 (TCR)이다. 이들 항원의 작은 조각, 예컨대 펩티드 또는 지방산은 표적 세포 표면으로 이동하여 MHC의 일부로서 T-세포 수용체에 제시된다. 항원 부하된 MHC에 결합하는 T-세포 수용체는 림프구를 활성화시킨다.
림프구 활성화는 림프구가 세포 표면 상의 항원-특이적 수용체를 통해 촉발될 때 발생한다. 이것은 세포가 증식하고 전문화된 이펙터 림프구로 분화되도록 한다. 이러한 "활성화된" 림프구는 전형적으로, 림프구 표면 상의 수용체 세트에 의해 특징규명된다. 활성화된 T 세포에 대한 표면 마커는 CD3, CD4, CD8, PD1, IL2R 등을 포함한다. 활성화된 세포독성 림프구는 표적 세포의 표면 상에 동족 수용체를 결합한 후 표적 세포를 사멸시킬 수 있다.
종양 침윤 림프구 (TIL)는 또한 본원에 사용된 바와 같은 용어 "림프구"에 포함된다. TIL은 종양 내부와 주위의 환경 ("종양 미세환경")에 침투한 면역 세포이다. TIL은 전형적으로, 종양 세포 및 종양 미세환경으로부터 단리되며 종양 항원에 대항한 높은 반응성을 위해 시험관내에서 선택된다. TIL은 생체내에 존재하는 관용 영향력을 극복하는 조건 하에 시험관내에서 성장한 다음, 치료를 위해 대상체에게 도입된다.
T 세포는 전형적으로, 수많은 하위유형, 예컨대 "천연 T 세포" (Tn), "줄기 세포 기억 T 세포" (Tscm), "중심 기억 T 세포" (Tcm), "이펙터 기억 T 세포" (Tem), "이펙터 T 세포" (Teff) 및 "조절 T 세포" (Treg)로 존재한다. 각각의 T-세포 서브세트는 세포 표면 마커의 세트에 의해 특징규명된다.
본원에 사용된 바와 같은, 용어 "친화성 태그"는 전형적으로, 예를 들어, 조작된 유형 I CRISPR-Cas 핵단백질 복합체의 형성을 촉진하기 위해 또 다른 거대 분자에 대한 하나의 거대 분자의 결합 친화성을 증가시키는 하나 이상의 모이어티를 지칭한다. 일부 실시양태에서, 친화성 태그는 또 다른 Cas 서브유닛 단백질에 대한 하나의 Cas 서브유닛 단백질 (예를 들어, 제2 Cas7 단백질에 대한 제1 Cas7 단백질)의 결합 친화성을 증가시키기 위해 사용될 수 있다. 일부 실시양태에서, 친화성 태그는 동족 가이드 폴리뉴클레오티드에 대한 하나 이상의 Cas 서브유닛 단백질의 결합 친화성을 증가시키기 위해 사용될 수 있다. 본 발명의 일부 실시양태는 하나 이상의 친화성 태그를 Cas 서브유닛 단백질 서열의 N-말단, Cas 서브유닛 단백질 서열의 C-말단, Cas 서브유닛 단백질 서열의 N-말단과 C-말단 사이에 위치한 위치, 또는 그의 조합에 도입한다. 본 발명의 일부 실시양태에서, 하나 이상의 가이드 폴리뉴클레오티드는 하나 이상의 Cas 서브유닛 단백질과 가이드 폴리뉴클레오티드의 결합 친화성을 증가시키는 친화성 태그를 포함한다. 광범위한 친화성 태그가 2014년 10월 23일에 공개된 미국 공개 특허 출원 번호 2014-0315985에 개시되어 있다. 리간드 및 리간드 결합 모이어티는 쌍형성된 친화성 태그이다.
본원에 사용된 바와 같은, "가교-결합"은 하나의 중합체 쇄 (예를 들어, 폴리뉴클레오티드 또는 폴리펩티드)를 또 다른 쇄에 연결하는 결합이다. 이러한 결합은 공유 결합 또는 이온 결합일 수 있다. 일부 실시양태에서, 하나의 폴리뉴클레오티드는 폴리뉴클레오티드를 가교 결합함으로써 또 다른 폴리뉴클레오티드에 결합될 수 있다. 다른 실시양태에서, 폴리뉴클레오티드는 폴리펩티드에 가교 결합될 수 있다. 부가 실시양태에서, 폴리펩티드는 폴리펩티드에 가교 결합될 수 있다.
본원에 사용된 바와 같은, 용어 "가교-결합 모이어티"는 전형적으로, 2개의 거대 분자 사이에 가교 결합을 제공하기에 적합한 모이어티를 지칭한다. 가교-결합 모이어티는 친화성 태그의 또 다른 예이다.
본원에 사용된 바와 같은, "숙주 세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 유기체의 기본 구조적, 기능적 및/또는 생물학적 단위이다. 세포는 하나 이상의 세포를 가진 임의의 유기체로부터 유래될 수 있다. 숙주 세포의 예는 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단일 세포 진핵 유기체의 세포, 진핵 유기체의 세포, 원생 동물 세포, 식물로부터의 세포, 조류 세포 (예를 들어, 보트리오코쿠스 브라우니이(Botryococcus braunii), 클라미도모나스 레인하르드티이(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스 씨. 아가르드(Sargassum patens C. agardh) 등), 해초 (예를 들어, 다시마), 진균 세포 (예를 들어, 효모 세포, 또는 버섯으로부터의 세포), 동물 세포, 무척추동물 (예를 들어, 초파리, 자포 동물, 극피 동물, 선충류 등)로부터의 세포, 포유동물을 포함한 척추동물 (예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 비-인간 영장류, 인간 등)로부터의 세포를 포함하나 이에 제한되지는 않는다. 더욱이, 숙주 세포는 줄기 세포 또는 전구 세포, 및 면역학적 세포, 예컨대 본원에 기재된 면역학적 세포 중 임의의 것일 수 있다. 숙주 세포는 인간 세포일 수 있다. 일부 실시양태에서, 인간 세포는 인체 외부에 있다. 일부 실시양태에서, 살아있는 유기체의 신체 (예를 들어, 인체) 세포는 생체외 (즉, 생체 외부에서) 조작된다. 생체외는 종종, 치료 또는 시술을 위해 생체 (예를 들어, 인체)로부터 기관, 세포 또는 조직을 채취한 다음, 이를 생체로 되돌리는 의료 시술을 지칭한다.
본원에 사용된 바와 같은, "줄기 세포"는 자기 재생 능력, 즉 미분화 상태를 유지하면서 세포 분열의 수많은 사이클을 통과할 수 있는 능력을 가진 세포를 지칭한다. 줄기 세포는 전능성, 만능, 다분화능, 과분화능, 또는 단분화능일 수 있다. 줄기 세포는 배아, 태아, 양수, 성체 또는 유도 만능 줄기 세포일 수 있다.
본원에 사용된 바와 같은, "유도 만능 줄기 세포"는 비-만능 세포, 전형적으로 체세포로부터 인공적으로 유래되는 만능 줄기 세포의 유형을 지칭한다. 일부 실시양태에서, 체세포는 인간 체세포이다. 체세포의 예는 진피 섬유모세포, 골수 유래 중간엽 세포, 심장 근육 세포, 각질 세포, 간 세포, 위 세포, 신경 줄기 세포, 폐 세포, 신장 세포, 비장 세포 및 췌장 세포를 포함하나 이에 제한되지는 않는다. 체세포의 부가의 예는 B 세포, 수지상 세포, 과립구, 선천성 림프계 세포, 거핵구, 단핵구/대식세포, 골수 유래 억제 세포, 자연 살해 (NK) 세포, T 세포, 흉선 세포 및 조혈 줄기 세포를 포함하나 이에 제한되지는 않는 면역 체계의 세포를 포함한다.
본원에 사용된 바와 같은, "조혈 줄기 세포"는 조혈 세포, 예컨대 림프구로 분화될 수 있는 능력을 가진 미분화 세포를 지칭한다.
본원에 사용된 바와 같은, "식물"은 전체 식물, 식물 기관, 식물 조직, 생식 질, 종자, 식물 세포 및 이들의 자손을 지칭한다. 식물 세포는 종자, 현탁 배양 물, 배아, 분열 조직, 캘러스 조직, 잎, 뿌리, 새싹, 배우자체, 포자체, 꽃가루 및 미세포자로부터의 세포를 포함하나 이에 제한되지는 않는다. 식물 부분은 뿌리, 줄기, 새싹, 잎, 꽃가루, 종자, 종양 조직 및 다양한 형태의 세포 및 배양물 (예를 들어, 단일 세포, 원형질체, 배아 및 캘러스 조직)을 포함하나 이에 제한되지는 않는 분화 및 미분화 조직을 포함한다. 식물 조직은 식물 또는 식물 기관, 조직 또는 세포 배양에 있을 수 있다. "식물 기관"은 식물의 형태학적으로 및 기능적으로 별개의 부분을 구성하는 식물 조직 또는 조직 군을 지칭한다.
용어 "대상체", "개체" 또는 "환자"는 본원에서 상호교환가능하게 사용되며, 인간 및 비-인간 영장류, 예컨대 히말라야 원숭이, 침팬지, 및 다른 원숭이 및 유인원 종을 포함한 다른 영장류; 농장 동물, 예컨대 소, 양, 돼지, 염소 및 말; 가축용 포유동물, 예컨대 개 및 고양이; 토끼, 마우스, 래트 및 기니 피그를 포함한 실험실 동물; 가축, 야생 및 사냥용 조류, 예컨대 닭, 칠면조 및 다른 순계류, 오리 및 거위를 포함한 조류 등을 포함하나 이에 제한되지는 않는 척색 동물 문의 임의의 구성원을 지칭한다. 상기 용어는 특별한 연령이나 성별을 나타내지 않는다. 따라서, 상기 용어는 다 자란 개체, 어린 개체 및 신생 개체 뿐만 아니라 수컷과 암컷을 포함한다. 일부 실시양태에서, 숙주 세포는 대상체로부터 유래된다 (예를 들어, 림프구, 줄기 세포, 전구 세포 또는 조직-특이적 세포). 일부 실시양태에서, 대상체는 비-인간 대상체이다. 일부 실시양태에서, 대상체는 인간 (에이치. 사피엔스) 대상체이다.
조성물 또는 작용제, 예컨대 본원에 제공된 바와 같은 유전적으로 조작된 입양 세포의 "유효량" 또는 "치료상 유효량"이라는 용어는 원하는 반응을 제공하기 위한, 예컨대 동종이계 입양 세포 요법과 연관된 한 가지 이상의 유해한 부작용을 예방 또는 제거하기 위한 조성물 또는 작용제의 충분한 양을 지칭한다. 이러한 반응은 해당 특별한 질환에 좌우될 것이다. 예를 들어, 입양 세포 요법을 사용하여 암 치료를 받는 환자에서, 원하는 반응은 GvHD, 숙주 대 이식편 거부, 시토카인 방출 증후군 (CRS), 시토카인 폭풍의 효과의 치료 또는 예방, 및 투여된 유전적으로 변형된 세포의 발암성 형질전환의 감소를 포함하나 이에 제한되지는 않는다. 필요한 정확한 양은 대상체의 종, 연령 및 일반적인 상태, 치료되는 병태의 중증도, 및 사용되는 특별한 변형된 림프구, 투여 방식 등에 따라 대상체마다 다를 것이다. 임의의 개별 사례에서 적절한 "유효한" 양은 일상적인 실험을 사용하여 관련 기술분야의 통상의 기술자에 의해 결정될 수 있다.
특별한 질환, 예컨대 암성 병태 또는 GvHD를 "치료" 또는 "치료하는 것"은 (1) 질환을 예방하는 것, 예를 들어, 질환에 걸리기 쉬울 수 있지만 아직 질환의 증상을 경험하거나 나타내지 않은 대상체에서 질환의 발생을 예방하거나 또는 질환이 더 적은 강도로 발생하도록 하는 것; (2) 질환을 억제하는 것, 예를 들어, 질환 상태의 발생 속도를 감소시키거나, 그의 발생을 저지하거나 또는 질환 상태를 반전시키는 것; 및/또는 (3) 질환의 증상 완화시키는 것, 예를 들어, 대상체가 경험하는 증상의 수를 감소시키는 것을 포함한다.
본원에 사용된 바와 같은, "유전자 편집" 또는 "게놈 편집"은 세포 게놈 내의 특이적 부위에서의 유전적 변형, 예컨대 뉴클레오티드 서열 또는 심지어 단일 염기의 삽입, 결실 또는 대체를 초래하는 유전 공학의 한 유형을 의미한다. 상기 용어는 본원에 정의된 바와 같은, 이종 유전자 발현, 유전자 또는 프로모터 삽입 또는 결실, 핵산 돌연변이, 및 파괴적 유전적 변형을 포함하나 이에 제한되지는 않는다.
"에피토프"는 특이적 B 세포 및 T 세포가 반응하는 분자 상의 부위를 의미한다. 에피토프는 이러한 에피토프에 고유한 공간적 입체 형태로 3개 이상의 아미노산을 포함할 수 있다. 일반적으로, 에피토프는 적어도 5개의 이러한 아미노산으로 이루어지며, 보다 통상적으로 적어도 8-10개의 이러한 아미노산으로 이루어진다. 아미노산의 공간적 입체 형태를 결정하는 방법은 관련 기술분야에 공지되어 있으며, 예를 들어, x-선 결정학, 전자 현미경 및 2차원 핵 자기 공명을 포함한다. 더욱이, 주어진 단백질에서의 에피토프의 확인은 관련 기술분야에 널리 공지된 기술을 사용하여, 예컨대 소수성 연구의 사용에 의해 및 부위-지정 혈청학에 의해 쉽게 달성된다.
"미모토프"는 에피토프의 구조를 모방하는 거대 분자, 예컨대 펩티드이다. 이러한 특성 때문에, 이는 에피토프에 의해 유도된 것과 유사한 항체 반응을 일으킨다. 주어진 에피토프 항원에 대한 항체는 그 에피토프를 모방하는 미모토프를 인식할 것이다. 미모토프는 통상적으로, 바이오패닝을 통해 파지 디스플레이 라이브러리로부터 수득된다.
"항체"는 폴리펩티드에 존재하는 관심 에피토프, 예컨대 리간드 결합 도메인을 "인식"하는, 즉 이에 특이적으로 결합하는 분자를 의도한다. "특이적으로 결합한다"는 것은 항체가 "잠금 및 열쇠" 유형의 상호작용에서 에피토프와 상호작용하여 항원과 항체 사이에 복합체를 형성한다는 것을 의미한다. 본원에 사용된 바와 같은, 용어 "항체"는 모노클로날 제제로부터 수득된 항체 뿐만 아니라 하기를 포함한다: 혼성체 (키메라) 항체 분자; F(ab')2 및 F(ab) 단편; Fv 분자 (비-공유 이종이량체); 단일 쇄 Fv 분자 (scFv); 이량체성 및 삼량체성 항체 단편 구축물; 미니바디; 인간화 항체 분자; 단일 쇄 항체; 나노바디(Nanobody)® (아블링스 N.V. (Ablynx N.V.; 벨기에 즈위자르드)) 항체; 및 이러한 분자로부터 수득된 임의의 기능적 단편 (여기서 이러한 단편은 모 항체 분자의 면역학적 결합 특성을 보유하고 있음). 항체는 상이한 종, 예컨대 인간, 마우스, 래트, 토끼, 낙타, 닭 등으로부터 공급될 수 있다. 이어서, 항체 및 항체 부분은 시험관내 기술에 의해, 예컨대 파지 디스플레이 및 효모 디스플레이에 의해 추가로 수득될 수 있다. 완전 인간화 항체는 조작된 인간화 B 세포 레퍼토리를 가진 인간 혈장, 인간 B 세포 클로닝, 마우스, 래트, 토끼, 닭 등으로부터 수득될 수 있다. 이어서, 항체는 친화성 성숙 및 다른 방법, 예컨대 아푸코실화 또는 IgG Fc 조작에 의해 추가로 변형될 수 있다.
본원에서 사용된 바와 같은, 용어 "모노클로날 항체"는 동질적 항체 집단을 갖는 항체 조성물을 지칭한다. 이러한 용어는 항체의 종 또는 공급원과 관련하여 제한되지 않으며 그것이 만들어지는 방식에 의해서도 제한되지 않는다. 상기 용어는 전체 이뮤노글로불린 뿐만 아니라 모 모노클로날 항체 분자의 면역학적 결합 특성을 나타내는 단편, 예컨대 Fab, F(ab')2, Fv 및 다른 단편 뿐만 아니라 키메라 및 인간화 동질적 항체 집단을 포함한다.
"항체-의존성 세포성 세포독성"으로서 지칭되기도 하는 "항체-의존성 세포-매개된 세포독성 (ADCC)"은 막-표면 리간드 결합 도메인이 특이적 항체에 의해 결합되었을 때 면역 체계의 이펙터 세포가 표적 세포, 예컨대 입양 세포를 능동적으로 용해시키는 메카니즘을 지칭한다. 이펙터 세포는 전형적으로 자연 살해 (NK) 세포이다. 그러나, 대식 세포, 호중구, 및 호산구가 또한 ADCC를 매개할 수 있다. ADCC는 항체 또는 면역 체계 세포의 개입 없이 막을 손상시켜 표적을 또한 용해시키는 보체-의존성 세포독성 (CDC)과는 무관하다.
본원에 사용된 바와 같은, "형질전환"은 삽입에 사용된 방법에 관계없이 숙주 세포 내로의 외인성 폴리뉴클레오티드의 삽입을 지칭한다. 예를 들어, 형질전환은 직접 흡수, 형질감염, 감염 등에 의해 이루어질 수 있다. 외인성 폴리뉴클레오티드는 비통합 벡터, 예를 들어, 에피솜으로서 유지될 수 있거나, 또는 또 다른 한편으론, 숙주 게놈에 통합될 수 있다. 본원에 사용된 바와 같은, "트랜스제닉 유기체"는 관련없는 유기체로부터의 DNA가 인공적으로 도입된 유전 물질을 함유하는 유기체를 지칭한다. 상기 용어는 트랜스제닉 유기체의 자손 (임의의 세대)을 포함하며, 단 이러한 자손이 유전적 변형을 가져야 한다. 일부 실시양태에서, 트랜스제닉 유기체는 비-인간 트랜스제닉 유기체이다.
본원에 사용된 바와 같은, "단리된"은 인간 개입에 의해 그의 천연 환경과 별도로 존재하므로 자연의 산물이 아닌 분자 (예를 들어, 폴리뉴클레오티드 또는 폴리펩티드)를 지칭할 수 있다. 폴리펩티드를 지칭할 때, 단리된 것은 표시된 분자가, 이러한 분자가 자연에서 발견되는 전체 유기체로부터 분리되고 별개라는 것 또는 동일한 유형의 다른 생물학적 거대 분자의 실질적인 부재 하에 존재한다는 것을 의미한다. 폴리뉴클레오티드와 관련하여 용어 "단리된"은 자연에서 그와 정상적으로 연합되는 서열의 전체 또는 일부가 결여된 핵산 분자; 또는 자연에 존재하는 바와 같지만, 그와 연합하여 이종 서열을 갖는 서열; 또는 염색체로부터 해리된 분자이다.
본원에 사용된 바와 같은, 용어 "정제된"은 바람직하게 동일한 분자의 적어도 75 중량%, 보다 바람직하게 적어도 85 중량%, 또한 보다 바람직하게 적어도 95 중량%, 및 가장 바람직하게 적어도 98 중량%가 존재하는 것을 의미한다.
본원에 사용된 바와 같은, "기질 채널"은 벌크 환경으로 먼저 확산되지 않고 하나의 효소 반응에서 또 다른 효소 반응으로 반응물을 직접 전달하는 것을 지칭한다 (예를 들어, 문헌 [Wheeldon, I., et al., Nat. Chem. 8:299-309 (2016)] 참조). 이러한 효소 단계의 중간체는 벌크 용액과 평형을 이루지 못하여, 효소 프로세스에서 효율과 수율을 증가시킬 수 있다. 흔히, 자연적으로 발생하는 대사 과정에서의 효소는 제어된 응집체로의 공동-국재화 및 어셈블리의 수단을 진화시켜 왔다.
본원에 사용된 바와 같은, "기질 채널 요소"는 대사 경로의 구성성분을 지칭한다. 일부 실시양태에서, 기질 채널 요소는 화학 반응을 촉매하는 효소이다.
본원에 사용된 바와 같은, "기질 채널 복합체"는 일부 수단을 통해 함께 공동-국재화되는 다수의 기질 채널 요소를 지칭한다.
본원에 사용된 바와 같은, "RNA 스캐폴드"는 펩티드가 결합을 위한 기질로서 사용할 수 있는 RNA 분자를 지칭한다.
본원에 제시된 데이터는 캐스케이드 구성성분과 뉴클레아제 도메인 (예를 들어, 이량체화-의존성, 비-특이적 FokI 뉴클레아제 도메인; 예를 들어, 문헌 [Urnov, F.D., et al., Nature Reviews Genetics 11:636-646 (2010); Joung, J.K., et al., Nat. Rev. Mol. Cell Biol. 14:49-55 (2013); Guilinger, J.P., et al., Nat. Biotechnol. 32:577-582 (2014); Tsai, S.Q., et al., Nat. Biotechnol. 32:569-576 (2014)] 참조) 사이의 융합이 인간 세포에서 유형 I 시스템을 사용하여 효율적인 프로그래밍가능한 RNA-가이드된 유전자 편집을 매개한다는 것을 명확하게 보여준다. 상기 데이터는 조작된 유형 I CRISPR-Cas 시스템 (예를 들어, FokI-캐스케이드 구성성분 융합을 포함하는 것)이 무손상 리보핵단백질 (RNP) 복합체로서 직접적으로 형질감염되거나 또는 개별 플라스미드 코딩된 구성성분의 전달을 통해 세포에서 어셈블리될 수 있다는 것을 명확하게 보여준다. 본원에 제시된 바와 같이, 모든 CRISPR-연합된 (Cas) 유전자는 단일 폴리시스트론성 벡터 상으로 어셈블리되어, 단순화된 2 구성성분 Cas 단백질-가이드 RNA 발현 시스템을 산출하였다. 또한, 뉴클레아제 (예를 들어, FokI)/캐스케이드 구성성분 링커 서열의 길이/조성 설계 및 적절한 DNA 기하학의 제형 화 뿐만 아니라 선택적 캐스케이드 상동체 선택은 약 50% 이하의 편집 효율을 갖는 조작된 유형 I CRISPR-Cas 복합체를 제공한다. DNA 표적화 동안 PAM 요구 사항 및 미스매치 감수성과 관련된 조작된 유형 I CRISPR-Cas 시스템 (예를 들어, FokI-캐스케이드 구성성분 융합 단백질을 포함하는 것)의 주요 특징이 결정되었다.
제1 측면에서, 본 발명은 캐스케이드 서브유닛 단백질 및 캐스케이드 가이드 폴리뉴클레오티드를 포함하나 이에 제한되지는 않는 캐스케이드 구성성분을 코딩하는 조작된 폴리뉴클레오티드에 관한 것이다.
한 실시양태에서, 본 발명은 캐스케이드 유형 I-E 시스템으로부터 유래되는 캐스케이드 구성성분을 코딩하는 조작된 폴리뉴클레오티드에 관한 것이다. 캐스케이드 단백질 및 캐스케이드 crRNA를 포함하는 예시적인 폴리뉴클레오티드 구축물이 실시예 1에 제시된다. 실시예 1, 표 15, 및 서열식별번호(SEQ ID NO): 1 내지 서열식별번호: 20은 특이적으로 이. 콜라이 균주 K-12 MG1655로부터의 유형 I-E 캐스케이드의 5개의 서브유닛 단백질을 코딩하는 유전자의 폴리뉴클레오티드 DNA 서열 뿐만 아니라 이로써 생성되는 단백질 구성성분의 아미노산 서열을 제시한다. 폴리뉴클레오티드 서열은 이. 콜라이 gDNA로부터 유래되었고, 이. 콜라이에서의 발현에 대해 특이적으로 코돈-최적화되고/거나 진핵 세포 (예를 들어, 인간 세포)에서의 발현에 대해 특이적으로 코돈-최적화되었다. 이러한 폴리뉴클레오티드가 전구체 crRNA로 전사되고 캐스케이드 RNA 엔도뉴클레아제에 의해 프로세싱될 때, 게놈 내의 상보적 DNA 서열을 표적화하는 가이드 RNA로서 기능하는 성숙한 crRNA가 생산된다. 최소 CRISPR 어레이는 crRNA의 가이드 부분을 나타내는 예시적인 스페이서 서열을 플랭킹하는 2개의 반복부 서열 (실시예 1에 제시된 CRISPR 어레이 서열에 밑줄이 그어져 있음)을 포함한다. 캐스케이드 엔도뉴클레아제에 의한 RNA 프로세싱은 가이드 서열을 플랭킹하는 5' 및 3' 단부 둘 다에 반복부 서열이 있는 crRNA를 생성한다. 본 명세서 및 실시예의 교시내용을 고려하여, 관련 기술분야의 통상의 기술자는 선택된 표적 서열 (예를 들어, gDNA 내의)에 대한 캐스케이드 복합체의 결합을 표적화하는 적절한 스페이서 서열을 선택할 수 있다.
부가의 박테리아 또는 고세균 종으로부터의 캐스케이드 구성성분을 코딩하는 폴리뉴클레오티드 서열은 본 명세서의 지침에 따르고, 한 예로서 이. 콜라이 균주 K-12 MG1655로부터의 캐스케이드 서브유닛 유전자의 상동체의 위치를 찾기 위해 생물 정보학 도구, 예컨대 BLAST 및 PSI-BLAST를 사용한 다음, 캐스케이드 유전자의 플랭킹 게놈 이웃을 검사하여 나머지 캐스케이드 서브유닛 단백질의 유전자의 위치를 찾고 확인함으로써 확인 및 설계될 수 있다 (예를 들어, 실시예 14A, 실시예 14B, 실시예 15A, 및 실시예 15B 참조). 캐스케이드 유전자는 보존된 오페론으로서 공동-발생하기 때문에, 이들은 전형적으로 동일한 유형 I 하위유형 내에서 일관된 순서로 배열되어, 추적 분석 및 실험을 위한 확인 및 선택을 용이하게 한다. 한 예로서, 부가의 유형 I-E 시스템은 Cas8 상동체의 위치를 찾고, 상동 캐스케이드 시험을 위한 유망한 박테리아 종을 확인한 다음, 이러한 상동 CRISPR-Cas 시스템으로부터의 캐스케이드의 다른 단백질 구성성분 및 Cas8을 코딩하는 폴리뉴클레오티드 서열을 수득하거나 또는 설계함으로써 확인될 수 있다.
수많은 종으로부터의 캐스케이드의 서브유닛 단백질을 코딩하는 유전자의 폴리뉴클레오티드 DNA 서열 (표 3 및 표 4에 열거됨) (일부는 이. 콜라이 균주 K-12 MG1655로부터 유래된 것들과 상동인 캐스케이드 복합체를 가짐), 및 이로써 생성되는 단백질 구성성분의 아미노산 서열 뿐만 아니라 예시적인 최소 CRISPR 어레이가 서열식별번호: 22 내지 서열식별번호: 213으로서 제시된다 (표 3).
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
단백질에 대한 폴리뉴클레오티드 서열은 숙주 박테리움의 gDNA로부터 유래되었으며, 이. 콜라이에서의 발현을 위해 특이적으로 코돈-최적화되고/거나 진핵 세포 (예를 들어, 인간 세포)에서의 발현을 위해 특이적으로 코돈-최적화되었다. 상응하는 최소 CRISPR 어레이를 코딩하는 폴리뉴클레오티드 DNA 서열은 12가지 종으로부터 유래된 반복부 서열을 기반으로 하였으며, 가이드 RNA로서 기능하는 성숙한 crRNA를 생성하기 위해 사용될 수 있다. 표 4에서, 최소 CRISPR 어레이는 crRNA의 가이드 부분을 나타내는 예시적인 "스페이서" 서열을 플랭킹하는 2개의 반복부 서열 (소문자, 밑줄)을 포함한다. 엔도뉴클레아제 캐스케이드 서브유닛에 의한 RNA 프로세싱은 가이드 서열을 플랭킹하는 5' 및 3' 단부 둘 다에 반복부 서열이 있는 crRNA를 생성한다.
Figure pct00019
또 다른 실시양태에서, 본 발명은 본 명세서의 지침에 따르고 각각의 하위유형을 대표하는 홀마크 시스템으로부터의 캐스케이드 유전자의 상동체의 위치를 찾기 위해 생물 정보학 도구, 예컨대 BLAST 및 PSI-BLAST를 사용함으로써 확인 및 설계될 수 있는, 유형 I-B, I-C, I-F, 및 I-F의 변이체를 포함하나 이에 제한되지는 않는 다른 유형 I 하위유형 내의, 부가의 박테리아 또는 고세균 종으로부터의 캐스케이드 구성성분을 코딩하는 조작된 폴리뉴클레오티드 서열에 관한 것이다 (예를 들어, 문헌 [Makarova, K.S., et al., Nat. Rev. Microbiol. 13:722-736 (2015); Koonin, E.V., et al., Curr. Opin. Microbiol. 37:67-78 (2017)] 참조). 바람직한 상동체를 확인한 후, 캐스케이드 유전자의 플랭킹 게놈 이웃을 검사하여, 본원에 개시된 바와 같이 나머지 캐스케이드 서브유닛 단백질의 유전자의 위치를 찾고 이를 확인할 수 있다. 한 예로서, 부가의 유형 I-F 시스템은 Cas8 상동체의 위치를 찾고 (부가의 유형 I-F 변이체 2 시스템은 Cas5 상동체의 위치를 찾음으로써 확인될 수 있음) 상동 캐스케이드 시험을 위한 유망한 박테리아 종을 확인한 다음, Cas8, Cas5, 및 이러한 상동 CRISPR-Cas 시스템으로부터의 캐스케이드의 다른 단백질 구성성분을 코딩하는 폴리뉴클레오티드 서열을 수득하거나 설계함으로써 확인될 수 있다.
12개의 부가의 상동 캐스케이드 복합체로부터의 유형 I-B, I-C, I-F, 및 I-F 변이체 2로부터의 캐스케이드의 3개, 4개 또는 5개의 서브유닛 단백질을 코딩하는 유전자의 폴리뉴클레오티드 DNA 서열, 및 이로써 생성되는 단백질 구성성분의 아미노산 서열 뿐만 아니라 예시적인 최소 CRISPR 어레이가 서열식별번호: 214 내지 서열식별번호: 351로서 제시된다 (표 3). 서브유닛 단백질에 대한 폴리뉴클레오티드 서열은 숙주 박테리움의 gDNA로부터 유래되었으며, 이. 콜라이에서의 발현을 위해 특이적으로 코돈-최적화되고/거나 진핵 세포 (예를 들어, 인간 세포)에서의 발현을 위해 특이적으로 코돈-최적화되었다. 상응하는 최소 CRISPR 어레이를 코딩하는 폴리뉴클레오티드 DNA 서열은 12가지 종으로부터 유래된 반복부 서열을 기반으로 하였으며, 가이드 RNA로서 기능하는 성숙한 crRNA를 생성하기 위해 사용될 수 있다. 표 5에서, 최소 CRISPR 어레이는 crRNA의 가이드 부분을 나타내는 예시적인 "스페이서" 서열을 플랭킹하는 2개의 반복부 서열 (소문자, 밑줄)을 포함한다. 엔도뉴클레아제 캐스케이드 서브유닛에 의한 RNA 프로세싱은 가이드 서열을 플랭킹하는 5' 및 3' 단부 둘 다에 반복부 서열이 있는 crRNA를 생성한다.
Figure pct00020
실시예 19A 내지 실시예 19I 및 실시예 22A 내지 실시예 22C는 각각의 캐스케이드 복합체에 대한 게놈 편집의 효율을 평가하기 위해, 각각 Cas 서브유닛 단백질-FokI 융합 단백질을 포함하는 다수의 캐스케이드 복합체 상동체의 설계 및 시험을 설명한다. 슈도모나스 (Pseudomonas) 종 S-6-2로부터의 변이체를 사용하는 경우에 가장 높은 편집이 관찰되었지만, 다른 상동체 (즉, 살모넬라 엔테리카(Salmonella enterica), 게오써모박터(Geothermobacter) 종 EPR-M, 메타노셀라 아르보리자에(Methanocella arvoryzae) MRE50, 및 에스. 써모필루스(S. thermophilus) (균주 ND07))는 이. 콜라이와 대략 등가의 편집을 나타내었다. 조작된 비브리오 콜레라(Vibrio cholera) 균주 L15 (유형 I-F) FokI-캐스케이드 복합체 및 비브리오 콜레라 균주 HE48 (유형 I-Fv2) FokI-캐스케이드 복합체를 사용한 경우에도 편집이 관찰되었다. 한 실시양태에서, 이들 상이한 상동체의 상이한 PAM 요건은 표적 폴리뉴클레오티드 (예를 들어, 세포 내의 gDNA)에서 표적 밀도를 증가시킬 수 있다. 따라서, 이러한 캐스케이드 복합체 상동체 컬렉션은 표적 폴리뉴클레오티드 (예를 들어, 세포 내의 gDNA)에서의 핵산 표적 서열의 선택에 더 큰 유연성을 제공한다.
제2 측면에서, 본 발명은 변형된 캐스케이드 서브유닛 단백질에 관한 것이다. 변형에 적합한 캐스케이드 서브유닛 단백질은 본원에 기재된 종의 캐스케이드 서브유닛 단백질을 포함하나 이에 제한되지는 않는다.
한 실시양태에서, 본 발명은 캐스케이드 서브유닛 단백질의 조작된 순환 순열에 관한 것이다. 이러한 캐스케이드 서브유닛 단백질의 순환 순열은 캐스케이드 서브유닛 단백질의 원래 선형 아미노산 서열의 상이한 연결성을 갖지만 전반적인 유사한 3차원 형태를 갖는 단백질 구조를 초래한다 (예를 들어, 문헌 [Bliven, S., et al., PLoS Comput. Biol. 8:e1002445 (2012)] 참조). 캐스케이드 서브유닛 단백질의 순환 순열은 많은 이점을 가질 수 있다. 예를 들어, Cas7 서브유닛 단백질의 순환 순열은 Cas7 단백질 폴드 또는 캐스케이드 복합체 어셈블리를 방해하지 않고 융합 단백질 또는 링커 영역을 형성하기 위해 부가의 폴리펩티드 서열과의 연결을 위해 배치되도록 설계된 새로운 N-말단 및 새로운 C-말단을 창출할 수 있다. Cas7의 순환 순열 (순환적으로 순열된 Cas7, cpCas7)의 3가지 예가 도 3a 및 도 3b에 예시된다. 도 3a 및 도 3b에서, 단백질의 세 부분이 표시된다: 천연 단백질의 N-말단 부분 (도 3a, 수직 줄무늬, 예를 들어 Cas7 단백질), 천연 단백질의 중앙 부분 (도 3a, 회색 음영), 및 천연 단백질의 C-말단 부분 (도 3a, 음영 없음). 도 3a는 천연 단백질의 N-말단 부분을 천연 단백질의 C-말단 위치로 재배치하여 순환적으로 순열된 단백질 (도 3a, cpCas7)을 생산하며, 여기서 천연 단백질의 N-말단 부분은 이제 cpCas7의 N-말단 단부에 있고, 링커 폴리펩티드 (도 3a, 링커)에 의해 천연 단백질의 중앙 부분에 연결된다. 도 3b는 천연 단백질의 C-말단 부분 (도 3b, Cas7)의 천연 단백질의 N-말단 위치 (도 3b, cpCas7)로의 재배치를 예시하며, 여기서 천연 단백질의 C-말단 부분이 이제 cpCas7의 N-말단 단부에 있고, 링커 폴리펩티드 (도 3b, 링커)에 의해 천연 단백질의 중앙 부분에 연결된다.
실시예 10A, 실시예 10B, 및 실시예 10에 제시된 데이터는 순환적으로 순열된 Cas7 서브유닛 단백질 변이체를 포함하는 캐스케이드 복합체의 정제가, 야생형 단백질을 포함하는 캐스케이드 복합체와 본질적으로 동일한 조성 (분자량에 기반함)을 갖는 캐스케이드 복합체를 형성하기 위해 순환적으로 순열된 유형 I-E CRISPR-Cas 서브유닛 단백질이 성공적으로 사용될 수 있다는 것을 명확하게 보여준다는 것을 나타낸다.
또 다른 실시양태에서, 본 발명은 융합 단백질 뿐만 아니라 이러한 융합 단백질을 코딩하는 폴리뉴클레오티드를 창출하기 위해 부가의 폴리펩티드 서열과 융합된 캐스케이드 서브유닛 단백질에 관한 것이다. 부가의 폴리펩티드 서열은 단백질, 단백질 도메인, 단백질 단편, 및 기능적 도메인을 포함할 수 있으나, 이에 제한되지는 않는다. 이러한 부가의 폴리펩티드 서열의 예는 전사 활성화제 또는 저해인자 도메인, 및 뉴클레오티드 데아미나제 (예를 들어, 문헌 [Komor, et al., Nature 553:420-424 (2016); Koblan, et al., Nat. Biotechnol. doi: 10.1038/nbt.4172 (May 29, 2018)]에 기재된 바와 같은 시티딘 데아미나제 또는 아데닌 데아미나제)로부터 유래된 서열을 포함하나 이에 제한되지는 않는다. 융합 단백질에 대한 부가의 기능적 도메인이 본원에 제시된다.
부가의 폴리펩티드 서열은 캐스케이드 서브유닛 단백질 중 임의의 것과 융합될 수 있으며, 여기서 부가의 폴리펩티드 서열은 전형적으로 캐스케이드 서브유닛 단백질의 코딩 서열을 포함하는 폴리뉴클레오티드의 5' 또는 3' 단부에 첨부되는 부가의 폴리뉴클레오티드 서열에 의해 코딩된다. 일부 실시양태에서, 아미노산 링커를 코딩하는 부가의 폴리뉴클레오티드 서열은 캐스케이드 서브유닛 단백질을 부가의 관심 폴리펩티드 서열에 연결시켜 준다. 일부 실시양태에서, 융합 단백질 파트너에 대한 폴리뉴클레오티드 서열 및 링커 서열은 자연적으로 발생하는 gDNA 서열로부터 유래될 수 있거나 또는 이. 콜라이에서의 박테리아 발현 또는 포유동물 세포 (예를 들어, 인간 세포)에서의 진핵 발현을 위해 코돈-최적화될 수 있다. 친화성 태그 (예를 들어, His6, 스트렙-태그(Strep-tag)® II (IBA GMBH LLC; 독일 괴팅겐)), 핵 국재화 시그널 또는 서열 (NLS), 말토스 결합 단백질, 및 FokI를 포함하는 융합 단백질의 예가 실시예 1에 제시된다. 예시적인 아미노산 링커 서열이 또한 실시예 1에 개시된다.
실시예 11A은 캐스케이드 서브유닛 단백질-FokI 융합 뿐만 아니라 시티딘 데아미나제, 엔도뉴클레아제, 제한 효소, 뉴클레아제/헬리카제, 또는 그의 도메인과의 캐스케이드 서브유닛 단백질 융합을 설명한다. 실시예 11B는 다른 캐스케이드 서브유닛 단백질과의 캐스케이드 서브유닛 단백질 융합 뿐만 아니라 다른 캐스케이드 서브유닛 융합 단백질 및 효소 단백질 도메인과의 캐스케이드 서브유닛 단백질 융합 (실시예 11D)을 설명한다. 일부 실시양태에서, 유형 I CRISPR 서브유닛 단백질은 N-말단, C-말단, 또는 N-말단과 C-말단 사이의 위치에서 단백질 융합물을 생성하는데 사용될 수 있는 능력에 관하여 인 실리코 평가될 수 있다. 일부 실시양태에서, 유형 I CRISPR 서브유닛 단백질은 하나 이상의 폴리펩티드 링커를 사용하여 N-말단, C-말단, 또는 N-말단과 C-말단 사이의 위치에서 하나 이상의 융합 도메인에 연결될 수 있다. 일부 실시양태에서, 캐스케이드 서브유닛 단백질은 단일 쇄 FokI와 융합될 수 있다 (예를 들어, Eco캐스케이드 RNP 복합체와의 단일 쇄 FokI 융합; 뉴클레오티드 서열, 서열식별번호: 1926; 단백질 서열, 서열식별번호: 1927). 예시적인 폴리펩티드 링커가 실시예 1, 11, 18, 및 19에 제시된다.
도 4a 및 도 4b는 부가의 단백질 서열 (예를 들어, FokI)과 융합된 Cas8 서브유닛 단백질을 포함하는 캐스케이드 복합체를 예시한다 (도 4a, 도 4b, Cas7, Cas5, Cas8, Cse2, Cas6, Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 이러한 헤어핀을 포함하는 흑색 선으로서 예시되며; Cas8, "C" C-말단, "N" N-말단이 표시됨). 도 4a는 링커 폴리펩티드 (도 4a, 흑색 곡선)를 사용하여 Cas8 서브유닛 단백질의 C-말단과 연결된 부가의 단백질 서열 (도 4a, FP)의 예를 제시한다. 도 4b는 링커 폴리펩티드 (도 4b, 흑색 곡선)를 사용하여 Cas8 서브유닛 단백질의 N-말단과 연결된 부가의 단백질 서열 (도 4b, FP)의 예를 제시한다. 실시예 11A는 FokI 뉴클레아제 도메인과 N-말단적으로 융합된 유형 I-E Cas8의 인 실리코 설계, 클로닝, 발현 및 정제를 설명한다.
도 5a 및 도 5b는 부가의 단백질 서열과 융합된 캐스케이드 서브유닛 단백질을 포함하는 캐스케이드 복합체의 부가의 예를 예시한다. 도 5a 및 도 5b에서, cRNA는 헤어핀을 포함하는 흑색 선으로서 예시되고 캐스케이드 복합체의 Cas 단백질의 상대적 위치가 제시되어 있다 (도 5a, 도 5b: Cas7, Cas5, Cas8, Cse2, Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타냄). 도 5a는 각각 링커 폴리펩티드 (도 5a, 흑색 곡선)를 통해 6개의 Cas7 서브유닛 단백질 각각과 융합된 검출가능한 모이어티 (예를 들어, 녹색 형광 단백질; 도 5a, GFP)의 예를 제시한다. 이러한 캐스케이드 복합체는 캐스케이드 복합체와 연합된 다수의 검출가능한 모이어티의 존재의 결과로서 상당한 시그널 증폭을 제공함으로써 핵산 표적 서열에 대한 복합체의 결합의 검출에 유용할 수 있다. 도 5b는 링커 폴리펩티드 (도 5b, 흑색 곡선)를 사용하여 Cas6 서브유닛 단백질과 연결된 부가의 단백질 서열 (도 5b, FP)의 예를 제시한다.
이. 콜라이 유형 I-E 캐스케이드 서브유닛 단백질을 함유하는 융합 단백질의 예는 하기를 포함하나 이에 제한되지는 않는다: 동일한 서브유닛 (예를 들어, Cse2_링커_Cse2), 순환적으로 순열된 서브유닛 (예를 들어, cpCas7_링커_cpCas7_링커_ cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7), 뉴클레아제와 융합된 유형 I-E 캐스케이드 단백질 (예를 들어, FokI_링커_Cas8, Cas3_링커_Cas8, Cas6_링커_FokI, S1뉴클레아제_링커_Cse2_링커_Cse2), 시티딘 데아미나제와 융합된 유형 I-E 캐스케이드 단백질 (예를 들어, Cas8_링커_AID, Cse2_링커_Cse2_링커_APOBEC3G), 및 하나 이상의 다른 유형 I-E 캐스케이드 단백질과 융합된 유형 I-E 캐스케이드 단백질 (예를 들어, Cas6_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7, cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_Cas5, Cas6_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_cpCas7_링커_Cas5).
도 6a, 도 6b, 및 도 6c는 cpCas7을 함유하는 조작된 유형 I CRISPR-Cas 이펙터 복합체의 예시를 제시한다. 도 6a, 도 6b, 및 도 6c에서, "cpCas7"은 순환적으로 순열된 Cas7 단백질 (도 6a, 도 6b, 도 6c: cpCas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 헤어핀을 포함하는 흑색 선으로서 예시되며; cpCas7의 경우에, 음영은 도 3a에 예시된 순환적으로 순열된 단백질에 상응함)이고, 캐스케이드 복합체의 Cas 단백질의 상대적 위치가 제시된다. 도 6a는 6개의 개별 cpCas7 서브유닛 단백질 (도 6a, cpCas7)을 포함하는 캐스케이드 복합체를 제시한다. 도 6b는 6개의 융합된 cpCas7 서브유닛 단백질을 포함하는 캐스케이드 복합체를 제시하며, 여기서 cpCas7 서브유닛 단백질 (도 6b, cpCas7)의 C-말단은 링커 폴리펩티드 (도 6b, 링커 폴리펩티드는 cpCas7 서브유닛 단백질을 연결하는 진한 흑색 선으로서 예시됨)를 사용하여 인접한 cpCas7 서브유닛 단백질의 N-말단과 연결된다. 도 6c는 캐스케이드 복합체가 6개의 융합된 cpCas7 서브유닛 단백질 ("백본")을 포함하는 실시양태를 제시하며, 여기서 제1 cpCas7 서브유닛 단백질의 C-말단은 링커 폴리펩티드 (도 6c, 링커 폴리펩티드는 cpCas7 서브유닛 단백질을 연결하는 진한 흑색 선으로서 예시됨)를 사용하여 제2 cpCas7 서브유닛 단백질의 N-말단과 연결되고, 제2 cpCas7 서브유닛 단백질의 C-말단은 링커 폴리펩티드 (도 6c, cpCas7과 FP를 연결하는 직선 흑색 선)를 사용하여 상이한 단백질 서열 (도 6c, FP) (예를 들어, 시티딘 데아미나제)의 N-말단과 연결되며, 이러한 단백질 코딩 서열의 C-말단은 링커 폴리펩티드를 사용하여 제3 cpCas7의 N-말단과 연결된다. cpCas7 서브유닛 단백질의 이러한 융합된 백본의 한 가지 이점은 백본을 따라 특이적 위치에 부가의 단백질 서열이 도입되어, 가이드가 캐스케이드 복합체의 결합을 지정하는 핵산 표적 서열의 길이를 따라 상이한 위치에 부가의 단백질 서열이 접근할 수 있다는 것이다.
도 7a 및 도 7b는 융합 단백질을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체의 추가 실시양태를 예시한다. 도 7a 및 도 7b에서, 캐스케이드 복합체의 Cas 단백질의 상대적 위치가 제시된다 (도 7a, 도 7b: Cas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 헤어핀을 포함하는 흑색 선으로서 예시됨). 도 7a는 Cse2-Cse2 융합 단백질 (도 7a, 흑색 곡선에 의해 연결된 2개의 Cse2 단백질)을 포함하는 캐스케이드 복합체를 제시한다. 인 실리코 설계, 클로닝, 발현, 정제, 및 전기영동 이동성 시프트 검정이 Cse2-Cse2 융합 단백질을 포함하는 실시예 11B 및 실시예 11C 캐스케이드 복합체에서 기재된다. 도 7b는 링커 폴리펩티드 (도 7b, Cse2 단백질을 FP에 연결하는 흑색 곡선)를 통해 부가의 단백질 서열 (도 7b, FP)과 연결된 Cse2-Cse2 융합 단백질을 포함하는 캐스케이드 복합체를 제시한다. 실시예 11D는 시티딘 데아미나제와 융합된 Cse2-Cse2 단백질의 인 실리코 설계, 클로닝, 발현, 및 정제를 설명한다.
일부 실시양태에서, 하나 이상의 핵 국재화 시그널이 캐스케이드 단백질 서브유닛 (예를 들어, Cas8-FokI 융합 단백질, cpCas7 단백질, 또는 Cse2-Cse2 융합 단백질)의 조작된 N-말단 또는 C-말단에서 부가될 수 있다.
융합 폴리펩티드의 일부 실시양태에서, 링커 폴리펩티드는 2개 이상의 단백질 코딩 서열을 연결한다. 예시적인 링커 폴리펩티드의 길이는 본 실시예에 기재되어 있다. 전형적으로, 링커 길이는 약 10개 아미노산 내지 약 40개 아미노산, 약 15개 아미노산 내지 약 30개 아미노산, 및 약 17개 아미노산 내지 약 20개 아미노산을 포함하나 이에 제한되지는 않는다. 링커 폴리펩티드의 아미노산 조성은 전형적으로, 극성, 소형 및/또는 하전된 아미노산 (예를 들어, Gly, Ala, Leu, Val, Gln, Ser, Thr, Pro, Glu, Asp, Lys, Arg, His, Asn, Cys, Tyr)을 포함한다. 부가 실시양태에서, 링커 폴리펩티드는 메티오닌을 함유하지 않도록 설계되고, 융합은 잠재적 번역 개시 부위를 피하도록 설계된다. 본 명세서의 지침에 따라, 링커 폴리펩티드는 융합 단백질 내에서 기능적 도메인 및 캐스케이드 단백질의 적절한 간격 및 위치를 제공하도록 설계된다 (예를 들어, 문헌 [Chichili, C., et al., Protein Science 22:153-167 (2013); Chen, X., et al., 65:1357-1369 (2013); George, R., et al., Protein Engineering, Design and Selection 15:871-879 (2002)] 참조). 본 발명의 실시에 유용한 링커 폴리펩티드의 부가의 예는 캐스케이드 시스템을 포함하는 유기체에서 캐스케이드 단백질의 코딩 서열을 서로 연결하는 것으로 확인된 링커 폴리펩티드이다 (예를 들어, 문헌 [Westra, E.R., et al., Mol, Cell. 46: 595-605 (2012)]에 기재된 바와 같이 스트렙토미세스 그리세우스(Streptomyces griseus)에서 Cas8을 Cas3에 연결하는 링커 폴리펩티드).
융합 단백질 코딩 DNA 서열은 선택된 유기체, 예컨대 박테리아, 고세균, 식물, 진균 또는 포유동물 세포에서의 발현을 위해 코돈-최적화될 수 있다. 코돈-최적화 프로그램은 예컨대 인티그레이티드 DNA 테크놀로지스(Integrated DNA Technologies) 웹사이트 (www.idtdna.com/CodonOpt) 상에서, 또는 젠스크립트(Genscript)® (젠스크립트; 미국 뉴저지주 피스카타웨이) 서비스를 통해 널리 이용가능하다. 수용자 발현 벡터로의 클로닝을 용이하게 하기 위해, SLIC 클로닝에 적합한 벡터와 중복되는 부가의 서열 (예를 들어, 문헌 [Li, M., et al., Methods Mol. Biol. 852:51-59 (2012)] 참조)이 DNA 서열의 5' 및 3' 단부에 첨부될 수 있다.
다른 실시양태에서, 캐스케이드 서브유닛 단백질은 전사 활성화 및/또는 저해 도메인과 융합될 수 있다. 일부 실시양태에서, 융합 단백질은 활성화제 도메인 (예를 들어, 열 충격 전사 인자, NFKB 활성화제, VP16, 및 VP64 (예를 들어, 문헌 [Eguchi, A. et al., Proc. Natl. Acad. Sci. USA 113:E8257-E8266 (2016); Perez-Pinera, P. et al., Nature Methods 10:973-6 (2013); Gilbert, L.A., et al. Cell 159:647-61 (2014)] 참조)) 또는 저해인자 도메인 (예를 들어, KRAB 도메인)을 포함할 수 있다. 일부 실시양태에서, 링커 핵산 서열은 단백질, 단백질 도메인, 또는 단백질 단편에 대한 2개 이상의 코딩 서열을 연결하기 위해 사용된다.
전사 활성화제와 융합된 유형 I CRISPR-Cas 서브유닛 단백질을 포함하는 캐스케이드 복합체를 사용하여 유전자의 발현을 활성화할 수 있다. 표적 로커스는 전형적으로 세포의 전사 활성화 기구 (인자)에 대한 하나 이상의 결합 부위를 정착시킨 전사 시작 부위 (TSS)를 함유할 수 있다. 도 8은 링커 폴리펩티드 (도 8, cpCas7을 VP64에 연결하는 흑색 곡선)를 통해 전사 활성화제 VP64에 연결된 cpCas7 (도 3a와 비교)을 포함하는 6개의 융합 단백질을 포함하는 캐스케이드 복합체를 예시한다. 도 8에서, crRNA는 헤어핀을 포함하는 진한 흑색 선으로서 예시되고, 캐스케이드 복합체의 Cas 단백질의 상대적 위치가 제시된다 (도 8: cpCas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타냄). 이러한 캐스케이드 복합체의 조작은 복합체를 유전자의 전사 활성화를 위한 가요성 도구 (캐스케이드a)로 전환시키며, 여기서 선택된 유전자를 표적화하는 것은, 캐스케이드 복합체가 선택된 유전자의 하나 이상의 조절 요소 (예를 들어, TSS)에 결합하는 것을 지시하는 가이드 서열의 선택에 의해 달성된다. 실시예 12는 캐스케이드 복합체에 전사 활성화 활성을 부여하기 위해 VP64 활성화 도메인과 융합된 이. 콜라이 유형 I-E cp-Cas7 단백질의 설계를 설명한다. 전사 활성화제는 호메오도메인 단백질, 징크-핑거 단백질, 날개형 나선 (포크헤드) 단백질, 류신-지퍼 단백질, 나선-루프-나선 단백질, 이종이량체성 전사 인자, 활성화 도메인, 및 인핸서에 결합하는 전사 인자를 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Molecular Cell Biology, Harvey Lodish, et al., W H Freeman & Co; (2002) ISBN 978-0849394805] 참조).
또한, 전사 저해인자와 융합된 유형 I CRISPR-Cas 서브유닛 단백질을 포함하는 캐스케이드 복합체를 사용하여 유전자의 발현을 저해할 수 있다. 표적 로커스는 전사 조절 요소를 포함할 수 있다. 한 실시양태에서, 캐스케이드 서브유닛 단백질은 링커 폴리펩티드를 통해 KRAB 도메인에 연결될 수 있다. 캐스케이드 서브유닛 단백질/KRAB 도메인 융합을 포함하는 캐스케이드 복합체는 이러한 복합체를 유전자의 전사 저해를 위한 가요성 도구 (캐스케이드i)로 전환시킬 수 있으며, 여기서 선택된 유전자를 표적화하는 것은, 선택된 유전자의 하나 이상의 조절 요소에 대한 캐스케이드 복합체의 결합을 지시하는 가이드 서열의 선택에 의해 달성된다. 전사 저해인자는 수동 전사 저해인자, bzip 전사 인자 패밀리, sp1-유사 전사 저해인자, 능동 전사 저해인자 (예를 들어, 히스톤 데아세틸라제의 동원, 히스톤 탈아세틸화, 및 이중-특이적 저해인자를 통한 전사 저해)를 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Thiel, G., et al., Eur. J. Biochem. 271:2855-2862 (2004); Nicola Reynolds, N., et al., Development 140:505-512 (2013); Gaston, K., et al., Cell Mol. Life Sci., 60:721-741 (2003)] 참조).
부가 실시양태에서, 캐스케이드 서브유닛 단백질은 친화성 태그와 융합될 수 있다.
본 발명의 다른 실시양태에서, 유형 I CRISPR-Cas 가이드 폴리뉴클레오티드는 가이드 폴리뉴클레오티드 내의 선택된 위치에서 뉴클레오티드의 변화 또는 선택된 폴리뉴클레오티드 요소의 삽입에 의해 변형될 수 있다 (예를 들어, RNA 모이어티에 대한 DNA 모이어티의 기본적으로 상이한 변화 뿐만 아니라 가이드 폴리뉴클레오티드에 대해 상기 기재된 다른 변화). 이러한 실시양태는 하나 이상의 뉴클레오티드 이펙터 도메인 (예를 들어, MS2 또는 MS2-P65-HSF1 결합 RNA 또는 전사 인자를 동원하는 앱타머)과 5', 3' 또는 내부적으로 융합된 유형 I CRISPR-Cas 가이드 폴리뉴클레오티드를 포함하나 이에 제한되지는 않는다. 도 9는 유형 I CRISPR 가이드 폴리뉴클레오티드를 예시하고, 캐스케이드 복합체의 Cas 단백질의 상대적 위치가 제시된다 (도 9: Cas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 파선 박스 내에 헤어핀을 포함하는 흑색 선으로서 예시됨). 도 9에서, crRNA는 추가로, 가이드 폴리뉴클레오티드의 3' 헤어핀 내로 도입된 RNA 앱타머 헤어핀 (도 9, 화살표로 표시된 위치)을 포함한다.
유형 I CRISPR-Cas 가이드의 길이는 또한, 전형적으로 Cas7 서브유닛 단백질 및 Cse2 서브유닛 단백질 결합 영역을 연장시키거나 단축시킴으로써 변형될 수 있다. 도 10a는 3개의 Cas7 서브유닛, 1개의 Cse2 서브유닛 및 단축된 crRNA가 있는 캐스케이드 복합체를 예시한다 (도 10a: Cas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 헤어핀을 포함하는 흑색 선으로서 예시됨). 도 10b는 9개의 Cas7 서브유닛, 3개의 Cse2 서브유닛, 및 연장된 crRNA가 있는 캐스케이드 복합체를 예시한다 (도 10b: Cas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 헤어핀을 포함하는 흑색 선으로서 예시됨).
실시예 16은 유형 I CRISPR-Cas 가이드 crRNA의 변형의 생성 및 시험, 및 조작된 유형 I CRISPR-Cas 이펙터 복합체를 구축하는데 사용하기 위한 상기 변형된 가이드의 적합성을 설명한다.
제3 측면에서, 본 발명은 하나 이상의 조작된 캐스케이드 구성성분을 코딩하는 핵산 서열 뿐만 아니라 하나 이상의 조작된 캐스케이드 구성성분을 코딩하는 핵산 서열을 포함하는 발현 카세트, 벡터, 및 재조합 세포에 관한 것이다. 본 발명의 제3 측면의 일부 실시양태는 선택된 캐스케이드 시스템 구성성분 모두 (예를 들어, Cse2, Cas5, Cas6, Cas7, 및 Cas8 단백질, 및 하나 이상의 동족 가이드)를 코딩하는 하나 이상의 폴리펩티드를 포함하여, 여기서 상기 구성성분은 이펙터 복합체를 형성할 수 있다. 전형적으로, 2개 이상의 동족 가이드가 발현될 때, 이러한 가이드는 상이한 핵산 표적 서열에의 결합을 지시하기 위해 상이한 스페이서 서열을 갖는다. 이러한 실시양태는 발현 카세트, 벡터 및 재조합 세포를 포함하나 이에 제한되지는 않는다.
한 실시양태에서, 본 발명은 하나 이상의 조작된 캐스케이드 구성성분을 코딩하는 하나 이상의 핵산 서열을 포함하는 하나 이상의 발현 카세트에 관한 것이다. 발현 카세트는 전형적으로, 전사의 조절, 전사 후 조절, 또는 번역의 조절 중 하나 이상에 관여한 조절 서열을 포함한다. 발현 카세트는 박테리아 세포, 효모 세포, 식물 세포 및 포유동물 세포 (인간 세포 포함)를 포함하나 이에 제한되지는 않는 광범위한 유기체 내로 도입될 수 있다. 발현 카세트는 전형적으로, 이들이 도입되는 유기체(들)에 상응하는 기능적 조절 서열을 포함한다.
본 발명의 추가 실시양태는 하나 이상의 조작된 캐스케이드 구성성분을 코딩하는 하나 이상의 핵산 서열을 포함하는 발현 벡터를 포함한 벡터에 관한 것이다. 벡터는 또한 선택가능한 또는 스크리닝가능한 마커를 코딩하는 서열을 포함할 수 있다. 더욱이, 핵 표적화 서열은 또한, 예를 들어, 캐스케이드 서브유닛 단백질에 부가될 수 있다. 벡터는 또한 단백질 태그 (예를 들어, 폴리-His 태그, 혈구 응집소 태그, 형광 단백질 태그 및 생물 발광 태그)를 코딩하는 폴리뉴클레오티드를 포함할 수 있다. 이러한 단백질 태그에 대한 코딩 서열은, 예를 들어, 캐스케이드 서브유닛 단백질을 코딩하는 하나 이상의 핵산 서열과 융합될 수 있다.
발현 벡터의 구축을 위한 일반적인 방법은 관련 기술분야에 공지되어 있다. 숙주 세포에 대한 발현 벡터는 상업적으로 이용가능하다. 세포 형질전환 및 유전자 발현 및 이러한 폴리뉴클레오티드의 클로닝을 쉽게 허용하는 방법에 적절한 벡터, 예컨대 곤충 세포 형질전환 및 곤충 세포에서의 유전자 발현을 위한 곤충 세포 벡터, 박테리아 형질전환 및 박테리아 세포에서의 유전자 발현을 위한 박테리아 플라스미드, 세포 형질전환 및 효모 및 다른 진균에서의 유전자 발현을 위한 효모 플라스미드, 포유동물 세포 형질전환 및 포유동물 세포 또는 포유류에서의 유전자 발현을 위한 포유동물 벡터, 및 바이러스 벡터 (렌티바이러스, 레트로바이러스, 아데노바이러스, 단순 포진 바이러스 I 또는 II, 파보바이러스, 세망 내피증 바이러스, 및 아데노-연관 바이러스 (AAV) 벡터를 포함하나 이에 제한되지는 않음)의 선택 및 그의 구축을 용이하게 하기 위해 설계된 몇 가지 상업적 소프트웨어 제품이 있다.
AAV-기반 벡터 (rAAV)는 본 발명의 방법의 실시에 유용한 바이러스 벡터의 한 예이다. AAV는 파르보비리다에(Parvoviridae) 과의 단일-가닥 DNA 구성원이며 자연적으로 복제가 결핍된 바이러스이다. AAV 벡터는 유전자 요법에 가장 자주 사용되는 바이러스 벡터 중 하나이다. 12개 인간 혈청형의 AAV (AAV 혈청형 1 [AAV-1] 내지 AAV-12) 및 비-인간으로부터의 100개 초과의 혈청형이 공지되어 있다. 한 실시양태에서, AAV-6이 벡터로서 사용된다.
렌티바이러스 벡터는 본 발명의 방법의 실시에 유용한 바이러스 벡터의 또 다른 예이다. 렌티바이러스는 레트로비리다에(Retroviridae) 과의 구성원이며 단일-가닥 RNA 바이러스로, 분열 세포와 비-분열 세포 둘 다를 감염시킬 수 있을 뿐만 아니라 게놈 내로의 통합을 통해 안정적인 발현을 제공할 수 있다. 렌티바이러스 벡터의 안전성을 증가시키기 위해, 바이러스 벡터를 생산하는데 필요한 구성성분은 다수의 플라스미드에 걸쳐 분할된다. 전달 벡터는 전형적으로 복제 부적격하며, 부가적으로 3'LTR에 결실을 함유할 수 있으며, 이는 통합 후 바이러스가 자기 불활성화되도록 한다. 패키징 및 외피 플라스미드는 전형적으로, 전달 벡터와 조합하여 사용된다. 예를 들어, 패키징 플라스미드는 Gag, Pol, Rev 및 Tat 유전자의 조합을 코딩할 수 있다. 전달 플라스미드는 바이러스 LTR 및 psi 패키징 시그널을 포함할 수 있다. 외피 플라스미드는 통상적으로 외피 단백질 (그의 감염력 범위가 넓기 때문에, 통상적으로 수포성 구내염 바이러스 당단백질, VSV-GP)을 포함한다.
예시적인 식물 형질전환 벡터는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)의 Ti 플라스미드로부터 유래된 것들을 포함한다 (예를 들어, 문헌 [Lee, L.Y., et al., Plant Physiology 146:325-332 (2008)] 참조). 또한, 유용하고 관련 기술분야에 공지된 것은 아그로박테리움 리조게네스(Agrobacterium rhizogenes) 플라스미드이다. 예를 들어, 스냅진(SNAPGENE)™ (GSL 바이오텍(Biotech) LLC; 미국 일리노이주 시카고; snapgene.com/resources/plasmid_files/your_time_is_valuable/)은 벡터, 개별 벡터 서열 및 벡터 맵의 광범위한 목록 뿐만 아니라 많은 벡터에 대한 상업적 공급원을 제공한다.
박테리아 발현 시스템에서 재조합 캐스케이드를 발현하고 정제하기 위해, 캐스케이드 서브유닛 단백질을 코딩하는 벡터 뿐만 아니라 관심 가이드 서열을 포함하는 최소 CRISPR 어레이를 설계할 수 있다. 따라서, 본 발명의 한 측면은 이러한 발현 시스템을 포함한다. 한 실시양태에서, 캐스케이드 복합체는 3개의 별개의 플라스미드 벡터에서 발현되며, 이는 하기 구성성분을 집합적으로 코딩한다: Cas8 단백질; Cse2, Cas7, Cas5 및 Cas6 단백질; 및 CRISPR RNA. 일부 실시양태에서, Cas8을 코딩하는 발현 플라스미드는 자연 gDNA 유전자 서열을 포함하고, 다른 실시양태에서, 발현 플라스미드는 선택된 세포 유형에서의 발현을 위해 코돈-최적화되는 Cas8을 코딩할 수 있다. 유사하게, Cse2, Cas7, Cas5, 및 Cas6을 코딩하는 발현 플라스미드는 자연 gDNA 유전자 서열을 함유할 수 있거나 또는 선택된 세포 유형에서의 발현을 위해 코돈-최적화된 유전자 서열을 함유할 수 있다. 일부 실시양태에서, 오페론을 코딩하는 전체 캐스케이드 서브유닛 단백질은 단일 전사 프로모터의 하류에 배치될 수 있어서, 상이한 단백질은 모두 단일 폴리시스트론성 전사체로부터 번역된다. 부가 실시양태에서, 캐스케이드 서브유닛 단백질을 코딩하는 유전자는 전사 종결인자 및 프로모터를 개재하여 서로 분리될 수 있다.
crRNA를 코딩하는 발현 플라스미드는 적절한 전사 프로모터의 하류에 있는 단일 스페이서 서열을 플랭킹하는 불과 2개의 반복부를 함유할 수 있거나, 또는 동일한 정확한 가이드 서열 또는 다수의 별개의 가이드 서열의 다수의 스페이서 서열을 플랭킹하는 많은 반복부를 함유할 수 있다. CRISPR 및 캐스케이드 서브유닛, 특히 Cas6 서브유닛의 협조적 발현은 긴 전구체 crRNA를 성숙한 길이의 crRNA로 프로세싱하며, 각각은 crRNA의 5' 및 3' 단부 상의 단일 반복부의 단편을 포함하고, 중간에 단일 스페이서 서열이 있다.
이. 콜라이에서 완전한 캐스케이드 복합체를 발현시키기 위한 대체 전략은 2개의 플라스미드를 사용하며; 하나는 단일 발현 플라스미드에서 전체 Cas8-Cse2-Cas7-Cas5-Cas6 오페론을 코딩하는 플라스미드이고, 다른 하나는 CRISPR RNA를 코딩하는 플라스미드이다. 이러한 경우에, 정상적으로 Cas8 유전자의 3' 단부부와 중복되는 Cse2 유전자의 5' 단부가 Cas8 유전자의 3' 단부로부터 공간적으로 분리되어, 친화성 태그를 코딩하는 폴리뉴클레오티드 서열 및/또는 프로테아제 인식 서열을 첨부시킨다.
실시예 2는 캐스케이드 단백질에 대한 2가지 유형의 박테리아 발현 플라스미드 시스템을 설명한다: 첫 번째 유형은 Cas8 단백질을 코딩하는 제1 플라스미드와 CasBCDE 복합체의 4개의 서브유닛 단백질 (cse2-cas7-cas5-cas6 오페론)을 코딩하는 제2 플라스미드인 2개의 플라스미드를 포함하고 ; 두 번째 유형은 캐스케이드 복합체의 모든 5개의 서브유닛 단백질 (cas8-cse2-cas7-cas5-cas6 오페론)을 코딩하는 발현 플라스미드를 포함한다. 동족 CRISPR 어레이가 또한 기재된다.
캐스케이드 복합체의 정제를 용이하게 하기 위해, 친화성 태그를 Cse2 서브유닛, 예컨대 N-말단 스트렙-II 태그 또는 헥사히스티딘 (His6) 태그 상으로 첨부할 수 있다. 더욱이, 프로테아제, 예컨대 TEV 프로테아제 또는 HRV3C 프로테아제에 의해 인식되는 아미노산 서열은 친화성 태그와 Cse2 서브유닛의 천연 N-말단 사이에 삽입될 수 있으므로, 초기 정제 후 프로테아제를 이용하여 서열을 생화학적으로 절단하면, 최종 재조합 캐스케이드 복합체로부터 친화성 태그가 유리된다. 친화성 태그는 또한, 다른 서브유닛 상에 배치될 수 있거나, 또는 Cse2 서브유닛에 남겨지고 다른 서브유닛 상의 부가의 친화성 태그와 조합될 수 있다. 친화성 태그를 포함하는 예시적인 캐스케이드 서브유닛 단백질은 실시예 1, 실시예 2, 실시예 3A, 실시예 3B, 및 실시예 3C에 제시되어 있다.
유형 I-E 캐스케이드 시스템의 경우에, 이. 콜라이의 균주는 CRISPR RNA 뿐만 아니라 cse2-cas7-cas5-cas6 유전자를 코딩하는 플라스미드로 형질전환될 수 있으며, 단백질 발현이 유도되고, Cas8 서브유닛이 결여되는 캐스케이드 복합체가 생산될 수 있다. 이러한 캐스케이드 복합체는 전형적으로, Cas8-마이너스 캐스케이드 복합체, 또는 또 다른 한편으론 CasBCDE 복합체로서 지칭된다 (예를 들어, 문헌 [Jore, M., et al., Nat. Struct. Mol. Biol. 18:529-536 (2011)] 참조). 이러한 정제된 복합체는 별도로 정제된 Cas8과 생화학적으로 조합되어 완전한 캐스케이드를 재구성할 수 있다 (예를 들어, 문헌 [Sashital, D.G., et al., Mol. Cell 46:606-615 (2012)] 참조).
표 6은 상이한 태그 및 설계를 함유하는, 최소 CRISPR 어레이, cas8, cse2-cas7-cas5-cas6 구축물, 및 cas8-cse2-cas7-cas5-cas6 구축물을 코딩하는 박테리아 발현 플라스미드의 예시적인 서열을 제시한다. 캐스케이드 복합체 및 상동 유형 I 시스템으로부터의 캐스케이드 복합체를 코딩하는 플라스미드는 본 명세서의 지침에 따라 이. 콜라이 K-12 MG1655에서 발견된 유형 I-E에 대한 예시적인 발현 플라스미드 서열과 유사하게 설계될 수 있다. 표 6은 부가적으로, 유전자 편집 실험을 위한 뉴클레아제-캐스케이드 융합을 생산하기 위하여, Cas8-Cse2-Cas7-Cas5-Cas6 단백질을 발현하는 발현 플라스미드의 서열 뿐만 아니라 cas8 유전자 또는 cas6 유전자 중 하나와의 FokI 융합물을 함유한다.
Figure pct00021
표 7은 단일 박테리아 발현 플라스미드로부터의 crRNA와 함께 5개의 모든 서브유닛 단백질을 코딩하는 단일 폴리프로모터 박테리아 발현 플라스미드의 서열을 함유한다. 이러한 설계에서, 각각의 유전자는 전사 프로모터 및 종결인자로 상류 및 하류를 플랭킹하는 다른 유전자로부터 분리된다. 유전자 편집을 위한 캐스케이드-뉴클레아제 융합을 생성하기 위해, 뉴클레아제 단백질과의 융합 뿐만 아니라 친화성 태그 및/또는 프로테아제 인식 태그를 코딩하는 부가의 서열이 도입될 수 있다.
Figure pct00022
부가의 박테리아 발현 플라스미드는 본원에서의 설계 기준에 기반하여 다른 유형 I 하위유형 및 다른 박테리아 또는 고세균 유기체로부터의 상동 캐스케이드 복합체를 코딩하도록 설계될 수 있다. 이러한 발현 플라스미드는 캐스케이드 유전자에 대한 gDNA 서열로 설계될 수 있거나, 또는 이. 콜라이 또는 다른 박테리아 균주에서의 발현을 위해 코돈-최적화된 유전자 서열로 설계될 수 있다.
포유동물 세포, 예컨대 인간 세포에서 캐스케이드 또는 캐스케이드와의 이펙터 융합물을 발현하기 위해, 진핵 전사 및 번역 기구에 의해 관련 단백질 및 RNA 구성성분의 발현을 가능하게 하도록 진핵 발현 플라스미드 벡터를 설계하였다. 한 실시양태에서, 캐스케이드는 진핵 프로모터 (예를 들어, 시토메갈로바이러스 (CMV) 프로모터)에 의해 구동되는 별도의 발현 벡터 상에 각각의 단백질 구성성분을 코딩하고 RNA 폴리머라제 III 프로모터 (예를 들어, 인간 U6 프로모터)에 의해 구동되는 별도의 발현 벡터 상에 crRNA를 코딩함으로써 포유동물 세포에서 생성될 수 있다. CRISPR RNA는 성숙한 crRNA의 가이드 부분으로 기능하는 하나 이상의 스페이서 서열을 플랭킹하는 적어도 2개의 반복부를 함유하는 최소 CRISPR 어레이로 코딩될 수 있다. CRISPR RNA를 생성하는 구축물은 상기 최소 어레이에서 가장 바깥 쪽 반복부를 플랭킹하는 부가의 서열로 설계될 수 있다. 전구체 CRISPR RNA의 프로세싱은 별도의 플라스미드로부터 발현될 수 있는 캐스케이드 복합체의 RNA 프로세싱 서브유닛 (Cas6 서브유닛 단백질)에 의해 가능해진다.
표 8은 이. 콜라이 유형 I-E 캐스케이드 복합체의 각각의 단백질에 대한 개별 진핵 발현 플라스미드의 서열을 함유한다. Cas8 서브유닛은 부가의 이펙터 뉴클레아제 도메인, 예컨대 FokI 뉴클레아제와 융합될 수 있다 (실시예 1, 실시예 3A, 실시예 3B, 및 실시예 3C). 표 8은 또한, 2개의 별도의 crRNA를 코딩하는, 캐스케이드의 crRNA 구성성분에 대한 발현 플라스미드의 서열을 함유하며, 이에 따라 3개의 반복부 서열이 2개의 스페이서를 플랭킹한다. 단백질 코딩 유전자 각각은 핵 국재화 시그널 (NLS), 친화성 태그, 및 이들 태그를 연결하는 링커 서열을 첨부하는 폴리뉴클레오티드 서열에 첨부될 수 있다. 캐스케이드 서브유닛 단백질 중 임의의 것에 대한 다른 융합은, 부가의 관심 폴리펩티드 서열에 캐스케이드 서브유닛 단백질을 연결하는 아미노산 링커를 코딩하는 부가의 폴리뉴클레오티드 서열을 포함한, 전형적으로 5' 또는 3' 코딩 서열에 첨부되는 부가의 폴리뉴클레오티드 서열에 의해 코딩될 수 있다. 후보 융합 단백질의 예가 본원에 기재되어 있다.
Figure pct00023
Figure pct00024
더 적은 수의 발현 벡터 상에 캐스케이드 복합체의 구성성분을 발현하기 위해, 폴리시스트론성 발현 벡터가 구축될 수 있으며, 이에 의해 단일 프로모터 (예를 들어, CMV 프로모터)가 토세아 아시그나(Thosea asigna) 바이러스 2A 서열에 의해 분리되는 다중 코딩 서열의 발현을 동시에 구동시킨다. 2A 바이러스 펩티드 서열은 리보솜 스키핑을 유도하여, 다중 단백질 코딩 유전자가 진핵 세포에서의 발현을 위해 단일 폴리시스트론성 구축물 내에서 연결될 수 있도록 한다. 따라서, 단일 프로모터에 의해 구동되는 단일 전사체 상에서 캐스케이드 복합체의 4개 또는 5개의 단백질 서브유닛을 코딩하는 폴리시스트론성 벡터를 설계할 수 있다. 표 9는 포유동물 세포에서 기능적 캐스케이드를 생산하기 위해 CRISPR RNA 발현 플라스미드와 조합될 수 있는 진핵 폴리시스트론성 발현 플라스미드의 서열을 함유한다.
Figure pct00025
일부 실시양태에서, CRISPR RNA는 단백질 코딩 유전자의 3' 비번역 영역 (UTR) 내에서 코딩되며, 그의 발현은 RNA 폴리머라제 II 프로모터 (예를 들어, CMV 프로모터)에 의해 구동되어 전사체를 생산한다. 이러한 실시양태에서, 최소 CRISPR 어레이는 단백질 코딩 유전자, 예컨대 Cas6, Cas7 또는 리포터 유전자 (예를 들어, 증강된 녹색 형광 단백질, eGFP)의 하류에 존재하도록 설계되고, 이전에 상류 전사체에 안정성을 부여하는 것으로 나타났던 MALAT1 트리플렉스 서열에 의해 단백질 코딩 서열로부터 분리된다. 최소 CRISPR 어레이는 캐스케이드의 RNA 프로세싱 서브유닛 (전형적으로 상이한 플라스미드를 사용하여 발현됨), 최소 CRISPR 어레이를 절단하는 엔도뉴클레아제에 의해 프로세싱되고, 파손이 상기 전사체 내로 도입되고, 트리플렉스 서열은 상류 단백질 코딩 유전자의 3' 단부를 조기 엑소뉴클레아제성 분해로부터 보호한다. 표 10은 3개의 폴리뉴클레오티드 서열을 포함하며, 이에 따라 CRISPR 어레이는 Cas6, Cas7 또는 eGFP의 하류에 클로닝되고, 전체 융합 서열의 발현은 CMV 프로모터에 의해 구동된다.
Figure pct00026
일부 실시양태에서, CRISPR RNA 어레이는 5개의 캐스케이드 서브유닛 단백질의 발현을 구동하는 폴리시스트론성 구축물과 동일한 벡터 상에서 코딩되고; 이들 두 요소의 조합은 캐스케이드 서브유닛 중 하나와 융합된 임의의 뉴클레아제 또는 이펙터 도메인과 함께, 캐스케이드 복합체의 모든 기능적 서브유닛 (단백질과 RNA 둘 다)을 생산하는 올-인-원 벡터를 생성한다. 표 11은 포유동물 세포에서 기능적 FokI-캐스케이드 RNP를 생산하기 위해 각각의 구성성분 모두를 코딩하는 이들 올-인-원 폴리뉴클레오티드 서열 중의 2가지 대표적인 서열을 함유한다.
Figure pct00027
실시예 3A, 실시예 3B, 및 실시예 3C는 각각 캐스케이드 서브유닛 단백질 및 최소 CRISPR 어레이를 발현하는 별도의 플라스미드를 사용하는 발현 시스템, 다수의 캐스케이드 서브유닛 단백질 코딩 서열이 단일 프로모터로부터 발현되는 발현 시스템, 및 포유동물 세포에서 사용하기 위한 최소 CRISPR 어레이 및 전체 cas8-cse2-cas7-cas5-cas6 오페론을 발현하도록 단일 플라스미드 캐스케이드 발현 시스템을 구축한 발현 시스템을 설명한다.
본 명세서의 지침에 따라 관련 기술분야의 통상의 기술자는 이. 콜라이 유형 I-E 캐스케이드 복합체가 제공된 실시예와 유사하게 다른 캐스케이드 복합체를 코딩하는 부가의 포유동물 발현 벡터를 설계할 수 있다.
제4 측면에서, 본 발명은 조작된 유형 I CRISPR-Cas 이펙터 복합체의 하나 이상의 구성성분을 코딩하는 플라스미드를 숙주 세포 내로 도입함으로써 조작된 유형 I CRISPR-Cas 이펙터 복합체를 생산하는 것에 관한 것이다. 형질전환된 숙주 세포 (또는 재조합 세포), 또는 재조합 DNA 기술을 사용하여 형질전환되었거나 또는 형질감염된 세포의 자손은 조작된 유형 I CRISPR-Cas 이펙터 복합체의 하나 이상의 구성성분을 코딩하는 하나 이상의 핵산 서열을 포함할 수 있다. 폴리뉴클레오티드 (예를 들어, 발현 벡터)를 숙주 세포 내로 도입하는 방법은 관련 기술분야에 공지되어 있으며 전형적으로, 숙주 세포의 종류에 기반하여 선택된다. 이러한 방법은, 예를 들어, 바이러스 또는 박테리오파지 감염, 형질감염, 접합, 전기천공, 인산칼슘 침전, 폴리에틸렌이민-매개 형질감염, DEAE-덱스트란 매개 형질감염, 원형질체 융합, 리포펙션, 리포솜-매개 형질감염, 입자 총 기술, 미세발사체 충격, 직접 미세주입 및 나노입자-매개 전달을 포함한다. 본 발명의 한 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체의 구성성분을 코딩하는 폴리뉴클레오티드가 박테리아 세포 (예를 들어, 이. 콜라이) 내로 도입된다.
실시예 4A 및 실시예 4B는 Cas8 단백질 코딩 서열의 도입 및 발현을 위한 방법 뿐만 아니라 이. 콜라이 발현 시스템을 사용하여 이러한 복합체의 박테리아 생산을 위한 조작된 유형 I CRISPR-Cas 이펙터 복합체의 구성성분에 대한 코딩 서열을 설명한다.
본원에 개시된 다양한 예시적인 숙주 세포는 조작된 캐스케이드 이펙터 복합체를 사용하여 재조합 세포를 생산하는데 사용될 수 있다. 이러한 숙주 세포는 식물 세포, 효모 세포, 박테리아 세포, 곤충 세포, 조류 세포 및 포유동물 세포를 포함하나 이에 제한되지는 않는다.
논의의 용이성을 위해, "형질감염"은 숙주 세포 내로 폴리뉴클레오티드를 도입하는 임의의 방법을 지칭하기 위해 하기에 사용된다.
일부 실시양태에서, 숙주 세포는 유형 I CRISPR-Cas 이펙터 복합체의 하나 이상의 구성성분을 코딩하는 핵산 서열로 일시적으로 또는 비-일시적으로 형질감염된다. 일부 실시양태에서, 세포는 대상체에서 자연적으로 발생하기 때문에 형질감염된다. 일부 실시양태에서, 형질감염되는 세포는 먼저, 대상체로부터 제거되는데, 예를 들어, 1차 세포 또는 전구 세포이다. 일부 실시양태에서, 1차 세포 또는 전구 세포는 배양되고/거나 생체외 형질감염 후 동일한 대상체 또는 상이한 대상체에 복귀된다.
조작된 유형 I CRISPR-Cas 이펙터 복합체의 발현 및 정제는 노동 집약적이므로, 많은 수의 가이드 폴리뉴클레오티드 또는 이펙터 복합체 변이체 전체에 걸친 스크리닝을 용이하게 하기 위해, 더 높은 처리량의 플라스미드-기반 전달 시스템이 설계되었다. 5개의 Cas 유전자 각각은 인간 코돈-최적화되었고 N-말단 NLS 융합으로서 CMV 구동 발현 플라스미드로 클로닝되었으며, T 세포 수용체 알파 로커스 (UCSC 게놈 브라우저, hg38))의 TRAJ27 엑손을 표적화하는 쌍형성된 gRNA를 함유하는 최소 CRISPR 어레이를, 인간 U6 프로모터의 제6 플라스미드 하류에 클로닝하였다 (실시예 3A; 도 35). 도 35에서, 좌측에서 우측으로 요소의 순서는 하기와 같다: hu6 프로모터, 다이아몬드 단부가 있는 회색 직사각형; 반복부 1, 열린 다이아몬드, (백색); 스페이서 1, 회색 와플 직사각형; 반복부 2, 회색 다이아몬드; 스페이서 2, 회색 점각 직사각형; 및 반복부 3, 흑색 다이아몬드. 도 35에서, 각 괄호는 2개의 gRNA를 코딩하는 영역을 예시한다. 일부 실시양태에서, 2개의 가이드 RNA는 동일할 수 있고 (예를 들어, 동일한 핵산 표적 서열을 표적화함), 다른 실시양태에서 2개의 가이드 RNA는 상이할 수 있다 (예를 들어, 2개의 상이한 핵산 표적 서열을 표적화함).
대부분의 유형 I 시스템에서의 gRNA 프로세싱은 캐스케이드에 존재하는 Cas6 리보뉴클레아제에 의해 자연적으로 촉매되어 (예를 들어, 문헌 [Brouns, S. J., et al., Science 321:960-964 (2008); Hochstrasser, M., et al., Trends Biochem. Sci. 40:58-66 (2015)] 참조), 본원에 제시된 쌍형성된 gRNA 접근법으로 다수의 프로모터에 대한 필요성을 배제시킨다. 따라서, 본 발명의 한 실시양태는 가이드 폴리뉴클레오티드 (예를 들어, gRNA)의 발현을 제공하기 위해 조절 요소에 작동가능하게 연결된 쌍형성된 가이드 폴리뉴클레오티드를 포함하는 벡터를 포함한다. 6-플라스미드 공동-형질감염은 TRAJ27 로커스에서 최대 ~3% 편집을 산출하였고, 이. 콜라이 캐스케이드 이펙터 복합체가 DNA 결합에 절대적으로 필요하지 않은 Cas11을 제외하고는, 어느 하나의 구성성분의 제거가 게놈 편집을 폐지하였다 (예를 들어, 문헌 [Westra, E., et al., RNA Biol. 9:1134-1138 (2012)] 참조).
본 발명의 또 다른 실시양태에서, 전형적으로 2개의 가이드 서열을 포함하는 최소 CRISPR 어레이는 DNA 주형으로서 세포 또는 생화학적 반응 내로 도입된다. DNA 주형은 PCR 증폭에 의해 생산된다 (예를 들어, 도 42a; 실시예 20A). 이러한 최소 CRISPR 어레이는 캐스케이드 복합체 단백질 구성성분을 코딩하는 하나 이상의 플라스미드를 사용하여 세포 내로 도입될 수 있다. 일부 실시양태에서, 쌍형성된 가이드 폴리뉴클레오티드를 포함하는 최소 CRISPR 어레이 및 벡터는 둘 다 세포 또는 생화학적 반응 내로 도입될 수 있다. 2개의 캐스케이드 RNP 복합체를 사용하는 방법 (예를 들어, 핵산 표적 서열에 결합하는 방법 또는 핵산 표적 서열을 커팅하는 방법; 예를 들어, 도 15a, 도 15b, 도 15c 참조)에서, 최소 CRISPR 어레이는 2개의 상이한 가이드를 코딩할 수 있다. 따라서, 일부 실시양태에서 2개의 가이드 RNA는 상이할 수 있다 (예를 들어, 2개의 상이한 핵산 표적 서열을 표적화함). 단일 캐스케이드 RNP 복합체를 사용하는 방법에서 (예를 들어, mCas3 단백질과 연합된 하나의 유형 I CRISPR-Cas 이펙터 복합체, 또는 Cas3 융합 단백질이 복합체와 연합되는 유형 I CRISPR-Cas 이펙터 복합체를 사용하는 경우; 예를 들어, 도 16a, 17b, 17c, 도 21a, 도 21b, 도 21c, 도 21d 참조), 최소 CRISPR 어레이는 동일한 가이드 서열의 2개의 카피를 코딩할 수 있다. 따라서, 일부 실시양태에서, 2개의 가이드 RNA는 동일할 수 있다 (예를 들어, 동일한 핵산 표적 서열을 표적화함).
또한 또 다른 실시양태에서, 성숙한 가이드 RNA에 대한 crRNA 전구체의 엔도뉴클레아제성 프로세싱을 위해 Cas6 단백질에 의해 인식되는 서열 및 구조를 추가로 포함하는 가이드 서열을 코딩하는 폴리뉴클레오티드가 세포 또는 생화학적 반응 내로 도입될 수 있다. 다른 실시양태에서, 프로세싱을 필요로 하지 않는 성숙한 가이드 폴리뉴클레오티드가 캐스케이드 복합체의 어셈블리에 사용될 수 있다. 이러한 성숙한 가이드는 서열 변형 (예를 들어, RNase에 의한 것과 같은 뉴클레아제 소화로부터 가이드를 보호하는데 도움을 주기 위한 5' 및/또는 3' 단부에서의 포스포로티오에이트 연결)를 포함할 수 있다. 부가의 가이드 변형은 뉴클레오티드 서열에 대해 본원에 기재된 것들을 포함한다 (예를 들어, 뉴클레오티드 유사체 등).
실시예 9A, 실시예 9B, 실시예 9C, 및 실시예 9D는 인간 세포에서 게놈 편집을 용이하게 하기 위해 FokI 융합 단백질을 포함하는 이. 콜라이 유형 I-E 캐스케이드 복합체의 설계 및 전달을 예시한다. 실시예 9B는 캐스케이드 복합체 구성성분을 발현하는 플라스미드 벡터를 진핵 세포로 전달하는 것을 설명한다. 제5 측면에서, 본 발명은 세포로부터 조작된 유형 I CRISPR-Cas 이펙터 복합체의 정제 및 이러한 복합체의 용도에 관한 것이다. 조작된 유형 I CRISPR-Cas 이펙터 복합체는 숙주 세포에서 생산된다. 조작된 유형 I CRISPR-Cas 이펙터 복합체 (이러한 경우에, 캐스케이드 RNP 복합체)는 세포 용해물로부터 정제된다.
실시예 5A 및 실시예 5B는 실시예 4B에 기재된 바와 같이 박테리아에서의 과다발현에 의해 생산된 이. 콜라이 유형 I-E 캐스케이드 RNP 복합체의 정제를 설명한다. 이러한 방법은 고정화된 금속 친화성 크로마토그래피에 이어 크기 배제 크로마토그래피 (SEC)를 사용한다. 실시예 5A 및 실시예 5B는 정제된 캐스케이드 RNP 산물의 품질을 평가하는데 사용될 수 있는 방법을 설명한다. Cas8, Cas7, Cas6, Cas5 및 Cse2 캐스케이드 RNP 복합체, Cas7, Cas6, Cas5 및 Cse2 단백질을 포함하는 캐스케이드 복합체, 및 FokI-Cas8 융합 단백질의 정제를 예시하는 실시예가 제시된다.
정제되고 조작된 유형 I CRISPR-Cas 이펙터 복합체는 또한 생화학적 검정 (예를 들어, 결합 및/또는 절단 검정)에서 직접적으로 사용될 수 있다. 실시예 6A, 실시예 6B, 및 실시예 6C는 시험관내 DNA 결합 또는 절단 검정에 사용하기 위한 dsDNA 표적 서열의 생산을 설명한다. 실시예 6은 합성 ssDNA 올리고뉴클레오티드의 어닐링, gDNA로부터 선택된 핵산 표적 서열의 PCR 증폭 뿐만 아니라 박테리아 플라스미드로의 핵산 표적 서열의 클로닝을 포함한, 표적 서열을 생산하는 3가지 방법을 설명한다. dsDNA 표적 서열이 캐스케이드 결합 또는 절단 검정에 사용되었다.
하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체의 부위-특이적 결합 및/또는 이에 의한 커팅은 필요한 경우에, 전기영동 이동성 시프트 검정 (예를 들어, 문헌 [Garner, M., et al., Nucleic Acids Res. 9:3047-3060 (1981); Fried, M., et al., Nucleic Acids Res. 9:6505-6525 (1981); Fried, M., Electrophoresis 10:366-376 (1989); Fillebeen, C., et al., J. Vis. Exp. (94), e52230, doi:10.3791/52230 (2014)] 참조), 또는 실시예 7에 기재된 생화학적 절단 검정을 사용하여 확증될 수 있다.
실시예 7에 제시된 데이터는 조작된 유형 I CRISPR-Cas 이펙터 복합체가 슈퍼코일드 원형 플라스미드 기질을 절단된 선형 형태로 전환시킴으로써 입증된 바와 같이, 거의 정량적 DNA 절단을 나타낼 수 있음을 명확하게 보여준다. 조작된 유형 I CRISPR-Cas 이펙터 복합체 (예를 들어, FokI-캐스케이드 구성성분 융합 단백질을 포함함)로 강력한 생화학적 활성을 입증한 후, 세포에서 게놈 편집을 수행하였다.
실시예 8A, 실시예 8B, 실시예 8C, 및 실시예 8D는 Cas 서브유닛 단백질-FokI 융합 단백질을 포함하는 이. 콜라이 유형 I-E 캐스케이드 복합체의 설계 및 인간 세포로의 전달을 예시한다. 실시예 8D에서의 데이터는 미리 어셈블리된 캐스케이드 RNP의 표적 세포로의 전달과 인간 세포에서의 유효한 게놈 편집을 명확하게 보여준다.
정제되고 조작된 유형 I CRISPR-Cas 이펙터 복합체는 세포 내로 직접 도입될 수 있다. 구성성분을 세포 내로 도입하는 방법은 전기천공, 리포펙션, 입자 총 기술 및 미세발사체 충격을 포함한다.
도 36a, 도 36b, 도 36c, 및 도 36d는 조작된 캐스케이드-RNP 복합체, 및 조작된 유형 I CRISPR-Cas 복합체의 플라스미드-기반 전달을 사용하여 인간 세포에서 게놈 편집을 위한 비교 데이터를 제공한다. 도 36a-d에서, 도 36a, HEK293 세포를 정제된 RNP로 형질감염시킨 다음, 편집된 부위의 차세대 시퀀싱 (NGS) 분석을 수행하였다. 도 36a (RNP 형질감염)에 제시된 바와 같이, 2개의 인접한 로커스를 표적화하는 FokI-캐스케이드 RNP 복합체 (도 36a, 직선 위 도면의 좌측에 나타냄)를 HEK293 세포 (도 36a, 도면의 좌측에 별 모양, 회색)로 뉴클레오펙션하여 DNA 절단 및 게놈 편집을 유도하였다. 16개의 고유한 게놈 표적 부위 (실시예 6C, 표 31, 인간 이중 Hsa1-16 참조)에서의 편집 효율을 계산하였다 (n=1). TRAC는 T 세포 수용체의 불변 영역이다. T 세포 수용체가 생성될 때, 이는 스플라이스 연접부 (즉, "가변" 영역 및 "연결" 영역)을 포함한다. 본원에 기재된 TRAC 가이드 중 일부는 연결 영역 (예를 들어, TRAJ27)을 표적화한다. 각각의 표적에 대한 인터스페이서 거리는 그래프 아래에 제시된다 (도 36a, 좌측에서 우측으로, 25, 30, 35, 40, 45 염기 쌍 (bp)). 도 36a에서, 수직축은 퍼센트 편집 효율 (도 36a, 편집 효율 (%))이고, 수평축은 표적 1 내지 16을 나타내고, 수평축 아래는 염기 쌍 (bp) 단위의 인터스페이서 길이를 나타내는 각 괄호이다.
도 36b는 도 36a에서의 표적 7에 대한 대표적인 DNA 복구 결과를 제공한다. 도 36b에서, 쌍형성된 gRNA에 의해 표적화된 절반-부위의 상대적 위치는, 그와 연합된 PAM 부위와 함께 도면의 상단에 제시된다. 인터스페이서 거리는 맨 윗줄에 예시된다. 본 그래프에서, 예상 절단 부위 (도 36b, 수직 흑색 중간 선으로 표시된 위치 "0") 및 bp 거리 (-50 내지 50)가 상단에 표시된다. 각각의 수평 회색 선은 표적화된 로커스에서 관찰된 상이한 클래스의 서열 판독값을 나타낸다. 이들 선에 대한 인디케이터는 하기와 같다: 회색 영역=서열 매치; 수평 흑색 선=결실; 및 열린 박스=삽입. 원은 각각의 선별로 그래프의 우측에 위치한다: 흑색 원은 야생형 판독값이고; 열린 백색 원은 돌연변이체 판독값이다. 예상되는 야생형 판독값은 제1 회색 막대 ("Ref"; 즉, 참조 서열)로 예시된다. 야생형 판독값은 제2 회색 막대 (제2 회색 막대; 도 36b, 흑색 원)로 예시된다. 그 다음 11개 선은 돌연변이체 판독값을 예시한다 (도 36b, 열린 원). 염기 쌍의 수로 주어진 삽입 길이는 원의 우측 열에 제시된다. 판독값의 총 퍼센트는 우측 다음 열에 제시되고, 총 판독값은 우측 마지막 열에 제시된다.
도 36c (6-플라스미드 형질감염 시스템)에 제시된 바와 같이, HEK293 세포 (도 36c, 도면의 좌측에 별 모양, 회색)를 6개의 플라스미드로 형질감염시키고, Cas 단백질을 코딩하는 5개의 플라스미드 (도 36c, FokI-Cas8, Cas11, Cas7, Cas5, 및 Cas6으로서 표시된 플라스미드) 및 쌍형성된 gRNA를 코딩하는 하나의 플라스미드를 CMV 및 인간 U6 (hU6) 프로모터의 제어 하에 둔 다음 (도 36c, gRNA), 편집된 부위의 NGS 분석을 수행하였다. FokI-캐스케이드 RNP 복합체가 파선 아래에 예시된다. 도 36a로부터의 표적 7에서의 편집 효율을 계산하고 (n=2) (도 36a, 그래프의 흑색 막대), 단일 구성성분 (도 36c, 수평축 아래, -/+를 함유하는 회색 박스)이 결여된 플라스미드 혼합물이 대조군으로서 포함되었다 (도 36c, 그래프 내의 열린 막대).
도 36d (2-플라스미드 형질감염 시스템)에 제시된 바와 같이, HEK293 세포 (도 36d, 도면의 좌측에 별 모양, 회색)를 쌍형성된 gRNA 발현 플라스미드 (도 36d, gRNA 플라스미드) 및 T2A "리보솜 스키핑" 서열 펩티드에 의해 분리된 5개 모든 단백질을 코딩하는 폴리시스트론성 발현 플라스미드 (도 36d, CMV-Cas7-2A-Cas11-2A-Cas5-2A-Cas6-2A-FokI-Cas8)로 형질감염시킨 다음, 편집된 부위의 NGS 분석을 수행하였다. FokI-캐스케이드 RNP 복합체가 파선 아래에 예시된다. 도 36a에 제시된 16개 표적에서의 편집 효율을 2-플라스미드 시스템 형질감염 (도 36d, 열린 막대)과 도 37c로부터의 6-플라스미드 시스템 형질감염 (n=3) (도 36d, 흑색 막대) 둘 다에 대해 계산하였다. 도 36d에서, 수직축은 퍼센트 편집 효율 ("편집 효율 (%))이고, 수평축은 표적 1 내지 16을 나타내며, 수평축 아래에는 염기 쌍 (bp)의 인터스페이서 길이를 표시하는 각 괄호가 있다 (도 36d, 좌측에서 우측으로, 25, 30, 35, 40, 45 bp).
실험은 FokI 및 Cas6 상의 핵 국재화 시그널 서열을 함유하는 정제된 캐스케이드-RNP로 HEK293 세포를 뉴클레오펙션함으로써 수행되었다. gDNA로부터 수득된 PCR 앰플리콘의 차세대 시퀀싱에 의해 입증된 바와 같이, 최대 ~4% 편집 효율이 관찰되었으며, 시험된 16개의 표적 부위 중에서 편집은 전형적으로, 30 bp 인터스페이서 길이를 함유하는 부위에서 이루어졌다 (도 36a). 복구 결과의 스펙트럼을 면밀히 조사한 결과, 유형 I CRISPR-Cas 복합체의 설계와 일치하는 인터스페이서의 중간에 indel이 군집되어 있는 것으로 밝혀졌다 (도 36b). 따라서, 본 발명의 한 실시양태에서, 조작된 유형 I CRISPR-Cas 복합체는 세포 내로 직접 도입된다. 6-플라스미드 전달 실험 (도 36c)을 위해, 하나를 제외하고 각각의 플라스미드 420 ng를 함유하는 플라스미드 혼합물을 어셈블리한 다음, 음성 대조군으로서 물 또는 누락된 플라스미드 700 ng를 뉴클레오펙션 후에 다시 부가하였다. 초기 FokI-Eco캐스케이드 폴리시스트론성 2-플라스미드 전달 실험 (도 36d)을 위해, 세포를 각각의 플라스미드 500 ng 또는 쌍형성된 gRNA 발현 플라스미드 500 ng 및 폴리시스트론성 플라스미드 2.5 μg (각각의 조건에 대해 총 3 μg)으로 전기천공하였다. 한 실시양태에서, 5개의 cas 유전자 모두는 T2A "리보솜 스키핑" 서열에 의해 직렬로 연결된 단일 폴리시스트론성 발현 벡터 (도 36d)로 구축되었다 (예를 들어, 문헌 [Kim, J., et al., PLoS ONE 6, e18556 (2011); Liu, Z., et al., Sci. Rep. 7:2193 (2017)] 참조). 놀랍게도, 폴리시스트론성 플라스미드 및 쌍형성된 gRNA 발현 플라스미드를 사용한 공동-형질감염은 6-플라스미드 방법 (실시예 9A)과 직접 RNP 전달 방법 (실시예 8A, 실시예 8B, 실시예 8C, 실시예 8D) 둘 다를 이용한 경우에 관찰된 것들과 유사한 편집 효율 및 DNA 복구 결과를 초래하였으며, 이는 생화학적으로 활성인 조작된 유형 I CRISPR-Cas 이펙터 복합체가 어셈블리되고 인간 세포의 핵에 트래피킹된다는 결론을 뒷받침한다. 집합적으로, 이들 실험은 광범위하게 사용되는 Cas9 및 sgRNA 플라스미드와 크기가 유사한 단 2개의 분자 구성성분으로 진핵 세포에서 정교한 11-서브유닛 RNA-가이드된 뉴클레아제를 재구성하기 위한 매우 단순화된 발현 시스템을 검증하였다.
조작된 유형 I CRISPR-Cas 복합체 (이. 콜라이 (Eco캐스케이드, 슈도모나스 종 S-6-2 (Pse캐스케이드), 및 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) (Sth캐스케이드))에 대한 데이터는, 대부분의 표적 부위가 절반-부위 둘 다, 필수 인터스페이서 거리 및 허용 PAM를 포함해야만 하기 때문에 고유할 것임을 암시하였다. 보다 상세한 특징규명을 위해 Eco캐스케이드, Pse캐스케이드, 및 Sth캐스케이드로부터의 조작된 캐스케이드 상동체가 선택되었다.
도 37a, 도 37b, 도 37c, 및 도 37d는 FokI 링커, 인터스페이서 길이, 및 캐스케이드 상동체와 관련된 바와 같은 편집 효율을 예시한다. 도 37a에서, FokI-Eco캐스케이드 편집 효율은 FokI-Cas8 링커 길이 (도 37a, 열린 원, 낮은 선 10 aa; 열린 원 위쪽 그래프 선, 20 aa; 흑색 원, 17 aa; 및 회색 원, 30 aa 링커 길이) 및 인터스페이서 거리의 함수로서 제시된다. 도 37a에서, 수직축은 편집 효율 (%)이고, 수평축은 인터스페이서 거리 (bp)이다. 각각의 데이터 점은 3-4개의 고유한 표적 부위의 평균을 나타낸다.
도 37b는 30-aa 링커와 함께 FokI-캐스케이드 뉴클레아제를 제공한다. FokI-Cas8 링커는 12개의 유형 I-E 캐스케이드 변이체에 대해 생성되었으며 4-7개의 표적 부위에서 게놈 편집을 관하여 시험되었다. 각각의 데이터 점은 단일 게놈 부위를 나타내고, 막대는 부위 전체의 평균 및 표준 편차 (s.d.)를 표시한다. 표적은 AAG (도 37b, 회색 막대) 또는 GAA (도 37b, 백색 막대) PAM 서열 및 30 bp 인터스페이서 거리를 함유하였으며, 여기서 수평축 상에 있는 종은 하기와 같다: Eco, 이. 콜라이; Pse, 슈도모나스 종 S-6-2; Sen, 살모넬라 엔테리카; Geo, 게오써모박터 종 EPR-M; Mar, 메타노셀라 아르보리자에; Ahe, 아틀란티박터 헤르만니이(Atlantibacter hermannii); Oce, 오세아니콜라(Oceanicola) 종 HL-35; Pae, 슈도모나스 아에루기노사(Pseudomonas aeruginosa); Sth, 스트렙토코쿠스 써모필루스; Str, 스트렙토미세스(Streptomyces) 종 S4; Kpn, 클레브시엘라 뉴모니아에(Klebsiella pneumoniae); Lba, 라크노스피라세아에 박테리움(Lachnospiraceae bacterium).
도 37c에서, FokI-Pse캐스케이드 데이터가 제시되며, 여기서 수직축은 퍼센트 편집 효율 (도 37c, 편집 효율 (%))이고, 수평축은 염기 쌍 (bp)의 인터스페이서 길이를 나타낸다. FokI-Cas8 링커 길이는 17개 아미노산이다. 각각의 데이터 점은 단일 게놈 부위를 나타내고, 막대는 7-8개 부위 전체의 평균 및 s.d.를 나타낸다.
도 37d는 PAM 서열의 함수로서의 FokI-Pse캐스케이드 편집 효율에 대한 데이터를 제공하며, 수직축은 퍼센트 편집 효율 (도 37d, 편집 효율 (%))이고, 수평축은 PAM 서열 (도 37d, 좌측에서 우측으로, CCG, CGC, AAG, AAA, ATG, AAC, AGG, ATA, GAG, 및 AAT)에 상응한다. 게놈 부위는 수평축 상에 제시된 바와 같이, 하나의 AAG PAM 및 제2 절반-부위에서의 가변 PAM을 함유하였다. 각각의 데이터 점은 단일 게놈 부위를 나타내고, 막대는 6-15개 부위 전체의 평균 및 s.d.를 나타낸다.
도 37e는 PAM 서열의 함수로서의 FokI-Eco캐스케이드 편집 효율 (도 37e, 수직축, 편집 효율 (%))에 대한 데이터를 제공한다. 표적 부위는 수평축 상에 제시된 바와 같이, 고정된 AAG PAM 및 제2 절반-부위에서의 가변 PAM을 함유하였다 (도 37e, 좌측에서 우측으로, CCG, CGC, AAG, AGG, ATG, GAG, AAA, AAC, ATA, 및 AAT). 각각의 점은 HEK293 세포 내의 단일 표적 부위를 나타내고, PAM당 6-15개의 부위가 시험되었다 (부위당 n=1). 막대 그래프는 평균 및 s.d.를 표시한다.
도 37f는 PAM 서열의 함수로서의 FokI-Sth캐스케이드 효율 (도 37f, 수직축, 편집 효율 (%))에 대한 데이터를 제공한다. 표적 부위는 수평축 상에 제시된 바와 같이, 고정된 GAA PAM 및 제2 절반-부위에서의 가변 PAM을 함유하였다 (도 37f, 좌측에서 우측으로, CC, AA, GA, TA, 및 CA). 각각의 점은 HEK293 세포 내의 단일 표적 부위를 나타내고, PAM당 18-33개의 부위가 시험되었다 (부위당 n=1). 막대 그래프는 평균 및 s.d.를 표시한다.
도 37g는 도 37c 및 도 37d로부터의 높은 편집 효율 (10-53%)을 나타내는 40개 게놈 부위에 대한 indel 클래스 빈도를 도시하는 히트 맵을 제공한다. 0-60의 퍼센트 편집 효율이 상단 패널의 막대 그래프에 제시된다. 1-8 bp의 삽입 길이는 중간 패널에 제시된 히트 맵에 제시되고, 1-50 bp의 결실 길이는 하단 패널의 히트 맵에 제시된다. 40개의 게놈 표적 부위 (도 37g, 표적)는 수평축에 표시된다 (1-40). 단일 bp 삽입은 뉴클레오티드 동일성에 의해 분리되고, 도면 하단의 회색 스케일 강도 등급은 삽입 빈도 백분율 (도 37g, Ins Freq (%), 스케일은 0 내지 20 이상임) 및 결실 빈도 백분율 (도 37g, Del Freq (%), 스케일은 0 내지 20 이상임)에 상응한다. 우측으로의 막대 그래프는 각각의 indel 클래스의 평균 빈도 (도 37g, 스케일은 0 내지 20임)를 표시한다. 우측으로의 파이 차트는, 절단 부위에 인접한 서열의 중복을 함유하는 것으로서 정의된 추정상의 주형 복구로부터 비롯되는 2-4 bp 삽입 분획을 보여준다 (도 37g, 파이 차트의 흑색 영역). "다른" 것은 파이 차트의 회색 영역으로 나타낸다.
가장 고도로 편집된 5개의 FokI-Pse캐스케이드 표적 부위에 대해 인간 게놈에서의 가장 밀접하게 관련된 부위 (~20-48% 편집)를 조사했으며, 이는 30-33 bp 인터스페이서 요구 사항에 의해서만 제한되었다. 5개 모든 표적 전체에 걸쳐, 절반-부위 둘 다의 전체에서 <22 미스매치인 부위가 확인되지 않았다. FokI-Eco캐스케이드 FokI-Cas8 링커 유형 및 인터스페이서 거리 실험 (도 37a)을 위해, 세포를 2.4 μg의 FokI-Eco캐스케이드 폴리시스트론성 플라스미드 및 ~0.5-3.5 μg의 쌍형성된 gRNA 발현 플라스미드로 뉴클레오펙션하였다.
FokI-캐스케이드 상동체 스크린 (도 37b)을 위해, 세포를 1.5 μg의 FokI-캐스케이드 폴리시스트론성 플라스미드 및 ~0.4-2.2 μg의 쌍형성된 gRNA 발현 플라스미드로 뉴클레오펙션하였다. 상동체 전체에 걸쳐, 4-7개 부위를 표적화하였고, FokI-Eco캐스케이드와 높은 편집 효율을 나타낸 부위를 선택하였다. 상동체 변이체 FokI-Cas8 링커 유형 및 인터스페이서 거리 편집 실험 (도 37c 및 도 41a 내지 도 41c)을 위해, 세포를 5 μg의 폴리시스트론성 플라스미드 및 ~100-400 ng의 올리고-주형화 쌍형성된 gRNA 발현 앰플리콘으로 뉴클레오펙션하였다. 이러한 실험을 위해, gRNA 농도는 웰 또는 상동체 변이체 전체에 걸쳐 정규화되지 않았다. 부가적으로, 도 41a 내지 도 41c의 경우에는, 세포를 FokI-Eco캐스케이드 또는 FokI-Sth캐스케이드 gRNA보다 평균 ~1.5배 더 많은 FokI-Pse캐스케이드 gRNA로 뉴클레오펙션하였다.
올리고-주형화 PCR 증폭이 본원에 기재된다 (예를 들어, 실시예 20A). 포유동물 세포에서 인간 U6 (hU6) 프로모터 (도 42a, 420)로부터 쌍형성된 gRNA 발현을 위한 앰플리콘을 생성하기 위한 올리고-주형화 PCR 전략이 도 42a 및 도 42b에 예시되어 있다. 간략하게, 역 내부 올리고뉴클레오티드 (도 42a, 424)는 두 gRNA 서열을 코딩하고 새로운 표적 부위에 대해 변형되는 반면 ("반복부-스페이서-반복부-스페이서-반복부" 서열을 코딩하는 고유한 프라이머로서 지칭되기도 함) (도 42a, 421: 반복부, 열린 직사각형; 스페이서 1, 회색 직사각형; 반복부, 열린 직사각형; 스페이서 2, 회색 직사각형; 반복부, 열린 직사각형), 나머지 프라이머는 불변체이다 (도 42a: 정방향 외부 프라이머, 422; 정방향 내부 프라이머, 423; 역방향 외부 프라이머, 425). HEK293 세포를 FokI Eco캐스케이드 RNP 복합체를 코딩하는 폴리시스트론성 플라스미드 및 쌍형성된 gRNA 발현 플라스미드 또는 쌍형성된 gRNA 발현 앰플리콘으로 공동-형질감염시킨 후 표적 7 (도 36b 참조)에서의 편집 효율이 도 42b에 제시되어 있다. 도 42b에서, 수직축은 편집 효율 (%)이고 수평축은 쌍형성된 gRNA 카세트 (ng)이다. 데이터 점은 하기와 같다: 각각 FokI-Eco캐스케이드 RNP 복합체 (ng), 쌍형성된 gRNA 플라스미드, 쌍형성된 gRNA 앰플리콘; 375, 열린 삼각형, 열린 원; 750, 흑색 삼각형, 흑색 원; 1,500, 회색 삼각형, 회색 원; 3,000, 백색 줄이 있는 흑색 삼각형, 백색 줄이 있는 흑색 원. 도 42b에서의 데이터는 쌍형성된 gRNA 발현 플라스미드에 비해 쌍형성된 gRNA 발현 앰플리콘 대한 편집 효율이 더 높지 않다면, 거의 동등한 수준이라는 것을 명확하게 보여준다.
PAM 스크린 (도 37d, 도 37e, 도 37f, 도 39a 내지 도 39d, 도 40c 및 도 40f)을 위해, 전형적으로, 세포를 3 μg의 FokI-캐스케이드 폴리시스트론성 플라스미드 및 150 ng (FokI-Pse캐스케이드 및 FokI-Eco캐스케이드) 또는 ~80-120 ng (FokI-Sth캐스케이드)의 올리고-주형화 쌍형성된 gRNA 발현 앰플리콘 (달리 표시되지 않는 한)으로 뉴클레오펙션하였다.
특이성 분석 (도 38a 내지 도 38c)을 위해, 세포를 3 μg의 폴리시스트론성 캐스케이드 및 150 ng의 올리고-주형화 쌍형성된 gRNA 발현 앰플리콘으로 뉴클레오펙션하고, 뉴클레오펙션 후 5일에 수거하였다. 도 38a의 상단에서, 수평선은 인터스페이서 거리를 나타내고, 가위는 예상 커트 부위를 나타내며, 게놈 표적의 절반-부위는 그의 상응하는 PAM 영역과 함께 표시된다 (도 38a, 대조적인 단부가 있는 직사각형 박스). 예시된 절반-부위와 표적의 관계는 파선으로 표시된다. 각각의 표적에 대해 32개의 염기 쌍이 예시되고 PAM 영역은 시드 서열에 인접하게 표시된다. 도 38a는 그리드에서 채워진 박스 (PAM 부위 제외)로 표시된 바와 같이, 게놈 표적 내의 하나 또는 둘 다의 절반-부위에 대한 미스매치를 함유하도록 설계된 쌍형성된 gRNA를 제공한다. 단순화를 위해 절반-부위 둘 다가 동일한 방향으로 표시된다는 것에 주목해야 한다. 도 38b는 완벽하게 매칭하는 gRNA에 대한 편집 효율의 백분율로서 플로팅된 미스매치된 쌍형성된 gRNA의 각각의 조합에 대해 게놈 표적 70에서의 상대적 편집 효율을 제공한다. 도 38b에서, 상부 라인은 표적 (도 38b, 표적 70)을 표시하고, 다음 라인은 가이드 (도 38b, gRNA1 및 gRNA2)를 나타내며, 다음 라인은 미스매치된 세트 (도 38b, mm 세트 1 및 mm 세트 2)를 확인하고, 다음 라인은 FokI-캐스케이드 RNP 복합체를 예시한다. 좌측 열은 가이드 1-mm 세트 1/가이드 2-mm 세트 2의 상대적 편집 효율에 대한 데이터를 제시하고, 우측 열은 가이드 1-mm 세트 2/가이드 2-mm 세트 1의 상대적 편집 효율에 대한 데이터를 제시하며, 두 열의 데이터는 상대적 편집 효율 퍼센트 (도 38b 상대적 편집 효율 (%), 스케일 0-100)를 제시하는데, 즉 좌측 열은 미스매치된 (mm) 세트 1 및 2를 갖는 gRNA1 및 gRNA2에 대한 데이터를 나타내고, 우측 열은 동일한 표적에 대한 데이터를 나타내지만 gRNA1과 gRNA2 사이에 미스매치된 (mm) 세트를 교환하였다 (n=1). 도 38c는 도 38b에 표시된 바와 같이, 표적 73에서의 편집 효율을 제공한다 (n=1).
노동 집약적인 클로닝 단계의 필요성을 제거시킨, 올리고-주형화 PCR 증폭 (본원에 기재된 바와 같음)에 의해 쌍형성된 gRNA 발현 카세트를 생성하는 확장가능한 방법을 개발한 후, FokI 링커 및 DNA 인터스페이서 길이를 96개의 게놈 표적 부위 패널 전체에 걸쳐 각각의 상동체 변이체에 대하여 재스크리닝하였다. 17-aa 링커를 사용하여, FokI-Pse캐스케이드는 대략 30-33 bp 인터스페이서 창 내에서 평균적으로 ~15-25%의 편집 효율을 일관되게 산출했으며, 일부 표적은 ~40-50% 이하의 indel을 나타냈다 (도 37c). 다른 상동체에서도 유사한 경향이 관찰되었다. PAM 요구 사항은 하나의 동족 PAM과 제2 돌연변이된 PAM이 정착된 게놈 부위를 표적화함으로써 조사되었다. PAM 인식은 시험관내에서 엄격한 5'-GG-3' 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) (에스. 피오게네스(S. pyogenes)) PAM 요구 사항보다 훨씬 더 난잡한 것으로 나타났다 (예를 들어, 문헌 [Szczelkun, M., et al., Proc. Natl. Acad. Sci. USA 111:9798-9803 (2014); Hayes, R., et al., Nature 530:499-503 (2016); Westra, E., et al., Mol. Cell. 46:595-605 (2012); Fineran, P., et al., Proc. Natl. Acad. Sci. USA 111:E1629-E1638 (2014); Leenay, R., et al., Mol. Cell. 62:137-147 (2016)] 참조). 놀랍게도 시험관내 데이터는 많은 수의 PAM이 활성에 대해 실제로 허용되었다는 것을 입증해 주었으며, 명확한 순위 선호도가 최근에 만들어졌다 (도 37d; 도 39a 내지 도 39d). 대조적으로, 돌연변이된 PAM이 CRISPR 어레이로부터의 "자기" 표적을 나타내면, 편집이 완전히 폐지되었다.
도 39a 내지 도 39d 각각에서, 수직축은 편집 효율 (편집 효율 (%))에 상응하고, 수평축은 표적과 연합된 PAM 서열에 상응한다. 도 39a는 PAM 서열의 함수로서 FokI-Pse캐스케이드 편집 효율을 제공한다. 게놈 부위는 수평축 상에 제시된 바와 같이, 하나의 고정된 ATG PAM과 제2 절반-부위에서의 가변 PAM을 함유하였다. 막대는 평균 및 s.d.를 나타낸다. (가변 PAM당 6-14개 부위, 표적 부위당 n=1). 도 37d는 하나의 PAM이 AAG에 고정되고 다른 PAM이 ATG를 포함한 PAM 세트에 걸쳐 가변적인 FokI-Pse캐스케이드에 대한 데이터를 설명한다는 것에 주목해야 한다. 따라서, 이러한 PAM의 서브세트는 AAG-ATG이다. 도 39a는 하나의 PAM이 ATG에 고정되고 다른 PAM이 AAG를 포함한 PAM 세트 전체에 걸쳐 가변적인 FokI-Pse캐스케이드에 대한 데이터를 설명한다 (도 39a, 수평축, 좌측에서 우측으로, AAG, AAC, AAA, ATG, GAG, ATA, AAT, 및 AGG). 따라서, 이들 PAM의 서브세트는 또한 AAG-ATG이고, 도 37d에서 동일한 AAG-ATG 부위이다.
도 39b는 PAM 서열 (도 39b, 수평축, 좌측에서 우측으로, CCG, CGC, AAG, AGG, ATG, GAG, AAA, AAC, ATA, 및 AAT)의 함수로서 FokI-Eco캐스케이드 편집을 제공한다. 고정된 PAM은 AAG이고, 막대는 평균 및 s.d.를 나타낸다 (가변 PAM당 6-15개 부위, 표적 부위당 n=1). 도 39c (도 39c, 수평축, 좌측에서 우측으로, AAG, ATG, AAC, AAA, AGG, GAG, AAT, 및 ATA)는 도 39b에 제시된 것과 유사한 결과를 제공하지만, 제1 PAM이 ATG로 고정되었다 (가변 PAM당 6-14개 부위, 표적 부위당 n=1). AAG-ATG 쌍 (평균 ~3)에 상응하는 도 39b에서의 ATG 열은 AAG-ATG 쌍 (평균 ~3)에 상응하는 도 39c에서의 AAG 열과 동일하다. 수직축은 상이한 스케일의 것임에 주목해야 한다. 도 39d는 PAM 서열의 함수로서 FokI-Sth캐스케이드 편집을 제공한다 (도 39d, 수평축, 좌측에서 우측, CC, AA, GA, TA 및 CA). 고정된 PAM은 GAA이고 막대는 평균 및 s.d.를 나타낸다 (가변 PAM당 18-33개 부위, 표적 부위당 n=1).
도 40a, 도 40b, 도 40c, 도 40d, 도 40e, 및 도 40f는 조작된 유형 I CRISPR-Cas 복합체의 편집 효율에 있어서의 예시적인 변화와 관련된 데이터를 제시한다. 백분율 편집 효율 (수직축) 대 인터스페이서 거리 (bp) (수평축)에 대한 도 40a (FokI-Pse캐스케이드) 및 도 40d (FokI-Sth캐스케이드)에 제시된 데이터는 도 41a 및 도 41c에 제시된 데이터에 대하여 본질적으로 실시예 20C에 기재된 바와 같이 수득되었다. 도 40a 및 도 40d에서, 수평축은 23-34 bp 인터스페이서 거리를 나타내고, 그래프의 막대는 좌측에서 우측으로, 17 aa (연한 회색 막대), 20개 아미노산 (진한 회색 막대) 및 30 aa (백색 막대)의 FokI-Cas8 폴리펩티드 링커 길이이다. 도 40c 및 도 40f에 제시된 데이터는 본질적으로 도 39b에 대해 기재된 바와 같이 수득되었다. 도 40c 및 도 40f는 PAM 서열 (도 40c, 좌측에서 우측으로, CCG, CGC, AAG, AAA, ATG, AAC, AGG, ATA, GAG, 및 AAT; 도 40f, 좌측에서 우측으로, CC, AA, GA, TA, 및 CA)의 함수로서 FokI-Pse캐스케이드 및 FokI-Sth캐스케이드 편집 (도 40c, 도 40f, 수직축, 편집 효율 (%))을 제공한다. 도 40b는 FokI-Pse캐스케이드 RNP 복합체를 예시한다. FokI-Pse캐스케이드에 대한 고정된 PAM은 AAG (도 40b, AAG PAM)이고, 다른 PAM은 PAM의 세트 전체에 걸쳐 가변적이다 (도 40b, 가변 PAM). 도 40e는 FokI-Sth캐스케이드 RNP 복합체를 예시한다. FokI-Sth캐스케이드에 대한 고정된 PAM은 GAA (도 40b, GAA PAM)이고, 다른 PAM은 PAM의 세트 전체에 걸쳐 가변적이다 (도 40e, 가변 PAM). FokI-Pse캐스케이드는 링커 및 인터스페이서 선호도에 관하여 재스크리닝되었고, 그 데이터는 거의 50% 편집을 명화하게 보여주었다. PAM 선호도를 또한 조사하였다. 이러한 데이터로부터, PAM의 시험관내 순위 선호도를 결정하였다. 스트렙토코쿠스 써모필루스로부터의 변이체에 대하여 본질적으로 동일한 분석을 수행하였다. 편집은 에스. 써모필루스 시스템에서 더 낮았다. 그러나, 본원에 제시된 데이터는 생체내 인간 세포에서, 에스. 써모필루스 시스템에 대한 PAM 선호도가 매우 난잡하다는 것을 입증한다. 프로토스페이서 (즉, 표적 서열)의 단일 A 상류가 편집에 허용되었다는 사실은 일반적으로, (예를 들어, 동일한 유전자 내의 잠재적 클래스 2 유형 II CRISPR-Cas9 PAM-연합된 표적 부위의 수에 비해) 유전자 내의 잠재적 표적 서열의 증가된 수를 제공한다. 더욱이, 본원에 제시된 생체내 데이터는 문헌 [Sinkunas, T., et al., EMBO J. 32:385-394 (2013)]에 의해 입증된 시험관내 PAM 선호도와 상관이 있다.
수백 개의 편집된 게놈 부위 전체에 걸친 NGS 데이터의 축적은 FokI-Pse캐스케이드에 의해 도입된 DSB의 DNA 복구 결과의 특징규명할 수 있는 능력을 제공하였다. indel 빈도가 >10%인 40개의 고유한 부위에 초점을 맞추어, 결실 및 삽입의 빈도를, 예측된 절단 부위를 둘러싼 50 bp 창 내에서 총 돌연변이체 판독값의 함수로서 분석하였다. 2-4 bp의 삽입은 고도로 강화되었고, 조사된 대부분의 부위에 존재하였다 (도 37e). 상세한 검사는 이러한 삽입의 ~90%가 절단 부위에 인접한 서열의 완벽한 복제를 함유하였다는 것을 보여주었다. 임의의 특별한 이론에 의해 제한되는 것을 원하지는 않지만, 이러한 중복은 이량체성 FokI에 의해 도입된 엇갈린 커트의 주형 복구의 결과일 수 있다.
FokI-Pse캐스케이드의 특이성은 미스매치된 쌍형성된 gRNA의 광범위한 패널을 사용하여 2개의 고 효율 표적 부위를 편집함으로써 평가되었다 (도 38a). 캐스케이드에 대한 이전 연구에서는 ~8-nt PAM-근위 시드 서열 뿐만 아니라 32-nt 가이드 gRNA 내의 모든 6번째 위치에서의 미스매치 무차별성이 강조되었는데, 이는 이들 염기가 표적 결합 시 형성된 RNA-DNA 헤테로듀플렉스 구조로부터 뒤집히기 때문이다 (예를 들어, 문헌 [Jung, C., et al., Cell 170:35-47 (2017); Mulepati, S., et al., Science 345:1479-1484 (2014); Fineran, P., et al., Proc. Natl. Acad. Sci. USA 111:E1629-E1638 (2014); Semenova, E., et al., Proc. Natl. Acad. Sci. USA 108:10098-10103 (2011)] 참조). PAM-근위 시드 영역 내의 미스매치는 게놈 편집에 매우 해로운 반면, PAM으로부터 멀리 떨어진 미스매치는 잘 관용되어, 거의 야생형 편집 효율로 이어졌다 (도 38b; 도 38c). 그러나, 미스매치의 블록이 절반-부위 둘 다에 존재할 때, 편집은 시험된 쌍형성된 gRNA의 전체 패널에 걸쳐 현저하게 떨어졌다 (도 38b, 도 38c). FokI-Pse캐스케이드-매개된 게놈 편집의 PAM 데이터 및 인터스페이서 데이터 (도 38c; 도 37d)를 기반으로 하여, 본 발명의 조작된 유형 I CRISPR-Cas 복합체의 한 가지 이점은 표적화가능한 부위가 인간 게놈에서 ~20 내지 ~30 bp마다 발생할 수 있는 반면, 잠재적인 표적-이탈 부위에서의 편집은 거의 불가능하다는 것이다.
따라서, 본 발명의 한 실시양태에서, 주어진 조작된 FokI-캐스케이드 시스템의 잠재적인 표적화가능한 부위, 또는 "표적 밀도"는 효율적인 인터스페이스 거리 및 PAM 선호도의 함수이며, 상동체 전반에 걸쳐 약간의 가변성을 가질 것이다. 일부 실시양태에서, FokI-Pse캐스케이드, FokI-Eco캐스케이드, 및 FokI-Sth캐스케이드에 대한 인간 게놈에서의 표적 밀도를 계산하기 위해 하기 기준을 사용할 수 있다 (데이터는 예측된 표적 밀도를 계산하기 위해 외삽되었음).
FokI-Pse캐스케이드, 표적 밀도는 하기 모티프를 사용하여 계산될 수 있다:
5'-[절반-부위1-PAM1]-[인터스페이서]-[PAM2-절반-부위2]-3'.
여기서 [절반-부위1-PAM1]은 절반-부위1 gRNA1 표적 가닥 표적 서열 및 PAM의 역 보체를 나타내고, [절반-부위2-PAM2]는 절반-부위2 gRNA2 비-표적 가닥 PAM 및 표적 서열을 나타낸다. FokI-Pse캐스케이드를 사용한 편집을 지원하는 인터스페이서 길이의 분포를 기반으로 한 (예를 들어, 도 37d 참조), 효율적인 인터스페이서 길이는 약 30-33 bp이다. PAM은 가장 높은 편집을 제공하는 세트 1 (AAG, AAA, ATG, AAC) 또는 활성을 보인 시험된 PAM 중 임의의 것 (AAG, AGG, ATG, GAG, AAA, AAC, AAT, ATA)이 함유된 경우에 세트 2에 속하는 것으로서 정의되었다 (예를 들어, 도 39a; 도 40b 참조). 이로부터, 세트 1 또는 세트 2에 속하는 2개의 PAM으로 선호되는 인터스페이서 길이 기준을 충족하는 잠재적 표적 부위는 각각 평균 33.4 bp 또는 9.2 bp마다 발생될 것이다.
FokI-Eco캐스케이드에 대한 표적 밀도는 인터스페이서 길이가 31-33으로서 정의된 것을 제외하고 유사하게 결정되었고, PAM은 가장 높은 편집을 제공하는 세트 1 (AAG, AGG, ATG, GAG, AAA) 또는 활성을 보인 시험된 PAM 중 임의의 것 (AAG, AGG, ATG, GAG, AAA, AAC, AAT, ATA)이 함유된 경우에 세트 2에 속하는 것으로서 정의되었다 (예를 들어, 도 39c; 도 39d 참조). 이로부터, 잠재적 표적 부위는 각각 평균 30.4 bp 또는 12.2 bp마다 발생하는 세트 1 PAM 또는 세트 2 PAM으로 계산되었다.
FokI-Sth캐스케이드에 대한 인간 게놈 표적 밀도는, 인터스페이서 길이가 29-31 bp로서 정의된 것을 제외하고는 유사하게 결정되었고, PAM은 NNA로서 결정되었다 (예를 들어, 도 39d 참조). 이로부터, 잠재적 표적 부위는 평균 4 bp마다 발생하도록 계산되었다.
따라서, 본원에 기재된 바와 같은, 조작된 유형 I CRISPR-Cas 복합체는 게놈 편집에 이용가능한 다수의 PAM 인접한 표적 서열을 제공함으로써 다양한 잠재적 표적 부위를 제공하는 방법을 제공한다. 따라서, 본 발명의 한 실시양태는 (예를 들어, 클래스 2 CRISPR-Cas 유형 II 또는 유형 V 시스템의 PAM 서열과 연합된 이용가능한 표적 서열의 수에 비해) 유전자 내에 증가된 수의 이용가능한 표적 서열을 제공하기 위해 조작된 유형 I CRISPR-Cas 복합체와 연합된 PAM 서열을 사용하는 방법에 관한 것이다. 이러한 방법의 적용은 표적 서열에의 결합 및/또는 그의 절단, 표적 서열의 돌연변이, 표적 서열 또는 그의 조절 요소와 관련된 전사 조절 뿐만 아니라 본원에 기재된 조작된 유형 I CRISPR-Cas 복합체의 사용에 의해 매개되는 (예를 들어, 유전자의 산물에서의) 의도적 변형, 변화 및/또는 현저하게 상이한 구조적 변화를 포함할 수 있으나, 이에 제한되지는 않는 조작된 유형 I CRISPR-Cas 복합체의 용도에 관한 것이다.
일부 실시양태에서, 본원에 기재된 조작된 유형 I CRISPR-Cas 이펙터 복합체는 gDNA의 변형, 변화 및/또는 돌연변이를 생성하기 위해 게놈 내의 DNA 표적 로커스에 선택된 폴리뉴클레오티드 서열 (예를 들어, 공여자 폴리뉴클레오티드의 일부분)을 부위 특이적으로 도입함으로써 비-인간 트랜스제닉 유기체를 생성하기 위해 사용될 수 있다. 트랜스제닉 유기체는 동물 또는 식물일 수 있다.
트랜스제닉 동물은 전형적으로, 조작된 유형 I CRISPR-Cas 이펙터 복합체를 접합자 세포 내로 도입함으로써 생성된다. 트랜스제닉 마우스를 만드는 것과 관련하여 기재된 기본 기술 (예를 들어, 문헌 [Cho, A., et al., "Generation of Transgenic Mice," Current Protocols in Cell Biology, CHAPTER.Unit-19.11 (2009)] 참조)은 5가지 기본 단계를 포함한다: 첫째, 적합한 공여자 폴리뉴클레오티드를 포함한, 본원에 기재된 바와 같은 시스템의 제조; 둘째, 공여자 접합자를 수거하는 것; 셋째, 마우스 접합자로의 시스템의 미세주사; 넷째, 거짓 임신 수용자 마우스 내로의 미세주사된 접합자의 체내 이식; 다섯째, 창시 마우스에서 확립된 gDNA의 유전자형 분석 및 변형 분석을 수행하는 것. 창시 마우스는 유전적 변형을 임의의 자손에게 물려줄 것이다. 창시 마우스는 전형적으로 트랜스진에 대해 이형 접합성이다. 이들 마우스 사이의 교배는 그 시간에 트랜스진 25%에 대해 동형 접합성인 마우스를 생산할 것이다.
트랜스제닉 식물을 생성하는 방법이 또한 널리 공지되어 있으며, 조작된 유형 I CRISPR-Cas 이펙터 복합체를 사용하여 적용할 수 있다. 예를 들어, 아그로박테리움-매개된 형질전환을 사용하여 생성된 트랜스제닉 식물은 전형적으로, 하나의 염색체 내로 삽입된 하나의 트랜스진을 함유한다. 단일 트랜스진을 함유하는 독립적인 분리 개체 트랜스제닉 식물을 그 자체와 성적으로 교배 (즉, 자가 수정)함으로써 트랜스진에 대해 동형 접합성인 트랜스제닉 식물을 생산할 수 있다. 전형적인 접합성 검정은 단일 뉴클레오티드 다형성 검정 및 동형 접합자와 이형 접합자를 구별하는 열 증폭 검정을 포함하나 이에 제한되지는 않는다.
제6 측면에서, 본 발명은 기질 채널을 창출하기 위해 조작된 유형 I CRISPR-Cas 이펙터 복합체를 사용하는 것에 관한 것이다. 일부 실시양태에서, 기질 채널 요소 및 Cas7 서브유닛 단백질을 포함하는 융합 단백질을 구축한다. 이어서, 이들 Cas7 융합 단백질은 조작된 유형 I CRISPR-Cas 이펙터 복합체 (예를 들어, Cse2, Cas5, Cas6, Cas7-기질 채널 요소 융합물, 및 Cas8을 포함함)로 어셈블리된다. 일부 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체의 crRNA는 부가의 Cas7 서브유닛을 수용하도록 연장될 수 있다 (예를 들어, 문헌 [Luo, M., et al., Nucleic Acids Res. 44:7385-7394 (2016)] 참조). 상이한 기질 요소를 Cas7과 융합한 다음, 원하는 화학량론으로 혼합할 수 있다. 이러한 다양한 Cas7 서브유닛이 완전한 유형 I CRISPR-Cas 이펙터 복합체로 어셈블리될 때, 기질 요소의 공동-국 재화는 기질 채널링의 효율을 증강시킬 수 있다.
일부 실시양태에서, RNA 스캐폴드는 다수의 Cas7-기질 채널 요소 융합이 다른 유형 I CRISPR-Cas 이펙터 복합체 구성성분의 부재 하에 이에 결합할 수 있도록 구축된다.
기질 채널 요소는 Cas7의 N-말단 및/또는 Cas7의 C-말단과 융합될 수 있다. 또한, Cas7의 순환 순열이 기질 채널 요소와 융합될 수 있다.
도 11a 및 도 11b는 경로에서 3개의 연속적인 효소로 이루어진 기질 채널의 예시를 제시한다. 기질 채널은 여분의 채널 공간으로 방출되지 않고 대사 경로 쇄에서 연속적인 효소의 활성 부위로 중간 대사 산물을 직접 전달하는 것을 용이하게 한다. 도 11a는 조작된 기질 채널의 전형적인 배열을 예시한다. 효소 E1, E2 및 E3은 스캐폴드 단백질 (S1, S2, S3) 매트릭스와 공유적으로 또는 비-공유적으로 상호작용한다. 양방향 화살표는 효소와 스캐폴드 단백질 사이의 상호작용 (예를 들어, 친화성 상호작용)을 나타낸다. 이어서, 기질 (X)은 여분의 채널 공간으로 방출되지 않고 산물 (Y)로 프로세싱된다. 도 11b는 Cas7 서브유닛 단백질과의 융합 단백질 (즉, 공유 상호작용)로서 효소 E1, E2 및 E3을 운반하므로, 기질 채널을 창출하는 조작된 유형 I CRISPR-Cas 이펙터 복합체를 포함하는 본 발명의 한 실시양태를 예시한다. cpCas7 단백질 및 cpCas7 단백질로 형성된 백본이 또한, 본 발명의 이러한 측면의 실시에 유용할 수 있다.
다른 실시양태에서, 기질 채널 요소가 Cas6과 융합될 수 있다. 캐스케이드 복합체의 Cas6 서브유닛은 특이적 RNA 헤어핀 구조를 인식한다. 함께 연결된 다수의 Cas6 RNA 헤어핀 구조로 구성되는 RNA 스캐폴드를 구축할 수 있다. 상이한 캐스케이드 복합체로부터의 Cas6 펩티드는 상이한 인식 서열을 갖는다. 따라서, RNA 스캐폴드는 다수의 직교 Cas6 RNA 헤어핀으로부터 구축될 수 있다. 상이한 기질 채널 요소를 직교 Cas6 펩티드와 융합시킴으로써, 기질 채널 복합체를 특이적 화학량론으로 어셈블리할 수 있다.
기질 채널 요소는 Cas6의 N-말단 및/또는 Cas6의 C-말단과 융합될 수 있다. 또한, Cas6의 순환 순열은 기질 채널 요소와 융합될 수 있다.
일부 실시양태에서, 관심 이종 대사 경로는 모델 유기체, 예컨대 이. 콜라이에서 발현될 수 있다. 유전자가 이종으로 발현되면, 유전자를 보다 효율적으로 발현하기 위해 유전자를 코돈-최적화할 수 있다.
한 실시양태에서, 관심 대사 경로는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터의 메발로네이트 경로이다. 이러한 경로의 기질 채널 요소는 아세토아세틸-CoA-티오아제 (AtoB), 히드록시-메틸글루타릴-CoA 신타제 (HMGS) 및 히드록시-메틸글루타릴-CoA 리덕타제 (HMGR)를 포함하나 이에 제한되지는 않는다.
또 다른 실시양태에서, 관심 대사 경로는 에스. 세레비지아에(S. cerevisiae)로부터의 글리세롤 합성 경로이다. 이러한 경로의 기질 채널 요소는 글리세롤-3-포스페이트 데히드로게나제 (GPD1) 및 글리세롤-3-포스페이트 포스파타제 (GPP2)를 포함하나 이에 제한되지는 않는다.
또한 또 다른 실시양태에서, 관심 대사 경로는 클로스트리디움 스테르코라리움(Clostridium stercorarium)으로부터의 전분 가수분해 경로이다. 이러한 경로의 기질 채널 요소는 CelY 및 CelZ를 포함하나 이에 제한되지는 않는다.
부가 실시양태에서, 관심 대사 경로는 이. 콜라이로부터의 글루코스 포스포트랜스퍼라제 경로이다. 이러한 경로의 기질 채널 요소는 트레할로스-6-포스페이트 신테타제 (TPS) 및 트레할로스-6-포스페이트 포스파타제 (TPP)를 포함하나 이에 제한되지는 않는다.
제7 측면에서, 본 발명은 클래스 2 유형 II Cas9 단백질 및 핵산 표적화 핵산 (NATNA)을 포함하는 복합체에 의해 캐스케이드 서브유닛 단백질과 융합된 기능적 도메인의 부위-지정 동원에 관한 것이다. 기능적 도메인이 본원에 개시되고, 이는 효소 기능을 갖거나, 전사 활성화할 수 있거나, 또는 전사 저해할 수 있는 단백질 도메인을 포함하나 이에 제한되지는 않는다. 실시예 13A 및 실시예 13B는 클래스 2 유형 II CRISPR sgRNA, crRNA, tracrRNA, 또는 crRNA 및 tracrRNA 서열을 클래스 1 유형 I CRISPR 반복부 스템 서열로 조작하여, 하나 이상의 캐스케이드 서브유닛 단백질을 유형 II CRISPR Cas 단백질/가이드 RNA 복합체 결합 부위로 동원할 수 있게 하는 방법을 설명한다.
도 12a, 도 12b, 및 도 12c는 dCas9:NATNA 복합체에 의해 캐스케이드 서브유닛 단백질과 융합된 기능적 단백질 도메인의 표적 부위로의 부위-지정 동원의 일반화된 예시를 제시한다. 스페이서 서열 (도 12a, 101)을 포함하는 클래스 2 유형 II CRISPR NATNA (도 12a, 102)는 링커 핵산 서열 (도 12a, 103)을 통하여 클래스 1 유형 I CRISPR 반복부 스템 서열 (도 12a, 104)에 공유적으로 연결된다. 유형 I CRISPR 반복부 스템 서열 (도 12a, 105)에 공유적으로 연결된 유형 II CRISRP NATNA는 유형 II dCas9 (도 12a, 106) 및 유형 I 캐스케이드 서브유닛 단백질 (예를 들어, Cas6; 도 12a, 107)에 결합할 수 있으며, 이는 링커 서열 (도 12a, 108)을 통하여 기능적 단백질 도메인 (예를 들어, 효소 도메인, 전사 활성화 또는 저해 도메인; 도 12a, 109)과 융합되어 RNP 복합체를 형성한다. 이러한 RNP 복합체 (도 12b, 110)는 유형 II CRISPR NATNA 스페이서 서열 (도 12a, 101)에 상보적인 표적 서열 (도 12b, 112)을 포함하는 이중-가닥 DNA (도 12b, 111)를 표적화할 수 있다. RNP 복합체에 의한 표적 인식은 스페이서 서열 (도 12a, 101)과 표적 서열 (도 12b, 112) 사이의 혼성화 (도 12b, 113)를 초래한다. 캐스케이드 서브유닛-기능적 도메인 융합 단백질을 DNA에 국재화하면, 인접한 유전자의 기능적 단백질 도메인 또는 전사 조절에 의해 상기 DNA의 변형이 허용된다 (도 12c, 114).
제8 측면에서, 본 발명은 조작된 유형 I CRISPR-Cas 이펙터 복합체, 조작된 가이드 폴리뉴클레오티드, 및 그의 조합을 포함하는 조성물에 관한 것이다. 일부 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체는 연합된 Cas3 융합 단백질을 포함한다. 야생형 유형 I CRISPR-Cas 시스템은 DNA 표적화를 위한 캐스케이드 이펙터 복합체와 전진하는 DNA 분해를 위한 Cas3 헬리카제-뉴클레아제의 협조적 작용을 필요로 한다. 본 발명의 한 실시양태에서, 유형 I CRISPR-Cas 이펙터 복합체는 이러한 복합체를 뉴클레아제 도메인 (예를 들어, 비-특이적 FokI 엔도뉴클레아제 도메인)과 융합시킴으로써 정밀한 DSB를 만들도록 조작되었다. 이러한 접근법은 개재 서열 (즉, 인터스페이서)에 의해 분리된 2개의 절반-부위 DNA 서열을 표적화하는 쌍형성된 가이드 폴리뉴클레오티드를 사용한다.
이러한 본 발명의 측면의 실시양태는 각각 스페이서 및 Cas 서브유닛과 엔도뉴클레아제 (예를 들어, FokI; 예를 들어, 도 2a, 도 2b, 및 도 2c의 캐스케이드 복합체 참조)를 포함하는 융합 단백질을 포함하는 2개의 조작된 유형 I CRISPR-Cas 이펙터 복합체를 포함하는 조성물에 관한 것이며, 여기서 적어도 2개의 파라미터가 게놈 편집 효율을 조정하기 위해 달라진다. 이러한 파라미터는 하기를 포함한다:
Cas 서브유닛 단백질과 엔도뉴클레아제 (예를 들어, FokI)를 포함하는 융합 단백질을 생산하기 위해 사용되는 링커 폴리펩티드의 길이; 및
스페이서에 결합될 수 있는 핵산 표적 서열 사이의 인터스페이서 거리의 길이.
아미노산 조성 및 서열 링커 폴리펩티드에 관한 지침이 본원에 제공된다.
이러한 본 발명의 측면의 한 실시양태는 하기를 포함하는 조성물이다:
제1 Cse2 서브유닛 단백질, 제1 Cas5 서브유닛 단백질, 제1 Cas6 서브유닛 단백질, 및 제1 Cas7 서브유닛 단백질,
제1 Cas8 서브유닛 단백질 및 제1 FokI를 포함하며, 여기서 제1 Cas8 서브유닛 단백질의 N-말단 또는 제1 Cas8 서브유닛 단백질의 C-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 제1 링커 폴리펩티드가 약 10개 아미노산 내지 약 40개 아미노산의 길이를 갖는 것인 제1 융합 단백질, 및
제1 핵산 표적 서열에 결합할 수 있는 제1 스페이서를 포함하는 제1 가이드 폴리뉴클레오티드
를 포함하는 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체; 및
제2 Cse2 서브유닛 단백질, 제2 Cas5 서브유닛 단백질, 제2 Cas6 서브유닛 단백질, 및 제2 Cas7 서브유닛 단백질,
제2 Cas8 서브유닛 단백질 및 제2 FokI를 포함하며, 여기서 제2 Cas8 서브유닛 단백질의 N-말단 또는 제2 Cas8 단백질의 C-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 제2 링커 폴리펩티드가 약 10개 아미노산 내지 약 40개 아미노산의 길이를 갖는 것인 제2 융합 단백질, 및
제2 핵산 표적 서열에 결합할 수 있는 제2 스페이서를 포함하며, 여기서 제2 핵산 표적 서열의 프로토스페이서 인접 모티프 (PAM)와 제1 핵산 표적 서열의 PAM이 약 20개 염기 쌍 내지 약 42개 염기 쌍의 인터스페이서 거리를 갖는 것인 제2 가이드 폴리뉴클레오티드
를 포함하는 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체.
이러한 제1 핵산 표적 서열에 결합된 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체 및 제2 핵산 표적 서열에 결합된 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체의 예가 도 2a, 도 2b, 및 도 2c에 예시된다.
일부 실시양태에서, 제1 링커 폴리펩티드 및/또는 제2 링커 폴리펩티드의 길이는 약 15개 아미노산 내지 약 30개 아미노산, 또는 약 17개 아미노산 내지 약 20개 아미노산의 길이이다. 한 실시양태에서, 제1 링커 폴리펩티드와 제2 링커 폴리펩티드의 길이는 동일하다.
제1 Cas8 서브유닛 단백질 및 제2 Cas8 서브유닛 단백질은 각각 Cas8 서브유닛 단백질의 동일한 아미노산 서열을 포함할 수 있다.
유사하게, 제1 Cse2 서브유닛 단백질 및 제2 Cse2 서브유닛 단백질은 각각 Cse2 서브유닛 단백질의 동일한 아미노산 서열을 포함할 수 있고, 제1 Cas5 서브유닛 단백질 및 제2 Cas5 서브유닛 단백질은 각각 Cas5 서브유닛 단백질의 동일한 아미노산 서열을 포함할 수 있으며, 제1 Cas6 서브유닛 단백질 및 제2 Cas6 서브유닛 단백질은 각각 Cas6 서브유닛 단백질의 동일한 아미노산 서열을 포함할 수 있고, 제1 Cas7 서브유닛 단백질 및 제2 Cas7 서브유닛 단백질은 각각 Cas7 서브유닛 단백질의 동일한 아미노산 서열을 포함할 수 있으며, 그의 조합이 있다.
전형적으로, 제1 Cas8 서브유닛 단백질의 N-말단은 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단에 공유적으로 연결되고, 제1 Cas8 서브유닛 단백질의 C-말단은 제1 링커 폴리펩티드에 의해 제1 FokI의 N-말단에 공유적으로 연결되며, 제2 Cas8 서브유닛 단백질의 N-말단은 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단에 공유적으로 연결되고, 제2 Cas8 서브유닛 단백질의 C-말단은 제2 링커 폴리펩티드에 의해 제2 FokI의 N-말단에 공유적으로 연결되며, 그의 조합이 있다.
이러한 본 발명의 측면의 실시양태는 제2 핵산 표적 서열과 제1 핵산 표적 서열 사이의 길이가 약 22개 염기 쌍 내지 약 40개 염기 쌍, 약 26개 염기 쌍 내지 약 36개 염기 쌍, 약 29개 염기 쌍 내지 약 35개 염기 쌍, 또는 약 30개 염기 쌍 내지 약 34개 염기 쌍의 인터스페이서 거리인 실시양태를 포함한다.
제1 FokI 및 제2 FokI는 연합하여 동종이량체를 형성할 수 있는 단량체성 서브유닛, 또는 연합하여 이종이량체를 형성할 수 있는 별개의 서브유닛일 수 있다.
바람직한 실시양태에서, 가이드 폴리뉴클레오티드는 RNA를 포함한다.
일부 실시양태에서, gDNA는 제2 핵산 표적 서열의 PAM 및 제1 핵산 표적 서열의 PAM을 포함한다.
일부 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체는 살모넬라 엔테리카, 게오써모박터 종 (균주 EPR-M), 메타노셀라 아르보리자에 MRE50, 스트렙토코쿠스 써모필루스 (예를 들어, 스트렙토코쿠스 써모필루스 (균주 ND07)), 슈도모나스 종 S-6-2, 및 이. 콜라이로 이루어진 군으로부터 선택된 하나 이상의 유기체의 유형 I CRISPR-Cas 이펙터 복합체에 기반한다. 바람직한 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체는 스트렙토코쿠스 써모필루스 (예를 들어, 스트렙토코쿠스 써모필루스 (균주 ND07)), 슈도모나스 종 S-6-2, 및/또는 이. 콜라이의 유형 I CRISPR-Cas 이펙터 복합체에 기반한다. 슈도모나스 종 S-6-2는 이. 콜라이 상동체보다 ~10배 더 높은 편집 효율을 유도했으며, 시험된 다른 상동체의 대략 절반은 이. 콜라이와 동등한 활성을 나타냈으며, 이는 다양한 유형 I 시스템으로부터의 조작된 유형 I CRISPR-Cas 이펙터 복합체가 인간 세포에서의 게놈 편집에 기능적으로 사용될 수 있다는 것을 명확하게 보여준다.
실시예 18A, 실시예 18B, 실시예 18C, 실시예 18D, 실시예 20A, 실시예 20B, 및 실시예 20C에 제시된 데이터는 Cas 서브유닛 단백질과 FokI를 포함하는 융합 단백질을 생산하기 위해 사용되는 링커 폴리펩티드의 길이를 다양하게 하고/거나 스페이서에 결합할 수 있는 핵산 표적 서열 사이의 인터스페이서 거리의 길이를 다양하게 하는 것이 세포에서의 게놈 편집 효율의 조정을 용이하게 한다는 것을 입증한다.
또한 또 다른 실시양태에서, 본 발명은 캐스케이드 서브유닛 단백질 (예를 들어, Cas8 서브유닛 단백질) 및 제1 기능적 도메인 (예를 들어, FokI)을 포함하는 제1 융합 단백질, 및 dCas3* 단백질 및 제2 기능적 도메인 (예를 들어, FokI)을 포함하는 제2 융합 단백질을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체에 관한 것이다 (도 13a: Cas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 헤어핀을 포함하는 흑색 선으로서 예시됨). 제1 기능적 도메인 (예를 들어, FokI)을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 13a, Cas8-링커1-FP1 융합물)는 DNA에 결합할 수 있고, 이어서 dCas3*-제2 기능적 도메인 (예를 들어, FokI) 융합 단백질을 동원할 수 있다 (도 13a, dCas3*-링커2-FP2). 제1 기능적 도메인 (도 13a, Cas8-링커1-FP1 융합물) 및 제2 기능적 도메인 (도 13a, dCas3*-링커2-FP2)이 이량체성 단백질의 서브유닛을 포함하는 경우에, dCas3*-제2 기능적 도메인 (예를 들어, FokI) 융합 단백질은 제1 기능적 도메인 (예를 들어, FokI)을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체에 결합하여, 제1 기능적 도메인과 제2 기능적 도메인의 이량체화를 용이하게 한다 (도 13a). 도 14a는 링커 폴리펩티드 (도 14a, 링커 1)를 통해 Cas 서브유닛 단백질 (도 14a, 줄무의 박스)에 연결된 제1 기능적 도메인 (도 14a, FD1) 및 캐스케이드 복합체와 연합된 링커 폴리펩티드 (도 14a, 링커 2)를 통해 제2 기능적 도메인 (도 14a, FD2)에 연결된 dCas3*을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 14a, 캐스케이드)의 dsDNA에 결합하는 것; 이에 따라, FD1 및 FD2를 근접하게 가져오는 것 및 FD1과 FD2의 상호작용을 용이하게 하는 것을 예시한다. 캐스케이드 복합체의 결합은 단일 PAM 서열 (도 14a, PAM, 열린 박스)을 수반한다. 도 14a에서, dsDNA는 쌍형성된 수평 파선으로서 예시된다. 기능적 도메인이 이량체성 엔도뉴클레아제 (예를 들어, FokI)인 경우에, FD1과 FD2의 근접성은 기능적 이량체의 형성을 용이하게 한다.
이러한 본 발명의 실시양태의 한 가지 이점은 2개의 FokI-캐스케이드 복합체를 사용하는 것과 비교하여, 단일 캐스케이드 복합체 (단일 PAM 서열을 인식함)를 사용하여 이중-가닥 핵산 표적 서열을 절단할 수 있다는 것이다 (도 14a를 도 2a, 도 2b, 및 도 2c와 비교함). 2개의 FokI-캐스케이드 복합체를 사용하기 위해서는 2개의 PAM 서열이 적당한 배향으로 존재해야 하며 (도 2a, 도 2b, 및 도 2c), 이는 근접 핵산 표적 서열의 선택을 제한할 수 있다.
Cas 서브유닛 단백질과 엔도뉴클레아제 (예를 들어, FokI)를 포함하는 융합 단백질을 생산하기 위해 사용되는 링커 폴리펩티드의 길이 및/또는 조성 뿐만 아니라 dCas3* 단백질과 엔도뉴클레아제를 포함하는 융합 단백질을 생산하기 위해 사용되는 링커 폴리펩티드의 길이 및/또는 조성은 게놈 편집 효율을 조정하기 위해 달라질 수 있다. 실시예 21A, 실시예 21B, 실시예 21C, 및 실시예 21D는 게놈 편집 효율의 조정을 위한 다수의 Cas3-FokI 링커 조성 및 길이 및 FokI-Cas8 링커 조성 및 길이의 설계 및 시험을 설명한다.
이러한 본 발명의 측면의 또 다른 실시양태는 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 13b: Cas7, Cas5, Cas8, Cse2, 및 Cas6; Cas6 주위의 파선 박스는 crRNA 헤어핀과의 상호작용을 나타내고; cRNA는 헤어핀을 포함하는 흑색 선으로서 예시됨) 및 링커 폴리펩티드 (도 13b, 링커)에 의해 연결된 dCas3* 단백질 (도 13b, dCas3*)과 기능적 도메인 (도 13b, FP) (예를 들어, 시티딘 데아미나제)을 포함하는 융합 단백질을 포함한다. 조작된 유형 I CRISPR-Cas 이펙터 복합체는 DNA에 결합할 수 있고, dCas3*-기능적 도메인 (예를 들어, 시티딘 데아미나제) 융합 단백질을 동원할 수 있다. 이러한 실시양태는 기능적 도메인에 의한 변형 또는 기능적 도메인과의 상호작용을 위하여 핵산 표적 서열의 부위-특이적 표적화를 용이하게 할 수 있다. 시티딘 데아미나제의 경우에, 조작된 유형 I CRISPR-Cas 이펙터 복합체 및 dCas3* 단백질과 시티딘 데아미나제를 포함하는 융합 단백질은 핵산 표적 서열에서의 부위-특이적 염기 편집에 사용될 수 있다. 도 14b는 링커 폴리펩티드 (도 14b, 링커)를 통해 기능적 도메인 (도 14b, FD)과 연결된 dCas3* 단백질 (도 14b, dCas3*)을 포함하는 융합 단백질을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 14b, 캐스케이드)의 예를 예시하며, 여기서 복합체는 dsDNA에 결합된다 (도 14b, 쌍형성된 수평 파선). 도 14b에서, 기능적 도메인과 dsDNA의 접촉이 용이해진다. 캐스케이드 복합체의 결합은 단일 PAM 서열 (도 14b, PAM, 열린 박스)을 수반한다. 도 14c는 링커 폴리펩티드 (도 14c, 링커)를 통해 기능적 도메인 (도 14c, FD)과 연결된 dCas3* 단백질 (도 14c, dCas3*)을 포함하는 융합 단백질을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 14c, 캐스케이드)의 또 다른 예를 예시하며, 여기서 복합체는 dsDNA에 결합된다 (도 14c, 쌍형성된 수평 파선). 캐스케이드 복합체의 결합은 단일 PAM 서열 (도 14c, PAM, 열린 박스)을 수반한다. 도 14c에서는, 기능적 도메인과 ssDNA의 접촉이 용이해진다.
유형 I CRISPR-Cas 서브유닛 단백질과의 융합 단백질을 구축하기 위해 사용될 수 있는 부가의 기능적 도메인 및 단백질이 본 명세서 및 실시예에 기재되어 있다. Cas3-링커 폴리펩티드-기능적 도메인 융합 단백질에 대한 링커 폴리펩티드 조성 및 길이는 기능적 도메인의 성능에 대한 효과를 평가하기 위한 실시예 21A 내지 실시예 21D 및 본 명세서의 지침에 따라 평가될 수 있다.
본 발명의 일부 실시양태는 조작된 유형 I CRISPR-Cas 이펙터 복합체 및 mCas3 단백질을 사용할 수 있으며, 여기서 mCas3 단백질은 하향-조정된 헬리카제 활성을 포함하거나 (예를 들어, Cas3 전진성 돌연변이체 단백질인 mCas3 단백질은 야생형 유형 I CRISPR Cas3 단백질에 비해 DNA에 따른 이동이 감소되었음) 또는 mCas3 단백질에 헬리카제 활성이 결여된다 (예를 들어, mCas3 단백질은 더 이상 wtCas3 단백질과 같이 전진하는 뉴클레아제가 아니지만, mCas3 단백질은 닉킹 활성을 보유함). 조작된 유형 I CRISPR-Cas 이펙터 복합체는 DNA에 결합할 수 있고, 이어서 mCas3 단백질을 동원할 수 있다. 이러한 실시양태는 게놈 DNA의 부위-특이적 절단을 용이하게 할 수 있다.
표 48은 수많은 mCas3 단백질을 설명하며, 여기서 Cas3 단백질에 만들어진 돌연변이는 헬리카제 도메인의 ATP 결합/가수분해 영역 또는 헬리카제 도메인의 ssDNA 경로 보존된 영역에 영향을 미쳤다. 도 44는 EcoCas3 단백질의 기능적 도메인 및 Cas3 코딩 서열 내에서 만들어진 돌연변이체의 상대적 위치의 선형 표현을 제시한다. 도 44에서, HD 뉴클레아제 도메인 (아미노산 1-272), 헬리카제 도메인 (RecA1 영역, 아미노산 273-521; RecA2 영역, 아미노산 522-737), 링커 (아미노산 738-794), 및 C-말단 도메인 (CTD, 아미노산 795-888)이 표시된다. 문헌 [Huo, Y., et al., Nat. Struct. Mol. Biol. 9:771-777 (2014)]은 써모비피다 푸스카(Thermobifida fusca) (등록 코드: Q47PJ0; 서열식별번호: 1869), 사카로모노스포라 비리디스(Saccharomonospora viridis) (C7MTA6; 서열식별번호: 1870), 써모모노스포라 쿠르바타(Thermomonospora curvata) (D1A6Q2; 서열식별번호: 1922), 스트렙토미세스 아베르미틸리스(Streptomyces avermitilis) (Q825B5; 서열식별번호: 1925), 스트렙토미세스 보트로펜시스(Streptomyces bottropensis) (M3DI13; 서열식별번호: 1923), 써무스 써모필루스(Thermus thermophilus) 균주 HD8 (Q53VY2; 서열식별번호: 1924) 및 이. 콜라이 (P38036; 서열식별번호: 1844)로부터의 단백질의 Cas3 패밀리의 서열 정렬을 이용한 서열 보존 분석을 제공한다. 헬리카제 도메인 또는 ssDNA 루프 결합 도메인의 ATP 결합 부분에서 돌연변이를 갖는 24개의 상이한 EcoCas3 단백질 변이체를 스크리닝하였다 (실시예 23A 내지 실시예 23C). 여러 돌연변이체는 앰플리콘 창 내에서 훨씬 더 많은 및/또는 위치-시프트된 결실 클래스를 보여주었으며; 이는 이들 mCas3 단백질이 wtCas3에 비해 감소된 전진성을 가지고 있다는 것을 뒷받침하는 발견이다.
실시예 23A 내지 실시예 23C는 이러한 mCas3 단백질을 설명하며, 여기서 평균 mCas3 단백질 유도 결실은 상응하는 wtCas3 단백질로 생성된 평균 결실에 비해 더 짧다. 이러한 mCas3 단백질은 (예를 들어, 인간 세포에서의) 게놈 편집에 유용하다. 도 45a, 도 45b, 도 45c, 및 도 45d는 캐스케이드 RNP 복합체와 연합될 때, 인간 세포 내로 도입되고 발현된 경우에 캐스케이드 RNP 복합체와 연합되는 wtCas3 단백질에 비해 더 짧은 평균 결실 길이를 생성하는 mCas3 단백질을 나타내는 데이터를 제시한다. 본 명세서의 교시의 관점에서, 관련 기술분야의 통상의 기술자는 이. 콜라이 이외의 다른 종의 박테리아로부터 수득된 Cas3 단백질의 상응하는 영역에서 유사한 돌연변이를 만들 수 있다.
실시예 26A 내지 실시예 26C는 게놈 결실을 생성하는데 유용한 mCas3 단백질의 부가의 예를 제공하며, 여기서 평균 mCas3 단백질 유도 결실은 상응하는 wtCas3 단백질로 생성된 평균 결실에 비해 더 짧다. 본 실시예에 제시된 데이터는 슈도모나스 종 S-6-2로부터의 Cas3 (mPseCas3 단백질)의 ATPase/헬리카제 결핍성 변이체가 Pse캐스케이드 RNP 복합체와 함께 사용되어, 예상 절단 부위에서의 결실 (즉, 절단 부위 국한된 결실)을 생성할 수 있다는 것을 뒷받침한다.
wtPseCas3 단백질/Pse캐스케이드 활성을 추가로 특징규명하였다. 부가의 실험은 표적 강화 프로브를 사용하여 수행되었으며, 이는 대규모 게놈 결실을 검출 할 수 있게 한다. 구체적으로, HEK293 세포를 Pse캐스케이드 RNP 복합체, wtPseCas3 단백질, 및 본질적으로 실시예 26A 내지 실시예 26C에 기재된 바와 같이 TRAC 로커스로 향하는 최소 CRISPR 어레이를 코딩하는 DNA 주형으로 형질감염시켰다. 표적 강화 프로브를 사용하여 게놈 단편을 단리하고 서열 분석한 반면; 실시예 26C에서는, 앰플리콘 창을 사용하여 결실의 존재를 확인하였다. 표적 강화/시퀀싱 방법은 결실을 확인하기 위해 앰플리콘 창을 사용함으로써 제공되지 않은 더 큰 결실에 대한 편견없는 보기를 제공하였다. 전반적으로, 표적 강화 및 게놈 단편의 시퀀싱을 사용하여 평가된 결실은 wtPseCas3 단백질 개시 부위의 상류에서 시작하여 주로 단방향인 것으로 밝혀졌다. 결실은 1 bp 내지 거의 250 kb의 범위였다. 게놈 DNA를 커팅하고 주어진 길이의 결실을 제공하는 방법을 제공하는 것 외에도, 이러한 방법은 유전자의 조절/프로모터 영역을 조사하기 위해 규정된 위치에서 결실의 큰 무작위 서브세트를 생성하는데 유용할 수 있다.
mCas3 단백질은 하나 이상의 돌연변이 (예를 들어, 표 48에 기재된 바와 같은 돌연변이의 조합)를 포함할 수 있다.
몇 가지 mCas3 단백질에 대한 결실 길이의 제어가 입증되었다. 일부 실시양태에서, 본 발명의 mCas3 단백질은 가이드 폴리뉴클레오티드를 포함하는 캐스케이드 복합체와 연합하여, 약 1개 내지 약 600개 염기 쌍, 약 1개 내지 약 500개 염기 쌍, 약 1개 내지 약 400개 염기 쌍, 약 1개 내지 약 300개 염기 쌍, 바람직하게 약 1개 내지 약 250개 염기 쌍, 약 1개 내지 약 200개 염기 쌍, 또는 약 1개 내지 약 100개 염기 쌍의 평균 결실 길이를 제공할 수 있다.
일부 실시양태에서, wtCas3 단백질 또는 mCas3 단백질은 캐스케이드 복합체의 다양한 서브유닛과 융합되어 Cas3 평균 결실 길이를 추가로 제어할 수 있다. 캐스케이드 복합체에 대한 테더링은 캐스케이드 복합체가 결합된 로커스에 고정될 것이기 때문에, Cas3 단백질 또는 mCas3 단백질이 DNA를 따라 이동하는 것을 제한하거나 방지할 수 있다. wtCas3 단백질 또는 mCas3 단백질은 전형적으로 링커 폴리펩티드를 사용하여, 캐스케이드 복합체의 단백질 구성성분의 N- 또는 C-말단 도메인과 융합될 수 있다 (예를 들어, Eco캐스케이드 복합체의 경우에 EcoCas8, EcoCas6, 또는 EcoCas5와 융합될 수 있음). NLS 서열은 또한 융합 단백질의 N-말단에 첨부될 수 있다. 이. 콜라이 캐스케이드 단백질 구성성분에 대한 이러한 구축물의 예는 표 12에 제시되어 있다. 이들 EcoCas3 융합 단백질은 또한 N-말단에 첨부된 NLS 서열을 갖는다.
Figure pct00028
* 단백질 서열은 코딩된 폴리시스트론성 단백질 서열이다.
본 발명의 실시양태는 야생형 유형 I CRISPR Cas3 단백질 (wtCas3 단백질)에 비해 DNA를 따라 이동하는 것을 감소시킬 수 있는 조작된 유형 I CRISPR mCas3 단백질을 포함한다. 일부 실시양태에서, mCas3 단백질은 상응하는 wtCas3 단백질과의 약 90% 이상, 바람직하게 약 95% 이상, 보다 바람직하게 약 98% 이상의 서열 동일성을 포함한다. mCas3 단백질에 대한 코딩 서열은 아미노 말단, 카르복시 말단, 또는 아미노 말단과 카르복시 말단 둘 다에 공유적으로 연결된 핵 국재화 시그널을 포함할 수 있다. mCas3 단백질은 헬리카제 활성을 하향-조정하는 하나 이상의 돌연변이를 포함할 수 있으며, 여기서 조작된 mCas3 단백질은 상응하는 wtCas3 단백질에 비해 뉴클레아제 활성 (또는 그의 적어도 일부분)을 보유한다. 전형적으로, DNA는 핵산 표적 서열을 포함하는 표적 영역을 포함하는 dsDNA이다. wtCas3 단백질이 상응하는 캐스케이드 핵단백질 복합체와 연합되고 ("캐스케이드 NP 복합체/wtCas3 단백질"; 예를 들어, 캐스케이드 RNP 복합체), 캐스케이드 NP 복합체가 핵산 표적 서열에 상보적인 스페이서를 포함하는 가이드를 포함하는 경우에, 핵산 표적 서열에 대한 캐스케이드 NP 복합체/wtCas3 단백질의 결합은 DNA의 표적 영역에서의 절단을 용이하게 하여, 전형적으로 표적 영역에서의 결실을 초래하고; mCas3 단백질이 캐스케이드 NP 복합체와 연합되고 ("캐스케이드 NP 복합체/mCas3 단백질"; 예를 들어, 캐스케이드 RNP 복합체/mCas3 단백질) 핵산 표적 서열에 결합하는 경우에, 이는 DNA의 표적 영역에서의 절단을 용이하게 하고 wtCas3 평균 결실 길이에 비해 더 짧은 평균 결실 길이를 초래한다.
일부 실시양태에서, mCas3 단백질에서의 하나 이상의 돌연변이는 wtCas3 단백질 대비 아미노산의 치환이다. 다른 실시양태에서, 하나 이상의 결실은 wtCas3 단백질 대비 mCas3 단백질 코딩 서열에서의 아미노산의 결실 또는 삽입을 포함한다. 하나 이상의 돌연변이는 헬리카제 도메인의 RecA1 영역 또는 RecA2 영역에서 일어날 수 있다. 한 실시양태에서, 하나 이상의 돌연변이는 wtCas3 단백질에 비해 ssDNA에 대한 mCas3 단백질의 결합을 하향-조정한다 (예를 들어, ssDNA 루프 결합에 영향을 미치는 돌연변이 및/또는 헬리카제 도메인의 ssDNA 경로 보존된 영역에서의 돌연변이). 부가 실시양태에서, 하나 이상의 돌연변이는 wtCas3 단백질에 비해 mCas3 단백질에 의한 ATP의 가수분해를 하향-조정하거나 또는 wtCas3 단백질에 비해 mCas3 단백질에 대한 ATP의 결합을 하향-조정한다. 추가 실시양태에서, mCas3 단백질은 wtCas3 단백질에 비해 ssDNA에 대한 mCas3 단백질의 결합을 하향-조정하거나, wtCas3 단백질에 비해 mCas3 단백질에 의한 ATP의 가수분해를 하향-조정하거나 또는 mCas3 단백질에 대한 ATP의 결합을 하향-조정하는 하나 이상의 돌연변이의 조합을 포함한다.
추가 실시양태는 캐스케이드 핵단백질 복합체 (예를 들어, 캐스케이드 RNP 복합체)의 Cas 단백질의 코딩 서열의 아미노 말단 또는 카르복시 말단에 공유적으로 연결된 mCas3 단백질에 대한 코딩 서열을 포함한다. 이러한 Cas 단백질은 Cse2, Cas8 단백질, Cas7 단백질, Cas6, 및 Cas5 단백질로 이루어진 군으로부터 선택될 수 있다.
일부 실시양태에서, wtCas3 단백질은 이. 콜라이 유형 1 CRISPR Cas3 단백질이다. 다른 실시양태에서, wtCas3 단백질은 슈도모나스 종 S-6-2, 써모비피다 푸스카, 사카로모노스포라 비리디스, 써모모노스포라 쿠르바타, 스트렙토미세스 아베르미틸리스, 스트렙토미세스 보트로펜시스, 써무스 써모필루스, 비브리오 콜레라, 살모넬라 엔테리카, 게오써모박터 종 EPR-M, 메타노셀라 아르보리자에 MRE50, 및 스트렙토코쿠스 써모필루스 (균주 ND07)로 이루어진 군으로부터 선택된 wtCas3 단백질이다.
이. 콜라이 유형 1 CRISPR wtCas3 단백질의 경우에, 하나 이상의 돌연변이는 D452H, A602V, 또는 D452H 및 A602V를 포함할 수 있으나, 이에 제한되지는 않는다.
추가 실시양태에서, 세포를 DNA를 포함하며, 여기서 세포는 진핵 세포 (예를 들어, 인간 세포)일 수 있다.
부가 실시양태에서, 본 발명은 mCas3 단백질에 대한 코딩 서열을 포함하는 폴리뉴클레오티드, mCas3 단백질 코딩 서열을 포함하는 발현 카세트, mCas3 단백질 코딩 서열을 포함하는 플라스미드, 및 mCas3 단백질을 포함하는 캐스케이드 핵단백질 복합체를 포함한다.
제9 측면에서, 본 발명은 조작된 유형 I CRISPR-Cas 이펙터 복합체를 사용하는 방법에 관한 것이다.
일부 실시양태에서, 본 발명은 세포 또는 생화학적 반응 내로의 도입을 위해 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체를 제공하는 단계; 및 조작된 유형 I CRISPR-Cas 이펙터 복합체를 세포 또는 생화학적 반응 내로 도입함으로써, 조작된 유형 I CRISPR-Cas 이펙터 복합체와 폴리뉴클레오티드의 접촉을 용이하게 하는 단계를 포함하는, 폴리뉴클레오티드 (예를 들어, dsDNA) 내의 핵산 표적 서열에 결합하는 방법을 포함한다. 상기 복합체와 폴리뉴클레오티드가 접촉하면, 조작된 유형 I CRISPR-Cas 이펙터 복합체가 폴리뉴클레오티드 내의 핵산 표적 서열(들)에 결합하게 된다.
한 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체는 폴리뉴클레오티드 내의 핵산 표적 서열에 상보적인 가이드를 포함한다. 조작된 유형 I CRISPR-Cas 이펙터 복합체는 폴리뉴클레오티드 내의 핵산 표적 서열에 결합한다.
추가 실시양태에서, 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체는 폴리뉴클레오티드 내의 제1 핵산 표적 서열에 상보적인 가이드를 포함하고, 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체는 폴리뉴클레오티드 내의 제2 핵산 표적 서열에 상보적인 가이드를 포함한다. 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체는 제1 핵산 표적 서열에 결합하고, 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체는 폴리뉴클레오티드 내의 제2 핵산 표적 서열에 결합한다.
또한 또 다른 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체는 폴리뉴클레오티드 내의 핵산 표적 서열에 상보적인 가이드를 포함하고, 이러한 복합체와 연합될 수 있는 dCas3* 융합 단백질을 추가로 포함한다. 조작된 유형 I CRISPR-Cas 이펙터 복합체는 폴리뉴클레오티드 내의 핵산 표적 서열에 결합하고, 이펙터 복합체는 이러한 복합체와 연합된 dCas3* 융합 단백질을 포함한다.
이러한 핵산 표적 서열에 결합하는 방법은 시험관내에서 (예를 들어, 생화학적 반응에서 또는 배양된 세포에서; 일부 실시양태에서, 배양된 세포는 배양물 중에 유지되고 인간에게 도입되지 않은 인간 배양된 세포임); 생체내에서 (예를 들어, 살아있는 유기체의 세포에서, 단 일부 실시양태에서, 유기체는 비-인간 유기체임) 또는 생체외에서 (예를 들어, 대상체로부터 제거된 세포, 단 일부 실시양태에서, 대상체는 인간 대상체를 포함하고, 다른 실시양태에서 대상체는 비-인간 대상체임) 수행될 수 있다.
하기를 포함하나 이에 제한되지는 않는, 핵산 서열과 폴리펩티드 사이의 상호작용을 평가하고/거나 정량화하기 위한 다양한 방법이 관련 기술분야에 공지되어 있다: 면역 침전 (ChIP) 검정, DNA 전기영동 이동성 시프트 검정 (EMSA), DNA 풀- 다운 검정, 및 마이크로 플레이트 포획 및 검출 검정. 상업적 키트, 물질 및 시약은 이러한 많은 방법을 실시하는데 이용할 수 있으며, 예를 들어, 하기 공급업자로부터 수득될 수 있다: 써모 사이언티픽 (Thermo Scientific; 미국 델라웨어주 윌밍턴), 시그노시스 (Signosis; 미국 캘리포니아주 산타 클라라), 바이오-래드 (Bio-Rad; 미국 캘리포니아주 헤라클레스), 및 프로메가 (Promega; 미국 위스콘신주 매디슨). 폴리펩티드와 핵산 서열 사이의 상호작용을 검출하는 통상의 접근법은 EMSA이다 (예를 들어, 문헌 [Hellman L.M., et al., Nature Protocols 2:1849-1861 (2007)] 참조).
또 다른 실시양태에서, 본 발명은 세포 또는 생화학적 반응 내로의 도입을 위해 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체를 제공하는 단계; 및 조작된 유형 I CRISPR-Cas 이펙터 복합체를 세포 또는 생화학적 반응 내로 도입함으로써, 조작된 유형 I CRISPR-Cas 이펙터 복합체와 폴리뉴클레오티드의 접촉을 용이하게 하는 단계를 포함하는, 폴리뉴클레오티드 내의 핵산 표적 서열을 커팅하는 (예를 들어, dsDNA에서의 단일-가닥 커트 또는 dsDNA에서의 이중-가닥 커트) 방법을 포함한다.
한 실시양태에서, 폴리뉴클레오티드 내의 제1 핵산 표적 서열에 상보적인 가이드 및 제1 뉴클레아제 도메인 (예를 들어, FokI)을 포함하는 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 15a, 캐스케이드1, 실선 아웃라인 박스, 링커 폴리펩티드, 흑색 곡선을 통해 부채꼴로서 나타낸 제1 뉴클레아제 도메인에 연결됨), 및 폴리뉴클레오티드 내의 제2 핵산 표적 서열에 상보적인 가이드 및 제2 뉴클레아제 도메인 (예를 들어, FokI)을 포함하는 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 15a, 캐스케이드 2, 파선 아웃라인 박스, 링커 폴리펩티드, 흑색 곡선을 통해 부채꼴로서 나타낸 제2 뉴클레아제 도메인에 연결됨)가 세포 또는 생화학적 반응 내로 도입된다. 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 15b, 캐스케이드1)는 dsDNA (도 15b, 쌍형성된, 수평 흑색 선으로 나타낸 dsDNA) 내의 제1 핵산 표적 서열에 결합하고, 제1 뉴클레아제 도메인은 dsDNA의 제1 가닥을 절단하며 (도 15c, 캐스케이드1), 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 15b, 캐스케이드2)는 dsDNA 내의 제2 핵산 표적 서열에 결합하고, 제2 뉴클레아제 도메인은 dsDNA의 제2 가닥을 절단한다. 조작된 유형 I CRISPR-Cas 이펙터 복합체의 결합은 조작된 유형 I CRISPR-Cas 이펙터 복합체에 의한 폴리뉴클레오티드 (예를 들어, dsDNA) 내의 핵산 표적 서열의 커팅을 초래한다.
부가 실시양태에서, 폴리뉴클레오티드 내의 제1 핵산 표적 서열에 상보적인 가이드를 포함하는 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체, 폴리뉴클레오티드 내의 제2 핵산 표적 서열에 상보적인 가이드를 포함하는 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체, 및 Cas3 닉카제 (예를 들어, 닉카제 활성만을 갖는 ATPase-결핍성 Cas3 변이체)가 세포 또는 생화학적 반응 내로 도입된다. 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체는 dsDNA 내의 제1 핵산 표적 서열에 결합하고, Cas3 닉카제 단백질은 제1 복합체와 연합되며, dsDNA의 제1 가닥을 절단하고, 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체는 dsDNA 내의 제2 핵산 표적 서열에 결합하고, Cas3 닉카제 단백질은 제2 복합체와 연합되며, dsDNA의 제2 가닥을 절단한다. 조작된 유형 I CRISPR-Cas 이펙터 복합체와 연합된 Cas3 닉카제 단백질과의 결합은 조작된 유형 I CRISPR-Cas 이펙터 복합체에 의한 폴리뉴클레오티드 (예를 들어, dsDNA) 내의 핵산 표적 서열의 커팅을 초래한다. 실시예 25A, 실시예 25B, 및 실시예 25C는 Cas3 ATPase 결핍성 돌연변이체 단백질을 포함하는 캐스케이드 RNP 복합체가 쌍형성된 닉킹을 통해 표적화된 게놈 결실을 유도할 수 있다는 것을 입증하는 데이터를 제시한다. 이러한 쌍형성된 닉킹은 숙주 세포 (예를 들어, 인간 세포)의 게놈에서의 표적화된 결실을 용이하게 할 수 있다.
또 다른 실시양태에서, 폴리뉴클레오티드 내의 핵산 표적 서열에 상보적인 가이드 및 제1 뉴클레아제 도메인 (예를 들어, FokI)을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 16a, 캐스케이드; 파선 아웃라인 박스, 링커 폴리펩티드, 흑색 곡선을 통해 부채꼴로서 나타낸 제1 뉴클레아제 도메인에 연결됨), 및 복합체와 연합될 수 있는 dCas3*-제2 뉴클레아제 도메인 (예를 들어, FokI) 융합 단백질 (도 16a, dCas3; 실선 아웃라인 박스, 링커 폴리펩티드, 흑색 곡선을 통해 부채꼴로서 나타낸 제2 뉴클레아제 도메인에 연결됨)가 세포 또는 생화학적 반응 내로 도입된다. 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 16b, 캐스케이드)는 dsDNA (도 16b, 쌍형성된, 수평, 흑색 선) 내의 핵산 표적 서열에 결합하고, dsDNA의 제1 가닥을 절단하며 (도 16c, 캐스케이드), dCas3* 융합 단백질은 캐스케이드 RNP 복합체와 연합되고 (도 16b, dCas3*), dsDNA의 제2 가닥을 절단한다 (도 16c, dCas3*).
추가 실시양태에서, 폴리뉴클레오티드 내의 핵산 표적 서열을 포함하는 표적 영역에 상보적인 가이드 및 복합체와 연합할 수 있는 Cas3 단백질 (예를 들어, Cas3 단백질 또는 mCas3 단백질)을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체가 세포 또는 생화학적 반응 내로 도입된다. 조작된 유형 I CRISPR-Cas 이펙터 복합체는 dsDNA 내의 핵산 표적 서열에 결합하고, Cas3 단백질 (예를 들어, Cas3 단백질 또는 mCas3 단백질)은 복합체와 연합되며, 표적 영역 내의 dsDNA의 적어도 하나의 가닥을 절단한다. 일부 실시양태에서, mCas3 단백질에 의한 dsDNA의 절단은 dsDNA의 표적 영역에서의 결실을 초래한다. 이러한 방법은 특이적 길이의 장거리 결실을 만드는데 사용될 수 있으며, 유전자 녹아웃 또는 녹인의 창출에 유용할 수 있다. 일부 실시양태에서, Cas3 단백질 (예를 들어, Cas3 단백질 또는 mCas3 단백질)은 캐스케이드 복합체 서브유닛 단백질 (예를 들어, Cas7 단백질, Cas8 단백질, Cas5 단백질, Cse2 단백질)와 융합될 수 있다. 실시예 23A 내지 실시예 23C는 mCas3 단백질의 실시양태를 설명한다.
또 다른 실시양태에서, 본 발명은 뉴클레아제 도메인이 캐스케이드 복합체 단백질 (예를 들어, 실시예 11A, 표 38 참조) 또는 dCas3* 단백질 (예를 들어, DNase와 융합된 dCas3* 단백질)과 융합되어 핵산 표적 서열을 결실시키는, 유형 I CRISPR-Cas 이펙터 복합체를 사용하는 것에 관한 것이다. 이러한 방법은 dsDNA의 표적 영역에서 커트 뿐만 아니라 결실을 만드는데 사용될 수 있으며 유전자 녹아웃의 창출에 유용할 수 있다. 일부 실시양태에서, 뉴클레아제 도메인은 캐스케이드 복합체 서브유닛 단백질, 예컨대 Cas7 단백질, Cas8 단백질, Cas5 단백질, Cse2 단백질과 융합될 수 있다.
폴리뉴클레오티드 내의 핵산 표적 서열을 커팅하는 방법은 공여자 폴리뉴클레오티드를 세포 내로 도입하여 공여자 폴리뉴클레오티드의 적어도 일부분을 세포의 gDNA 내로 혼입하는 것을 용이하게 하기 위한 것을 추가로 포함할 수 있다.
도 17a는 폴리뉴클레오티드 내의 제1 핵산 표적 서열 (도 17a, 캐스케이드1)에 상보적인 가이드 및 제1 뉴클레아제 도메인 (예를 들어, FokI)을 포함하는 제1 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 17a, 캐스케이드1과 회색의 부채꼴을 연결하는 구부러진 선으로서 예시된 링커 폴리펩티드), 및 폴리뉴클레오티드 내의 제2 핵산 표적 서열 (도 17a, 캐스케이드 2)에 상보적인 가이드 및 제2 뉴클레아제 도메인 (예를 들어, FokI)을 포함하는 제2 조작된 유형 I CRISPR-Cas 이펙터 복합체 (도 17a, 캐스케이드2와 회색의 부채꼴을 연결하는 구부러진 선으로서 예시된 링커 폴리펩티드)에 의해 절단되는 dsDNA (도 17a, 쌍형성된, 진한 수평선)의 두 가닥의 예를 예시한다. 도 17b는 이중-가닥 커트 부위 (도 18b, 공여자, 파선)에 인접한 DNA 서열에 상보적인 상동성 아암을 포함하는 공여자 폴리뉴클레오티드 (도 17b, 캐스케이드2 위에 제시된 쌍형성된, 파선)를 예시한다. 도 17c는 이중-가닥 커트 부위의 영역 내에 공여자 폴리뉴클레오티드 (도 17c, dsDNA를 나타내는 쌍형성된, 진한, 수평선을 연결하는 쌍형성된, 파선)의 일부분을 혼입하는 것을 예시한다. 공여자 폴리뉴클레오티드를 혼입하는 것은 세포성 DNA 복구 메카니즘 (예를 들어, HDR)에 의해 매개된다 (도 17b 내지 도 17c, 아래쪽을 가리키는, 수직 화살표는 세포성 DNA 복구 메카니즘을 나타냄).
다른 실시양태에서, 폴리뉴클레오티드 내의 제1 핵산 표적 서열에 상보적인 가이드 및 제1 뉴클레아제 도메인을 포함하는 조작된 유형 I CRISPR-Cas 이펙터 복합체는 제2 뉴클레아제 도메인을 포함하는 제2 구성성분과 쌍형성될 수 있으며, 여기서 제2 구성성분은 폴리뉴클레오티드 내의 제2 핵산 표적 서열에 결합할 수 있다. 이러한 제2 구성성분의 예는 제2 뉴클레아제 도메인을 포함하는 전사 활성화제 유사 이펙터 뉴클레아제 (TALEN), 제2 뉴클레아제 도메인을 포함하는 징크 핑거 뉴클레아제 (ZFN), 또는 제2 뉴클레아제 도메인을 포함하는 dCas9/NATNA 복합체를 포함한다.
한 실시양태에서, 표적 폴리뉴클레오티드 (예를 들어, gDNA)의 특정 영역은 표적 폴리뉴클레오티드 내의 제1 핵산 표적 서열에 상보적인 가이드를 포함하는 캐스케이드 복합체와, NATNA가 표적 폴리뉴클레오티드 내의 제2 핵산 표적 서열에 상보적인 스페이서 서열을 포함하는 dCas9/NATNA 복합체의 조합을 사용하여 결실될 수 있다. 제1 및 제2 핵산 표적 서열은 결실을 위해 표적화된 핵산 표적 서열을 플랭킹하도록 선택된다. 활동적 엔도뉴클레아제 활성을 포함하는 Cas3 단백질은 캐스케이드 복합체와 연합된 다음, 결실을 위해 표적화된 핵산 표적 서열을 포함하는 dsDNA의 단일 가닥을 점진적으로 결실시킨다. Cas3 단백질이 dCas9/NATNA 복합체와 충돌하는 경우 (즉, "로드블록"), Cas3 뉴클레아제 활성은 dCas9/NATNA 복합체에 의해 제2 핵산 표적 서열에서 중지될 수 있다. 도 21a 내지 도 21d는 핵산 표적 서열의 Cas3 결실의 예를 예시한다. 도 21a는 결실을 위해 표적화된 핵산 표적 서열을 플랭킹하는 핵산 표적 서열 1 (도 21a, NATS1) 및 핵산 표적 서열 2 (도 21a, NATS2)를 포함하는 dsDNA (도 21a, 쌍형성된, 수평, 흑색 선)를 제시한다. 도 21a는 NATS1에 상보적인 가이드를 포함하는 캐스케이드 복합체 (도 21a, 캐스케이드; 흑색 선 프레임드 직사각형), Cas3 단백질 (도 21a, Cas3; 회색 부채꼴), 및 NATS2에 상보적인 스페이서를 포함하는 dCas9/NATNA 복합체 (도 21a, dCas9; 파선 프레임드 직사각형)를 제시한다. 도 21b는 NATS1에 대한 캐스케이드 복합체의 결합, 캐스케이드 복합체와 Cas3 단백질의 연합, 및 NATS2에 대한 dCas9/NATNA 복합체의 결합을 제시한다. 도 21c는 결실을 위해 표적화된 핵산 표적 서열의 단일 가닥의 Cas3에 의한 점진적인 결실을 예시한다. 도 21d는 NATS2에 결합된 dCas9/NATNA 복합체의 위치에서 dsDNA로부터의 Cas3 단백질의 해리를 제시한다. 실시예 24A 내지 실시예 24D는 캐스케이드 핵단백질 복합체와 연합된 Cas3 단백질에 의해 매개된 결실의 길이를 제어하기 위해 단백질 로드블록을 사용하는 것을 뒷받침하는 데이터를 제시하므로; 세포 (예를 들어, 인간 세포)의 gDNA에서 규정된 길이를 갖는 결실의 형성을 용이하게 하기 위해 캐스케이드 핵단백질 복합체와 연합된 Cas3 단백질을 사용하는 방법을 제공한다.
또 다른 실시양태에서, 표적 폴리뉴클레오티드 (예를 들어, gDNA)의 특정 영역은 표적 폴리뉴클레오티드 내의 제1 핵산 표적 서열에 상보적인 가이드를 포함하는 제1 캐스케이드 복합체와 표적 폴리뉴클레오티드 내의 제2 핵산 표적 서열에 상보적인 가이드를 포함하는 제2 캐스케이드 복합체의 조합을 사용하여 결실될 수 있다. 제1 및 제2 핵산 표적 서열은 결실을 위해 표적화된 핵산 표적 서열을 플랭킹하도록 선택된다. 활동적 엔도뉴클레아제 활성을 포함하는 Cas3 단백질은 각각의 캐스케이드 복합체와 연합된 다음, 결실을 위해 표적화된 핵산 표적 서열의 두 가닥을 점진적으로 결실시킨다. 각각의 Cas3 단백질이 캐스케이드 복합체 중 하나와 충돌하는 경우에, Cas3 뉴클레아제 활성은 캐스케이드 복합체에 의해 제1 및 제2 핵산 표적 서열에서 중지될 수 있다. 도 22a 내지 도 22d는 핵산 표적 서열의 두 가닥의 Cas3 결실의 예를 예시한다. 도 22a는 결실을 위해 표적화된 핵산 표적 서열을 플랭킹하는 핵산 표적 서열 1 (도 22a, NATS1) 및 핵산 표적 서열 2 (도 22a, NATS2)를 포함하는 dsDNA (도 22a; 쌍형성된, 수평, 흑색 선)를 제시한다. 도 22a는 NATS1에 상보적인 가이드를 포함하는 제1 캐스케이드 복합체 (도 22a, 캐스케이드1; 흑색 선 프레임드 직사각형), Cas3 단백질 (도 22a, Cas3; 회색 부채꼴), 및 NATS2에 상보적인 가이드를 포함하는 제2 캐스케이드 복합체 (도 22a, 캐스케이드2; 파선 프레임드 직사각형)를 제시한다. 도 22b는 NATS1 및 NATS2에 대한 캐스케이드 복합체의 결합 뿐만 아니라 캐스케이드 복합체와 Cas3 단백질의 연합을 제시한다. 도 22c는 결실을 위해 표적화된 핵산 표적 서열의 두 가닥의 Cas3에 의한 뉴클레아제 분해 및 DNA를 따라 이동하는 것으로부터 비롯되는 점진적인 결실을 예시한다. 도 22d는 NATS1 및 NATS2에 결합된 캐스케이드 복합체의 위치에서 dsDNA로부터의 Cas3 단백질의 해리를 제시한다.
추가 실시양태에서, 캐스케이드 복합체는 Cas3 단백질에 결합할 수 없도록 변형될 수 있고, 이러한 변형된 캐스케이드 복합체는 캐스케이드 RNP 복합체와 연합하여 촉매적으로 활성인 Cas3에 의한 DNA의 점진적인 분해를 중지시키기 위해 본질적으로 도 21a 내지 도 21d에 예시된 바와 동일한 방식으로 로드블록으로서 작용할 수 있다. 부가의 부위-특이적 결합 단백질 (예를 들어, 전사 활성화제 유사 이펙터 (TAL), 또는 징크 핑거 (ZnF) DNA 결합 단백질)이 유사한 방식으로 로드블록으로서 사용될 수 있다.
일부 실시양태에서, 핵산 표적 서열은 dsDNA (예를 들어, 게놈 DNA)이다. 일부 실시양태에서, 핵산 표적 서열은 이중-가닥이고, 이러한 가닥 중 하나 또는 둘 다가 커팅된다. 이러한 핵산 표적 서열을 커팅하는 방법은 시험관내에서, 생체내에서 또는 생체외에서 수행될 수 있다.
상기 기재된 바와 같이, 일부 실시양태에서 본 발명은 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체를 숙주 세포 내로 도입하여, 공여자 폴리뉴클레오티드의 존재 하에 dsDNA 내의 핵산 표적 서열의 절단을 용이하게 하는 것에 관한 것이며, 여기서 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체는 숙주 세포 DNA의 핵산 표적 서열을 포함하는 표적 영역 내에 커트 부위를 생성함으로써 (또는 부위를 커팅하고 결실과 연합됨), 공여자 폴리뉴클레오티드의 적어도 일부분이 표적 영역 내로 삽입되는 것을 용이하게 한다. 일부 실시양태에서, 커트 부위는 표적 영역에서의 이중-가닥 파손이다 (예를 들어, 각각 스페이서 및 Cas 단백질과 엔도뉴클레아제 (예를 들어, FokI)를 포함하는 융합 단백질을 포함하는 2개의 조작된 유형 I CRISPR-Cas 이펙터 복합체 또는 각각 Cas3 단백질 또는 mCas3 단백질과 연합되는 스페이서를 포함하는 2개의 조작된 유형 I CRISPR-Cas 이펙터 복합체를 사용하는 경우). 일부 실시양태에서, 커트 부위는 표적 영역에서의 단일-가닥 파손이다 (예를 들어, mCas3 단백질과 연합된 유형 I CRISPR-Cas 이펙터 복합체를 사용하는 경우). 다른 실시양태에서, 커트 부위는 표적 영역에서의 결실이다 (예를 들어, Cas3 또는 mCas3 단백질과 연합된 유형 I CRISPR-Cas 이펙터 복합체를 사용하는 경우).
상동성-지정 복구 (HDR)를 입증하기 위해, FokI-Pse캐스케이드 RNP 복합체가 인간 게놈 내의 4개의 로커스 (WDR92, B2M, CCR5, 및 TRAC)를 표적화하도록 최소 CRISPR 어레이를 설계하였다. 최소 CRISPR 어레이는 3개의 올리고뉴클레오티드 (서열식별번호: 1513 내지 서열식별번호: 1515; 실시예 20A) 및 "반복부-스페이서-반복부-스페이서-반복부" 서열을 코딩하는 고유한 프라이머를 사용하여 PCR-기반 어셈블리로 생성되었으며, 여기서 제1 및 제2 스페이서는 FokI-Pse캐스케이드 RNP 복합체가 인접한 핵산 표적 서열을 지정하도록 하여 FokI 이량체화 및 게놈 절단 (즉, 커트 부위의 생성)을 가능하게 한다.
커트 부위를 포함하는 표적 영역에서의 각각의 HDR 삽입 부위 (이러한 경우에 커트 부위와 중복됨)에 대해, 세포를 하기로 형질감염시켰다: FokI의 N 말단과 연결된 NLS를 갖는 Cas8의 N-말단과 융합된 FokI를 포함하는 FokI-Pse캐스케이드 복합체 단백질 구성성분을 코딩하는 벡터 3 μg, 150 ng의 최소 CRISPR 어레이, 및 HDR을 위한 단일-가닥 올리고데옥시뉴클레오티드 (ssODN) 주형 공여자 폴리뉴클레오티드 0-60 pmol. ssODN은 상동성 아암을 포함하였고, 각각의 상동성 아암은 75개 뉴클레오티드였으며, 2개의 아암은 커트 부위 주위에 대칭적으로 위치되었다. 공여자 폴리뉴클레오티드는 이러한 공여자 폴리뉴클레오티드의 세포성 분해를 감소 또는 방지하기 위해 상동성 아암의 3' 말단 뉴클레오티드에 포스포로티오에이트 결합을 추가로 포함하였다. 포스포티오에이트 결합의 5'에서 공여자 폴리뉴클레오티드는 2개의 중지 코돈을 삽입하고 복구된 염색체에서 인터스페이서 거리를 증가시킴으로써, FokI-Pse캐스케이드 RNP 복합체 재절단을 방해하기 위해 "TAATAAT"의 삽입 서열을 추가로 포함하였다.
HDR을 가능하게 하기 위해 ssODN이 혼합물에 포함되었다는 것을 제외하고는 본질적으로 실시예 20B에 기재된 바와 같이 HEK293 세포에서 형질감염을 수행하였다. 형질감염한지 며칠 후, gDNA를 세포로부터 정제하고, 엑소뉴클레아제로 처리하여 후속 PCR을 오염시킬 수 있는 임의의 잔여 ssODN을 제거한 다음, 이를 증폭을 위한 주형으로서 사용하여 공여자 삽입을 측정하였다. 심층 시퀀싱 분석은 본질적으로 실시예 20C에 기재된 바와 같이 수행되었다. 이러한 실험으로부터의 총 판독값 중에서 돌연변이체 판독값의 백분율이 표 13에 제시되어 있다 (제1 열은 ssODN의 pmol임):
Figure pct00029
돌연변이체 판독값의 백분율은 비-상동 단부 결합으로부터 비롯되는 indel 뿐만 아니라 "TAATAAT" HDR 서열의 삽입을 함유하는 돌연변이체 판독값을 나타낸다.
이러한 실험으로부터의 총 돌연변이체 판독값 중에서, "TAATAAT" 삽입 서열 만을 함유하는 HDR 판독값의 백분율이 표 14에 제시되어 있다 (제1 열은 ssODN의 pmol임):
Figure pct00030
데이터로부터 알 수 있는 바와 같이, 캐스케이드 RNP 복합체에 의한 dsDNA의 절단은 HDR을 가능하게 하고 인간 게놈 전체에 걸친 다수의 로커스에서 공여자 폴리뉴클레오티드의 혼입을 가능하게 한다.
또한 또 다른 실시양태에서, 본 발명은 세포 또는 생화학적 반응 내로 도입하기 위한 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체 (예를 들어, Cas 서브유닛 단백질-시티딘 데아미나제 융합 단백질을 포함함)를 제공하는 단계, 및 조작된 유형 I CRISPR-Cas 이펙터 복합체(들)를 세포 또는 생화학적 반응 내로 도입함으로써, 조작된 유형 I CRISPR-Cas 이펙터 복합체(들)와 폴리뉴클레오티드의 접촉을 용이하게 하여, 핵산 표적 서열(들)의 돌연변이 (예를 들어, C에서 T로 , G에서 A로, A에서 G로, 및 T에서 C로의 돌연변이)를 용이하게 하는 폴리뉴클레오티드 내의 핵산 표적 서열(들)에 대한 조작된 유형 I CRISPR-Cas 이펙터 복합체(들)의 결합을 초래하는 단계를 포함하는, 세포 또는 생화학적 반응에서 폴리뉴클레오티드 (예를 들어, DNA) 내의 하나 이상의 핵산 표적 서열을 변형시키는 방법을 포함한다. 도 18a 내지 도 18d는 세포의 gDNA 내의 표적 뉴클레오티드를 돌연변이시키기 위해 Cas 서브유닛 단백질-링커 폴리펩티드-시티딘 데아미나제 융합 단백질을 포함하는 캐스케이드 복합체 (캐스케이드/CD 복합체)를 사용하는 것의 예를 예시한다 (도 18a, 쌍형성된, 진한 수평선, 시토신의 경우에 "C" 및 구아닌의 경우에 "G"를 수반함). 캐스케이드/CD 복합체 (도 18a; 회색의 부채꼴로서 나타낸 시티딘 데아미나제 "CD"와 캐스케이드를 연결하는 구부러진 선으로서 예시된 링커 폴리펩티드를 갖는 "캐스케이드")가 세포 내로 도입된다. 캐스케이드/CD 복합체는 표적 시토신 (도 18b, "C")에 인접한 DNA 표적 서열에 상보적인 가이드를 포함한다. 도 18b에서, 캐스케이드/CD 복합체는 DNA 표적 서열에 결합하고 시티딘 데아미나제는 시토신 (도 18b, "C")을 우라실 (도 18c, "U")로 전환시킨다. 이어서, 세포성 복구 메카니즘은 우라실을 티미딘으로 복구할 수 있고, 미스매치된 구아니딘을 아데닌으로 변화시킬 수 있다 (도 18c 내지 도 18d, 아래쪽을 가리키는, 수직 화살표는 세포성 DNA 복구 메카니즘을 나타냄).
또한 또 다른 실시양태에서, 본 발명은 시험관내 또는 생체내 전사, 예를 들어, 조절 요소 서열을 포함하는 유전자의 전사를 조정하는 방법을 포함한다. 이러한 방법은 세포 또는 생화학적 반응 내로 도입하기 위한 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체 (예를 들어, Cas 서브유닛 단백질-전사 인자 융합 단백질을 포함함)를 제공하는 단계, 및 조작된 유형 I CRISPR-Cas 이펙터 복합체(들)를 세포 또는 생화학적 반응 내로 도입함으로써, 조작된 유형 I CRISPR-Cas 이펙터 복합체(들)와 조절 요소 서열의 접촉을 용이하게 하여, 조절 요소 서열에 대한 조작된 유형 I CRISPR-Cas 이펙터 복합체(들)의 결합을 초래함으로써 조절 요소 서열을 포함하는 유전자의 시험관내 또는 생체내 전사를 조정하는 것을 용이하게 하는 단계를 포함한다.
도 19a 및 도 19b는 일반 유전자 ("유전자1")의 전사 활성화를 위한 예의 일반적 예시를 제시한다. 도 19a는 진핵 세포에서 내인성 유전자의 전사 조절의 개요를 제공한다. 도 19a에서, 2개의 진한 평행선은 이중-가닥 DNA를 나타내며, 유전자 1 (도 19a, 유전자 1)의 위치 뿐만 아니라 유전자 1과 연합된 전사 시작 부위 (도 19a, TSS)가 표시된다. 도 19a의 제1 패널에서, 유전자 1의 전사 활성화에 필요한 전사 인자 (도 19a, TF) 및 폴리머라제 II (도 19a, Pol II)는 아직 유전자1-TSS와 연합되지 않은 것으로 예시되어 있다. 제2 패널은 TF와 그의 동족 TSS의 연합을 예시한다. 이어서, TF는 전사 활성화 단백질 (도 19a, TP)을 동원하여 RNA 폴리머라제 II (도 19a, Pol II)를 동원한다. 전형적으로, 진핵 생물에서 TF 인자와 TP는 다수의 단백질과 가능한 다른 분자를 포함하는 복합체를 형성한다. 제3 패널은 이로써 생성되는, Pol II에 의한 유전자 1의 전사를 예시한다 (도 19a, 유전자 1의 단부에 구부러진 화살표는 전사의 방향을 표시함). 이러한 유형의 전사 활성화는 전형적으로, 유전자(들)의 발현에 특이적인 TF(들)에 의존적이다. 도 19b는 본 발명의 한 실시양태의 예시를 제시하며, 여기서 캐스케이드 복합체는 전사 활성화를 담당하는 세포 내의 하나 이상의 구성성분 (전사 활성화 인자; 도 19b, TA)을 끌어당기는 단백질 또는 인자를 포함하도록 조작된다 (도 19b, 캐스케이드a). 이러한 단백질 또는 인자의 한 예는 단백질 VP64이다. 캐스케이드a는 TSS (도 19b, TSS) 또는 그 근처에서 결합할 수 있는 가이드를 포함한다. 도 19b에서, 2개의 진한 평행선은 이중-가닥 DNA를 나타내며, 유전자 1 (도 19b, 유전자 1)의 위치 뿐만 아니라 유전자 1과 연합된 전사 시작 부위 (TSS)가 표시된다. 도 19b의 제1 패널에서, 캐스케이드a 및 폴리머라제 II (도 19b, Pol II)는 아직 유전자1-TSS와 연합되지 않은 것으로 예시되어 있다. 제2 패널은 캐스케이드a와 그의 표적인 TSS의 연합을 예시한다. 이어서, 캐스케이드a는 전사 활성화 단백질 (도 19b, TA)을 동원한 다음, RNA 폴리머라제 II (도 19b, Pol II)를 동원한다. 제3 패널은 이로써 생성되는, Pol II에 의한 유전자 1의 전사를 예시한다 (도 19b, 유전자 1의 단부에 구부러진 화살표는 전사의 방향을 표시함). 이러한 본 발명의 실시양태의 한 가지 이점은 유전자의 전사 활성화가 유전자의 TSS에 결합하는 내인성 전사 인자에 의존하지 않고, 오히려 유전자의 TSS가 적절한 캐스케이드 가이드의 선택에 의해 표적화될 수 있다는 것이다.
도 20a 및 도 20b는 유전자 1과 연합된 조절 서열 (도 20a, 프로모터)에 상보적인 가이드 및 Cas 서브유닛 단백질-KRAB 도메인 융합을 포함하는 캐스케이드 복합체 (도 20a, KRAB 도메인을 나타내는 원형 요소와 캐스케이드를 연결하는 구부러진 선으로서 예시된 링커 폴리펩티드를 갖는 캐스케이드i)를 사용하여 일반 유전자 (도 20a, 유전자 1)의 전사 저해에 대한 예의 일반적 예시를 제시한다. 조절 서열에 대한 캐스케이드i의 결합 (도 20b)은 유전자 1의 전사 저해를 초래한다 (도 20b, X에서 끝나는 진한 선은 전사 저해를 나타냄).
본원에 기재된 바와 같은, 조작된 유형 I CRISPR-Cas 이펙터 복합체는 키트 내로 혼입될 수 있다. 일부 실시양태에서, 키트는 하나 이상의 별도의 조성물로서 또는 임의적으로 구성성분의 화합성이 허용하는 경우에는 혼합물로서, 키트 요소를 유지하는 하나 이상의 용기와의 패키지를 포함한다. 일부 실시양태에서, 키트는 또한 하기 부형제 중 하나 이상을 포함한다: 완충제, 완충 작용제, 염, 멸균 수성 용액, 보존제 및 그의 조합. 예시적인 키트는 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체 및 하나 이상의 부형제, 또는 조작된 유형 I CRISPR-Cas 이펙터 복합체의 하나 이상의 구성성분을 코딩하는 하나 이상의 핵산 서열을 포함할 수 있다.
더욱이, 키트는 조작된 유형 I CRISPR-Cas 이펙터 복합체 조성물의 사용 설명서를 추가로 포함할 수 있다.
본 발명의 또 다른 측면은 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체, 또는 그의 구성성분을 만들거나 제조하는 방법에 관한 것이다. 한 실시양태에서, 만들거나 제조하는 방법은 세포에서 조작된 유형 I CRISPR-Cas 이펙터 복합체를 생산하는 것 및 세포 용해물로부터 조작된 유형 I CRISPR-Cas 이펙터 복합체를 정제하는 것을 포함한다.
조작된 유형 I CRISPR-Cas 이펙터 복합체 조성물은 검출가능한 표지, 예컨대 검출가능한 시그널을 제공할 수 있는 모이어티를 추가로 포함할 수 있다. 검출가능한 표지의 예는 효소, 방사성 동위 원소, 특이적 결합 쌍의 구성원, 형광단 (FAM), 형광 단백질 (녹색 형광 단백질 (GFP), 적색 형광 단백질, mCherry, tdTomato), 적합한 형광단 (증강된 GFP (eGFP), "스피나크")과 함께 DNA 또는 RNA 앱타머, 양자점, 항체 등을 포함하나 이에 제한되지는 않는다. 다수의 다양한 적합한 검출가능한 표지는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다.
일부 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체 (즉, 핵단백질 입자)는 뉴클레오펙션, 유전자 총 전달, 소노포레이션, 세포 압착, 리포펙션, 또는 다른 화학물질, 세포 침투 펩티드 등의 사용을 포함하나 이에 제한되지는 않는 방법에 의해 세포 내로 도입될 수 있다. 다른 실시양태에서, 조작된 유형 I CRISPR-Cas 이펙터 복합체의 하나 이상의 구성성분에 대한 코딩 서열 및 연합된 단백질은 벡터 시스템, 상기 구성성분 중 하나 이상을 코딩하는 DNA 서열을 포함하는 발현 카세트 뿐만 아니라 상기 구성성분 중 하나 이상을 코딩하는 RNA 서열을 포함하는 발현 카세트를 포함하는 하나 이상의 RNA 분자 (예를 들어, mRNA)를 사용하여 세포 내로 도입될 수 있다.
본 발명의 한 실시양태는 재조합 세포 (예를 들어, 변형된 림프구)를 생산하기 위한 조작된 유형 I CRISPR-Cas 이펙터 복합체의 용도에 관한 것이다. 상기 방법은 전형적으로, 숙주 세포에서의 핵산 표적 서열을 포함하는 표적 영역을 포함하는 dsDNA와 본 발명의 하나 이상의 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체의 접촉을 용이하게 하는 것을 포함한다. 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 핵산 표적 서열의 접촉은 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 핵산 표적 서열을 포함하는 표적 영역의 결합, 핵산 표적 서열을 포함하는 표적 영역의 절단, 및 표적 영역에서의 dsDNA의 변형을 초래하여, 재조합 세포를 생산한다. 일부 실시양태에서, dsDNA는 둘 이상의 핵산 표적 서열을 포함하며, 각각의 핵산 표적 서열에 상보적인 스페이서 서열을 포함하는 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체가 사용되어 각각의 핵산 표적 서열에 결합하고, 이를 커팅하며 변형시킨다. 일부 실시양태에서, 표적 영역의 변형은 삽입, 결실, 또는 삽입과 결실이다. 세포 내로 도입하기 위하여 하나 이상의 조작된 유형 I CRISPR-Cas 이펙터 복합체를 제공하는 것을 포함하는, 폴리뉴클레오티드 내의 핵산 표적 서열을 커팅하는 방법 (예를 들어, dsDNA에서의 단일-가닥 커트 또는 dsDNA에서의 이중-가닥 커트)은 상기 기재되어 있다.
본 발명의 실시양태는 하나 이상의 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체를 사용하여 재조합 세포를 생산하는 것을 포함하며, 여기서 재조합 세포의 gDNA는 (예를 들어, B2M 유전자 및/또는 PDCD1 유전자의) 녹아웃 돌연변이, 녹인 (예를 들어, TRAC 로커스에서의 편집 및 공여자 폴리뉴클레오티드로부터의 CAR의 통합), 또는 그의 조합을 포함한다. 일부 실시양태에서, gDNA의 TRAC 유전자 내의 핵산 표적 서열에서의 절단에 이어 핵산 표적 서열에서 공여자 폴리뉴클레오티드의 적어도 일부분이 혼입된다. 공여자 폴리뉴클레오티드는 CAR 구축물을 포함할 수 있으며, 여기서 CAR은 핵산 표적 서열에 삽입된다.
본 발명의 방법에 의해 만들어진 재조합 세포는 입양 세포 전달 (ACT)에 사용될 수 있다. ACT는 이식된 면역 세포를 사용하여 암을 치료하는 신속하게 부상하는 면역 요법 접근법이다. ACT는 세포를 환자에게 전달하는 것이다. 가장 통상적으로, 면역 세포는 면역 기능 개선을 목표로 면역 체계로부터 유래된다. 자가 암 면역 요법에서는, 환자로부터 면역 세포 또는 줄기 세포를 수거하여 생체외 배양을 통해 다량으로 확장한 다음, 이를 환자에게 되돌려 보낸다. 면역 세포 또는 줄기 세포는 배양에서 다양한 방식으로 변형될 수 있다 (예를 들어, CAR을 T 세포의 게놈에 혼입하기 위하여 게놈 편집을 사용함). 일부 실시양태에서, 변형을 위한 림프구는 대상체로부터 단리되고, 변형된 다음, 동일한 대상체 내로 재도입된다. 이러한 기술은 자가 림프구 요법으로서 공지되어 있다. 동종이계 암 면역 요법에서는, 단일 공여자로부터 유래되는 배양 확장된 면역 세포 또는 줄기 세포가 다수의 환자에게 치료를 제공한다. 이러한 면역 세포 또는 줄기 세포는 또한 배양에서 다양한 방식으로 변형될 수 있다. 일부 실시양태에서, 림프구는 단리되고, 변형되며, 상이한 대상체 내로 도입될 수 있다. 이러한 기술은 동종이계 림프구 요법으로서 공지되어 있다.
특정 실시양태에서, 이러한 면역 요법 방법은 T 세포, 자연 살해 세포 (NK 세포), B 세포, 종양 침윤 림프구 (TIL), 키메라 항원 수용체 T 세포 (CAR-T 세포), T 세포 수용체 조작된 T 세포 (TCR), TCR CAR-T 세포, CAR TIL 세포, CAR-NK 세포, 조작된 NK 세포, 또는 림프구 세포를 생성하는 조혈 줄기 세포를 포함하나 이에 제한되지는 않는 림프구를 활용할 수 있다. 다른 실시양태에서, 세포는 줄기 세포, 수지상 세포 등이다. 이러한 세포의 게놈은 본 발명의 하나 이상의 조작된 클래스 I 유형 I 캐스케이드 이펙터 복합체를 사용함으로써 변형 (예를 들어, 림프구 세포 게놈에서 삽입 및/또는 결실의 생성)될 수 있다.
변형을 위한 림프구는 대상체, 예컨대 인간 대상체로부터, 예를 들어, 혈액으로부터 또는 TIL의 경우와 같은 고형 종양으로부터, 또는 림프 기관, 예컨대 흉선, 골수, 림프절 및 점막-연관 림프 조직으로부터 단리될 수 있다. 림프구를 단리하는 기술은 관련 기술분야에 널리 공지되어 있다. 예를 들어, 림프구는, 예를 들어, 혈액 층을 분리하는 친수성 폴리사카라이드인 피콜, 및 밀도 구배 원심 분리를 사용하여 전혈로부터 분리되는 말초 혈액 단핵 세포 (PBMC)로부터 단리될 수 있다. 일반적으로, 항응고제 또는 섬유소 제거된 혈액 표본은 피콜 용액 위에 층을 이루고 원심 분리하여 상이한 세포 층을 형성한다. 바닥 층은 적혈구 (적혈구)를 포함하며, 이는 피콜 배지에 의해 수집되거나 응집되어 바닥으로 완전히 가라 앉는다. 다음 층은 주로 과립구를 함유하며, 이는 또한 피콜-파크 용액을 통해 아래로 이동한다. 다음 층은 전형적으로, 단핵구 및 혈소판과 함께 혈장과 피콜 용액 사이의 계면에 있는 림프구를 포함한다. 림프구를 단리하기 위해, 이러한 층을 회수하고, 염 용액으로 세척하여 혈소판, 피콜 및 혈장을 제거한 다음, 다시 원심 분리한다. 또 다른 한편으론, 원심 분리 기술 (예를 들어, 셀세이버(CellSaver)® (해모네트릭스 (Haemonetrics; 미국 매사추세츠주 브레인트리)) 기계 또는 로보 자동화 세포 프로세싱 시스템 (프레세니우스 카비 유에스에이, 엘엘씨 (Fresenius Kabi USA, LLC; 미국 일리노이주 레이크 취리히)을 사용함)을 통해 공여자 혈액으로부터 세포를 단리될 수 있다.
림프구를 단리하는 다른 기술은 관심 세포를 항체 코팅된 플라스틱 표면에 결합하여 용액으로부터 세포 집단을 단리하는 바이오패닝을 포함한다. 이어서, 원치 않는 세포는 특이적 항체 및 보체로 처리하여 제거된다. 부가적으로, 형광 활성화 세포 분류 (FACS) 분석을 사용하여 림프구를 검출하고 계수할 수 있다. FACS 분석은 빛 산란 및 형광에 있어서의 차이에 기반하여 표지된 세포를 분리하는 유동 세포계수기를 사용한다.
TIL의 경우에, 림프구를 종양으로부터 단리하고, 예를 들어, 고용량 IL-2에서 성장시키고, 자가 종양 또는 HLA 매칭된 종양 세포주에 대항한 시토카인 방출 공동배양 검정을 사용하여 선택한다. 동종이계 비-MHC 매칭된 대조군과 비교해서 증가된 특이적 반응성의 증거가 있는 배양물이 신속한 확장을 위해 선택되고 암 치료를 위해 대상체 내로 도입된다 (예를 들어, 문헌 [Rosenberg, S., et al., Clin. Cancer Res. 17:4550-4557 (2011); Dudly, M., et al., Science 298:850-854 (2002); Dudly, M., et al., J. Clin. Oncol. 26:5233-5239 (2008); Dudley, M., et al., J. Immnother. 26:332-342 (2003)] 참조).
단리 시, 림프구는 특이성, 빈도 및 기능의 측면에서 특징규명될 수 있다. 자주 사용되는 검정은 T 세포 반응의 빈도를 측정하는 ELISPOT 검정을 포함한다.
일부 실시양태에서, CD4+ 및 CD8+ T 세포는 공여자 말초 혈액 단핵 세포 (PBMC)로부터 단리된다. 관련 기술분야의 통상의 기술자는 상기 기재된 바와 같은 다양한 방법에 의해 T 세포 또는 다른 림프계 세포를 단리할 수 있다. 이러한 세포는 또한 iPSC 세포로부터의 분화에 의해 단리될 수 있다.
단리 후, 림프구는 전문화된 이펙터 림프구로의 증식 및 분화를 촉진하기 위해 관련 기술분야에 공지된 기술을 사용하여 활성화될 수 있다. 활성화된 T 세포에 대한 표면 마커는, 예를 들어, CD3, CD4, CD8, PD1, IL2R 등을 포함한다. 활성화된 세포독성 림프구는 표적 세포의 표면 상에 동족 수용체를 결합한 후 표적 세포를 사멸시킬 수 있다. NK 세포에 대한 표면 마커는, 예를 들어, CD16, CD56 등을 포함한다.
단리 및 임의적으로 활성화 후, 원하는 특징을 제공하기 위해 림프구를 변형시킬 수 있다. 본 발명의 하나 이상의 조작된 유형 I 캐스케이드 이펙터 복합체는 발현될 코딩 서열의 도입 및/또는 내인성 유전자 발현의 불활성화를 포함하나 이에 제한되지는 않는 게놈 변형을 도입하는데 사용될 수 있다. 일부 실시양태에서, 본 발명의 하나 이상의 조작된 유형 I 캐스케이드 이펙터 복합체는 TRAC 유전자 (T 세포 수용체 α 상수를 코딩함), B2M 유전자 (β2 마이크로글로불린을 코딩함) 및/또는 PDCD1 유전자 (프로그래밍된 세포 사멸 단백질 1을 코딩함; PD-1로서 공지되기도 함)를 편집하는데 사용될 수 있다.
T 세포 및 NK 세포는 본 발명의 방법에 의해 변형될 수 있는 림프구의 예이다. 일부 실시양태에서, 본 발명의 하나 이상의 조작된 유형 I 캐스케이드 이펙터 복합체는 CAR을 포함하는 공여자 폴리뉴클레오티드의 존재 하에 유전자의 표적 영역에 커트 부위를 도입하는데 사용될 수 있으며, 여기서 CAR은 림프구의 게놈의 표적 영역 내로 혼입된다. 부가 실시양태에서, 본 발명의 하나 이상의 조작된 유형 I 캐스케이드 이펙터 복합체는 유전자의 발현을 방지하기 위해 녹아웃 돌연변이의 생성을 용이하게 하기 위해 유전자의 표적 영역에 커트 부위를 도입하는데 사용될 수 있다.
또 다른 실시양태에서, 본 발명의 조작된 유형 I 캐스케이드 이펙터 복합체는 인간 iPSC 내로 게놈 변형을 도입하기 위해 사용될 수 있다. 일부 실시양태에서, 본 발명의 하나 이상의 조작된 유형 I 캐스케이드 이펙터 복합체는 TRAC 유전자, B2M 유전자, 및/또는 PDCD1 유전자를 편집하는데 사용될 수 있다. 추가 실시양태에서, 조작된 유형 I 캐스케이드 이펙터 복합체는 공여자 폴리뉴클레오티드와 함께, 게놈 변형 및 코딩 서열, 예컨대 CAR 또는 시토카인 (예를 들어, IL2, IL15 등)을 도입하기 위해 사용될 수 있다. 이어서, 변형된 iPSC 세포는 T 세포 및 NK 세포 또는 수지상 세포를 포함하는 성숙한 세포 유형으로 추가로 분화될 수 있다. 일부 실시양태에서, 변형된 iPSC는 CAR-T 세포 및 CAR-NK 세포로 분화될 수 있다.
본 발명의 방법의 일부 실시양태에서, 공여자 폴리뉴클레오티드는 CAR을 코딩하는 폴리뉴클레오티드를 포함한다. CAR은 상동 재조합 ("녹인")을 통해 커트 부위를 포함하는 유전자 (예를 들어, TRAC 유전자)의 표적 영역으로의 삽입을 위해 표적화될 수 있다. 이러한 접근법의 이점은 표적화된 TRAC 유전자의 녹아웃을 제공할 수도 있다는 것이며; 즉, TRAC 유전자가 작동하지 않게 된다. CAR 구축물 내로 혼입될 수 있는 세포외 항원 인식 도메인의 예는 상기 기재되어 있다 (표 2 참조). 한 실시양태에서, 세포외 항원 인식 도메인은 CD19 결합 모이어티를 포함한다 (예를 들어, 항-CD19 scFv). 또 다른 실시양태에서, 세포외 항원 인식 도메인은 B-세포 성숙 항원 (BCMA) 결합 모이어티를 포함한다 (예를 들어, 항-BCMA scFv).
DNA의 표적 영역에서 커트 부위를 생성하는 것을 포함하는 본 발명의 방법의 실시양태에서, 상기 방법은 공여자 폴리뉴클레오티드를 변형된 세포 내로 도입함으로써, 변형된 세포의 커트 부위를 포함하는 표적 영역 내로의 공여자 폴리뉴클레오티드의 적어도 일부분의 삽입을 용이하게 하는 것을 추가로 포함할 수 있다. 공여자 폴리뉴클레오티드는 변형된 세포 내로 직접적으로 도입될 수 있다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 벡터를 사용하여 도입된다. 벡터의 구축을 위한 일반적인 방법은 관련 기술분야에 공지되어 있다. 바이러스 벡터의 예는 렌티바이러스, 레트로바이러스, 아데노바이러스, 단순 포진 바이러스 I 또는 II, 파보바이러스, 세망 내피증 바이러스, 및 AAV 벡터를 포함하나 이에 제한되지는 않는다.
본 발명의 방법의 추가 실시양태는 B2M 유전자에 돌연변이를 도입하는 것을 포함한다. 바람직한 실시양태에서, 돌연변이는 B2M 유전자에서의 녹아웃 돌연변이이다.
본 발명의 방법의 추가 실시양태는 PDCD1 유전자에 돌연변이를 도입하는 것을 포함한다. 바람직한 실시양태에서, 돌연변이는 PDCD1 유전자에서의 녹아웃 돌연변이이다.
본 발명의 하나 이상의 조작된 유형 I 캐스케이드 이펙터 복합체에 의해 촉진되는 게놈 변형은 조작된 캐스케이드 복합체, 폴리뉴클레오티드 (예를 들어, 플라스미드 또는 발현 카세트) 또는 이들의 혼합물을 숙주 세포 (예를 들어, 림프구) 내로 동시에 또는 일련으로 도입함으로써 수행될 수 있다.
변형된 림프구를 생산한 후, 림프구는 FACS, 미세유체-기반 스크리닝 플랫폼 등을 포함하나 이에 제한되지는 않는 방법, 예컨대 고 처리량 스크리닝 기술을 사용하여, 발현하는 세포 (예를 들어, 원하는 세포 표면 수용체를 발현함) 또는 발현하지 않는 세포 (예를 들어, 하나 이상의 조작된 유형 I 캐스케이드 이펙터 복합체를 사용하는 게놈 편집을 통해 그의 발현을 불활성화시킨 세포 표면 단백질)에 관하여 선택하기 위해 스크리닝될 수 있다. 이들 기술은 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Wojcik, M., et al., Int. J. Mol. Sci. 16:24918-24945 (2015)] 참조).
일단 생산되면, 변형된 림프구는 치료할 대상체에게 전달하기 위해 제약 조성물로 제형화될 수 있다. 본 발명의 조성물은 변형된 림프구 및 하나 이상의 제약상 허용되는 부형제를 포함한다. 예시적인 부형제는 탄수화물, 무기 염, 항미생물제, 항산화제, 계면 활성제, 완충제, 산, 염기 및 그의 조합을 포함하나 이에 제한되지는 않는다. 주사용 조성물에 적합한 부형제는 물, 알콜, 폴리올, 글리세린, 식물성 오일, 인지질 및 계면 활성제를 포함한다. 탄수화물, 예컨대 당, 유도체화된 당, 예컨대 알디톨, 알돈산, 에스테르화된 당, 및/또는 당 중합체가 부형제로서 존재할 수 있다. 구체적 탄수화물 부형제는, 예를 들어, 모노사카라이드, 예컨대 프룩토스, 말토스, 갈락토스, 글루코스, D-만노스, 소르보스 등; 디사카라이드, 예컨대 락토스, 수크로스, 트레할로스, 셀로비오스 등; 폴리사카라이드, 예컨대 라피노스, 멜레지토스, 말토덱스트린, 덱스트란, 전분 등; 및 알디톨, 예컨대 만니톨, 크실리톨, 말티톨, 락티톨, 크실리톨, 소르비톨 (글루시톨), 피라노실 소르비톨, 미오이노시톨 등을 포함한다. 부형제는 또한 무기 염 또는 완충제, 예컨대 시트르산, 염화나트륨, 염화칼륨, 황산나트륨, 질산칼륨, 일염기성 인산나트륨, 이염기성 인산나트륨 및 그의 조합을 포함할 수 있다. 동결제 (예를 들어, 크리오스토르(CryoStor)® (바이오라이프 솔루션즈 인크 (BioLife Solutions Inc; 미국 워싱톤주 보셀)) CS2, CS5 또는 CS10 동결 배지)를 사용하여 저장 및 수송을 위해 세포를 동결시킬 수 있다.
본 발명의 제약 조성물은 또한 미생물 성장을 예방 또는 억제하기 위한 항미생물제를 포함할 수 있다. 본 발명에 적합한 항미생물제의 비-제한적인 예는 벤즈알코늄 클로라이드, 벤제토늄 클로라이드, 벤질 알콜, 세틸피리디늄 클로라이드, 클로로부탄올, 페놀, 페닐에틸 알콜, 페닐수은 니트레이트, 티메로살 및 그의 조합을 포함한다.
항산화제가 또한 제약 조성물에 존재할 수 있다. 산화를 방지하기 위해 항산화제가 사용되어, 제제의 림프구 또는 다른 구성성분의 악화를 방지한다. 본 발명에 사용하기 적합한 항산화제는, 예를 들어, 아스코르빌 팔미테이트, 부틸화 히드록시아니솔, 부틸화 히드록시톨루엔, 차아인산, 모노티오글리세롤, 프로필 갈레이트, 중아황산염 나트륨, 소듐 포름알데히드 술폭실레이트, 소듐 메타비술파이드 및 그의 조합을 포함한다.
계면 활성제가 부형제로서 존재할 수 있다. 예시적인 계면 활성제는 하기를 포함한다: 폴리소르베이트, 예컨대 TWEEN 20 및 TWEEN 80, 및 플루로닉, 예컨대 F68 및 F88 (BASF; 미국 뉴저지주 마운트 올리브); 소르비탄 에스테르; 지질, 예컨대 인지질, 예컨대 레시틴 및 다른 포스파티딜콜린, 포스파티딜에탄올아민 (바람직하게 리포솜 형태는 아니지만), 지방산 및 지방 에스테르; 스테로이드, 예컨대 콜레스테롤; 킬레이트제, 예컨대 EDTA; 및 아연 및 다른 이러한 적합한 양이온을 포함한다.
산 또는 염기가 제약 조성물에서 부형제로서 존재할 수 있다. 사용될 수 있는 산의 비-제한적인 예는 염산, 아세트산, 인산, 시트르산, 말산, 락트산, 포름산, 트리클로로아세트산, 질산, 과염소산, 인산, 황산, 푸마르산 및 그의 조합으로 이루어진 군으로부터 선택된 산을 포함한다. 적합한 염기의 예는 수산화나트륨, 아세트산나트륨, 수산화암모늄, 수산화칼륨, 아세트산암모늄, 아세트산칼륨, 인산나트륨, 인산칼륨, 시트르산나트륨, 포름산나트륨, 황산나트륨, 황산칼륨, 푸마르산칼륨 및 그의 조합으로 이루어진 군으로부터 선택된 염기를 포함하나 이에 제한되지는 않는다.
조성물 내의 림프구 (또는 다른 재조합 세포)의 양은 다수의 인자에 따라 달라질 수 있지만, 조성물이 단위 투여 형태 또는 용기 (예를 들어, 봉지)에 있을 때 최적의 치료상 유효 용량이 될 것이다. 치료상 유효 용량은 임상적으로 원하는 평가 항목을 산출하는 양을 결정하기 위해 증가하는 양의 조성물을 반복 투여함으로써 실험적으로 결정될 수 있다.
조성물 중의 임의의 개별 부형제의 양은 부형제의 성질과 기능 및 조성물의 특별한 요구에 따라 달라질 것이다. 전형적으로, 임의의 개별 부형제의 최적 양은 일상적인 실험을 통해 결정되는데, 즉 다양한 양의 부형제 (낮은 양 내지 높은 양의 범위)를 함유하는 조성물을 제조하고, 안정성 및 다른 파라미터를 조사한 다음, 상당한 유해 효과 없이 최적의 성능이 달성되는 범위를 결정함으로써 결정된다. 그러나 일반적으로, 부형제(들)는 조성물에 약 1 중량% 내지 약 99 중량%, 바람직하게 약 5 중량% 내지 약 98 중량%, 보다 바람직하게 약 15 중량% 내지 약 95 중량%의 부형제의 양으로 존재할 것이며, 30 중량% 미만의 농도가 가장 바람직하다. 다른 부형제와 함께 이들 전술한 제약 부형제는 문헌 ["Remington: The Science & Practice of Pharmacy," current edition, Williams & Williams; the "Physician's Desk Reference," current edition, Medical Economics, Montvale, NJ; and Kibbe, A.H., Handbook of Pharmaceutical Excipients, current edition, American Pharmaceutical Association, Washington, D.C.]에 기재되어 있다.
제약 조성물은 의도된 전달 방식 및 사용 방식에 따라 주사기, 이식 장치 등에 수용될 수 있다. 바람직하게, 존재하는 조성물의 양은 미리 측정되거나 미리 패키징된 형태로 단일 용량에 적절하다.
본원의 제약 조성물은 임의적으로, 하나 이상의 부가 작용제, 예컨대 해당 암에 대한 대상체를 치료하거나 또는 치료로부터의 공지된 부작용을 치료하기 위해 사용되는 다른 의약을 포함할 수 있다. 예를 들어, T 세포는 시토카인을 혈류로 방출하여 위험할 정도로 고열과 갑작스런 혈압 강하를 유발할 수 있다. 이러한 병태는 시토카인 방출 증후군 (CRS)으로서 공지되기도 한다. 많은 환자에서, CRS는 스테로이드 및 면역 요법, 예컨대 IL-6 활성을 차단하는 토실리주맙 (악템라(Actemra)™, 제넨테크 (Genentech; 미국 캘리포니아주 사우스 샌프란시스코))을 포함한 표준 지원 요법으로 관리될 수 있다.
변형된 림프구 조성물을 사용한 치료의 적어도 하나의 치료상 유효 사이클이 대상체에게 투여될 것이다. "치료의 치료상 유효 사이클"은 투여될 때 해당 질환에 대한 개체의 치료에 대해 긍정적인 치료 반응을 가져 오는 치료의 사이클을 의도한다. "양성 치료 반응"은 본 발명에 따른 치료를 받고 있는 개체가 종양 감소 및/또는 림프구 요법에 대한 필요성 감소와 같은 개선을 포함하여, 질환의 한 가지 이상의 증상에 있어서의 개선을 나타내는 것으로 의도된다.
특정 실시양태에서, 림프구 또는 다른 의약을 포함하는 조성물의 다수의 치료상 유효 용량이 투여될 것이다. 본 발명의 조성물은 반드시는 아니지만 전형적으로, 주사, 예컨대 피하로, 피내로, 정맥내로, 동맥내로, 근육내로, 복강내로, 골수내, 종양내로, 결절내로를 통해, 주입에 의해 또는 국소적으로 투여된다. 제약 제제는 투여 직전에 액상 용액 또는 현탁액의 형태일 수 있다. 전술한 내용은 예시적인 것인데, 이는 부가의 투여 방식이 또한 고려되기 때문이다. 제약 조성물은 관련 기술분야에 공지된 임의의 의학적으로 허용되는 방법에 따라 동일하거나 상이한 투여 경로를 사용하여 투여될 수 있다.
투여되는 실제 용량은 대상체의 연령, 체중 및 일반적인 상태 뿐만 아니라 치료되는 병태의 중증도, 의료 전문가의 판단, 및 투여되는 특별한 림프구에 따라 달라질 것이다. 치료상 유효량은 관련 기술분야의 통상의 기술자에 의해 결정될 수 있고, 각각의 특별한 경우의 특별한 요건에 따라 조정될 것이다.
일반적으로, 림프구의 치료상 유효량은 환자당 총 약 1 x 105 내지 약 1 x 1010개 림프구 또는 그 초과의 범위, 예컨대 1 x 106 내지 약 1 x 1010, 예를 들어, 1 x 107 내지 1 x 109, 예컨대 5 x 107 내지 5 x 108, 또는 이들 범위 내의 임의의 양일 것이다. 다른 투여량 범위는 체중 kg당 1x104 내지 1x1010개의 세포일 수 있다. 총 림프구 수는 단일 볼루스 용량으로 투여될 수 있거나, 또는 1일 이상의 간격으로 2회 이상의 용량으로 투여될 수 있다. 림프구의 총 수는 단일 볼루스 용량으로 투여될 수 있거나, 또는 1일 이상의 간격으로 2회 이상의 용량으로 투여될 수 있다. 투여되는 화합물의 양은 특이적 림프구 조성의 효능, 치료되는 질환 및 투여 경로에 의존할 것이다.
부가적으로, 용량은 림프구의 혼합물, 예컨대 CD8+ 세포와 CD4+ 세포의 혼합물을 포함할 수 있다. CD8+ 세포와 CD4+ 세포의 혼합물이 제공되는 경우에, CD8+ 세포 대 CD4+ 세포의 비는, 예를 들어, 1:1, 1:2 또는 2:1, 1:3 또는 3:1, 1:4 또는 4:1, 1:5 또는 5:1 등일 수 있다.
변형된 림프구는 다른 작용제 이전에, 동시에 또는 이후에 투여될 수 있다. 다른 작용제와 동시에 제공되는 경우에, 변형된 림프구는 동일하거나 상이한 조성물에 제공될 수 있다. 따라서, 림프구 및 다른 작용제는 동반 요법을 통해 개체에게 제시될 수 있다. "동반 요법"은 물질의 조합의 치료 효과가 요법을 받는 대상체에서 발생하도록 하는 대상체에 대한 의도된 투여이다. 예를 들어, 동반 요법은 변형된 림프구를 포함하는 제약 조성물의 용량, 및 특별한 투여 요법에 따라 조합하여 치료상 유효 용량을 포함하는 적어도 하나의 다른 작용제, 예컨대 또 다른 화학 요법제를 포함하는 제약 조성물의 용량을 투여함으로써 달성될 수 있다. 유사하게, 변형된 림프구 및 치료제는 적어도 하나의 치료 용량으로 투여될 수 있다. 별도의 제약 조성물의 투여는 동시에 또는 상이한 시간에 (예를 들어, 동일한 날에 또는 상이한 날에 어느 한 순서로 순차적으로) 수행될 수 있으며, 단 이들 물질의 조합의 치료 효과가, 요법을 받는 대상체에서 야기되어야 한다.
본원에 기재된 바와 같이, 본 발명의 조작된 유형 I 캐스케이드 이펙터 복합체는 게놈 편집 도구를 제공한다. 게놈 편집을 위해 포유동물 세포에서 클래스 1 CRISPR-Cas 시스템의 기능적 재구성을 명확하게 보여주는 실험은, 이러한 간소화된 플라스미드 설계가 더 적은 단백질 구성성분과 고유한 PAM 요구 사항을 나타내는 시스템을 포함한 다른 클래스 1 CRISPR-Cas 시스템, 및 잠재적으로 심지어 유형 III CRISPR-Cas 시스템으로부터의 RNA 표적화 및 DNA 표적화 이펙터 복합체를 사용할 수 있다는 것을 보여준다 (예를 들어, 문헌 [Hille, F., et al., Cell 172:1239-1259 (2018); Tamulaitis, G., et al., Trends Microbiol. 25:49-61 (2017)] 참조). 캐스케이드 복합체의 다중 서브유닛 본성은 이펙터 융합물, 예컨대 합성 전사 인자, 후성유전자 변형제 및 염기 편집기의 다가 및/또는 입체적으로 정밀한 모집을 위한 잠재력을 제공한다. 또한, 유형 I 시스템으로부터의 완전한 DNA 간섭 경로의 이종 발현 (즉, Cas3 헬리카제-뉴클레아제의 게놈 표적 부위로의 캐스케이-매개 동원)을 이용하여 큰 DNA 결실을 생성하고, 상동성-지정 복구에 대한 긴 ssDNA 트랙을 노출시키고/거나 규정된 게놈 로커스에서 단백질-DNA 로드블록을 기계적으로 붕괴시킬 수 있다. 따라서, 본 발명의 한 실시양태에서, 조작된 클래스 1 CRISPR-Cas 시스템을 사용하여 큰 결실 영역을 생성할 수 있으며, 공여자 폴리뉴클레오티드 (예를 들어, 적절한 상동성 아암을 포함함)가 세포 내로 도입될 수 있어, 공여자 폴리뉴클레오티드의 적어도 일부분이 영역으로 삽입되는 것을 용이하게 할 수 있다.
본 발명의 실시양태는 하기를 포함하나 이에 제한되지는 않는다.
실시양태 1.
하기를 포함하는 조성물:
제1 Cse2 서브유닛 단백질, 제1 Cas5 서브유닛 단백질, 제1 Cas6 서브유닛 단백질, 및 제1 Cas7 서브유닛 단백질,
제1 Cas8 서브유닛 단백질 및 제1 FokI를 포함하며, 여기서 제1 Cas8 서브유닛 단백질의 N-말단 또는 제1 Cas8 서브유닛 단백질의 C-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 여기서 제1 링커 폴리펩티드가 약 10개 아미노산 내지 약 40개 아미노산의 길이를 갖는 것인 제1 융합 단백질, 및
제1 핵산 표적 서열에 결합할 수 있는 제1 스페이서를 포함하는 제1 가이드 폴리뉴클레오티드
를 포함하는 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체; 및
제2 Cse2 서브유닛 단백질, 제2 Cas5 서브유닛 단백질, 제2 Cas6 서브유닛 단백질, 및 제2 Cas7 서브유닛 단백질,
제2 Cas8 서브유닛 단백질 및 제2 FokI를 포함하며, 여기서 제2 Cas8 서브유닛 단백질의 N-말단 또는 제2 Cas8 서브유닛 단백질의 C-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 여기서 제2 링커 폴리펩티드가 약 10개 아미노산 내지 약 40개 아미노산의 길이를 갖는 것인 제2 융합 단백질, 및
제2 핵산 표적 서열에 결합할 수 있는 제2 스페이서를 포함하며, 여기서 제2 핵산 표적 서열의 프로토스페이서 인접 모티프 (PAM)와 제1 핵산 표적 서열의 PAM이 약 20 bp 내지 약 42 bp의 인터스페이서 거리를 갖는 것인 제2 가이드 폴리뉴클레오티드
를 포함하는 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체.
실시양태 2. 제1 링커 폴리펩티드가 약 15개 아미노산 내지 약 30개 아미노산의 길이를 갖는 것인, 실시양태 1의 조성물.
실시양태 3. 제1 링커 폴리펩티드가 약 17개 아미노산 내지 약 20개 아미노산의 길이를 갖는 것인, 실시양태 2의 조성물.
실시양태 4. 제2 링커 폴리펩티드가 약 15개 아미노산 내지 약 30개 아미노산의 길이를 갖는 것인, 실시양태 1 내지 3 중 어느 하나의 조성물.
실시양태 5. 제2 링커 폴리펩티드가 약 17개 아미노산 내지 약 20개 아미노산의 길이를 갖는 것인, 실시양태 4의 조성물.
실시양태 6. 제1 링커 폴리펩티드와 제2 링커 폴리펩티드의 길이가 동일한 것인, 임의의 전술한 실시양태의 조성물.
실시양태 7. 제2 핵산 표적 서열 및 제1 핵산 표적 서열이 각각 약 22 bp 내지 약 40 bp의 인터스페이서 거리를 갖는 것인, 임의의 전술한 실시양태의 조성물.
실시양태 8. 제2 핵산 표적 서열 및 제1 핵산 표적 서열이 각각 약 26 bp 내지 약 36 bp의 인터스페이서 거리를 갖는 것인, 실시양태 7의 조성물.
실시양태 9. 제2 핵산 표적 서열 및 제1 핵산 표적 서열이 각각 약 29 bp 내지 약 35 bp의 인터스페이서 거리를 갖는 것인, 실시양태 8의 조성물.
실시양태 10. 제2 핵산 표적 서열 및 제1 핵산 표적 서열이 각각 약 30 bp 내지 약 34 bp의 인터스페이서 거리를 갖는 것인, 실시양태 9의 조성물.
실시양태 11. 제1 FokI 및 제2 FokI가 연합하여 동종이량체를 형성할 수 있는 단량체성 서브유닛인, 임의의 전술한 실시양태의 조성물.
실시양태 12. 제1 FokI 및 제2 FokI가 연합하여 이종이량체를 형성할 수 있는 별개의 단량체성 서브유닛인, 실시양태 1 내지 10 중 어느 하나의 조성물.
실시양태 13. 제1 Cas8 서브유닛 단백질의 N-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단에 공유적으로 연결되는 것인, 임의의 전술한 실시양태의 조성물.
실시양태 14. 제1 Cas8 서브유닛 단백질의 C-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 N-말단에 공유적으로 연결되는 것인, 실시양태 1 내지 12 중 어느 하나의 조성물.
실시양태 15. 제2 Cas8 서브유닛 단백질의 N-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단에 공유적으로 연결되는 것인, 임의의 전술한 실시양태의 조성물.
실시양태 16. 제2 Cas8 서브유닛 단백질의 C-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 N-말단에 공유적으로 연결되는 것인, 실시양태 1 내지 14 중 어느 하나의 조성물.
실시양태 17. 제1 Cas8 서브유닛 단백질 및 제2 Cas8 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하는 것인, 임의의 전술한 실시양태의 조성물.
실시양태 18. 제1 Cse2 서브유닛 단백질 및 제2 Cse2 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하고, 제1 Cas5 서브유닛 단백질 및 제2 Cas5 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하고, 제1 Cas6 서브유닛 단백질 및 제2 Cas6 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하고, 제1 Cas7 서브유닛 단백질 및 제2 Cas7 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하는 것인, 임의의 전술한 실시양태의 조성물.
실시양태 19. 제1 가이드 폴리뉴클레오티드가 RNA를 포함하는 것인, 임의의 전술한 실시양태의 조성물.
실시양태 20. 제2 가이드 폴리뉴클레오티드가 RNA를 포함하는 것인, 임의의 전술한 실시양태의 조성물.
실시양태 21. 게놈 DNA가 제2 핵산 표적 서열의 PAM 및 제1 핵산 표적 서열의 PAM을 포함하는 것인, 임의의 전술한 실시양태의 조성물.
실시양태 22. 임의의 전술한 실시양태의 조성물을 포함하는 세포.
실시양태 23. 세포의 게놈 DNA가 제2 핵산 표적 서열의 PAM 및 제1 핵산 표적 서열의 PAM을 포함하는 것인, 실시양태 22의 세포.
실시양태 24. 세포가 원핵 세포인, 실시양태 22 또는 23의 세포.
실시양태 25. 세포가 진핵 세포인, 실시양태 22 또는 23의 세포.
실시양태 26. 실시양태 1 내지 21 중 어느 하나의 제1 Cse2 서브유닛 단백질, 제1 Cas5 서브유닛 단백질, 제1 Cas6 서브유닛 단백질, 제1 Cas7 서브유닛 단백질, 제1 융합 단백질 및 제1 가이드 폴리뉴클레오티드를 코딩하는 하나 이상의 핵산 서열.
실시양태 27. 실시양태 1 내지 21 중 어느 하나의 제2 Cse2 서브유닛 단백질, 제2 Cas5 서브유닛 단백질, 제2 Cas6 서브유닛 단백질, 제2 Cas7 서브유닛 단백질, 제2 융합 단백질 및 제2 가이드 폴리뉴클레오티드를 코딩하는 하나 이상의 핵산 서열.
실시양태 28. 실시양태 26, 실시양태 27, 또는 실시양태 26 및 실시양태 27의 하나 이상의 핵산 서열을 포함하는 하나 이상의 발현 카세트.
실시양태 29. 실시양태 28의 하나 이상의 발현 카세트를 포함하는 하나 이상의 벡터.
실시양태 30.
하기 단계를 포함하는, 제1 핵산 표적 서열 및 제2 핵산 표적 서열을 포함하는 폴리뉴클레오티드를 결합하는 방법:
세포 또는 생화학적 반응 내로의 도입을 위해 실시양태 1 내지 21 중 어느 하나의 조성물을 제공하는 단계; 및
상기 조성물을 세포 또는 생화학적 반응 내로 도입하며, 이로써 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제1 핵산 표적 서열의 접촉 및 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제2 핵산 표적 서열의 접촉을 용이하게 하여, 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제1 핵산 표적 서열의 결합 및 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 폴리뉴클레오티드 내의 제2 핵산 표적 서열의 결합을 초래하는 단계.
실시양태 31. 게놈 DNA가 폴리뉴클레오티드를 포함하는 것인, 실시양태 30의 방법.
실시양태 32.
하기 단계를 포함하는, 제1 핵산 표적 서열 및 제2 핵산 표적 서열을 포함하는 폴리뉴클레오티드를 커팅하는 방법:
세포 또는 생화학적 반응 내로의 도입을 위해 실시양태 1 내지 21 중 어느 하나의 조성물을 제공하는 단계; 및
상기 조성물을 세포 또는 생화학적 반응 내로 도입하며, 이로써 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제1 핵산 표적 서열의 접촉 및 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제2 핵산 표적 서열의 접촉을 용이하게 하여, 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체에 의한 제1 핵산 표적 서열의 커팅 및 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체에 의한 제2 핵산 표적 서열의 커팅을 초래하는 단계.
실시양태 33. 게놈 DNA가 폴리뉴클레오티드를 포함하는 것인, 실시양태 32의 방법.
실시양태 34. 실시양태 1 내지 21 중 어느 하나의 조성물; 및 완충제를 포함하는 키트.
실시양태 35. 실시양태 26, 실시양태 27, 또는 실시양태 26 및 실시양태 27의 하나 이상의 핵산 서열; 및 완충제를 포함하는 키트.
실시양태 36. 하기를 포함하는 조성물:
하기를 포함하는 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체:
Cse2 서브유닛 단백질, Cas5 서브유닛 단백질, Cas6 서브유닛 단백질, 및 Cas7 서브유닛 단백질,
Cas8 서브유닛 단백질 및 제1 FokI를 포함하며, 여기서 제1 Cas8 서브유닛 단백질의 N-말단 또는 제1 Cas8 서브유닛 단백질의 C-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되는 것인 제1 융합 단백질, 및
핵산 표적 서열에 결합할 수 있는 스페이서를 포함하는 가이드 폴리뉴클레오티드; 및
dCas3* 단백질 및 제2 FokI를 포함하는 조작된 클래스 1 유형 I CRISPR-Cas3 융합 단백질을 포함하며, 여기서 dCas3* 단백질의 N-말단 또는 dCas3* 단백질의 C-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 제1 링커 폴리펩티드가 약 10개 아미노산 내지 약 40개 아미노산의 길이를 갖는 것인 제2 융합 단백질.
실시양태 37. 제1 링커 폴리펩티드가 약 5개 아미노산 내지 약 40개 아미노산의 길이를 갖는 것인, 실시양태 36의 조성물.
실시양태 38. 제2 링커 폴리펩티드가 약 5개 아미노산 내지 약 40개 아미노산의 길이를 갖는 것인, 실시양태 36의 조성물.
실시양태 39. 실시양태 36 내지 38 중 어느 하나의 조성물을 포함하는 세포.
실시양태 40. 세포가 원핵 세포인, 실시양태 39의 세포.
실시양태 41. 세포가 진핵 세포인, 실시양태 39의 세포.
실시양태 42. 실시양태 36 내지 38 중 어느 하나의 Cse2 서브유닛 단백질, Cas5 서브유닛 단백질, Cas6 서브유닛 단백질, Cas7 서브유닛 단백질, 제1 융합 단백질 및 가이드 폴리뉴클레오티드를 코딩하는 하나 이상의 핵산 서열.
실시양태 43. 실시양태 36 내지 38 중 어느 하나의 제2 융합 단백질을 코딩하는 하나 이상의 핵산 서열.
실시양태 44. 실시양태 42, 실시양태 43, 또는 실시양태 42 및 실시양태 43의 하나 이상의 핵산 서열을 포함하는 하나 이상의 발현 카세트.
실시양태 45. 실시양태 44의 하나 이상의 발현 카세트를 포함하는 하나 이상의 벡터.
실시양태 46. 하기 단계를 포함하는, 핵산 표적 서열을 포함하는 폴리뉴클레오티드를 결합하는 방법:
세포 또는 생화학적 반응 내로의 도입을 위해 실시양태 36 내지 38 중 어느 하나의 조성물을 제공하는 단계; 및
상기 조성물을 세포 또는 생화학적 반응 내로 도입함으로써, 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 핵산 표적 서열의 접촉 및 제2 융합 단백질과 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체의 접촉을 용이하게 하여, 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체 및 제2 융합 단백질과 폴리뉴클레오티드 내의 핵산 표적 서열의 결합을 초래하는 단계.
실시양태 47. 게놈 DNA가 폴리뉴클레오티드를 포함하는 것인, 실시양태 46의 방법.
실시양태 48. 하기 단계를 포함하는, 핵산 표적 서열을 포함하는 폴리뉴클레오티드를 커팅하는 방법:
세포 또는 생화학적 반응 내로의 도입을 위해 실시양태 36 내지 38 중 어느 하나의 조성물을 제공하는 단계; 및
상기 조성물을 세포 또는 생화학적 반응 내로 도입하며, 이로써 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제1 핵산 표적 서열의 접촉 및 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제2 핵산 표적 서열의 접촉을 용이하게 하고,
상기 조성물을 세포 또는 생화학적 반응 내로 도입함으로써, 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 핵산 표적 서열의 접촉 및 제2 융합 단백질과 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체의 접촉을 용이하게 하여, 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체 및 제2 융합 단백질에 의한 핵산 표적 서열의 커팅을 초래하는 단계.
실시양태 49. 게놈 DNA가 폴리뉴클레오티드를 포함하는 것인, 실시양태 48의 방법.
실시양태 50. 실시양태 36 내지 38 중 어느 하나의 조성물; 및 완충제를 포함하는 키트.
실시양태 51. 실시양태 42, 실시양태 43, 또는 실시양태 42 및 실시양태 43의 하나 이상의 핵산 서열; 및 완충제를 포함하는 키트.
실시양태 52. 야생형 유형 I CRISPR Cas3 단백질 ("wtCas3 단백질")에 비해 DNA를 따라 이동하는 것을 감소시킬 수 있는 조작된 유형 I CRISPR Cas3 돌연변이체 단백질 ("mCas3 단백질")로서, mCas3 단백질은
상응하는 wtCas3 단백질과의 약 95% 이상의 서열 동일성을 포함하고,
아미노 말단, 카르복시 말단, 또는 아미노 말단과 카르복시 말단 둘 다에 공유적으로 연결된 핵 국재화 시그널을 포함하고,
헬리카제 활성을 하향-조정하는 하나 이상의 돌연변이를 포함하며, 여기서 조작된 유형 I CRISPR Cas3 돌연변이체 단백질이 뉴클레아제 활성을 보유하고;
여기서 DNA는 핵산 표적 서열을 포함하는 표적 영역을 포함하는 이중-가닥 DNA (dsDNA)이고;
여기서 wtCas3 단백질이 상응하는 캐스케이드 핵단백질 복합체와 연합되고 ("캐스케이드 NP 복합체/wtCas3 단백질"), 캐스케이드 NP 복합체가 핵산 표적 서열에 상보적인 스페이서를 포함하는 가이드를 포함하는 경우에, 핵산 표적 서열에 대한 캐스케이드 NP 복합체/wtCas3 단백질의 결합은 DNA의 표적 영역에서의 절단을 용이하게 하며, 이로써 결실 ("wtCas3-결실)을 초래하고;
여기서 mCas3 단백질이 캐스케이드 NP 복합체와 연합되고 ("캐스케이드 NP 복합체/mCas3 단백질") 핵산 표적 서열에 결합하는 경우에, 이는 DNA의 표적 영역에서의 절단을 용이하게 하며, 이로써 wtCas3-결실에 비해 더 짧은 결실을 초래하는 것인
mCas3 단백질.
실시양태 53. 하나 이상의 돌연변이가 아미노산의 치환인, 실시양태 53의 mCas3 단백질.
실시양태 54. 하나 이상의 돌연변이가 헬리카제 도메인의 RecA1 영역 또는 RecA2 영역 내에 있는 것인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 55. 하나 이상의 돌연변이가 wtCas3 단백질에 비해 단일-가닥 DNA (ssDNA)에 대한 mCas3 단백질의 결합을 하향-조정하는 것인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 56. 하나 이상의 돌연변이가 wtCas3 단백질에 비해 mCas3 단백질에 의한 아데노신 트리포스페이트 (ATP)의 가수분해를 하향-조정하거나 또는 mCas3 단백질에 대한 ATP의 결합을 하향-조정하는 것인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 57. mCas3 단백질에 대한 코딩 서열이 캐스케이드 NP 복합체의 Cas 단백질의 코딩 서열의 아미노 말단 또는 카르복시 말단에 공유적으로 연결되는 것인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 58. 하나 이상의 돌연변이가 wtCas3 단백질에 비해 단일-가닥 DNA (ssDNA)에 대한 mCas3 단백질의 결합을 하향-조정하는 것인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 59. mCas3 단백질에 대한 코딩 서열이 캐스케이드 RNP 복합체의 Cas 단백질의 코딩 서열의 아미노 말단 또는 카르복시 말단에 공유적으로 연결되는 것인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 60. Cas 단백질이 Cse2, Cas8 단백질, Cas7 단백질, Cas6 단백질, 및 Cas5 단백질로 이루어진 군으로부터 선택되는 것인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 61. wtCas3 단백질이 이. 콜라이 유형 1 CRISPR Cas3 단백질인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 62. 하나 이상의 돌연변이가 D452H, A602V, 및 D452H 및 A602V로 이루어진 군으로부터 선택되는 것인, 실시양태 61의 mCas3 단백질.
실시양태 63. DNA가 세포 내에 있는 것인, 임의의 전술한 실시양태의 mCas3 단백질.
실시양태 64. 세포가 진핵 세포인, 실시양태 63의 mCas3 단백질.
실시양태 65. 진핵 세포가 포유동물 세포 (예를 들어, 인간 세포)인, 실시양태 64의 mCas3 단백질.
실시양태 66. 실시양태 52 내지 65 중 어느 하나의 mCas3 단백질을 코딩하는 하나 이상의 폴리뉴클레오티드.
실시양태 67. 포유동물 세포에서의 발현을 위해 조절 서열에 작동가능하게 연결된 실시양태 52 내지 65 중 어느 하나의 mCas3 단백질을 코딩하는 폴리뉴클레오티드 서열을 포함하는 플라스미드.
실시양태 68. 포유동물 세포에서의 발현을 위해 조절 서열에 작동가능하게 연결된, 실시양태 52 내지 65 중 어느 하나의 mCas3 단백질을 코딩하는 폴리뉴클레오티드 서열 및 상응하는 유형 I CRISPR 캐스케이드의 단백질 구성성분을 코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 하나 이상의 플라스미드.
실시양태 69. 포유동물 세포에서의 발현을 위해 조절 서열에 작동가능하게 연결된 하나 이상의 가이드 폴리뉴클레오티드를 코딩하는 플라스미드를 추가로 포함하는, 실시양태 68의 하나 이상의 플라스미드.
실시양태 70. 실시양태 52 내지 65 중 어느 하나의 mCas3 단백질을 포함하는 유형 I CRISPR 캐스케이드 핵단백질 복합체.
실시양태 71. 핵단백질 복합체가 RNP인, 실시양태 70의 유형 I CRISPR 캐스케이드 핵단백질 복합체.
본 발명의 바람직한 실시양태가 본원에 제시되고 기재되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술분야의 통상의 기술자에게 명백할 것이다. 본 명세서 및 실시예로부터, 관련 기술분야의 통상의 기술자는 본 발명의 본질적인 특징을 확인할 수 있으며, 그의 취지 및 범주를 벗어나지 않고서도 본 발명을 다양한 활용 및 조건에 적응시키기 위해 본 발명의 변화, 치환, 변이 및 변형을 만들 수 있다. 이러한 변화, 치환, 변이 및 변형은 또한 본 개시내용의 범주 내에 속하는 것으로 의도된다.
실험
본 발명의 측면은 하기 실시예에 예시된다. 사용된 숫자 (예를 들어, 양, 농도, 퍼센트 변화 등)와 관련하여 정확성을 보장하기 위해 노력했지만, 일부 실험적 오차 및 편차를 고려해야 한다. 달리 표시되지 않는 한, 온도는 섭씨 온도이고 압력은 대기압 또는 그 근처이다. 이들 실시예는 단지 예시로서 제공되며 본 발명의 범주를 제한하려는 의도가 아님을 이해해야 한다.
실시예 1
캐스케이드 구성성분을 코딩하는 폴리뉴클레오티드의 인 실리코 설계
본 실시예는 유형 I-E CRISPR-Cas 시스템으로부터 유래된 유전자, 단백질 및 CRISPR 서열을 사용하여 캐스케이드를 코딩하는 폴리뉴클레오티드 구성성분의 설계에 대한 설명을 제공한다.
표 15는 유형 I-E, 구체적으로 이. 콜라이 균주 K-12 MG1655로부터의 캐스케이드의 5개 단백질을 코딩하는 유전자의 폴리뉴클레오티드 DNA 서열 뿐만 아니라 이로써 생성되는 단백질 구성성분의 아미노산 서열을 제시한다. 게놈 서열은 NCBI 참조 서열 NZ_CP014225.1로부터 수득되었다. 표 15에서, 폴리뉴클레오티드 서열은 이. 콜라이 gDNA로부터 증폭되었거나 또는 이. 콜라이에서의 발현 및 또한 인간 세포에서의 발현을 위해 특이적으로 코돈-최적화된 캐스케이드 단백질 구성성분을 코딩하는 제조업체 생산 폴리뉴클레오티드로부터 증폭되었다.
Figure pct00031
또한, 캐스케이드 단백질을 포함하는 몇 가지 융합 단백질이 설계되었다. 표 16은 캐스케이드 단백질 융합 단백질을 코딩하는 유전자의 폴리뉴클레오티드 DNA 서열 뿐만 아니라 이로써 생성된 단백질 구성성분의 아미노산 서열을 제시한다. 대부분의 경우에, 표 16에 기재된 융합 단백질은 융합 구축물 내에서 2개의 폴리펩티드 서열을 연결하는 짧은 트리-아미노산 링커를 포함하며; 이러한 링커는 전형적으로 글리신-글리신-세린 (GGS) 또는 글리신-세린-글리신 (GSG)을 포함한다. 각각의 특별한 융합 단백질에 사용되는 정확한 트리-아미노산 링커 서열는 표 16에서 완전한 길이의 아미노산 서열에서 찾을 수 있다.
Figure pct00032
Cse2 단백질 상의 His6 (헥사히스티딘; 서열식별번호: 418) 및 스트렙-태그™ II (GE 헬스케어 바이오-사이언시스 (GE Healthcare Bio-Sciences; 미국 펜실베니아주 피츠버그)) (서열식별번호: 419) 펩티드 태그가 다른 캐스케이드 단백질과 공동-발현될 때, 이는 니켈-니트릴로아세트산 (Ni-NTA) 수지 또는 스트렙-탁틴(Strep-Tactin)™ (IBA GMBH LLC; 독일 괴팅겐) 수지를 통해 각각 복합체를 정제 할 수 있게 한다. HRV3C (인간 리노바이러스 3C) 프로테아제 인식 서열 (서열식별번호: 420)은 HRV3C 프로테아제에 의해 절단되며, 관심 단백질로부터 N-말단 융합물을 제거하는데 사용될 수 있다. Cas6, Cas7, 및/또는 Cas8 단백질 상의 NLS (핵 국재화 시그널; 서열식별번호: 421) 펩티드 태그는 진핵 시스템에서의 핵 트래피킹을 가능하게 한다. Cas6 또는 Cas7 단백질 상의 HA (혈구 응집소; 서열식별번호: 422) 펩티드 태그는 항-HA 항체를 사용한 웨스턴 블롯팅에 의해 이종 단백질 발현을 검출할 수 있게 한다. MBP (말토스 결합 단백질; 서열식별번호: 423) 펩티드 융합은 Cas8 단백질의 정제를 용이하게 하는 가용화 태그이다. TEV (담배 식각 바이러스) 프로테아제 인식 서열 (서열식별번호: 424)은 TEV 프로테아제에 의해 절단되고 관심 단백질로부터 N-말단 융합물을 제거하는데 사용될 수 있다. FokI 뉴클레아제 도메인은 문헌 [Guo, J., et al., J. Mol. Biol. 400:96-107 (2010)]에 기재된 샤키 변이체를 포함하고, 2개의 단량체성 FokI 서브유닛이 연합하여 동종이량체를 형성하며, 동종이량체화 시 이중-가닥 DNA 절단을 촉매한다. 링커 서열 (서열식별번호: 425)은 FokI 뉴클레아제 도메인을 Cas8 단백질과 융합시키는데 사용된다.
FokI 뉴클레아제 도메인을 Cas8 단백질에 연결하는 다양한 길이 및 아미노산 조성의 부가의 링커 서열이 설계되었다. 이들 아미노산 서열은 표 17에서 찾을 수 있다.
Figure pct00033
표 18은 전구체 crRNA로 전사되고 캐스케이드의 RNA 엔도뉴클레아제 단백질에 의해 프로세싱될 때, 생화학적 검정 및 세포 배양 유전자 편집 실험에서 상보 적 DNA 서열을 표적화하는 가이드 RNA로서 기능하는 성숙한 crRNA를 생성하는 4개의 최소 CRISPR 어레이의 폴리뉴클레오티드 DNA 서열을 함유한다.
최소 CRISPR 어레이는 crRNA의 가이드 부분을 나타내는 스페이서 서열을 플랭킹하는 2개의 반복부 서열 (밑줄, 소문자)을 포함한다. 캐스케이드 엔도뉴클레아제 단백질에 의한 RNA 프로세싱은 가이드 서열을 플랭킹하는 5' 단부와 3' 단부 둘 다에 반복부 서열이 있는 crRNA를 생성한다. CRISPR 어레이는 또한 엔도뉴클레아제 캐스케이드 단백질에 의한 RNA 프로세싱에 의해 2개의 별개의 crRNA의 가이드 부분을 나타내는 2개의 스페이서 서열을 플랭킹하는 3개의 반복부 서열 (밑줄)을 포함하도록 확장될 수 있다. 원하는 경우에 부가의 스페이서 서열을 포함하도록 상기 어레이를 추가로 확장할 수 있다.
Figure pct00034
실시예 2
캐스케이드 이펙터 복합체의 생산을 위한 박테리아 발현 벡터의 설계
본 실시예는 캐스케이드-연합된 단백질을 코딩하는 박테리아 발현 벡터 뿐만 아니라 실시예 1에 기재된 바와 같은 가이드 서열을 포함하는 최소 CRISPR 어레이의 설계를 설명한다. 최소 CRISPR 어레이를 코딩하는 플라스미드와 함께 사용하기 위한 캐스케이드 서브유닛 단백질 발현 시스템의 구축이 기재되어 있다.
단일 플라스미드 캐스케이드 단백질 발현 시스템은 CasBCDE 복합체 (Cse2, Cas7, Cas5, 및 Cas6 단백질을 함유하지만, Cas8 단백질은 함유하지 않음)로서 공지된 이. 콜라이에서의 캐스케이드의 복합체, 또는 이. 콜라이에서의 전체 기능적 캐스케이드 복합체의 단백질을 발현하도록 구축되었다. 단일 플라스미드 시스템은 단일 발현 플라스미드 상의 cse2-cas7-cas5-cas6 오페론 또는 전체 cas8-cse2-cas7-cas5-cas6 오페론을 포함한다. Cas8 단백질은 캐스케이드를 재구성하기 위해 CasBCDE 복합체와 함께 혼합되는 생화학 실험에 사용하기 위해, 자체 발현 플라스미드로부터 발현될 수 있다.
발현 벡터 구축을 위한 출발 플라스미드가 사용되었다 (문헌 [Brouns, S., et al., Science 321:960-964 (2008)] 참조). Cas 오페론을 포함하는 단일 플라스미드 캐스케이드 단백질 발현 시스템이 다음과 같이 어셈블리되었다. cas 유전자에 대한 코딩 서열은 cse2-cas7-cas5-cas6 (CasBCDE 복합체) 또는 cas8-cse2-cas7-cas5-cas6 (완전한 캐스케이드 복합체)의 순서로 배열되었고, 야생형 박테리아 유전자 배열에 상응하는 서열 (NCBI 참조 서열 NZ_CP014225.1 참조)에 의해 분리되었다.
친화성 태그 (His6 또는 스트렙-태그® II, IBA GMBH LLC, 독일 괴팅겐)를 코딩하는 폴리뉴클레오티드 서열을 첨부하기 위해, 상응하는 코딩 서열을 cas8 유전자의 3' 단부와 cse2 유전자의 5' 단부의 연접부에 삽입하였고; 이들 2개의 오픈 리딩 프레임은 야생형 gDNA 서열에서 중복된다.
N-말단 NLS 및/또는 NLS-HA 태그를 코딩하는 폴리뉴클레오티드 서열을 cas6 유전자의 5' 단부 상에 첨부하기 위해, cas6과 상류 cas5 유전자 사이에 부가의 간격을 도입하였는데, 이는 이들 오픈 리딩 프레임이 야생형 gDNA 서열에서 중복되어, cas6 유전자에 대한 샤인-달가르노(Shine-Dalgarno) 서열이 cas5 유전자의 3' 부분 내에 있기 때문이다. 새로운 샤인-달가르노 서열이 새로운 NLS-Cas6 또는 NLS-HA-Cas6 오픈 리딩 프레임의 상류에 삽입되어 번역 효율을 개선시켰다.
C-말단 NLS 및/또는 HA-NLS 태그를 코딩하는 폴리뉴클레오티드 서열을 cas7 유전자의 3' 단부 상에 첨부하기 위해, cas7과 하류 cas5 유전자 사이에 부가의 간격을 도입하였는데, 이는 이들 오픈 리딩 프레임이 야생형 gDNA 서열에 아주 근접하여 있으므로, cas5 유전자에 대한 샤인-달가르노 서열이 cas7 유전자의 3' 부분 내에 있기 때문이다. 새로운 샤인-달가르노 서열이 새로운 Cas7-NLS 또는 Cas7-HA-NLS 오픈 리딩 프레임의 하류에 삽입되어 cas5 유전자에 대한 번역 효율을 개선시켰다.
N-말단 NLS-FokI-링커 융합물을 코딩하는 폴리뉴클레오티드 서열을 Cas8 단백질에 첨부하기 위해, 상응하는 코딩 서열을 cas8 유전자의 5' 단부에 삽입하였다.
cse2-cas7-cas5-cas6cas8-cse2-cas7-cas5-cas6 오페론은 pCDF (밀리포어시그마 (MilliporeSigma; 미국 캘리포니아주 헤이워드)) 벡터 백본에 클로닝되었으며, 이는 aadA 유전자의 존재로 인해 스펙티노마이신 내성을 부여한다. 오페론의 전사는 T7 프로모터에 의해 구동되고 Lac 작동인자의 제어 하에 있으며; 벡터는 또한 LacI 저해인자를 코딩한다. T7 종결인자는 cse2-cas7-cas5-cas6 또는 cas8-cse2-cas7-cas5-cas6 오페론의 하류에 클로닝되었다. 벡터는 CDF 복제 기점을 함유한다.
Cas8 또는 FokI-Cas8 융합 단백질의 발현을 위해, cas8 유전자는 pET (밀리포어시그마; 미국 캘리포니아주 헤이워드) 패밀리 벡터 백본으로 클로닝되었으며, 이는 kanR 유전자의 존재로 인해 카나마이신 내성을 부여한다. 오페론의 전사는 T7 프로모터 (PT7)에 의해 구동되며 Lac 작동인자 (lacO)의 제어 하에 있으며; 벡터는 또한 LacI 저해인자 (lacI 유전자)를 코딩한다. T7 종결인자는 cas8 유전자의 하류에 클로닝되었다. 벡터는 ColE1 복제 기점을 함유한다.
도 23a, 도 23b, 도 23c, 도 23d, 및 도 23e는 cas8, fokI-cas8, cse2-cas7-cas5-cas6 오페론, cas8-cse2-cas7-cas5-cas6 오페론, 및 fokI-cas8-cse2-cas7-cas5-cas6 오페론에 대한 과다발현 벡터의 개략도를 제시한다. 도 23a, 도 23b, 도 23c, 도 23d, 및 도 23e에서의 명칭은 (실시예 1에서 뿐만 아니라) 본 실시예에 기재되어 있고 다음과 같다: PT7 (T7 프로모터), lacO (Lac 작동인자), His6 (헥사히스티딘), MBP (말토스 결합 단백질), 스트렙-태그® II (IBA GMBH LLC, 독일 괴팅겐) HRV3C (인간 리노바이러스 3C) 프로테아제 인식 서열, TEV (담배 식각 바이러스) 프로테아제 인식 서열, NLS (핵 국재화 시그널), kanR (카나마이신 내성 유전자), lacI (LacI 저해인자 유전자), colE1 ori (복제 기점), CDF ori (CloDF13 복제 기점), FokI 뉴클레아제 도메인 (샤키 변이체), 및 aadA (아미노글리코시드 내성 단백질을 코딩하는 유전자).
표 19는 Cas8 단백질, CasBCDE 복합체의 4개의 단백질 (cse2-cas7-cas5-cas6 오페론), 및 캐스케이드 복합체의 5개 모든 단백질 (cas8-cse2-cas7-cas5-cas6 오페론)을 코딩하는 박테리아 발현 플라스미드의 서열을 제공한다. Cas8 단백질 상에 N-말단 FokI 융합을 수반한 경우 및 수반하지 않은 경우의 폴리뉴클레오티드 서열이 제공된다.
Figure pct00035
crRNA를 함유하는 CasBCDE 복합체 및 캐스케이드 복합체를 정제하기 위해, cse2-cas7-cas5-cas6 오페론 또는 cas8-cse2-cas7-cas5-cas6 오페론을 코딩하는 단백질 발현 벡터를, 최소 CRISPR 어레이를 함유하는 벡터와 조합한다.
CRISPR 어레이는 pACYC-Duet1 벡터 백본에 클로닝되었으며, 이는 camR 유전자로 인해 클로람페니콜 내성을 부여한다. 어레이의 전사는 T7 프로모터에 의해 구동되며 Lac 작동인자 (lacO)의 제어 하에 있으며; 벡터는 또한 LacI 저해인자를 코딩한다. T7 종결인자는 CRISPR 어레이의 하류에 클로닝되었다. 벡터는 p15A 복제 기점을 함유한다.
도 24는 2개의 반복부 (도 24, "반복부") 및 1개의 스페이서 (도 24, "스페이서")를 갖는 CRISPR 어레이를 함유하는 발현 벡터의 개략도를 함유한다. 이러한 어레이는 본원에 기재된 바와 같이 확장될 수 있다. 도 24에서의 명칭은 (실시예 1에서 뿐만 아니라) 본 실시예에 기재되어 있고 다음과 같다: PT7 (T7 프로모터), lacO (Lac 작동인자), lacI (LacI 저해인자 유전자), p15A ori (복제 기점) 및 camR (클로람페니콜 내성 유전자).
표 20은 최소 CRISPR 어레이의 예를 코딩하는 박테리아 발현 플라스미드의 서열을 제공한다.
Figure pct00036
실시예 3
포유동물 세포에서 캐스케이드 이펙터 복합체의 생산을 위한 진핵 발현 벡터의 설계
본 실시예는 캐스케이드-연합된 단백질을 코딩하는 진핵 발현 플라스미드 벡터 뿐만 아니라 실시예 1에 기재된 바와 같은 구성성분 서열을 포함하는 최소 CRISPR 어레이의 설계를 설명한다.
A. 각각의 캐스케이드 단백질을 발현하는 별도의 플라스미드 및 최소 CRISPR 어레이
캐스케이드 단백질은 인간 시토메갈로바이러스 (CMV) 즉발형 프로모터/인핸서에 의해 구동되는 별도의 발현 벡터 상에 단백질 구성성분 각각을 코딩하고 인간 U6 프로모터에 의해 구동되는 별도의 발현 벡터 상에 crRNA를 코딩함으로써 포유동물 세포에서 발현될 수 있다.
각각의 발현 플라스미드에 대한 출발 플라스미드는 pcDNA3.1의 유도체 (써모 사이언티픽; 미국 델라웨어주 윌밍턴)였다. 인간 세포에서의 발현을 위해 코돈-최적화된 캐스케이드 단백질에 대한 코딩 서열 (실시예 1 참조)을 CMV 프로모터의 하류 및 소 성장 호르몬 (bGH) 폴리아데닐화 시그널의 상류에서 벡터 내로 삽입하였다. cse2 유전자는 N-말단 NLS 및 3x-FLAG 에피토프 태그를 코딩하는 5' 단부에서 폴리뉴클레오티드 서열과 융합시켰다. cas5 유전자는 N-말단 NLS를 코딩하는 5' 단부에서 폴리뉴클레오티드 서열과 융합시켰다. cas6 유전자는 N-말단 NLS 및 HA 에피토프 태그를 코딩하는 5' 단부에서 폴리뉴클레오티드 서열과 융합시켰다. cas7 유전자는 N-말단 NLS 및 Myc 에피토프 태그를 코딩하는 5' 단부에서 폴리뉴클레오티드 서열과 융합시켰다. cas8 유전자는 N-말단 NLS를 코딩하는 5' 단부에서 폴리뉴클레오티드 서열과 융합시켰고; 또 다른 실시양태에서, cas8 유전자는 N-말단 NLS, HA 에피토프 태그, 및 FokI 뉴클레아제 도메인을 코딩하는 5' 단부에서 폴리뉴클레오티드 서열과 융합시켰다.
각각의 유전자 또는 유전자 융합은 pcDNA3.1 유도체 벡터 백본으로 클로닝되었으며, 이는 ampR 유전자의 존재로 인해 암피실린 내성을 부여한다. 벡터는 또한 SV40 초기 프로모터 (PSV40) 및 기점 (SV40 ori)의 하류, 및 SV40 초기 폴리아데닐화 시그널 (SV40 pA)의 상류에 있는 neoR 유전자의 존재로 인해 네오마이신 내성을 코딩한다. 인간 CMV 즉발형 프로모터/인핸서 (PCMV) 및 bGH (소 성장 호르몬) 폴리아데닐화 시그널 이외에, 벡터는 관심 유전자의 하류에 T7 프로모터를 함유하여, mRNA의 시험관내 전사를 허용한다. 벡터는 f1 복제 기점 뿐만 아니라 ColE1 복제 기점을 함유한다.
도 25는 FokI-Cas8 융합 단백질을 코딩하는 포유동물 발현 벡터의 개략도를 함유한다. 도 25에서의 명칭은 (실시예 1에서 뿐만 아니라) 본 실시예에 기재되어 있고 다음과 같다: 인간 CMV 즉발형 프로모터/인핸서 (PCMV), NLS (핵 국재화 시그널), FokI (FokI 뉴클레아제 도메인 (샤키 변이체)), Cas8 단백질 코딩 서열, bGH pA (소 성장 호르몬 폴리아데닐화 시그널), f1 ori (f1 파지 복제 기점), PSV40 (SV40 초기 프로모터), SV40 ori (SV40 기점), neoR (네오마이신 내성 유전자), SV40 pA (SV40 초기 폴리아데닐화 시그널), colE1 ori (복제 기점), 및 ampR (암피실린 내성 유전자). 다른 캐스케이드 단백질을 코딩하는 벡터가 유사하게 설계되었다.
표 21은 Cse2, Cas5, Cas6, Cas7, Cas8, 및 FokI-Cas8 각각을 코딩하는 개별 포유동물 발현 벡터의 서열을 제공한다.
Figure pct00037
CRISPR RNA는 2개의 스페이서 서열을 플랭킹하는 3개의 반복부를 함유하는 최소 CRISPR 어레이로 코딩되었다. CRISPR RNA를 생성하는 구축물은 최소 어레이에서 가장 바깥 쪽 반복부를 플랭킹하는 부가의 서열로 설계될 수 있다. 전구체 CRISPR RNA의 프로세싱은 별도의 플라스미드 상에서 발현될 수 있는 캐스케이드 복합체 (Cas6 단백질)의 RNA 프로세싱 단백질에 의해 가능해진다.
인간 CMV 프로모터가 인간 U6 프로모터 (PU6)로 대체되고 bGH 폴리아데닐화 시그널이 폴리-T 종결 시그널로 대체된 것을 제외하고는, CRISPR 어레이를 상기 기재된 바와 동일한 pcDNA3.1 유도체 벡터 백본에 클로닝하였다. 이러한 CRISPR 어레이의 예가 도 35에 예시되어 있다. 이러한 도면에서, hU6 프로모터 (도 35, 점각 영역으로서 표시됨)는 제1 반복부 서열 (투명 사각형)에 인접해 있고, 이는 제1 스페이서 서열 (도 35, 스페이서 1, 비스듬한 선)에 인접해 있으며, 이는 제2 반복부 서열 (도 35, 회색 사각형)에 인접해 있고, 이는 제2 스페이서 서열 (도 35, 스페이서 2)에 인접해 있으며, 이는 제3 반복부 서열 (도 35, 흑색 사각형)에 인접해 있다. 도 35에서, 쌍형성된 gRNA 가이드를 포함하는 영역이 제시되어 있다 (도 35, 쌍형성된 gRNA).
도 26은 TRAC 유전자를 표적화하는 대표적인 CRISPR 어레이를 코딩하는 진핵 발현 벡터의 개략도를 함유한다. 도 26에서의 명칭은 (실시예 1에서 뿐만 아니라) 본 실시예에 기재되어 있고 다음과 같다: PU6 (인간 U6 프로모터), 반복부 (CRISPR RNA 반복부), TRAC 스페이서-1 (TRAC 유전자를 표적화하는 제1 스페이서), TRAC 스페이서-2 (TRAC 유전자를 표적화하는 제2 스페이서), 폴리T (폴리-T 종결 시그널), f1 ori (f1 파지 복제 기점), PSV40 (SV40 초기 프로모터), SV40 ori (SV40 기점), neoR (네오마이신 내성 유전자), SV40 pA (SV40 초기 폴리아데닐화 시그널), colE1 ori (복제 기점), 및 ampR (암피실린 내성 유전자).
표 22는 TRAC 유전자를 표적화하는 CRISPR 어레이를 코딩하는 대표적인 포유동물 발현 벡터의 서열을 제공하며; TRAC 유전자에서의 매칭 DNA 서열을 표적화하는 스페이서 서열은 표 18에서 찾을 수 있다.
Figure pct00038
B. 다수의 캐스케이드 단백질 코딩 서열이 단일 프로모터로부터 발현되는 캐스케이드 단백질 발현 시스템
더 적은 발현 벡터로부터 캐스케이드 복합체의 구성성분을 발현하기 위해, 폴리시스트론성 발현 벡터를 구축하였다. 각각에서, 단일 CMV 프로모터는 2A 바이러스 펩티드 서열에 의해 분리되는 다수의 코딩 서열의 발현을 동시에 구동한다. 토세아 아시그나 바이러스 2A 펩티드 서열은 리보솜 스키핑을 유도하므로 (예를 들어, 문헌 [Liu, Z., et al., Sci. Rep. 7:2193 (2017)] 참조), 다수의 단백질 코딩 유전자가 단일 폴리시스트론성 구축물 내에서 연결될 수 있다.
폴리시스트론성 발현 플라스미드에 대한 출발 플라스미드는 CMV 프로모터 및 bGH 폴리아데닐화 시그널을 함유하는, 상기 기재된 pcDNA3.1의 동일한 유도체였다. 인간 세포에서의 발현을 위해 코돈-최적화된 캐스케이드 단백질에 대한 코딩 서열 (실시예 1 참조)을 cas7-cse2-cas5-cas6-cas8의 순서로 연결하며, 토세아 아시그나 바이러스 2A (T2A) 펩티드를 코딩하는 폴리뉴클레오티드 서열이 각각의 쌍의 유전자 사이에 삽입되었다. 또한, NLS 태그를 코딩하는 폴리뉴클레오티드 서열을 각각의 캐스케이드 단백질 유전자의 5' 단부에 첨부하고, FokI 뉴클레아제 도메인을 코딩하는 폴리뉴클레오티드 서열을 cas8 유전자의 5' 단부에 첨부하여, 30-아미노산 링커에 의해 연결하였다. 최종 구축물은 요소를 하기 순서로 갖는다: NLS-cas7-T2A-NLS-cse2-T2A-NLS-cas5-T2A-NLS-cas6-T2A-NLS-fokI-링커-cas8.
도 27은 모든 캐스케이드 단백질을 코딩하는 예시적인 폴리시스트론성 포유동물 발현 벡터의 개략도를 함유한다. 도 27에서의 명칭은 (실시예 1에서 뿐만 아니라) 본 실시예에 기재되어 있고 다음과 같다: 인간 CMV 즉발형 프로모터/인핸서 (PCMV), NLS (핵 국재화 시그널), T2A (토세아 아시그나 바이러스 2A 펩티드를 코딩하는 폴리뉴클레오티드 서열), Cas7, Cse2, Cas5, 및 Cas6 단백질에 대한 코딩 서열, fokI (FokI 뉴클레아제 도메인 (샤키 변이체) 링커 서열), Cas8 단백질에 대한 코딩 서열, bGH pA (소 성장 호르몬 폴리아데닐화 시그널), f1 ori (f1 파지 복제 기점), PSV40 (SV40 초기 프로모터), SV40 ori (SV40 기점), neoR (네오마이신 내성 유전자), SV40 pA (SV40 초기 폴리아데닐화 시그널), colE1 ori (복제 기점), ampR (암피실린 내성 유전자), 및 MluI 제한 부위.
표 23은 모든 캐스케이드 단백질을 코딩하는 예시적인 폴리시스트론성 포유동물 발현 벡터의 서열을 제공한다. 이러한 벡터는 상기 기재된 CRISPR RNA를 코딩하는 포유동물 발현 벡터와 조합되어, 포유동물 세포에서 기능적 캐스케이드 복합체를 생산할 수 있다.
Figure pct00039
C. 단일 플라스미드 발현 시스템
인간 세포에서 완전한 캐스케이드 복합체를 발현하기 위해 단일 플라스미드 캐스케이드 발현 시스템이 구축되었다. 플라스미드는 단일 플라스미드 상에 전체 cas8-cse2-cas7-cas5-cas6 오페론 및 최소 CRISPR 어레이를 코딩한다. 이러한 플라스미드는 MluI 제한 부위에 상류 인간 U6 프로모터 및 하류 폴리-T 종결 시그널과 함께 최소 CRISPR 어레이를 삽입함으로써 폴리시스트론성 단백질 발현 벡터 (표 23 및 도 27에 기재됨)로부터 구축되었다.
표 24는 인간 세포에서 캐스케이드 복합체의 형성을 용이하게 하기 위해 crRNA와 함께 5개의 모든 캐스케이드 단백질의 발현을 위한 단일 플라스미드의 서열을 제공한다.
Figure pct00040
플라스미드는 또한 이. 콜라이 및 포유동물 세포에서 Cas3 단백질 (서열식별번호: 21; 단량체 Cas3 뉴클레아제/헬리카제 이. 콜라이 K-12 아균주 MG1655)의 발현을 위해 설계되었다. 표 25는 이들 플라스미드의 구축물 및 서열을 제공한다.
Figure pct00041
실시예 4
캐스케이드 구성성분을 코딩하는 폴리뉴클레오티드의 박테리아 생산 균주 내로의 도입
본 실시예는 Cas8 서브유닛 단백질 코딩 서열의 도입 및 발현 뿐만 아니라 이. 콜라이 발현 시스템을 사용하는 박테리아 세포에서의 조작된 유형 I CRISPR-Cas 이펙터 복합체의 구성성분에 대한 코딩 서열에 대해 설명한다.
A. Cas8 단백질의 발현
T7 프로모터로부터의 His6-MBP-TEV-Cas8의 IPTG 유도성 발현을 위한 오페론을 함유하는 플라스미드 (실시예 2, 서열식별번호: 438, 표 19, 도 23a)로부터 이. 콜라이 유형 I-E Cas8 단백질이 발현되었다. 발현 플라스미드는 카나마이신에 대한 내성을 부여하였다.
Cas8 단백질을 발현시키기 위해, 이. 콜라이 세포를 발현 플라스미드로 형질전환시켰다. 간단하게, 미세원심분리기 튜브에 있는 100 μL 분취액의 화학적으로 적격한 이. 콜라이 세포 (이. 콜라이 BL21 스타(Star)™ (써모 피셔 사이언티픽 (Thermo Fisher Scientific; 미국 매사추세츠주 월섬)) 세포)를 얼음에서 10분 동안 해동하였다. 35 ng의 플라스미드 DNA를 상기 해동된 세포에 부가하고 세포를 8분 동안 얼음에서 DNA와 함께 인큐베이션하였다. 열 충격은 미세원심분리기 튜브를 42℃ 수조에 30초 동안 놓아둔 다음, 즉시 튜브를 2분 동안 얼음에 놓아 둠으로써 수행되었다. 900 μL의 2xYT 배지를 미세원심분리기 튜브에 부가하고, 미세원심분리기 튜브를 37℃ 하에 1시간 동안 튜브 회전자에 놓아 두었다. 마지막으로, 회수된 세포 100 μL를 LB 고체 카나마이신 (50 μg/mL) 상에 플레이팅하고 37℃에서 밤새 인큐베이션하였다.
항생제 선택 플레이트 상에서 성장한 집락으로부터 단일 집락을 골라 내고, 카나마이신 (50 μg/mL)이 보충된 10 mL의 2xYT 배지에 접종하였다. 배양물은 궤도 진탕기에서 200 RPM으로 진탕시키면서 37℃에서 밤새 성장시켰다. 6 mL의 밤새 배양물을 카나마이신 (50 μg/mL)이 보충된 1 L의 2xYT 배지를 갖는 2 L의 칸막이가 있는 플라스크로 옮겼다. 1 L 배양액은 600 nm에서의 광학 밀도가 0.56이 될 때까지 궤도 진탕기에서 200 RPM으로 진탕시키면서 37℃에서 성장시켰다.
이어서, IPTG를 1 mM의 최종 농도로 부가하여 발현을 유도하였다. 유도된 배양물은 궤도 진탕기에서 200 RPM으로 진탕시키면서 16℃에서 밤새 성장시켰다. 세포는 4℃에서 15분 동안 4,000 RCF에서 원심 분리함으로써 수거하였다. 세포 펠릿을 50 mL의 용해 완충제당 1개의 컴플리트(Complete)™ (로슈 (Roche; 스위스 바젤)) 프로테아제 억제제 정제가 보충된 50 mM 트리스 pH 7.5, 100 mM NaCl, 5% 글리세롤, 및 1 mM TCEP로 구성된 15 mL의 용해 완충제에 재현탁시켰다. 이와 같이 재현탁시킨 세포를 즉각적인 하류 프로세싱을 위해 50 mL 원뿔형 튜브로 옮겼다. Cas8 단백질을 정제하고, 이와 같이 정제된 단백질을 본질적으로 FokI-Cas8 융합 단백질에 대해 아래에 기재된 바와 같이 특징규명하였다 (실시예 5C).
B. 캐스케이드 RNP 복합체의 구성성분의 발현
5개의 이. 콜라이 캐스케이드 단백질 및 RNA 가이드의 전체 세트는 캐스케이드 RNP 복합체를 생산하기 위해 2-플라스미드 시스템을 사용하여 이. 콜라이 세포에서 공동-발현되었다. 하나의 플라스미드 (실시예 2, 서열식별번호: 441, 표 19, 도 23d)는 T7 프로모터로부터의 Cse2, Cas5, Cas6, Cas7, 및 Cas8 단백질의 IPTG 유도성 발현을 위한 오페론을 함유하였다. His6 친화성 태그는 Cse2의 N-말단에 대한 번역 융합으로서 포함되었다 (실시예 1, 서열식별번호: 392, 표 16). 제2 플라스미드는 J3 가이드의 IPTG 유도성 발현을 코딩한다 (실시예 2, 서열식별번호: 444, 표 20, 도 24). 캐스케이드 단백질 발현 플라스미드는 스펙티노마이신 내성을 부여하였고, 캐스케이드 RNA 가이드 발현 플라스미드는 클로람페니콜 내성을 부여하였다.
동일한 세포에서 캐스케이드 단백질과 RNA 구성성분을 공동-발현하기 위해, 이. 콜라이 세포를 2개의 플라스미드로 동시에 형질전환시켰다. 미세원심분리기 튜브에 있는 화학적으로 적격한 이. 콜라이 세포 (이. 콜라이, BL21 스타™ (DE3) (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬))의 100 μL 분취액을 얼음에서 10분 동안 해동하였다. 35 ng의 각각의 플라스미드를 상기 해동된 세포에 부가하고 세포를 8분 동안 얼음에서 DNA와 함께 인큐베이션하였다. 열 충격은 미세원심분리기 튜브를 42℃ 수조에 30초 동안 놓아둔 다음, 즉시 미세원심분리기 튜브를 2분 동안 얼음에 놓아둠으로써 수행되었다. 900 μL의 2xYT 배지를 미세원심분리기 튜브에 부가하고, 미세원심분리기 튜브를 37℃ 하에 1시간 동안 튜브 회전자에 놓아 두었다. 마지막으로, 회수된 세포 100 μL를, 클로람페니콜 (34 μg/mL) 및 스펙티노마이신 (50 μg/mL)이 있는 LB 고체 배지 상에 플레이팅하고 37℃에서 밤새 인큐베이션하였다.
항생제 선택 플레이트 상에서 성장한 집락으로부터 단일 집락을 골라 내고, 클로람페니콜 (34 μg/mL) 및 스펙티노마이신 (100 μg/mL)이 보충된 10 mL의 2xYT 배지에 접종하였다. 배양물은 궤도 진탕기에서 200 RPM으로 진탕시키면서 37℃에서 밤새 성장시켰다. 6 mL의 밤새 배양물을 클로람페니콜 (34 μg/mL) 및 스펙티노마이신 (100 μg/mL)이 보충된 1 L의 2xYT 배지를 갖는 2 L의 칸막이가 있는 플라스크로 옮겼다. 1 L 배양액은 600 nm에서의 광학 밀도가 0.56이 될 때까지 궤도 진탕기에서 200 RPM으로 진탕시키면서 37℃에서 성장시켰다.
IPTG를 1 mM의 최종 농도에 부가함으로써 두 플라스미드로부터의 발현을 유도하였다. 유도된 배양물은 궤도 진탕기에서 200 RPM으로 진탕시키면서 16℃에서 밤새 성장시켰다. 세포는 4℃에서 15분 동안 4,000 RCF에서 원심 분리함으로써 수거하였다. 세포 펠릿을 50 mL의 용해 완충제당 1개의 컴플리트™ (로슈; 스위스 바젤) 프로테아제 억제제 정제가 보충된 50 mM 트리스 pH 7.5, 100 mM NaCl, 5% 글리세롤, 및 1 mM TCEP로 구성된 15 mL의 용해 완충제에 재현탁시켰다. 이와 같이 재현탁시킨 세포를 즉각적인 하류 프로세싱을 위해 50 mL 원뿔형 튜브로 옮겼다. 캐스케이드 RNP 복합체을 정제하고, 아래에 기재된 바와 같이 특징규명하였다.
실시예 5
캐스케이드 구성성분 및 캐스케이드 RNP 복합체의 정제
본 실시예는 실시예 4B에 기재된 바와 같이 박테리아에서의 과다발현에 의해 생산된 이. 콜라이 유형 I-E 캐스케이드 RNP 복합체를 정제하는 방법을 설명한다. 이러한 방법은 고정화된 금속 친화성 크로마토그래피에 이어 크기 배제 크로마토그래피 (SEC)를 사용한다. 본 실시예는 또한, 정제된 캐스케이드 RNP 산물의 품질을 평가하는데 사용되는 방법을 설명한다. 또한, 본 실시예는 캐스케이드 구성성분의 정제 및 특징규명을 설명한다.
A. Cas8, Cas7, Cas6, Cas5, 및 Cse2 캐스케이드 RNP 복합체의 정제
이. 콜라이 유형 I-E 캐스케이드 RNP 복합체가 실시예 4B에 기재된 바와 같이 생산되었다. 캐스케이드 복합체는 고정화된 금속 친화성 크로마토그래피를 사용하여 포획되었다. 간단하게, 실시예 4B에 기재된 바와 같이 생산된, 재현탁된 세포 펠릿을 얼음에서 해동하고, 50 mL의 용해 완충제당 1개의 컴플리트™ (로슈; 스위스 바젤) 프로테아제 억제제 정제가 보충된 50 mM 트리스 pH 7.5, 100 mM NaCl, 5% 글리세롤, 및 1 mM TCEP로 구성된 부가의 15 mL의 용해 완충제에 의해 용적이 35 mL가 되게 하였다.
50 mL 원뿔형 튜브를 얼음 수조에 넣고 ½ 인치 팁이 있는 Q500 초음파 처리기 (콰니카 (Qsonica; 미국 코네티컷주 뉴타운))를 사용하여 2 라운드의 초음파 처리에 의해 세포를 용해시켰다. 각각의 라운드의 초음파 처리는 2.5분의 처리 사이클로 이루어졌으며, 50% 진폭에서 10초 초음파 처리한 다음 20초 휴식을 취하는 사이클을 반복하였다. 튜브를 초음파 처리의 라운드 사이에 1분 동안 얼음 수조에서 냉각시켰다. 용해물은 4℃에서 30분 동안 48,384 RCF으로 원심 분리함으로써 정화시켰다. 이어서, 이와 같이 정화된 상청액을, 50 mM 트리스 pH 7.5, 100 mM NaCl, 10 mM 이미다졸, 5% 글리세롤, 및 1 mM TCEP로 구성된 Ni-세척 완충제로 미리 평형화시킨 히스푸르(Hispur)™ Ni-NTA (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 수지에 부가하였다. 1.5 mL 층 용적의 니켈 친화성 수지를 각각 1 L의 이. 콜라이 발현 배양에 사용하였다. 부드럽게 혼합하면서 4℃에서 1시간 인큐베이션한 후, 수지를 4℃에서 2분 동안 500 RCF 하에 원심 분리함으로써 펠릿화하였다. 상청액을 흡인하고 수지를 5 층 용적의 Ni-세척 완충제로 5회 세척하였다. 각각의 세척 후, 수지를 4℃에서 2분 동안 500 RCF 하에 펠릿화하고, 상청액을 흡인하여 제거하였다. 마지막으로, 결합된 단백질 (캐스케이드 RNP 복합체를 포함함)은 50 mM 트리스 pH 7.5, 100 mM NaCl, 300 mM 이미다졸, 5% 글리세롤, 및 1 mM 트리스(2-카르복시에틸)포스핀 (TCEP)으로 구성된 Ni-용출 완충제의 5 층 용적을 부가함으로써 용출시켰다. 4℃에서 2분 동안 500 RCF 하에 원심 분리한 후, 니켈 친화성 용출액을 청정한 50 mL 원뿔형 튜브 내로 흡인시켰다.
니켈 친화성 용출액은 크기 배제 크로마토그래피 (SEC)에 의해 추가로 정제되었다. 니켈 친화성 용출액을 울트라셀(Ultracel)®-50 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 막이 있는 아미콘(Amicon)® (밀리포어시그마; 미국 매사추세츠주 빌러리카) 한외 여과 스핀 농축기를 사용하여 12℃에서 한외 여과함으로써 0.5 mL의 최종 용적이 되도록 농축시켰다. 농축된 샘플을 0.22 μM 울트라프리(Ultrafree)-MC GV (밀리포어시그마; 미국 캘리포니아주 헤이워드) 원심 필터를 사용하여 여과한 후, 50 mM 트리스 pH 7.5, 500 mM NaCl, 5% 글리세롤, 0.1 mM EDTA, 및 1 mM TCEP으로 구성된 SEC 완충제로 평형화시킨 하이프렙(HiPrep)™ 16/60 세파크릴(Sephacryl)® S-300 (GE 헬스케어; 스웨덴 웁살라) 칼럼 상에서 0.5 mL/분의 유속으로 4℃에서 분리함으로써 추가로 정제하였다. 단백질을 SEC 완충제로 용출하고 1 ml 분획을 수집하였다. UV 280에 의해 판단된 바와 같이, 가장 초기의 용출 피크는 고 분자량 응집 물질인 것으로 가정되었으며 상응하는 분획은 폐기되었다. 후속 용출 분획은 쿠마시 염색된 SDS-PAGE로 분석하였다. 적절하게 형성된 각각의 복합체는 Cas8 1개 분자, Cas7 6개 분자, Cas6 및 Cas5 각각 1개 분자, Cse2 2개 분자를 함유하였다. SDS-PAGE 겔 상에서 시각화될 때, 캐스케이드 단백질의 대략적인 예상 화학량론을 갖는 용출 분획을 풀링하였다. 풀링된 분획은 280 nm에서의 흡광도보다 더 큰 260 nm에서의 흡광도에 의해 입증된 바와 같이, 상당한 핵산 구성성분을 함유하고 있음을 확증하기 위해 분광 광도법으로 분석되었다.
풀링된 샘플을 울트라셀®-50 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 막이 있는 아미콘® (밀리포어시그마; 미국 캘리포니아주 헤이워드) 스핀 농축기로 100 uL가 되게 농축시킨 다음 저장 완충제로 50배 희석시킴으로써, 50 mM 트리스 pH 7.5, 100 mM NaCl, 5% 글리세롤, 0.1 mM EDTA, 및 1 mM TCEP로 구성된 저장 완충제로 교환시켰다. 마지막으로, 동일한 한외 여과 장치를 이용하여 샘플을 10 mg/mL로 농축하고 -80℃ 하에 저장하였다.
최종 정제된 산물을 분광 광도법으로 분석하여 캐스케이드 RNP 복합체의 최종 농도를 결정하고 280 nM에서의 흡광도보다 더 큰 260 nm에서의 흡광도에 의해 입증된 바와 같이 핵산 구성성분의 존재를 확증하였다. 캐스케이드 RNP 복합체의 농도는 280 nm에서의 흡광도를, 경로 길이가 1 cm인 무손상 복합체의 0.1% 용액의 계산된 흡광도로 나눔으로써 결정되었다. 정제된 복합체의 0.1% 용액의 예상 흡광도는 2.03 cm-1이며, 이는 복합체 내의 분자 각각에 대해 계산된 280 nm에서의 흡광 계수의 합 (916940 M-1cm-1)을, 복합체 내의 분자 각각의 분자량의 합 (450832 g/mole)으로 나눔으로써 계산되었다.
부가적으로, 최종 산물은 쿠마시 블루 염색으로 SDS-PAGE에 의해 분석되어 각각의 단백질 구성성분이 대략 정확한 화학량론으로 존재하였다는 것을 확증하고 오염 단백질의 존재를 평가하였다. SDS-PAGE 겔은 쿠마시 인스탄트블루(InstantBlue)™ (익스피던 (Expedeon; 미국 캘리포니아주 샌디에이고)) 염색으로 염색되었다. 겔 doc™ EZ (바이오-래드; 미국 캘리포니아주 헤라클래스) 영상화기를 사용하여 겔을 영상화하고 이미지랩(ImageLab) (바이오-래드; 미국 캘리포니아주 헤라클래스) 소프트웨어를 사용하여 주석을 달았다.
B. Cas7, Cas6, Cas5 및 Cse2 단백질을 포함하는 캐스케이드 복합체의 정제
단백질 구성성분 Cas7, Cas6, Cas5, 및 Cse2로 구성된 캐스케이드 복합체를 정제하였다. L3 가이드 RNA (실시예 2, 서열식별번호: 445, 표 20)는 본질적으로 실시예 4B에 기재된 바와 같이 제1 플라스미드 (실시예 2, 도 24)로부터 발현되었다. 캐스케이드 단백질은 본질적으로 실시예 4B에 기재된 바와 같이 제2 플라스미드 (실시예 2, 서열식별번호: 440, 표 19, 도 23c)로부터 발현되었다.
복합체는 친화성 크로마토그래피를 사용하여 포획되었다. 재현탁된 세포 펠릿을 얼음에서 해동하였다. 50 mL 원뿔형 튜브에서, 50 mL의 용해 완충제당 1개의 컴플리트™ (로슈; 스위스 바젤) 프로테아제 억제제 정제가 보충되고, 50 mM 트리스 pH 7.5, 100 mM NaCl, 5% 글리세롤, 및 1 mM TCEP로 구성된 부가의 15 mL의 용해 완충제로 용적이 35 mL 이하가 되게 하였다. 50 mL 원뿔형 튜브를 얼음 수조에 넣고 ½ 인치 팁이 있는 Q500 초음파 처리기 (콰니카; 미국 코네티컷주 뉴타운)를 사용하여 6 라운드의 초음파 처리에 의해 세포를 용해시켰다. 각각의 라운드의 초음파 처리는 1분의 처리 사이클로 이루어졌으며, 90% 진폭에서 3초 초음파 처리한 다음 9초 휴식을 취하는 사이클을 반복하였다. 튜브를 초음파 처리의 라운드 사이에 1분 동안 얼음 수조에서 냉각시켰다. 용해물은 4℃에서 30분 동안 48,384 RCF으로 원심 분리함으로써 정화시켰다. 이와 같이 정화된 상청액을, 50 mM 트리스 pH 7.5, 100 mM NaCl, 1 mM EDTA, 5% 글리세롤, 및 1 mM TCEP로 구성된 스트렙-세척 완충제로 미리 평형화시킨 스트렙-탁틴® 세파로스(Sepharose)® (IBA GMBH LLC; 독일 괴팅겐) 수지에 부가함으로써 친화성 정제하였다. 0.55 mL 층 용적의 친화성 수지를 각각 1 L의 이. 콜라이 발현 배양에 사용하였다. 부드럽게 혼합하면서 4℃에서 1시간 인큐베이션한 후, 샘플을 30 mL 일회용 중력 흐름 칼럼 (바이오-래드; 미국 캘리포니아주 헤라클래스) 상으로 따라 부어, 결합되지 않은 물질이 칼럼을 통해 흐르도록 하였다. 수지를 5 층 용적의 스트렙-세척 완충제로 5회 세척하였다. 마지막으로, 결합된 단백질은 50 mM 트리스 pH 7.5, 100 mM NaCl, 2.5 mM 데스티오비오틴, 5% 글리세롤, 1 mM EDTA, 및 1 mM TCEP로 구성된 5 층 용적의 스트렙-용출 완충제를 두 번 순차적으로 부가함으로써 용출시켰다.
친화성 용출액은 SEC에 의해 추가로 정제되었다. 친화성 용출액을 울트라셀®-50 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 막이 있는 아미콘® (밀리포어시그마; 미국 캘리포니아주 헤이워드) 스핀 농축기를 사용하여 12℃에서 한외 여과함으로써 550 uL의 최종 용적으로 농축시켰다. 농축된 샘플을 0.22 μm 13 mm 울트라크루즈(UltraCruz)® (산타 크루즈 바이오테크놀로지 (Santa Cruz Biotechnology; 미국 텍사스주 댈러스)) PVDF 주사기 필터를 사용하여 여과한 후, 50 mM 트리스 pH 7.5, 500 mM NaCl, 5% 글리세롤, 0.1 mM EDTA, 및 1 mM TCEP로 구성된 SEC 완충제로 평형화시킨 하이프렙™ 16/60 세파크릴® S-300 (GE 헬스케어; 스웨덴 웁살라) 칼럼 상에서 0.4 mL/분의 유속으로 4℃에서 분리함으로써 추가로 정제하였다. 단백질을 SEC 완충제로 용출시키고 0.75 ml 분획을 수집하였다. UV 280에 의해 판단되는 바와 같이, 가장 초기의 용출 피크는 고 분자량 응집 물질인 것으로 가정되었으며 상응하는 분획은 폐기되었다. 제2 피크에 상응하는 분획 (제1 UV 280 피크의 뒷면에 있는 숄더)을 풀링하였다.
풀링된 샘플을 울트라셀®-50 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 막이 있는 아미콘® (밀리포어시그마; 미국 캘리포니아주 헤이워드) 스핀 농축기로 200 uL 이하가 되도록 농축한 다음 저장 완충제로 75배 희석함으로써 50 mM 트리스 pH 7.5, 100 mM NaCl, 5% 글리세롤, 0.1 mM EDTA, 및 1 mM TCEP로 구성된 저장 완충제로 교환하였다. 샘플을 두 번째로 700 uL로 농축시키고 다시 저장 완충제로 20배 희석하였다. 마지막으로, 샘플을 동일한 한외 여과 장치에서 4.7 mg/mL로 농축하고 -80℃ 하에 저장하였다.
최종 정제된 산물을 분광 광도법으로 분석하여 캐스케이드 RNP 복합체의 최종 농도를 결정하고 280 nM에서의 흡광도보다 더 큰 260 nm에서의 흡광도에 의해 입증된 바와 같이 핵산 구성성분의 존재를 확증하였다. 캐스케이드 RNP 복합체의 농도는 280 nm에서의 흡광도를, 경로 길이가 1 cm인 무손상 복합체의 0.1% 용액의 계산된 흡광도로 나눔으로써 결정되었다. 정제된 복합체의 0.1% 용액의 예상 흡광도는 2.18 cm-1이며, 이는 복합체 내의 각각의 분자에 대한 280 nm에서의 계산된 흡광 계수의 합 (762240 M-1cm-1)을, 복합체 내의 각각의 분자의 분자량의 합 (348952.07 g/mole)으로 나눔으로써 계산되었다.
부가적으로, 최종 산물은 쿠마시 블루 염색으로 SDS-PAGE에 의해 분석되어 각각의 캐스케이드 단백질이 대략 정확한 화학량론으로 존재하였다는 것을 확증하고 오염 단백질의 존재를 평가하였다. SDS-PAGE 겔은 쿠마시 인스탄트블루™ (익스피던; 미국 캘리포니아주 샌디에이고) 염색으로 염색되었다. 겔 doc™ EZ (바이오-래드; 미국 캘리포니아주 헤라클래스) 영상화기를 사용하여 겔을 영상화하고 이미지랩 (바이오-래드; 미국 캘리포니아주 헤라클래스) 소프트웨어를 사용하여 주석을 달았다. 적절하게 형성된 각각의 복합체는 Cas7 6개 분자, Cas6 및 Cas5 각각 1개 분자, 및 Cse2 2개 분자를 함유하였다.
C. FokI-Cas8 융합 단백질의 정제
고정화된 금속 친화성 크로마토그래피, 양이온 교환 크로마토그래피 (CIEX), 및 마지막으로 크기 배제 크로마토그래피 (SEC)를 사용하여 박테리아 과다발현 펠릿으로부터의 이. 콜라이 유형 I-E Cas8 단백질에 대한 FokI 뉴클레아제 융합을 포함하는 융합 단백질을 정제하기 위해 사용되는 방법이 본원에 기재된다.
링커 서열을 포함한 이. 콜라이 유형 I-E FokI-Cas8 융합 단백질이 실시예 1에 기재되어 있다 (서열식별번호: 413, 표 16). 발현 플라스미드는 실시예 2에 기재되어 있다 (서열식별번호: 439, 표 19, 도 23b). 융합 단백질을 포함하는 세포는 본질적으로 실시예 4A에 기재된 바와 같이 생산되었다. Cas8 융합 단백질은 N-말단 His6 태그, 말토스 결합 단백질 도메인, TEV 절단 부위, FokI 뉴클레아제 도메인, 및 30-아미노산 링커를 함유하였다. 단백질은 고정화된 금속 친화성 크로마토그래피를 사용하여 포획되었다. 재현탁된 세포 펠릿을 함유하는 50 mL 원뿔형 튜브를 얼음에서 해동시켰다. 이어서, 튜브를 얼음 수조에 넣고 ¼ 인치 팁이 있는 Q500 초음파 처리기 (콰니카; 미국 코네티컷주 뉴타운)를 사용하여 초음파 처리에 의해 세포를 용해시켰으며, 이는 40% 진폭에서 10초 초음파 처리한 다음 20초 휴식을 취하는 사이클을 반복하여 3분의 처리 사이클 동안 수행되었다. 용해물은 4℃에서 30분 동안 30,970 RCF으로 원심 분리함으로써 정화시켰다. 이어서, 이와 같이 정화된 상청액을, 50 mM 트리스 pH 7.5, 100 mM NaCl, 10 mM 이미다졸, 5% 글리세롤, 및 1 mM TCEP로 구성된 Ni-세척 완충제로 미리 평형화시킨 히스푸르™ Ni-NTA (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 수지에 부가하였다. 2 mL 층 용적의 니켈 친화성 수지를 1 L의 이. 콜라이 발현 배양에 사용하였다. 부드럽게 혼합하면서 4℃에서 1시간 인큐베이션한 후, 샘플을 30 mL 일회용 중력 흐름 칼럼 (바이오-래드; 미국 캘리포니아주 헤라클래스) 상으로 따라 부어, 결합되지 않은 물질이 칼럼을 통해 흐르도록 하였다. 수지를 5 층 용적의 Ni-세척 완충제로 5회 세척하였다. 마지막으로, 결합된 단백질은 50 mM 트리스 pH 7.5, 100 mM NaCl, 300 mM 이미다졸, 5% 글리세롤, 및 1 mM TCEP로 구성된 5 층 용적의 Ni-용출 완충제로 용출시켰다.
니켈 친화성 용출액은 친화성 태그를 제거하기 위해 TEV 프로테아제로 처리되었다. TEV 프로테아제는 1:25 (w/w)의 비로 용출액에 부가되었다. TEV를 포함한 샘플을 12 mL 슬라이드-A-라이저(Slide-A-Lyzer)™, 10K MWCO (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 투석 카세트를 사용하여 Ni-세척 완충제에 대항하여 밤새 투석하였다.
TEV 프로테아제 및 절단된 His6-MBP 단편은 Ni 친화성 크로마토그래피에 의해 투석된 샘플로부터 제거되었다. 투석된 샘플을 Ni-세척 완충제로 평형화시킨 청정한 히스푸르™ Ni-NTA (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 수지 칼럼 상으로 따라 부었다. 이어서, 수지를 1 칼럼 용적의 Ni-NTA 세척 완충제로 세척하였다. 통과액 및 세척액을 합하고, 농축시키며, 울트라셀®-10 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 막이 있는 아미콘® (밀리포어시그마; 미국 캘리포니아주 헤이워드) 스핀 농축기를 사용하여 저장 완충제 (50 mM 트리스 pH 7.5, 500 mM NaCl, 5% 글리세롤, 및 1 mM TCEP)로 교환하였다. 이어서, 이러한 샘플은 저장을 위해 -80℃ 하에 동결시켰다.
샘플을 해동시키고 양이온 교환 크로마토그래피 (CIEX)에 의해 추가로 정제 하였다. 샘플을 얼음에서 해동하고, 50 mM 트리스 pH 7.5, 5% 글리세롤, 및 1 mM TCEP로 구성된 찬 CIEX_A 완충제로 0.475 mL에서 4.75 mL로 10배 희석하여 50 mM NaCl의 최종 농도를 초래하였다. 10 mL 모세관 루프를 사용하여, CIEX_A 완충제 및 5% CIEX_B 완충제 (50 mM 트리스 pH 7.5, 1 M NaCl, 5% 글리세롤, 및 1 mM TCEP)를 포함하는 완충제로 평형화시킨, 1 mL 하이트랩™ SP HP (GE 헬스케어; 스웨덴 웁살라) 칼럼 상에 샘플을 부하하였다. 분리 내내 유속은 0.75 mL/분이었다. 루프는 15 mL의 5% CIEX_B 완충제로 칼럼 상에 비워졌다. 결합되지 않은 샘플을 부가 2 mL의 5% CIEX_B 완충제로 세척하였다. 결합된 단백질이 5% 내지 65% CIEX_B 완충제의 8 mL 선형 구배로 용출됨에 따라 500 μL 분획을 수집하였다. 2개의 주요 UV280 용출 피크가 있었다. 이들 2개의 피크 중 첫 번째에 상응하는 4개의 분획을 풀링하였다. 풀링된 총 용적은 2 mL였다.
풀링된 CIEX 분획을 SEC에 의해 추가로 정제하였다. 풀링된 CIEX 분획은, 울트라셀®-10 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 막이 있는 아미콘® (밀리포어시그마; 미국 캘리포니아주 헤이워드) 스핀 농축기를 사용하여 12℃에서 한외 여과함으로써 0.3 mL의 최종 용적으로 농축시켰다. 농축된 샘플을, 0.22 μm 울트라프리-MC GV 원심 분리기 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 스핀 필터를 사용하여 여과시키고, Cas8 SEC 완충제 (50 mM 트리스 pH 7.5, 200 mM NaCl, 5% 글리세롤, 및 1 mM TCEP)로 평형화시킨 10/300 슈퍼덱스(Superdex)™ 200 GL 인크리즈 (GE 헬스케어; 스웨덴 웁살라) 칼럼 상에 0.6 mL/분의 유속으로 4℃ 하에 분리함으로써 추가로 정제하였다. 단백질을 Cas8 SEC 완충제로 용출시키고 0.5 ml 분획을 수집하였다. UV 280에 의해 판단되는 바와 같이 가장 초기의 용출 피크는 고 분자량 응집 물질인 것으로 가정되었으며 상응하는 분획은 폐기되었다. 두 번째 주요 UV 280 피크는 약 14 mL 후에 용출되었다. 이러한 두 번째 피크에 상응하는 분획을 풀링하였다. 풀링된 샘플은 울트라셀®-3 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 막이 있는 아미콘® (밀리포어시그마; 미국 캘리포니아주 헤이워드) 스핀 농축기로 40 μL로 농축시켰다. 농축된 샘플은 -80℃ 하에 저장하였다.
최종 정제된 산물을 분광 광도법으로 분석하여 융합 단백질의 최종 농도를 결정하고 260 nm에서의 흡광도보다 더 큰 280 nm에서의 흡광도에 의해 입증된 바와 같이 상당한 핵산 구성성분의 부재를 확증하였다. FokI-Cas8 융합물의 농도는 280 nm에서의 흡광도를, 무손상 복합체의 0.1% 용액의 계산된 흡광도로 나눔으로써 결정되었다. 정제된 복합체의 0.1% 용액의 예상 흡광도는 1.05 cm-1이며, 이는 FokI-Cas8 융합에 대한 280 nm에서의 흡광 계수 (86290 M-1cm-1)를, 그의 분자량 (82171.32 g/mole)으로 나눔으로써 계산되었다. 부가적으로, 최종 산물은 인스탄트블루™ (익스피던; 미국 캘리포니아주 샌디에이고) 염색으로 염색된 SDS-PAGE 겔에 의해 분석되었다. 겔 doc™ EZ (바이오-래드; 미국 캘리포니아주 헤라클래스) 영상화기를 사용하여 겔을 영상화하고 이미지랩 (바이오-래드; 미국 캘리포니아주 헤라클래스) 소프트웨어를 사용하여 주석을 달았다. 이러한 분석은 정제된 융합 단백질이 예상된 크기였고, 단지 낮은 수준의 오염 단백질이 존재하였다는 것을 명확하게 보여준다.
실시예 6
생화학적 절단 검정에 사용하기 위한 dsDNA 표적 서열의 생산
캐스케이드 또는 캐스케이드-융합 이펙터 복합체를 사용한 시험관내 DNA 결합 또는 절단 검정에 사용하기 위한 dsDNA 표적 서열은 여러 가지 상이한 방법을 사용하여 생산될 수 있다. 본 실시예는 합성 ssDNA 올리고뉴클레오티드의 어닐링, gDNA로부터 선택된 핵산 표적 서열의 PCR 증폭, 및/또는 핵산 표적 서열을 박테리아 플라스미드로의 클로닝을 포함하여, 표적 서열을 생산하는 3가지 방법을 설명한다. dsDNA 표적 서열이 캐스케이드 결합 또는 절단 검정에 사용되었다.
A. 합성 ssDNA 올리고뉴클레오티드를 어닐링함으로써 dsDNA 표적 서열을 생산함
CRISPR RNA의 가이드 부분에 의해 인식되는 표적 서열, 이웃한 프로토스페이서 인접 모티프 (PAM), 및 부가의 5' 및 3' 플랭킹 서열을 포함하는 관심 표적 영역을 코딩하는 DNA 올리고뉴클레오티드는 상업적 제조업체 (인티그레이티드 DNA 테크놀로지스; 미국 아이오와주 코럴빌)로부터 구입하였다. 구축물당 2개의 올리고뉴클레오티드가 정렬되었으며, 하나는 센스 가닥을 포함하고 다른 하나는 넌센스 가닥을 포함한다. 표 26은 박테리오파지 람다 gDNA로부터 유래되는, J3으로 표시된 표적 서열을 함유하도록 정렬된 올리고뉴클레오티드 서열을 열거한다. 표적 및 PAM 서열은 5' 단부와 3' 단부 둘 다에서 20 bp의 부가의 서열에 의해 플랭킹된다.
Figure pct00042
올리고뉴클레오티드는 1X 어닐링 완충제 (6 mM HEPES, pH 7.0, 및 60 mM KCl)에서 등몰 농도 (10 μM)로 두 올리고뉴클레오티드를 혼합하고, 95℃에서 2분 동안 가열한 다음, 서서히 냉각시킴으로써 어닐링하였다. 이어서, 어닐링된 올리고뉴클레오티드는 캐스케이드 및/또는 캐스케이드-이펙터 도메인 융합 RNP를 사용한 DNA 결합 및/또는 DNA 절단 검정에 직접 사용되었다.
CRISPR RNA의 가이드 부분에 의해 인식되는 표적 서열 뿐만 아니라 플랭킹 이웃한 프로토스페이서 인접 모티프 (PAM) 및 부가의 5' 및 3' 플랭킹 서열을 둘 다 포함하는 관심 표적 영역을 코딩하는 5' Cy5 형광 표지된 DNA 올리고뉴클레오티드는 상업적 제조업체 (인티그레이티드 DNA 테크놀로지스; 미국 아이오와주 코럴빌)로부터 구입하였다. 구축물당 4개의 올리고뉴클레오티가 정렬되었으며, 하나는 5' 형광 표지된 센스 가닥을 포함하고, 하나는 5' 비표지된 센스 가닥을 포함하며, 하나는 5' 형광 표지된 넌센스 가닥을 포함하고, 하나는 5' 비표지된 넌센스 가닥을 포함한다. 표적 및 PAM 서열은 5' 단부와 3' 단부 둘 다에서 20 bp의 부가의 서열에 의해 플랭킹된다.
표 27은 박테리오파지 람다 gDNA로부터 유래된 J3으로 표시된 표적 서열, 및 인간 CCR5 로커스로부터 유래된 CCR5로 표시된 대조군 표적 서열을 함유하도록 정렬된 올리고뉴클레오티드 서열을 열거한다.
Figure pct00043
올리고뉴클레오티드는 1X 어닐링 완충제 (6 mM HEPES, pH 7.0, 60 mM KCl)에서 등몰 농도 (1 μM)로 표지 및 비표지된 또는 2개의 표지된 또는 2개의 비표지된 올리고뉴클레오티드를 혼합하고, 95℃에서 2분 동안 가열한 다음, 서서히 냉각시킴으로써 어닐링하였다. 이어서, 어닐링된 올리고뉴클레오티드는 캐스케이드 및/또는 캐스케이드-이펙터 도메인 융합 RNP를 사용한 DNA 결합 분석에 직접 사용되었다. Cy5 형광 표지된 DNA 올리고뉴클레오티드는 AZURE c600 (아즈레 바이오시스템즈 (Azure BioSystems; 미국 캘리포니아주 더블린)) 바이오 영상화기로 영상화되었다.
이러한 방법은 부가의 표지되거나 비표지된 표적 또는 이중 표적 서열을 생성하는데 적용될 수 있으며, 이로써 이중-표적은 인터스페이서 서열에 의해 분리된 개별 캐스케이드 분자에 의해 표적화된 2개의 프로토스페이서 서열을 함유하는 표적으로서 정의된다.
B. gDNA로부터 PCR 증폭에 의한 dsDNA 표적 서열의 생산
인간 gDNA로부터 유래된 이중 표적에 대한 dsDNA 표적 서열은 gDNA 주형 물질로부터 직접적으로 PCR 증폭을 사용하여 생산되었다. 구체적으로, PCR 반응은 K562 세포 및 Q5 핫 스타트(Hot Start) 고 충실도 2X 마스터 믹스 (뉴 잉글랜드 바이오랩스 (New England Biolabs; 미국 매사추세츠주 입스위치))로부터 정제된 인간 gDNA 뿐만 아니라 표 28에 열거된 프라이머를 함유하였으며, 여기서 밑줄이 그어진 부분은 gDNA 내의 프라이머 결합 부위에 상응한다.
Figure pct00044
PCR은 제조업체의 지침 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)에 따라 수행되었으며, 원하는 산물 DNA (288 bp 길이)를 뉴클레오스핀 겔 및 PCR 클린업 키트 (맥헤리-나겔 (Macherey-Nagel; 미국 펜실베니아주 베들레헴))를 사용하여 정제하였다. 이어서, 이러한 dsDNA는 캐스케이드 및/또는 캐스케이드-이펙터 도메인 융합 RNP를 사용한 DNA 결합 및/또는 DNA 절단 검정에 직접 사용되었다.
C. 표적 서열을 박테리아 플라스미드로 클로닝함으로써 dsDNA 표적 서열을 생산함
CRISPR RNA의 가이드 부분에 의해 인식되는, 프로토스페이서로서 공지되기도 한 표적 서열, 이웃한 프로토스페이서 인접 모티프 (PAM), 및 부가의 5' 및 3' 플랭킹 서열을 포함하는 관심 표적 영역을 코딩하는 DNA 올리고뉴클레오티드는 상업적 제조업체 (인티그레이티드 DNA 테크놀로지스; 미국 아이오와주 코럴빌)로부터 구입하였다. 올리고뉴클레오티드는 어닐링될 때, 제한 효소 EcoRI 및 BlpI에 의한 또는 BamHI 및 EcoRI에 의한 각각의 인식 부위의 절단 시 말단이 점착성 단부를 재생하도록 설계되었다. 올리고뉴클레오티드는 J3으로 표시된, 박테리오파지 람다 게놈으로부터 유래된 단일 표적 서열을 함유하도록 설계되었다. 또한, 올리고뉴클레오티드는 J3 및 L3으로 표시된, 박테리오파지 람다 게놈으로부터 유래된 2개의 직렬 표적 서열을 함유하도록 설계되었으며, 이는 15 bp 인터스페이서 서열에 의해 서로 분리되었다. 이들 올리고뉴클레오티드의 서열이 표 29에 열거되어 있다.
Figure pct00045
올리고뉴클레오티드는 5'-인산화된 단부를 함유하며, 이는 상업적 제조업체에 의해 도입되거나 또는 T4 폴리뉴클레오티드 키나제를 사용하여 사내에서 인산화되었다 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치). 이어서, 올리고뉴클레오티드는 어닐링 완충제 (6 mM HEPES, pH 7.0, 60 mM KCl)에서 등몰량을 함께 혼합하고, 95℃로 2분 동안 가열한 다음, 벤치 탑에서 서서히 냉각시킴으로써, 1 μM의 최종 농도에서 어닐링하였다.
별도로, pACYC-Duet1 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 플라스미드는 BamHI 및 EcoRI 또는 EcoRI 및 BlpI의 상응하는 제한 효소 쌍으로 이중 소화시켰으며, 그의 점착성 단부는 혼성화된 올리고뉴클레오티드의 말단에 의해 형성된 점착성 단부와 매칭된다. 이중 소화된 벡터는 아가로스 겔 전기영동을 사용하여 제거된 삽입물로부터 분리되었다.
혼성화된 올리고뉴클레오티드를 이중 소화된 벡터에 클로닝하기 위해, 혼성화된 올리고뉴클레오티드를 50 nM 스톡 농도로 희석한 다음, 혼성화된 올리고뉴클레오티드, 이중 소화된 벡터 및 퀵 리가제 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)를 사용하여 10 μL 라이게이션 반응물을 형성하였다. 이어서, 라이게이션 반응물을 사용하여 화학적으로 적격한 이. 콜라이 균주를 형질전환하고, 아가로스 플레이트 상에서 밤새 성장한 후, 개별 클론을 단리하고 액체 배양물에서 성장시켜, 플라스미드를 단리하기에 충분한 박테리아 배양물을 생성하였다. 이어서, 생어 시퀀싱을 사용하여 원하는 플라스미드 서열을 검증하였다. 표 30은 J3 표적 서열을 함유하는 플라스미드 (서열식별번호: 481) 및 15 bp 인터스페이서 서열에 의해 분리된 J3 및 L3 표적 서열을 함유하는 플라스미드 (서열식별번호: 482)에 대한 완전한 벡터 서열을 제공한다.
Figure pct00046
추가 클로닝 조작을 사용하여 부가의 이중 표적 플라스미드 구축물을 생성하였다. 서열식별번호: 482의 15 bp 인터스페이서 서열은 고유한 AvrII 및 XhoI 제한 부위를 함유한다. 따라서, 이들 제한 부위 내로 부가의 혼성화된 올리고뉴클레오티드를 도입하면, 정제된 캐스케이드 및 캐스케이드-뉴클레아제 융합 RNP를 사용한 생화학적 시험을 위해 인터스페이서가 더 긴 길이로 확장된다. crRNA-가이드된 FokI-캐스케이드 융합 복합체는 2개의 인접한 DNA 부위를 표적화하기 때문에, 인접한 DNA 결합된 복합체로부터의 FokI 도메인의 이량체화는 2개의 표적 부위를 분리하는 인터스페이서 내에서의 DNA 절단으로 이어진다. 가변 인터스페이서 길이는 FokI 뉴클레아제 도메인과 그의 융합된 캐스케이드 서브유닛 단백질 사이에 주어진 테더링 기하학적 구조를 이용하여 주어진 인터스페이서 길이를 평가하기 위해 설계되고 시험되었다. 30 bp의 확장된 인터스페이서 서열을 함유하는 표적 DNA 기질에 대한 완전한 벡터 서열은 서열식별번호: 483으로서 표 30에 제공된다.
또한, 하기 클로닝 전략은 하나의 큰 삽입물을 따라 일련으로 연결된 몇 가지 표적 서열을 함유하는 플라스미드 기질을 제공하였다. 유전자 블록은 17개의 연속적인 이중 표적을 함유하는 상업적 제조업체 (인티그레이티드 DNA 테크놀로지스; 미국 아이오와주 코럴빌)로부터 정렬되었다. 유전자 블록은 이웃한 이중 표적으로부터 각각의 이중 표적을 분리하는 4 bp를 함유하였고, 에이치. 사피엔스 gDNA로부터 유래된 16개의 이중 표적 뿐만 아니라 박테리오파지 람다 게놈으로부터 유래된 J3/L3 표적을 함유하는 하나의 대조군 이중 표적을 함유하였다. 16개의 연속적인 인간 이중 표적의 게놈 좌표가 표 31에 제시되어 있다. 유전자 블록은 단부에 SacI 및 SbfI 제한 부위를 플랭킹하면서 정렬되어, pACYC-Duet1 벡터 내의 SacI 및 SbfI 부위로 클로닝될 수 있도록 하였다. 유전자 블록을 pACYC-Duet1에 클로닝함으로써 생성된 다중-표적 플라스미드 기질의 전체 벡터 서열이 표 30에서 서열식별번호: 484로서 제시된다. 이러한 다중-표적 서열 플라스미드는 플라스미드 내에서 일련으로 연결된 표적 부위 중 하나를 표적화하는 crRNA를 정착시킨 다수의 상이한 FokI-캐스케이드 제제의 생화학적 시험을 허용하였다.
Figure pct00047
실시예 7
생화학적 절단 검정에서 정제된 캐스케이드 복합체의 사용
본 실시예는 생화학적 dsDNA 절단 검정에서 FokI-캐스케이드 융합 단백질 복합체의 사용을 예시한다. 단백질 시약은 dsDNA 절단에 있어서의 활성 측면에서 비교되었다.
이. 콜라이 유형 I-E 캐스케이드 시스템으로부터 유래된 FokI-캐스케이드 RNP는 실시예 1, 2 및 5에 설명된 바와 같이 설계되고, 이. 콜라이에서 재조합적으로 발현되며, 사용을 위해 정제되었다. 이들 RNP는 박테리오파지 람다 gDNA로부터 유래된 J3 및 L3 표적 서열을 표적화하거나, 또는 인간 gDNA 내의 TRAC 유전자에서의 인트론을 표적화하는 CRISPR RNA를 함유하도록 설계되었다. 각각의 RNP 제제는 crRNA의 가이드 부분을 제외하고는 달리 동일한 2개의 FokI-캐스케이드 복합체를 포함하는 이질적 혼합물이다.
FokI-Cas8은 Cas8이 없는 캐스케이드 복합체로부터 별도로 정제되었으며, J3 및 L3 람다 표적 서열을 표적화하는 가이드 폴리뉴클레오티드로 프로그래밍되었으며, PAM-인 입체 배치에서 표적 부위를 정착시킨 J3/L3 플라스미드 기질을 이용한 생화학적 절단 검정에 사용되었다.
FokI-캐스케이드 복합체는 CasBCDE 복합체 (실시예 2에 기재된 바와 같이, 서열식별번호: 440 및 서열식별번호: 446을 사용하여 생산됨)를, 16-aa 링커를 포함하는 정제된 FokI-Cas8 (일반적 FokI-Cas8 발현 벡터 서열는 실시예 2에 기재되어 있고, 표 19에서의 서열식별번호: 439이며; 특별한 16-aa 링커는 실시예 1에 기재되어 있고, 표 17에서의 서열식별번호: 431임)과 함께 혼합함으로써 재구성되었다. 재구성은 CasBCDE 및 FokI-Cas8 둘 다 1 μM 최종 농도에서 1X 캐스케이드 절단 완충제 (20 mM 트리스-Cl, pH 7.5, 200 mM NaCl, 5 mM MgCl2, 1 mM TCEP, 5% 글리세롤)에서 수행되었다.
DNA 절단 검정을 수행하기 위해, 반응 혼합물은 하기와 같다. 30 bp 인터스페이서를 갖는 J3/L3 이중 표적 서열을 포함하는 플라스미드 기질 (표 30에서의 서열식별번호: 483)은 13.3 ng/μL의 최종 농도 하의 플라스미드 DNA를 사용하여, 1X 캐스케이드 절단 완충제 중의 15 μL 반응물에서 다양한 농도의 FokI-캐스케이드 복합체 (3-100 nM)와 함께 인큐베이션되었다. 반응물은 37℃에서 30분 동안 인큐베이션한 후, 3 μL의 6X SDS 부하 염료를 부가하였다. 결합된 FokI-캐스케이드 복합체를 변성시키기 위해 부하 염료를 부가하였다. 반응 혼합물 구성성분은 0.8% 아가로스 겔 전기영동에 의해 분해되었다. 겔은 SYBR™ 세이프 DNA 겔 염색 (써모 사이언티픽, 미국 델라웨어주 윌밍턴)으로 전기영동 후 염색되었다.
양성 대조군으로서, 에스. 피오게네스 Cas9 단백질은 캐스케이드 J3 표적 서열의 20 bp 부분을 표적화하는 단일 가이드 RNA (sgRNA) (sgRNA-J3; 스페이서 서열은 서열식별번호: 501로서 제시됨)로 프로그래밍되었다. Cas9/sgRNA-J3 복합체는 1X CCE 완충제 (20 mM HEPES pH 7.4, 10 mM MgCl2, 150 mM KCl, 5% 글리세롤)에서 2배 몰 과량의 sgRNA와 함께 Cas9를 혼합함으로써 재구성되었다. 이러한 Cas9/sgRNA-J3 복합체에 의한 절단은 37℃에서 30분 동안 반응물을 인큐베이션함으로써 동일한 농도 범위 (3-100 nM) 전체에 걸쳐 평가되었다. 또한 본 실험에는 커팅되지 않은 플라스미드 DNA 뿐만 아니라 NheI 제한 효소 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)로 선형화된 플라스미드 DNA를 함유하는 대조군 레인이 포함되었다. 표적 DNA 절단은 플라스미드에서의 이동성 시프트에 의해 입증되는데, 이는 커팅되지 않은 플라스미드 DNA가 슈퍼코일되고, 절단되고 선형화된 플라스미드 DNA보다 더 신속한 이동성을 갖기 때문이다. 닉킹된 열린 원형 플라스미드 DNA는 슈퍼코일된 플라스미드 DNA 및 선형화된 플라스미드 DNA 둘 다보다 더 느린 이동성을 갖는다.
이들 실험으로부터 수득된 데이터는 농도 범위에 걸쳐, FokI-캐스케이드 복합체가 Cas9-sgRNA와 유사한 표적 DNA 절단 활성을 나타낸다는 것을 명확하게 보여준다. 시험된 가장 높은 농도 (100 nM)에서, 플라스미드 표적은 FokI-캐스케이드 복합체 및 Cas9-sgRNA에 의해 정량적으로 선형화되었다.
FokI-캐스케이드 복합체 시약은 또한 표적 DNA 절단의 동역학에 관하여 시험되었다. 30 bp 인터스페이서를 갖는 J3/L3 이중 표적 서열을 함유하는 플라스미드 기질 (서열식별번호: 483)은 13.3 ng/μL의 최종 농도 하의 플라스미드 DNA를 이용하여 15 μL 반응물에서 200 nM FokI-캐스케이드 복합체 또는 200 nM Cas9-sgRNA와 함께 인큐베이션되었다. 반응물을 0, 7, 10, 15, 20, 25, 또는 30분에 켄칭하고, 반응 구성성분을 상기 기재된 바와 같이 아가로스 겔 전기영동에 의해 분해시켰다. FokI-캐스케이드 복합체는 Cas9/sgRNA-J3 복합체와 유사하지만 약간 더 느린 속도의 표적 DNA 절단 활성을 나타냈으며, 표적 플라스미드는 FokI-캐스케이드 복합체의 경우에 25분 시점까지 정량적으로 선형화되었고, Cas9/sgRNA-J3 복합체의 경우에는 20분 시점까지 정량적으로 선형화되었다.
FokI-캐스케이드 복합체 시약은 또한, J3/L3 이중 표적 플라스미드 기질의 특이적 DNA 절단과 비교하여 pACYC-Duet1 비-표적 플라스미드 기질에 대한 비-특이적 DNA 절단 및/또는 닉킹 활성에 관하여 시험되었다. 표 32는 이러한 대조군에 대해 사용된 pACYC-Duet1 비-표적 플라스미드 기질의 서열 (서열식별번호: 502)을 함유한다. 구체적으로, 반응 완충제에서 1가 염 농도의 함수로서 비-특이적 및 특이적 DNA 표적 절단의 의존성을 조사하였다. 1X 캐스케이드 절단 완충제 (20 mM 트리스-Cl, pH 7.5, 200 mM NaCl, 5 mM MgCl2, 1 mM TCEP, 및 5% 글리세롤)의 변이체를 제조하였으며, 여기서는 NaCl 농도를 200 mM에서 150 mM, 100 mM 또는 50 mM으로 떨어 뜨리고, 200 nM FokI-캐스케이드 복합체를 13.3 ng/μL의 J3/L3 표적 플라스미드 또는 13.3 ng/μL의 pACYC-Duet1 비-표적 플라스미드와 함께 인큐베이션함으로써 상기 기재된 바와 동일한 절단 반응을 수행하였다. NaCl 농도는 100 mM으로 유지되었지만, 5 mM MgCl2가 10 mM EDTA로 대체된 부가의 대조군 반응이 수행되었으며, 이는 DNA 절단을 위한 2가 금속 이온에 대한 FokI의 요구 사항 때문에 절단을 폐기할 것으로 예상되었다. 따라서, 비-표적 플라스미드 및 J3/L3 표적 플라스미드는 하기 반응 조건에 적용되었다: -FokI-캐스케이드 복합체; +FokI-캐스케이드 복합체, 100 mM NaCl 완충제 + 10 mM EDTA; +FokI-캐스케이드 복합체, 50 mM NaCl 완충제; +FokI-캐스케이드 복합체, 100 mM NaCl 완충제; +FokI-캐스케이드 복합체, 150 mM NaCl 완충제; +FokI-캐스케이드 복합체, 200 mM NaCl 완충제. 데이터는 FokI-캐스케이드 복합체가 낮은 염 농도 <200 mM NaCl에서 비-표적 및 J3/L3 표적 플라스미드 둘 다의 비-특이적 닉킹을 보여주었지만, 200 mM NaCl의 1가 염 농도에서는 비-표적 플라스미드가 무손상으로 유지되었지만, J3/L3 표적 플라스미드는 정량적으로 선형화되었다는 것을 명확하게 보여준다. 더욱이, EDTA를 함유하는 완충제는 예상대로 표적 절단의 완전한 폐기를 초래하였다.
FokI-캐스케이드 복합체가 예상되는 위치, 즉 J3과 L3 표적을 분리하는 인터스페이서 서열의 중간 내에서 표적 플라스미드를 절단한다는 것을 확증하기 위해, 표적 플라스미드를 먼저, FokI-캐스케이드 복합체와 함께 인큐베이션한 다음, 플라스미드 기질의 다른 곳에서 절단하는 AfeI 제한 효소 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)와 함께 인큐베이션하는 실험을 수행하였다. 따라서, FokI-캐스케이드 1 복합체와 AfeI 둘 다에 의한 절단은 슈퍼코일된 원형 플라스미드를 아가로스 겔 상에서 별개의 종으로서 이동하는 2개의 선형 단편으로 전환시킨다. 구체적으로, 절단은 길이가 2427 bp 및 1357 bp인 단편을 생성할 것으로 예상되었다.
13.3 ng/μL J3/L3 표적 플라스미드를 200 nM FokI-캐스케이드 1 복합체와 함께 30분 동안 인큐베이션한 후, 1 μL의 AfeI (10 단위/μL; 뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)를 반응물에 부가한 다음, 37℃에서 30분 더 인큐베이션하였다. 반응 산물을 상기 기재된 바와 같이 아가로스 겔 전기영동에 의해 분해시켰다. 부가적으로, 대조군 실험을 위해 표적 플라스미드를 단지 FokI-캐스케이드 1 복합체 또는 단지 AfeI와 함께 인큐베이션하였고, AfeI에 의해 절단될 수 있지만 FokI-캐스케이드 1 복합체에 의해서는 절단될 수 없는 비-표적 플라스미드 (이러한 플라스미드에 J3/L3 이중 표적이 결여되기 때문임)를 사용하여 동일한 반응을 수행하였다. 표 32는 이러한 대조군에 사용된 pACYC-Duet1 비-표적 플라스미드 기질의 서열 (서열식별번호: 502)을 함유한다. 따라서, 비-표적 플라스미드 및 J3/L3 표적 플라스미드는 하기 반응 조건에 적용되었다: -AfeI/-FokI-캐스케이드 복합체; -AfeI/+FokI-캐스케이드 복합체; +AfeI/+FokI-캐스케이드 복합체; 및 +AfeI/-FokI-캐스케이드 복합체. 데이터는 FokI-캐스케이드 복합체가 예상 위치에서 표적 플라스미드를 절단하였는데, 이는 FokI-캐스케이드 1 복합체와 AfeI의 공동-인큐베이션이 예상 길이의 2개의 선형 산물로 이어지기 때문이라는 것을 명확하게 보여준다.
FokI-캐스케이드 복합체에 의한 DNA 절단의 서열 특이성을 추가로 확증하기 위해, 하기를 함유하는 부가의 대조군 플라스미드 기질이 생성되었다: J3 표적을 플랭킹하는 PAM에서의 돌연변이, L3 표적을 플랭킹하는 PAM에서의 돌연변이, J3/L3 표적을 플랭킹하는 두 PAM에서의 돌연변이; J3 표적 내의 스페이서 서열에서의 돌연변이, L3 표적 내의 스페이서 서열에서의 돌연변이, J3/L3 표적 내의 두 스페이서 서열에서의 돌연변이; 및 J3 표적이지만, L3 표적은 아니고, L3 표적이지만, J3 표적은 아니며, J3 표적도 아니고 L3 표적도 아니다. 따라서, 플라스미드 기질은 하기와 같다: J3 PAM 돌연변이체, L3 PAM 돌연변이체, J3/L3 PAM 돌연변이체, J3 스페이서 돌연변이체, L3 스페이서 돌연변이체, J3/L3 스페이서 돌연변이체, 비-표적 플라스미드, J3-단독 표적, L3-단독 표적, 및 J3/L3 표적 플라스미드. 각각의 표적은 하기 반응 조건에 적용되었다: -NdeI/-FokI-캐스케이드 복합체; +NdeI/-FokI-캐스케이드 복합체; 및 -NdeI/+FokI-캐스케이드 1 복합체. 표 32는 상기 기재된 돌연변이된 모든 플라스미드 기질의 서열 (서열식별번호: 502 내지 서열식별번호: 510)을 함유한다.
Figure pct00048
DNA 절단 반응은 200 nM FokI-캐스케이드 복합체 및 13.3 ng/μL 플라스미드 기질을 사용하여, 상기 기재된 바와 같이 수행하였고; 각각의 플라스미드 기질을 선형화하기 위한 대조군 반응은 NdeI (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)으로 수행되었다. 아가로스 겔 전기영동은 상기 기재된 바와 같이 수행되었다. 데이터는 효율적인 이중-가닥 파손 도입 및 표적 플라스미드의 선형화가 J3/L3 표적 플라스미드에 대해서만 관찰되나, PAM 또는 시드 돌연변이를 정착시킨 대조군 플라스미드에 대해서는 그렇지 않거나, 또는 2개의 표적 부위 중 단지 하나에 대해서는 그렇다는 것을 입증한다.
다양한 FokI-캐스케이드 복합체에 대한 구성성분이 클로닝되고 과다발현되었다. 이들 구성성분에 의해 생산된 RNP는 상이한 FokI-캐스케이드 복합체에 대한 활성을 비교하기 위해 정제되고 생화학적 DNA 절단에 관하여 시험되었다. 구체적으로, DNA 절단 활동은 하기를 포함하는 재구성된 FokI-캐스케이드 복합체에 대해 비교되었다: 별도로 정제된 CasBCDE 복합체 (서열식별번호: 440 및 서열식별번호: 446을 사용하여 생산됨) 및 FokI-Cas8 (서열식별번호: 439를 사용하여 생산됨); J3/L3 가이드 crRNA를 정착시킨 FokI-캐스케이드 (서열식별번호: 442 및 서열식별번호: 446을 사용하여 생산됨); Cas7 서브유닛 (서열식별번호: 443 및 서열식별번호: 446을 사용하여 생산됨) 또는 Cas6 서브유닛 상에 부가의 핵 국재화 시그널을 정착시킨 FokI-캐스케이드; Cas7 서브유닛 또는 Cas6 서브유닛 상에 부가의 핵 국재화 시그널 및 HA 태그를 정착시킨 FokI-캐스케이드; 크기 배제 크로마토그래피 (SEC)와 이온 교환 크로마토그래피 (IEX) 둘 다를 수반하는 보다 엄격한 정제를 진행한 FokI-캐스케이드; 및 추가 클린업 없이, 고정화된 금속 친화성 크로마토그래피 (IMAC)에 의해서만 정제된 FokI-캐스케이드.
따라서, 비-표적 플라스미드 및 J3/L3 표적 플라스미드는 하기 반응 조건에 적용되었다: 음성 대조군; AfeI; CasBCDE+FokI-Cas8 복합체; FokI-캐스케이드 복합체; FokI-캐스케이드 (NLS-Cas6) 복합체; FokI-캐스케이드 (Cas7-NLS) 복합체; FokI-캐스케이드 (NLS-HA-Cas6) 복합체; FokI-캐스케이드 (Cas7-HA-NLS) 복합체; FokI-캐스케이드 복합체 (IEX, SEC 클린업); 및 FokI-캐스케이드 복합체 (클린업 없음). DNA 절단 반응은 비-표적 플라스미드 또는 컨센서스 J3/L3 표적 플라스미드를 사용하여, 상기 기재된 바와 같이 이들 RNP 시약으로 수행되었고, 반응 산물은 아가로스 겔 전기영동에 의해 분해되었다. 데이터는 한 가지 예외를 제외하고 모든 RNP 시약이 비-표적 플라스미드의 배경 절단 없이, 거의 동일하고 정량적인 플라스미드 DNA 절단을 나타낸다는 것을 명확하게 보여준다. 유일한 예외는 추가 클린업 없이 정제된 FokI-캐스케이드였으며, 이는 비-표적 플라스미드와 함께 인큐베이션된 레인에 대해 볼 수 있는 바와 같이, 더 많은 비-특이적 닉킹 활성을 나타 냈다.
마지막으로, FokI-캐스케이드 복합체의 NLS-태그부착된 Cas7 변이체를 출발점으로서 사용하여, 하나의 큰 삽입물을 따라 일련으로 연결된 에이치. 사피엔스 게놈 부위 Hsa01 내지 Hsa16에 대한 플라스미드 기질 (서열식별번호: 484)의 생화학적 DNA 절단에 관하여, 16개의 상이한 쌍형성된 가이드 crRNA를 시험하였다. 각각의 crRNA 쌍은 인터스페이서에 의해 분리된, 인간 gDNA 내의 2개의 인접한 표적 부위에 상응하는 2개의 고유한 스페이서 서열을 함유하며; 표적 서열은 서열식별번호: 485 내지 서열식별번호: 500에 기재되어 있다. 표 33은 Hsa01 내지 Hsa16 gDNA 서열을 표적화하는 각각의 쌍 내의 두 crRNA의 서열을 함유하고; crRNA의 스페이서에 밑줄이 그어져 있고 소문자로 되어 있으며, 가이드 영역의 5' 및 3'에 있는 서열은 CRISPR 어레이로부터의 반복부 서열에 상응한다.
Figure pct00049
Figure pct00050
16개의 FokI-캐스케이드 복합체를 정제한 후, 상기 기재된 바와 같이 절단 반응을 수행했으며, 여기서 FokI-캐스케이드 복합체는 에이치. 사피엔스 게놈 부위 Hsa01 내지 Hsa16를 함유하는 플라스미드 기질과 함께 인큐베이션되었으며, 반응 산물은 아가로스 겔 전기영동에 의해 분해되었다. 데이터는 16개의 RNP 시약 중에서, 14개/16개 (Hsa03-Hsa16)가, 슈퍼코일된 원형 플라스미드 기질을 절단된 선형 형태로 전환함으로써 입증된 바와 같이, 거의 정량적 DNA 절단을 나타냈다는 것을 명확하게 보여준다. 구축물 Hsa01 및 Hsa02 만이 부분적인 닉킹 활성을 나타 냈다. 더욱이, 데이터는 FokI-캐스케이드 복합체가 치료상 관련된 에이치. 사피엔스 유전자를 표적화하기 위해 설계된 16개의 쌍형성된 gRNA를 사용하여 효과적으로 프로그래밍되었다는 것을 입증해 주었다.
실시예 8
표적 세포 내로의 FokI-캐스케이드 RNP 복합체의 도입
본 실시예는 인간 세포에서 게놈 편집을 용이하게 하기 위해 FokI 융합 단백질을 포함하는 이. 콜라이 유형 I-E 캐스케이드 복합체의 설계 및 전달을 예시하고, 미리 어셈블리된 캐스케이드 RNP 복합체로서 표적 세포로의 전달을 설명한다.
A. 세포로의 형질전환을 위한 FokI를 포함하는 캐스케이드 RNP 복합체의 생산
최소 CRISPR 어레이는 인간 게놈에서 8개의 별개의 로커스를 표적화하도록 설계되었다. 각각의 최소 CRISPR 어레이는 2개의 스페이서 서열을 함유하며, 둘 다는 CRISPR 반복부 서열에 의해 플랭킹되었다. 2개의 스페이서 서열은 30 bp (즉, 30 bp 인터스페이서 영역)에 의해 분리된 게놈 내의 로커스를 표적화하였고, 각각의 스페이서는 표적 세포 게놈에서 AAG 또는 ATG 프로토스페이서 인접 모티프 (PAM) 서열에 인접한 표적 서열에 결합하도록 설계되었다. 각각의 최소 CRISPR 어레이를 함유하는 플라스미드 벡터는 박테리아 발현을 위해 어닐링된 올리고뉴클레오티드 (인티그레이티드 DNA 테크놀로지스; 미국 아이오와주 코럴빌)를 pACYC-Duet1 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 벡터 백본에 라이게이션함으로써 생산되었다.
최소 CRISPR 어레이에서 선택된 스페이서를 생산하기 위한 중첩 프라이머가 표 34에 제시되어 있고, 프라이머의 서열은 표 35에 기재되어 있다.
Figure pct00051
Figure pct00052
Figure pct00053
캐스케이드 RNP 복합체의 생산을 위한 박테리아 발현 벡터의 설계는 실시예 2에 상세히 기재되어 있다. 간단히 말해서, 각각의 cas 유전자는 단일 오페론으로부터 발현되었으며 cas 유전자에 대한 코딩 서열은 cas8-cse2-cas7-cas5-cas6의 순서로 배열되었다. FokI 모이어티는 30-aa 링커에 의해 Cas8에 부착되고, 핵 국재화 시그널 (NLS)은 FokI-Cas8 (FokI-캐스케이드 복합체)의 N-말단 및 Cas6의 N-말단에 부착되었다 (FokI-캐스케이드-NLS-Cas6 복합체로서 후술되기도 함; 서열식별번호: 577).
FokI-캐스케이드-NLS-Cas6 복합체는 본질적으로 실시예 5A에 기재된 바와 같이 이. 콜라이로부터 어셈블리된 복합체로서 정제되었다.
B. FokI를 포함하는 캐스케이드 RNP 복합체의 진핵 세포 내로의 형질감염
HEK293 세포 (ATCC; 미국 버지니아주 마나사스)는 37℃, 5% CO2 및 100% 습도에서 10% FBS 및 1x 항생제-항진균제 용액 (메디아테크, 인크. (Mediatech, Inc.; 미국 버지니아주 마나사스))이 보충된 DMEM 배지에서 현탁액으로 배양되었다. HEK293 세포는 뉴클레오펙터(Nucleofector)® 96-웰 셔틀 시스템 (론자; 미국 뉴저지주 앨런데일)을 사용하여 형질감염되었다. 뉴클레오펙션 전에, 5 μl의 FokI-캐스케이드 RNP를 96-웰 플레이트의 개별 웰로 옮겼다. 각각의 웰은 RNP에 따라 ~225-500 pmol의 FokI-캐스케이드-NLS-Cas6 복합체를 함유하였다. HEK293 세포를 50 ml 원뿔형 원심 분리기 튜브로 옮기고 200 xG에서 3분 동안 원심 분리하였다. 배지를 흡인하고 세포 펠릿을 칼슘 및 마그네슘이 없는 PBS로 세척하였다. 세포를 한 번 더 원심 분리하고 1x107개 세포/ml의 농도로 뉴클레오펙터 SF (론자; 미국 뉴저지주 앨런데일) 완충제에 재현탁시켰다. 이러한 세포 현탁액 20 μl를 96-웰 플레이트 내의 FokI-캐스케이드-NLS-Cas6 복합체에 부가하고, 혼합한 다음, 전체 용적을 96-웰 뉴클레오큐벳(Nucleocuvette)™ (론자; 미국 뉴저지주 앨런데일) 플레이트로 옮겼다. 이어서, 플레이트를 뉴클레오펙터™ 96-웰 셔틀™ 시스템 (론자; 미국 뉴저지주 앨런데일)으로 부하하고, 세포를 96-CM-130 뉴클레오펙터™ 프로그램 (론자; 미국 뉴저지주 앨런데일)을 사용하여 뉴클레오펙션하였다. 뉴클레오펙션 직후, 80 μl의 완전 DMEM 배지를 96-웰 뉴클레오큐벳™ (론자; 미국 뉴저지주 앨런데일) 플레이트의 각각의 웰에 부가하였다. 이어서, 웰의 전체 내용물을 100 μl의 완전 DMEM 배지를 함유하는 96-웰 조직 배양 플레이트로 옮겼다. 세포를 37℃, 5% CO2 및 100% 습도에서 ~72시간 동안 배양하였다.
~72시간 후, HEK293 세포를 500 xG에서 5분 동안 원심 분리하고 배지를 제거하였다. 세포를 칼슘 및 마그네슘이 없는 PBS로 세척하였다. 이어서, 세포 펠릿을 50 μl의 퀵익스트랙트(QuickExtract) DNA 추출 용액 (에피센트레 (Epicentre; 미국 위스콘신주 매디슨))에 재현탁시켰다. 이어서, 수득된 gDNA 샘플을 37℃에서 10분, 65℃에서 6분, 및 95℃에서 3분 동안 인큐베이션하여 반응을 중지시켰다. 이어서, gDNA 샘플을 50 μl의 물로 희석하고 후속 심층 시퀀싱 분석을 위해 -20℃에 저장하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
단리된 gDNA를 사용하여, 1x 농도의 Q5 핫 스타트 고 충실도 2X 마스터 믹스 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치), 각각 0.5 μM의 프라이머, 10 μL의 최종 용적의 gDNA 3.75 μL를 사용하여 제1 PCR을 수행하였고, 98℃에서 1분 동안, 98℃에서 10초, 60℃에서 20초, 72℃에서 30초, 및 72℃에서 2분 동안 최종 연장의 35 사이클로 증폭시켰다. PCR 반응물을 물에서 1:100으로 희석시켰다. 표적-특이적 프라이머가 표 36에 제시되어 있다. 표적-특이적 프라이머는 일루미나(Illumina)-화합성 서열을 함유하므로, 증폭 산물은 MiSeq 서열 분석기 (일루미나; 미국 캘리포니아주 샌디에이고)를 사용하여 분석할 수 있었다.
Figure pct00054
*DNA 프라이머 서열은 표 35에 제시된다
제2 "바코딩" PCR은 각각의 표적이 각각 고유한 8-bp 인덱스 (프라이머 서열 (서열식별번호: 575 및 서열식별번호: 576 참조)에서 "NNNNNNNN"으로 표시됨)를 함유하는 프라이머 (표 35에서의 G2 및 H2)로 증폭되도록 설정되었으며, 따라서 서열 분석 동안 각각의 앰플리콘의 탈다중화를 허용하였다.
1x 농도의 Q5 핫 스타트 고 충실도 2X 마스터 믹스 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치), 각각 0.5 μM의 프라이머, 10 μL의 최종 용적의, 1:100 희석된 제1 PCR 1μL를 사용하여 제2 PCR을 수행하였고, 98℃에서 1분 동안, 98℃에서 10초, 60℃에서 20초, 72℃에서 30초, 및 72℃에서 2분 동안 최종 연장의 12 사이클로 증폭시켰다. PCR 반응물은 시퀀싱을 위해 앰플리콘의 SPRI셀렉트(SPRIselect) 비드 (베크만 쿨터 (Beckman Coulter; 미국 캘리포니아주 파사데나))-기반 클린업을 위한 단일 마이크로퍼지 튜브 내로 풀링하였다.
풀링된 앰플리콘에, 0.9x 용적의 SPRI셀렉트 비드를 부가하고, 혼합하며, 실온에서 10분 동안 인큐베이션하였다. 용액이 청정해질 때까지 마이크로퍼지 튜브를 자기 튜브 스탠드 (베크만 쿨터; 미국 캘리포니아주 파사데나)에 놓아 두었다. 상청액을 제거하고 폐기하며, 잔류 비드를 1 용적의 85% 에탄올로 세척하고, 실온 (RT)에서 30초 동안 인큐베이션하였다. 인큐베이션 후, 에탄올을 흡인하고, 비드를 실온에서 10분 동안 공기 건조시켰다. 이어서, 마이크로퍼지 튜브를 자기 스탠드로부터 제거하고 0.25x 용적의 물을 비드에 부가하고, 격렬하게 혼합하며 실온에서 2분 동안 인큐베이션하였다. 마이크로퍼지 튜브를 미세원심분리기에서 회전시켜 튜브의 내용물을 수집한 다음, 자석으로 되돌려 보내고, 용액이 청정해질 때까지 인큐베이션하며, 정제된 앰플리콘을 함유하는 상청액을 깨끗한 마이크로퍼지 튜브에 분배하였다. 정제된 앰플리콘 라이브러리는 나노드롭(Nanodrop)™ 2000 (써모 사이언티픽; 미국 델라웨어주 윌밍턴) 시스템을 사용하여 정량화되었다.
앰플리콘 라이브러리는 260 nm에서의 광학 흡광도 (나노드롭™ 2000 (써모 사이언티픽; 미국 델라웨어주 윌밍턴) 시스템) 및 앰플리콘의 크기로부터 계산된 바와 같이 4 nM 농도로 정규화되었다. 라이브러리는 MiSeq 시약 키트 v2, 300 사이클 (일루미나; 미국 캘리포니아주 샌디에이고)을 사용하여 MiSeq 서열 분석기 (일루미나; 미국 캘리포니아주 샌디에이고) 상에서 2개의 151 사이클 페어드-엔드 실행 플러스 2개의 8 사이클 인덱스 판독값을 사용하여 분석되었다.
D. 심층 시퀀싱 데이터 분석
시퀀싱 데이터에서 산물의 실체는 PCR의 제2 라운드에서 앰플리콘 상에 적응된 인덱스 바코드 서열을 기반으로 분석되었다. MiSeq (일루미나; 미국 캘리포니아주 샌디에이고) 데이터를 처리하기 위해 하기 작업을 실행하는 계산 스크립트가 사용되었다:
판독값은 보타이(Bowtie) (bowtie-bio.sourceforge.net/index.shtml) 소프트웨어를 사용하여 인간 게놈 (빌드 GRCh38/38)에 정렬되었다.
정렬된 판독값은 야생형 로커스와 비교되었으며; 로커스의 어떤 부분에도 정렬되지 않은 판독값은 폐기되었다.
야생형 서열과 매칭되는 판독값이 집계되었다. indel을 포함한 판독값 (FokI-캐스케이드 RNP 예상 커트 부위로부터 10 bp 주변)은 indel 유형별로 분류되고 집계되었다.
총 indel 판독값을 야생형 판독값과 indel 판독값의 합계로 나누어 퍼센트 돌연변이된 판독값을 제공하였다.
도 28은 FokI-캐스케이드-NLS-Cas6 복합체 뉴클레오펙션 (n=1) (도 27, 수평축, Hsa3, Hsa4, Hsa5, Hsa6, Hsa7, Hsa8, Hsa9, 및 Hsa10)의 함수로서의 게놈 편집 (도 28, 수직축, "% 편집")을 제시한다. 도 28에서, 열린 막대는 음성 대조군이고, 흑색 막대는 FokI-캐스케이드-NLS-Cas6 복합체의 부가이다. FokI-캐스케이드-NLS-Cas6 복합체는 8개 모든 로커스에서 편집을 유도하였다. 편집 범위는 ~0.2-5% indel이며, indel은 인터스페이서 영역의 중간에서 예상 커트 부위를 중심으로 이루어졌다.
실시예 9
FokI-캐스케이드 RNP 복합체의 구성성분을 코딩하는 플라스미드를 표적 세포 내로 도입함
본 실시예는 인간 세포에서 게놈 편집을 용이하게 하기 위해 FokI 융합 단백질을 포함하는 이. 콜라이 유형 I-E 캐스케이드 복합체의 설계 및 전달을 예시한다. 본 실시예는 또한 캐스케이드 복합체 구성성분을 발현하는 플라스미드 벡터를 진핵 세포로 전달하는 것을 설명한다.
A. 표적 세포 내로 형질감염될 FokI-캐스케이드 RNP 구성성분을 코딩하는 벡터의 생산
최소 CRISPR 어레이는 인간 게놈에서 TRAC 로커스를 표적화하도록 설계되었다. 최소 CRISPR 어레이는 2개의 스페이서 서열을 함유하였고, 둘 다는 실시예 1 및 3에 기재된 바와 같이 CRISPR 반복부 서열에 의해 플랭킹되었다. 2개의 스페이서 서열은 30 bp에 의해 분리된 게놈 내의 로커스를 표적화하였고, 각각의 스페이서는 AAG PAM 서열에 인접한 게놈 서열에 상보적이었다. 최소 CRISPR 어레이를 함유하는 플라스미드 벡터는 2개의 스페이서 서열에 의해 플랭킹된 CRISPR 반복부를 코딩하는 어닐링된 올리고뉴클레오티드 (인티그레이티드 DNA 테크놀로지스; 미국 아이오와주 코럴빌)를 2개의 CRISPR 반복부 서열이 있는 포유동물 발현 벡터에 라이게이션함으로써 생산되었다. 이로써 생성된 플라스미드는 인간 U6 (hU6) 프로모터 (서열식별번호: 454)로부터의 2개의 가이드를 발현하는 "반복부-스페이서-반복부-스페이서-반복부"를 함유하였다.
FokI-캐스케이드 RNP 단백질 구성성분 코딩 유전자를, CMV 프로모터를 함유하는 플라스미드 벡터로 클로닝하여 포유동물 세포에서의 전달 및 발현을 가능하게 하였다. Cas 유전자를 별도의 플라스미드 (서열식별번호: 448 내지 서열식별번호: 451 및 서열식별번호: 453)로 클로닝하거나 또는 2A 바이러스 펩티드 "리보솜-스키핑" 서열을 통해 연결된 각각의 유전자를 갖는 폴리시스트론성 구축물로서 단일 플스미드 (서열식별번호: 455)에서 클로닝하였다. FokI-캐스케이드 RNP 복합체는 2가지 상이한 방법을 통해 진핵 세포로 전달되었다: cas 유전자 및 최소 CRISPR 어레이를 별도의 플라스미드 (6-플라스미드 전달 시스템, 서열식별번호: 448 내지 서열식별번호: 451, 서열식별번호: 453 및 서열식별번호: 454) 상에 공급하거나, 또는 폴리시스트론성 구축물로서 모든 cas 유전자를 코딩하는 하나의 플라스미드 및 최소 CRISPR 어레이를 코딩하는 제2 플라스미드 (2-플라스미드 전달 시스템, 서열식별번호: 454 및 서열식별번호: 455) 상에 공급하였다.
B. FokI-캐스케이드 RNP 복합체를 코딩하는 플라스미드(들)의 형질감염
6-플라스미드 전달 시스템 및 2-플라스미드 전달 시스템에 대한 형질감염 조건은 하기 변형을 수반하여 실시예 8B에 상세히 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, 5 μl의 플라스미드 벡터 용액을 96-웰 플레이트의 개별 웰로 옮겼다. 6-플라스미드 전달 시스템은 게놈 편집을 위해 각각의 구성성분의 필요성을 조사함으로써 초기에 시험되었다. 보다 구체적으로, 플라스미드 "칵테일"을 각각의 웰에 부가하여, 일정한 양 (420 ng)의 5개의 플라스미드와 가변 양의 제6 플라스미드 (0 ng, 70 ng, 700 ng, 또는 1,400 ng)가 존재하도록 하였다. 다음으로, 최소 CRISPR 어레이 플라스미드 대 cas-코딩 플라스미드(들)의 비를 변화시키면서 총 플라스미드 DNA의 고정된 양 (3.5μg)으로 뉴클레오펙션함으로써 6-플라스미드 전달 시스템과 2-플라스미드 전달 시스템을 비교하였다. 마지막으로, 후속 심층 시퀀싱 분석을 위해 뉴클레오펙션 후 ~72시간에 용해물을 수거하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱 및 데이터 분석
심층 시퀀싱은 실시예 8C에 상세히 기재된 바와 같이 수행되었으나, 표 36으로부터의 표적-특이적 프라이머 Y 및 Z 만 사용하였다.
D. 심층 시퀀싱 데이터 분석
심층 시퀀싱 데이터 분석은 실시예 8D에 상세히 기재된 바와 같이 수행되었다. 도 29는 6-플라스미드 전달 전략 (n=1)에서 각각의 FokI-캐스케이드 구성성분 (도 29, 수평축, 가이드, FokI-Cas8, Cse2, Cas7, Cas5, Cas6, 및 참조 샘플)의 함수로서 TRAC 로커스에서의 게놈 편집 (도 29, 수직축, "% 편집")을 제시한다. 도 29에서, 열린 막대는 0 ng의 FokI-캐스케이드 구성성분을 나타내고, 점각 막대는 70 ng의 FokI-캐스케이드 구성성분을 나타내며, 사각형 패턴 막대는 700 ng의 FokI-캐스케이드 구성성분을 나타내고, 줄무늬 막대는 1,400 ng의 FokI-캐스케이드 구성성분을 나타낸다 (수평축 상의 막대 순서는 각각의 FokI-캐스케이드 구성성분에 대해 각각 좌측에서 우측임). 제시된 바와 같이, 주어진 구성성분이 결여된 경우에, 편집이 폐지되거나 크게 감소되었다 (Cse2의 경우). 이는 플라스미드 전달을 통한 편집을 위해서는 각각의 캐스케이드 구성성분이 필요하다는 것을 확증시켜 준다.
도 30은 게놈 편집을 6-플라스미드 전달 시스템 또는 2-플라스미드 전달 시스템과 비교한 데이터를 제시한다. 도 30은 6-플라스미드 (도 30, 열린 막대) 및 2-플라스미드 (도 30, 흑색 막대) 시스템의 각각의 구성성분의 다양한 농도 (도 30, 수평축 상의 막대 순서는 6-플라스미드 시스템 및 2-플라스미드 시스템에 대해 각각, 좌측에서 우측임)의 함수로서 표적 로커스에서의 게놈 편집 (도 30, 수직축, "% 편집")을 제시한다. 수평축을 따라 수치적 그룹핑은 구성성분의 양을 지칭한다: 상부 라인 = ng 단위의 총 플라스미드, 제2 라인 = ng 단위의 최소 CRISPR 어레이 플라스미드, 및 제3 라인 = ng 단위의 Cas-코딩 플라스미드 (예를 들어, 제1 수치적 그룹핑: 상부 라인 = 총 플라스미드, 3500 ng; 제2 라인 = 최소 CRISPR 어레이 플라스미드, 0 ng; 및 제3 라인 = Cas-코딩 플라스미드, 3500 ng).
두 방법 전체에 걸쳐, 가장 높은 비의 cas:최소 CRISPR 어레이 플라스미드를 이용하여 최고 수준의 편집이 달성되었다. 부가적으로, 폴리시스트론성 플라스미드는 잠재적으로 플라스미드 μg당 전사 증가로 인해, 더 높은 수준의 편집을 가능하게 하였다.
실시예 10
캐스케이드 서브유닛 단백질의 순환 순열
본 실시예는 구조-가이드된 모델링 접근법을 사용하여 순환적으로 순열된 (cp) 이. 콜라이 유형 I-E Cas7 단백질의 인 실리코 설계, 클로닝, 발현 및 정제를 예시한다.
A. 인 실리코 설계
이. 콜라이 캐스케이드 결정 구조 5H9E.pdb에 기반한 구조-가이드된 접근법을 사용하여, 이. 콜라이 유형 I-E Cas7 단백질 (서열식별번호: 18)을 순환적으로 순열시켰다 (www.rcsb.org/pdb/; Hayes, R.P, et al., Nature 530(7591):499-503 (2016)). 천연 Cas7 N-말단 및 C-말단은 서열 글리신-세린 (G-S)을 갖는 2-아미노산 펩티드 링커와 연결되었다. 이러한 원형화된 Cas7의 폴리펩티드 서열은 새로운 N-말단 (잔기 302)과 새로운 C-말단 (잔기 301)을 형성하기 위해 야생형 Cas7 폴리펩티드 서열에서 잔기 301과 302 사이의 펩티드 결합에 상응하는 위치에서 개방되어, Cas7 단백질의 순환 순열된 버전 (cp-Cas7 V1 단백질)이 생성되었다. 새로운 N-말단 및 새로운 C-말단은 Cas7 단백질 폴드 또는 캐스케이드 복합체 어셈블리를 방해하지 않고 융합 단백질 또는 링커 영역과의 연결을 위해 위치하도록 설계되었다. 메티오닌 잔기를 cp-Cas7 V1 단백질 (서열식별번호: 578)의 새로운 N-말단 (즉, 야생형 Cas7 단백질의 잔기 302에 상응하는 아미노산 잔기)에 부가하였다.
제2 cp-Cas7 단백질인 cp-Cas7 V2 단백질은 G-S 링커를 사용하여 유사하게 조작되었다. cp-Cas7 V2 단백질의 N-말단 및 C-말단은 야생형 Cas7 서열에서 각각 잔기 338 및 339에 상응한다. 새로운 N-말단 및 새로운 C-말단은 Cas7 단백질 폴드 또는 캐스케이드 복합체 어셈블리를 방해하지 않고 융합 단백질 또는 링커 영역과의 연결을 위해 위치하도록 설계되었다. 메티오닌 잔기를 cp-Cas7 V2 단백질 (서열식별번호: 579)의 N-말단 (즉, 야생형 Cas7 단백질의 잔기 339에 상응하는 아미노산 잔기)에 부가하였다.
B. cp-Cas7을 포함하는 캐스케이드 복합체의 클로닝, 발현 및 정제
cp-Cas7 V1 단백질 및 cp-Cas7 V2 단백질의 인 실리코 설계된 폴리펩티드 서열의 DNA 코딩 서열은 이. 콜라이에서의 발현을 위해 코돈-최적화되었다.
이들 DNA 코딩 서열은 합성을 위해 상업적 제조업체 (젠스크립트; 미국 뉴저지주 피스카타웨이)에 제공되었다. 실시예 2에 기재된 바와 같이 발현 벡터에서 야생형 Cas7 단백질을 대체하기 위해 DNA 서열을 캐스케이드-오페론 발현 벡터 (표 19; 서열식별번호: 441) 내로 개별적으로 도입하였다.
각각의 발현 벡터를 실시예 2에 기재된 바와 같이, 표 20에 제시된 J3 표적에 대한 가이드 RNA를 코딩하는 제2 벡터 (서열식별번호: 444)를 사용하여 이. 콜라이 BL21 스타™ (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 세포 내로 형질감염시켰다. 세포를 실시예 4B에 기재된 바와 같이 배양하였다. Cas5, Cas6, cp-Cas7 V1, Cse2, 및 Cas8 단백질 뿐만 아니라 가이드 RNA/표적 J3을 함유하는 이. 콜라이 유형 I-E 캐스케이드 복합체; 및 Cas5, Cas6, cp-Cas7 V2, Cse2, 및 Cas8 단백질 뿐만 아니라 가이드 RNA/표적 J3을 함유하는 이. 콜라이 유형 I-E 캐스케이드 복합체를 실시예 5A에 기재된 바와 같이 정제하였다.
cp-Cas7 변이체를 포함하는 캐스케이드 복합체의 정제는 순환적으로 순열된 유형 I-E CRISPR-Cas 서브유닛 단백질이, 야생형 단백질을 포함하는 캐스케이드 복합체와 본질적으로 동일한 조성 (분자량 기준)을 갖는 캐스케이드 복합체를 형성하는데 성공적으로 사용될 수 있다는 것을 명확하게 보여준다.
C. 캐스케이드/cp-Cas7 및 J3 표적의 EMSA (전기영동 이동성 시프트 검정)
정제된 캐스케이드/cp-Cas7 복합체를 본 실시예에 기재된 바와 같이 정제하고 EMSA를 수행하여 각각의 표적 서열에 대한 특이적 결합을 입증하였다. 간단하게, 캐스케이드/cp-Cas7 및 캐스케이드/wt-Cas7을 정제하고 10 mg/mL로 농축시켰다. Cy5 이중-가닥 표적 DNA는 본질적으로 실시예 6A에 기재된 바와 같이 생산되었고, TE 완충제에서 1 μM로 희석되었다 (J3 표적 서열식별번호: 469 및 서열식별번호: 472 및 CCR5 표적 서열식별번호: 474 및 서열식별번호: 470). 캐스케이드 복합체 및 표지된 이중-가닥 표적 DNA를 37℃에서 30분 동안 상이한 단백질/표적 비로 인큐베이션하였다. 인큐베이션 직후, 2 μl의 50% 글리세롤을 샘플에 부가하고, 5% 천연 PAA 겔에 부하하였다. 겔을 0.5x TBE 완충제에서 90분 동안 70V에서 4℃ 하에 실행하고, AZURE c600 바이오 영상화기 (아즈레 바이오시스템즈; 미국 캘리포니아주 더블린) 상에서 영상화하며, 밴드를 정량화하였다. 데이터가 표 37에 제시된다.
Figure pct00055
*LOD = 검출 한계 미만
실시예 11
캐스케이드 서브유닛 융합 단백질
A. FokI과의 캐스케이드 서브유닛 융합
본 실시예는 캐스케이드 복합체에 뉴클레아제 활성을 부여하기 위해 FokI 뉴클레아제 도메인과 융합된 이. 콜라이 유형 I-E Cas8 단백질의 인 실리코 설계, 클로닝, 발현 및 정제를 예시한다.
이. 콜라이 유형 I-E Cas8은 플라보박테리움 오케아노코이테스(Flavobacterium okeanokoites) FokI 뉴클레아제 도메인 (젠뱅크 번호 AAA24927.1)과 N-말단에 융합되었다. FokI 뉴클레아제 도메인은 문헌 [Guo, J., et al., J. Mol. Biol. 400:96-107 (2010)]에 기재된 샤키 변이체에 함유된 잔기를 포함하고, 동종이량체화 시 이중-가닥 DNA 절단을 촉매한다. FokI 뉴클레아제에 대한 아미노산 서열 (서열식별번호: 580)은 잔기 Q384 내지 F579를 함유하였고 (젠뱅크 번호 AAA24927.1), 하기 점 돌연변이를 갖는다: E486Q, L499I, 및 D469N. 간략하게, FokI 샤키 뉴클레아제 도메인 (서열식별번호: 581)은 링커 서열 (서열식별번호: 582)을 사용하여 Cas8과 N-말단 융합시켰다. 정제 목적으로, 헥사히스티딘 태그 (His6, 서열식별번호: 583)에 이어, MBP 태그 (서열식별번호: 584)에 이어, TEV 프로테아제 절단 서열 (서열식별번호: 585), 핵 국재화 시그널 (NLS, 서열식별번호: 586), 및 GGS 링커를 FokI의 잔기 384에 N-말단 첨부하였다. 최종 구축물은 단백질 서열에서 NH3-His6-MBP-TEV-NLS-GGS-FokI샤키-30aa-링커-Cas8-COOH를 포함하였다 (서열식별번호: 413).
인 실리코 설계된 DNA 서열은 합성을 위해 상업적 제조업체 (젠스크립트; 미국 뉴저지주 피스카타웨이)에 제공되었다. DNA 서열은 pET 발현 (밀리포어시그마; 미국 캘리포니아주 헤이워드) 패밀리 벡터 백본으로 클로닝되었으며, 이는 실시예 2에 기재된 바와 같이 kanR 유전자의 존재로 인해 카나마이신 내성을 부여하여, NH3-His6-MBP-TEV-NLS-GGS-FokI샤키-30aa-링커-Cas8-COOH를 운반하는 벡터를 생성한다 (서열식별번호: 439).
이. 콜라이 유형 I-E 캐스케이드 H3-His6-MBP-TEV-NLS-GGS-FokI샤키-30aa-링커-Cas8-COOH (서열식별번호: 439)는 실시예 4B 및 실시예 5C에 기재된 바와 같이 발현 및 정제되었다. TEV 절단 다음의 단백질 서열은 NH3-NLS-GGS-FokI샤키-30aa-링커-Cas8-COOH를 포함한다 (서열식별번호: 587).
유사하게, 실시예 1 및 2에 기재된 바와 같이 NLS-FokI-링커-Cas8_His6-HRV3C-Cse2_Cas7_Cas5_Cas6을 운반하는 벡터 (서열식별번호: 442)에서 Fok1-Cas8 융합 단백질을 구축하였다. 각각의 발현 벡터를 실시예 2에 기재된 바와 같이, J3 표적에 대한 가이드 RNA를 코딩하는 제2 벡터 (서열식별번호: 444)를 사용하여 이. 콜라이 BL21 스타™ (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 세포로 형질감염시켰다. 이러한 구축물을 실시예 4B 및 실시예 5A에 기재된 바와 같이 발현 및 정제하였다. 상기 융합된 FokI-Cas8 변이체를 포함하는 캐스케이드 복합체의 정제는 뉴클레아제 융합된 유형 I-E CRISPR-Cas 서브유닛 단백질이, 야생형 단백질을 포함하는 캐스케이드 복합체와 본질적으로 동일한 조성 (분자량 기준)을 갖는 캐스케이드 복합체를 형성하는데 성공적으로 사용될 수 있다는 것을 명확하게 보여준다. FokI-Cas8 융합은 표적 핵산의 생화학적 절단 (실시예 7) 및 진핵 세포에서 게놈 서열의 세포 내 절단 (실시예 8D 및 실시예 9D)에 성공적으로 사용되었다.
표 38은 Cas 서브유닛 단백질-효소 융합의 추가 예를 열거한다. 표 38에서, APOBEC는 시티딘 데아미나제 경로의 구성원인 유전자에 상응하고 (인간 APOBEC I 젠뱅크 번호 AB009426, 인간 APOBEC 3F 젠뱅크 번호 CH471095, 인간 APOBEC 3G 젠뱅크 번호 CR456472, 래트 APOBEC UCSC 게놈 브라우저 ID RGD:2133 래트); AID는 활성화 유도된 시티딘 데아미나제에 상응하며 (젠뱅크 번호 AY536516); PmCDA1은 AID 오르소로그이고 (예를 들어, 문헌 [Nishida, et al., Science 16:353 (2016); Iwamatsu, et al., J. Biochem. 110:151-158 (1991)] 참조); PvuIIHIFIT46G는 PvuII 고 충실도 변이체 T46G이며 (예를 들어, 문헌 [Fonfara, et al., Nucleic Acids Res. 40:847-860 (2012)] 참조); PvuII단일쇄T46G는 pdbID 3KSK에 기재되고; I-TevI는 박테리오파지 T4로부터의 부위 특이적, 서열 내성 귀소 엔도뉴클레아제이며, N-말단 촉매 도메인 뿐만 아니라 C-말단 DNA-결합 도메인 (이들 도메인은 긴 가요성 링커에 의해 연결됨)을 포함하며 (예를 들어, 문헌 [Van Roey, et al., EMBO J. 20:3631-3637 (2001)] 참조); BcnI (예를 들어, 문헌 [Sokolowska, et al., J. Mol. Biol. 369:722-734 (2007)] 참조); 및 MvaI (예를 들어, 문헌 [Kaus-Drobek, et al., Nucleic Acids Res. 35:2035-2046 (2007)] 참조)가 제한 효소이다.
Figure pct00056
B. 또 다른 캐스케이드 서브유닛 단백질과의 캐스케이드 서브유닛 단백질 융합
캐스케이드 복합체의 2개의 Cse2 단백질을 이. 콜라이 캐스케이드 결정 구조 5H9E.pdb (www.rcsb.org/pdb/; 예를 들어, 문헌 [Hayes, R.P, et al., Nature 530(7591):499-503 (2016)] 참조)에 기반한 구조-가이드된 접근법을 사용하여 함께 융합시켰다. 간단하게, 하나의 Cse2의 C-말단과 제2 Cse2의 N-말단을, 10-aa 가요성 링커 (서열식별번호: 589)를 사용하여 함께 융합시켰다. Cse2-Cse2 (CasB_CasB) 융합 단백질의 완전한 서열이 서열식별번호: 588에 제시된다.
인 실리코 설계된 DNA 서열은 합성을 위해 상업적 제조업체 (젠스크립트; 미국 뉴저지주 피스카타웨이)에 제공되었다. DNA 서열은 실시예 2에서 설계된 발현 벡터 (서열식별번호: 441)에 클로닝되었다. Cse2 서열은 서열식별번호: 588로 교환되었다.
각각의 발현 벡터를 실시예 2에 기재된 바와 같이, J3 표적에 대한 가이드 RNA를 코딩하는 제2 벡터 (서열식별번호: 444)를 사용하여 이. 콜라이 BL21 스타™ (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 세포로 형질감염시켰다. Cas5, Cas6, Cas7, Cse2-Cse2, 및 Cas8을 함유하는 이. 콜라이 유형 I-E 캐스케이드 복합체를 실시예 4B 및 5B에 기재된 바와 같이 발현 및 정제하였다. 융합된 Cse2-Cse2 변이체를 포함하는 캐스케이드 복합체의 정제는, 융합된 유형 I-E CRISPR-Cas 서브유닛 단백질이 야생형 단백질을 포함하는 캐스케이드 복합체와 본질적으로 동일한 조성 (분자량 기준)을 갖는 캐스케이드 복합체를 성공적으로 형성하였다는 것을 명확하게 보여준다.
C. 캐스케이드/Cse2-Cse2 및 J3 표적의 전기영동 이동성 시프트 검정 (EMSA)
정제된 캐스케이드/Cse2-Cse2 복합체를 본 실시예에 기재된 바와 같이 정제하고 EMSA에 적용하여 각각의 표적 서열에 대한 특이적 결합을 입증하였다. 간단하게, 캐스케이드/Cse2-Cse2 및 캐스케이드/WT-Cse2를 정제하고 10 mg/mL로 농축시켰다. Cy5 이중-가닥 표적 DNA를 실시예 6A에 기재된 바와 같이 생산하고 TE 완충제에서 1 M으로 희석하였다 (J3 표적 서열식별번호: 469 및 서열식별번호: 472 및 CCR5 표적 서열식별번호: 474 및 서열식별번호: 470). 캐스케이드 복합체 및 표지된 이중-가닥 표적 DNA를 37℃에서 30분 동안 상이한 단백질/표적 비로 인큐베이션하였다. 인큐베이션 직후, 2 μl의 50% 글리세롤을 샘플에 부가하고, 5% 천연 PAA 겔에 부하하였다. 겔을 0.5x TBE 완충제에서 90분 동안 70V에서 4℃ 하에 실행하고, AZURE c600 바이오 영상화기 (아즈레 바이오시스템즈; 미국 캘리포니아주 더블린) 상에서 영상화하며, 밴드를 정량화하였다. 데이터가 표 39에 제시된다.
Figure pct00057
*LOD = 검출 한계 미만
D. 또 다른 캐스케이드 서브유닛 단백질 및 효소 단백질 도메인과의 캐스케이드 서브유닛 단백질 융합
시티딘 데아미나제 rAPOBEC1 (아포지단백질 B mRNA 편집 효소 촉매 서브유닛 1, 라투스 노르베기쿠스(Rattus norvegicus); NCBI 유전자 ID: 25383, uEnsembl:ENSRNOG00000015411)이 융합을 위해 선택되었다. Cse2-Cse2 단백질을 이. 콜라이 캐스케이드 결정 구조 5H9E.pdb (www.rcsb.org/pdb/; 예를 들어, 문헌 [Hayes, R.P, et al., Nature 530(7591):499-503 (2016)] 참조)에 기반한 구조 유도 접근법을 사용하여 rAPOBEC1과 융합시켰다. 간단하게, rAPOBEC1 (서열식별번호: 590)의 C-말단을, 9-aa 가요성 링커 (서열식별번호: 591)를 사용하여 Cse2-Cse2 이량체 (상기 기재됨)의 N-말단과 융합시켰다. rAPOBECI_Cse2-Cse2 융합 단백질의 완전한 서열이 서열식별번호: 592에 제시된다.
인 실리코 설계된 DNA 서열은 합성을 위해 상업적 제조업체 (젠스크립트; 미국 뉴저지주 피스카타웨이)에 제공되었다. DNA 서열은 Cse2 서열을 대체하여 발현 벡터 (서열식별번호: 441)로 클로닝되었다. 각각의 발현 벡터를 실시예 2에 기재된 바와 같이, J3 표적에 대한 가이드 RNA를 코딩하는 제2 벡터 (서열식별번호: 444)를 사용하여 이. 콜라이 BL21 스타™ (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 세포로 형질감염시켰다. Cas5, Cas6, Cas7, rAPOBEC1_Cse2-Cse2, 및 Cas8을 함유하는 이. 콜라이 유형 I-E 캐스케이드 복합체를 실시예 4B 및 5B에 기재된 바와 같이 발현 및 정제하였다. 융합된 rAPOBEC1_Cse2-Cse2 변이체를 포함하는 캐스케이드 복합체의 정제는, 유형 I-E CRISPR-Cas 서브유닛 단백질과의 시티딘 데아미나제 융합물이 야생형 단백질을 포함하는 캐스케이드 복합체와 본질적으로 동일한 조성 (분자량 기준)을 갖는 캐스케이드 복합체를 형성하는데 성공적으로 사용되었다는 것을 명확하게 보여준다. 표 40은 Cse2-Cse2와의 효소 융합물의 예를 제시한다.
Figure pct00058
실시예 12
전사 활성화/저해 도메인과의 캐스케이드 서브유닛 단백질 융합
본 실시예는 캐스케이드 복합체에 전사 활성화 활성을 부여하기 위해 VP64 활성화 도메인과 융합된 이. 콜라이 유형 I-E cp-Cas7 단백질의 설계를 예시한다.
VP64는 글리신-세린 (GS) 링커와 연결된 VP16 (단순 포진 바이러스 단백질 16, DALDDFDLDML (서열식별번호: 614); 아미노산 437-447, 유니프로트:UL48)의 4개의 직렬 카피를 포함하는 전사 활성화제이다. 유전자의 프로모터 근처에서 결합할 수 있는 단백질 도메인과 융합될 때, VP64 (서열식별번호: 615)는 강력한 전사 활성화제로서 작용한다. 이. 콜라이 유형 I-E cp-Cas7 V2 (서열식별번호: 616)가 조작을 위해 선택될 수 있다.
활성화 도메인 VP64는 cpCas7 V2의 N-말단과 융합될 수 있다 (실시예 10A에 기재됨). 링커 (예를 들어, 5개 내지 50개의 아미노산 길이)는 cpCas7 V2와 VP64 도메인을 작동가능하게 연결하기 위해 선택될 수 있다.
인 실리코 설계된 DNA 서열은 합성을 위해 상업적 제조업체에 제공될 수 있다. VP64-cpCas7 V2 융합 단백질을 코딩하는 DNA 서열이 발현 벡터 (예를 들어, 서열식별번호: 455, 여기서 VP64-cpCas7 V2가 Cas7을 대체하는데 사용될 수 있음)로 클로닝될 수 있다. 각각의 발현 벡터를 실시예 2에 기재된 바와 같이, J3 표적에 대한 가이드 RNA를 코딩하는 제2 벡터 (서열식별번호: 444)를 사용하여 이. 콜라이 BL21 스타™ (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬) 세포로 형질감염시킬 수 있다. Cas5, Cas6, VP64_cpCas7 V2, Cse2, 및 Cas8을 함유하는 이. 콜라이 유형 I-E 캐스케이드 복합체를 실시예 4 및 5에 기재된 바와 같이 발현 및 정제할 수 있다. 융합된 VP64_cpCas7 V2 변이체를 포함하는 캐스케이드 복합체의 정제는 야생형 단백질을 포함하는 캐스케이드 복합체와 본질적으로 동일한 조성 (분자량 기준)을 갖는 캐스케이드 복합체를 형성하는데 사용될 수 있다.
특별한 유전자의 프로모터 영역에 표적화된 가이드의 선택은 유전자의 전사 활성화를 용이하게 할 수 있는 융합된 VP64_cpCas7 V2를 포함하는 캐스케이드 복합체의 능력을 검증하기 위해 사용될 수 있다.
실시예 13
dCas9/가이드 복합체에 의해 캐스케이드 서브유닛과 융합된 기능적 도메인의 부위-지정 동원
본 실시예는 기능적 도메인과 융합된 하나 이상의 캐스케이드 서브유닛 단백질 (즉, Cas6, Cas5 등)을 유형 II CRISPR Cas 단백질/가이드 RNA 복합체 결합 부위로 동원하기 위하여 클래스 1 유형 I CRISPR 반복부 스템 서열 (예를 들어, 유형 I-F CRISPR 반복부 스템 서열)로 클래스 2 유형 II CRISPR sgRNA, crRNA, tracrRNA, 또는 crRNA 및 tracrRNA 서열을 조작하는 방법을 설명한다. 이러한 방법은 문헌 [Gilbert, L., et al., Cell 154(2):442-451 (2013) and Ferry, Q, et al., Nature Communication 8:14633 doi: 10.1038/ncomms14633 (2017)]을 각색한 것이다.
A. 유형 II 가이드 RNA를 조작하는 것
유형 II CRISPR sgRNA, crRNA, tracrRNA, 또는 crRNA 및 tracrRNA (집합적으로 "유형 II 가이드 RNA"로서 지칭됨)가 조작을 위해 선택될 수 있다.
유형 II 가이드 RNA 서열을, 유형 I CRISPR 반복부 스템 서열의 혼입 영역에 관하여 인 실리코 평가할 수 있다. 유형 I CRISPR 반복부 스템 서열을 유형 II 가이드 RNA의 내부에 있는 유형 II 가이드 RNA의 5' 또는 3' 단부에 부착시킬 수 있거나, 또는 유형 II 가이드 RNA 내의 2차 구조 (예를 들어, 3' 헤어핀 요소)를 대체할 수 있다. 유형 I CRISPR 반복부 스템 서열의 혼입은 링커 요소 뉴클레오티드 서열을 동반할 수 있다. 유형 I CRISPR 반복부 스템 서열을 포함하도록 조작된 유형 II tracrRNA 3'의 예가 표 41에 제시된다.
Figure pct00059
*유형 I CRISPR 반복부 스템 서열에 밑줄이 그어져 있고 소문자이다. 상응하는 DNA 코딩 서열은 서열식별번호: 618로서 제시된다.
포유동물 유전자, 예컨대 C-X-C 케모카인 수용체 유형 4 (CXCR4)가 표적화를 위해 선택될 수 있다. 5' UTR과 엑손 1 사이의 연접부를, 유형 II CRISPR Cas 단백질 PAM 서열 (예를 들어, 5'-NGG)에 인접하여 발생하는 유형 II CRISPR Cas 단백질 표적 서열에 대해 인 실리코 스캔할 수 있다. 5' 방향으로 상류에서 발생하는 20-뉴클레오티드 표적 서열을 유형 II crRNA에 혼입할 수 있다. CXCR4를 표적화하는 유형 II crRNA의 예가 표 42에 제시된다.
Figure pct00060
*상응하는 DNA 코딩 서열이 서열식별번호: 620으로서 제시된다.
또 다른 한편으론, CXCR4 표적화 스페이서 (RNA) (서열식별번호: 619)의 3' 단부는 링커를 사용하여 3' 유형 I CRISPR 반복부 스템 서열 (RNA) (서열식별번호: 617)을 갖는 유형 II tracrRNA의 5' 단부에 공유적으로 연결될 수 있다. 적합한 링커 요소는 5'-GAAA-3'이다.
혼입된 유형 I CRISPR 반복부 스템 서열을 갖는 인 실리코 설계된 유형 II 가이드 RNA가 합성을 위해 상업적 제조업체에 제공할 수 있다.
유형 I 캐스케이드 서브유닛 단백질 (예를 들어, Cas6)은 전사 활성화 또는 저해 도메인 (예를 들어, KRAB)에 작동가능하게 연결될 수 있고, 실시예 12에 기재된 바와 같이 핵 국재화 시그널 (NLS)로 C-말단에 태그부착될 수 있다.
유형 II Cas 단백질 (예를 들어, Cas9)은 촉매적으로 불활성 (예를 들어, dCas9)되고 NLS 서열로 태그부착되도록 돌연변이될 수 있다.
Cas6-KRAB-NLS 단백질 및 dCas9-NLS 단백질은 이. 콜라이로부터 재조합적으로 발현 및 정제될 수 있다.
RNP 복합체는 유형 I CRISPR 반복부 스템 서열을 포함하도록 조작된 60 pmol dCas9 단백질:60 pmol Cas6-KRAB-NLS:120 pmol CXCR4 표적화 crRNA:120 pmol tracrRNA 3'의 농도에서 형성될 수 있다. dCas9 및 Cas6-KRAB-NLS로 어셈블리하기 전에, 유형 I CRISPR 반복부 스템 서열을 포함하도록 조작된 각각의 120 pmol CXCR4 표적화 crRNA 및 120 pmol tracrRNA 3' (본원에서 "조작된 유형 II 가이드 RNA"로서 지칭됨)을 2 μL의 최종 용적에서 원하는 총 농도 (120 pmol)로 희석하고, 95℃에서 2분 동안 인큐베이션하며, 열 순환기로부터 제거하고 실온으로 평형화되게 할 수 있다. dCas9 및 Cas6-KRAB-NLS 단백질을 결합 완충제 (20 mM HEPES, 100 mM KCl, 5 mM MgCl2, 및 5% 글리세롤, pH 7.4)에서 적절한 농도로 희석하여 3 μL의 최종 용적이 되도록 하고, 2 μL의 유형 II 가이드 RNA와 혼합한 다음, 37℃에서 30분 동안 인큐베이션할 수 있다. 형질감염되지 않은 대조군 (예를 들어, 완충제 단독), 조작되지 않은 유형 II 가이드 RNA, 또는 저해 도메인에 연결되지 않은 Cas6을 사용하여 음성 대조군 RNP를 어셈블리할 수 있다.
B. dCas9:Cas6-KRAB-NLS:조작된 유형 II 가이드 RNA를 사용한 세포 형질감염
dCas9:Cas6-KRAB-NLS:조작된 유형 II 가이드 RNA 핵단백질 복합체는 뉴클레오펙터® 96-웰 셔틀 시스템 (론자; 미국 뉴저지주 앨런데일) 및 하기 프로토콜을 사용하여 HEK293 세포 (ATCC; 미국 버지니아주 마나사스)로 형질감염시킬 수 있다: 복합체를 96-웰 플레이트의 개별 웰에 5 μL 최종 용적으로 분배할 수 있다. 세포 배양 배지를 HEK293 세포 배양 플레이트로부터 제거할 수 있고, 세포를 TrypLE™ (써모 사이언티픽; 미국 델라웨어주 윌밍턴)로 분리할 수 있다. 현탁된 HEK293 세포를 200 x g에서 3분 동안 원심 분리함으로써 펠릿화하고, TrypLE 시약을 흡인하며, 세포를 칼슘 및 마그네슘이 없는 인산염 완충 식염수 (PBS)로 세척할 수 있다. 세포를 200 x g에서 3분 동안 원심 분리함으로써 펠릿화하고, PBS를 흡인하며, 세포 펠릿을 10 mL의 칼슘 및 마그네슘이 없는 PBS에 재현탁시킬 수 있다.
카운티스(Countess)® II 자동화 세포 계수기 (라이프 테크놀로지스 (Life Technologies; 미국 뉴욕주 그랜드 아일랜드))를 사용하여 세포를 계수할 수 있다. 2.2 x 107개의 세포를 1.5 ml 마이크로퍼지 튜브로 옮기고 펠릿화할 수 있다. PBS를 흡인하고 세포를 뉴클레오펙터™ SF (론자; 미국 뉴저지주 앨런데일) 용액에 1 x 107개 세포/m의 밀도로 재현탁할 수 있다. 이어서, 20 μL의 세포 현탁액을 5 μL의 RNP 복합체를 함유하는 각각의 개별 웰에 부가할 수 있으며, 각각의 웰로부터의 전체 용적을 96-웰 뉴클레오큐벳™ (론자; 미국 뉴저지주 앨런데일) 플레이트의 웰로 옮길 수 있다. 플레이트를 뉴클레오펙터™ 96-웰 셔틀™ (론자; 미국 뉴저지주 앨런데일) 상으로 부하하고, 96-CM-130 뉴클레오펙터™ (론자; 미국 뉴저지주 앨런데일) 프로그램을 사용하여 세포를 뉴클레오펙션할 수 있다. 뉴클레오펙션 후, 10% 소 태아 혈청 (FBS; 써모 사이언티픽; 미국 델라웨어주 윌밍턴), 페니실린 및 스트렙토마이신 (라이프 테크놀로지스; 미국 뉴욕주 그랜드 아일랜드)이 보충된 70 μL 둘베코 변형 이글 배지 (DMEM; 써모 사이언티픽; 미국 델라웨어주 윌밍턴)를 각각의 웰에 부가할 수 있으며, 50 μL의 세포 현탁액을, 150 μL의 미리 가온된 DMEM 완전 배양 배지를 함유하는 96-웰 세포 배양 플레이트로 옮길 수 있다. 플레이트를 조직 배양 인큐베이터로 옮기고 5% CO2에서 37℃ 하에 48시간 동안 유지시킬 수 있다.
dCas9:Cas6-KRAB-NLS:조작된 유형 II 가이드 RNA 핵단백질 복합체의 뉴클레오펙션 후 72시간에, 세포를 CXCR4 발현의 저해에 관하여 평가할 수 있다. 배양 배지를 HEK293으로부터 흡인할 수 있으며, 세포를 칼슘과 마그네슘이 없는 PBS로 1회 세척한 다음, TrypLE (라이프 테크놀로지스; 미국 뉴욕주 그랜드 아일랜드)를 부가하여 트립신 처리한 후, 37℃에서 3-5분 동안 인큐베이션한다. 트립신 처리된 세포를 위아래로 부드럽게 피펫팅하여 단일 세포 현탁액을 형성한 다음, 세포를 200 x g에서 3분 동안 원심 분리함으로써 펠릿화할 수 있다. 원심 분리 후, 배양 배지를 흡인할 수 있고 세포를 10 mM EDTA/PBS 완충제에 재현탁하며 부드럽게 혼합하여 단일 세포 현탁액으로 만든다. 단일 세포 현탁액을, 실온에서 1시간 동안 10% FBS를 함유하는 PBS에서 항-인간 CXCR4 항체 (메디칼 앤 바이오로지칼 래보러토리즈 캄파니 (Medical & Biological Laboratories Co.; 일본 나고야))와 접합된 0.05% FITC를 사용하여 염색할 수 있다. 이소형 대조군 및 천연 RNP 대조군은 참조를 위해 유사하게 염색될 수 있다. 이어서, 염색된 세포를 LSR II 유동 세포계수기 (BD 래보러토리즈 (BD laboratories; 미국 캘리포니아주 산 호세))로 분류하고 FITC 양성 형광 세포 집단을 집계할 수 있다.
CXCR4 발현에 있어서의 감소는 비-형질감염된 대조군의 측정된 형광과 비교해서 dCas9:Cas6-KRAB-NLS:조작된 유형 II 가이드 RNA 뉴클레오펙션된 샘플의 검출된 형광에 있어서의 감소에 의해 측정된다. 유동 세포계수기로부터의 형광 상의 감소를 사용하여, 유형 I CRISPR 반복부 스템 서열을 갖는 조작된 유형 II 가이드 RNA를 뉴클레아제-결핍성 유형 II Cas9 단백질과 조합하여 사용하여 저해 도메인과 융합된 유형 I CRISPR 캐스케이드 서브유닛 단백질을 유전자 표적에 동원 및 국재화하고 상기 유전자 표적의 전사를 저해할 수 있다는 것을 입증할 수 있다.
실시예 14
유형 I cas 유전자의 확인 및 스크리닝
본 실시예는 상이한 종으로부터 유형 I cas 유전자를 확인하고 스크리닝하는 방법을 설명한다. 여기에 제시된 방법은 문헌 [Shmakov, S., et al., Mol. Cell 60:385-397 (2015)]을 각색한 것이다.
A. 유형 I CRISPR-Cas 유전자의 확인
기본 로컬 정렬 검색 도구 (BLAST, blast.ncbi.nlm.nih.gov/Blast.cgi)를 사용하여, 다양한 종의 게놈의 검색을 시행하여 유형 I CRISPR-Cas 복합체의 다양한 유전자 구성성분을 코딩하는 하나 이상의 유전자를 확인할 수 있다. cas1 인테그라제 유전자는 클래스 1 및 클래스 2 CRISPR-Cas 패밀리 둘 다의 구성성분이며, cas1 유전자를 함유하는 종의 확인 시, 이들 게놈에서의 하위 서열 검색기를 시행하여 유형 I-특이적 유전자를 포함하는 게놈을 단리할 수 있다. 게놈 검색은 CRISPR-Cas 인테그라제 유전자 cas1 상에 고정될 수 있으며, 사용될 수 있는 이. 콜라이 K-12 MG1655로부터의 유형 I-E 시스템으로부터의 예시적인 cas1 서열은 서열식별번호: 621이다. 특별한 유전자 (예를 들어, cas7cas5)는 유형 I 시스템의 간섭 복합체의 핵심 구성성분이며 유형 I 시스템을 함유하는 종을 추가로 구별하기 위해 사용될 수 있다. 사용될 수 있는 이. 콜라이 K-12 MG1655 cas7cas5 유전자의 예시적인 서열은 각각 서열식별번호: 622 및 서열식별번호: 623이다. cas7cas5 유전자를 보유하고 있는 것으로 확인된 게놈은 유형 I-특이적 뉴클레아제-헬리카제 cas3 유전자 또는 그의 상동체의 확인을 통해 추가로 분석될 수 있다. 사용될 수 있는 이. 콜라이 K-12 MG1655 cas3 서열의 예시적인 서열은 서열식별번호: 624이다.
CRISPR-Cas 인테그라제 유전자 cas1, 유형 I 간섭 복합체 유전자 cas7cas5, 및 뉴클레아제-헬리카제 cas3 유전자, 또는 그의 일부 조합을 함유하는 게놈은 유형 I CRISPR-Cas 시스템(들)의 후보일 가능성이 높다. 유형 I CRISPR-Cas 유전자는 일반적으로, 단일 게놈 로커스 내의 하나에 근접하여, 전형적으로 20 킬로염기 (kb) 이내에서 발견된다. cas1, cas7, cas5, 또는 cas3 유전자 주변 영역은 유형 I 간섭 복합체를 구성하는 나머지 cas 유전자의 다른 오픈 리딩 프레임 (ORF)에 관하여 검색될 수 있다. 추정상의 ORF의 아미노산 서열은 상동성에 대하여 공지된 유형 I 유전자와 비교될 수 있거나, 또는 유형 I 단백질 구성성분의 특징적인 단백질 도메인의 존재는 맥스 플랜크 연구소 생물 정보학 툴키트(Max Planck Institute Bioinformatics Toolkit) (www.toolkit.tuebingen.mpg.de/#/), 또는 등가물을 통해 이용가능한 상동성 검출 및 구조 예측 검색 도구를 사용하여 분석될 수 있다.
B. 확인된 유형 I 구성성분의 스크리닝
일단 유형 I 구성성분 (예를 들어, cas 유전자 및 상응하는 crRNA)의 추정상의 컬렉션이 확인되면, 유형 I 구성성분을 프로그래밍가능한 DNA 표적화를 수행할 수 있는 능력에 관하여 시험할 수 있다.
추정상의 cas 유전자 및 crRNA는 실시예 1, 2 및 3의 안내에 따라 발현 벡터로 코딩될 수 있다. 다양한 cas 유전자 및 crRNA를 코딩하는 벡터를 박테리아 균주 내로 도입하고, 유형 I 간섭 복합체를 실시예 4 및 5에 기재된 바와 같이 발현 및 정제할 수 있다. 크기 배제 크로마토그래피 (SEC) 칼럼으로부터의 용출 분획은 SDS-PAGE 겔을 통해 분석하여, 완전한 유형 I 간섭 복합체를 포함하는 단백질 구성성분의 실체 (중량 기준)를 결정할 수 있다. 에티듐 브로마이드 겔을 또한 실행하여 간섭 복합체의 일부로서 crRNA의 존재를 검출할 수 있다.
정제된 캐스케이드 복합체는 실시예 6 및 7에 기재된 바와 같이 DNA 표적의 시험관내 생화학적 절단을 지원할 수 있는 능력에 관하여 시험될 수 있다.
단일 추정상의 cas 유전자가 발현되지 않는 대조군 발현 및 정제 샘플은, 프로그래밍가능한 DNA 표적을 할 수 있는 완전한 유형 I 간섭 복합체를 구성하는 필수 cas 유전자를 결정하는데 사용될 수 있다.
특정 적용의 경우에, 게놈 서열로부터 개별 cas 유전자 상동체 (예를 들어, cas7)를 확인하는 것이 충분하며, 부가의 cas 유전자를 확일할 필요가 없거나 스크리닝을 수행할 필요가 없다.
실시예 15
유형 I crRNA의 확인
본 실시예는 상이한 종에서 유형 I crRNA를 확인하는 방법을 설명한다. 여기에 제시된 방법은 문헌 [Chylinski, K., et al., RNA Biology 10:726-737 (2013)]을 각색한 것이다.
실시예 17A에 기재된 바와 같이 유형 I CRISPR-Cas 유전자를 확인하기 위해 다양한 종의 게놈 검색을 시행할 수 있다. 하나 이상의 유형 I 특이적 cas 유전자를 포함하는 게놈은 CRISPR 반복부-스페이서 어레이 내에 코딩된 CRISPR RNA (crRNA)를 함유할 가능성이 있는 후보 게놈이다. 확인된 유형 I cas 유전자 (예를 들어, cas7, cas5 또는 cas3 유전자)에 인접한 서열은 연합된 CRISPR 반복부-스페이서 어레이에 대해 프로빙될 수 있다. 인 실리코 예측 스크리닝하는 방법은 문헌 [Grissa, I.V., et al. Nucleic Acids Res. 35(Web Server issue):W52-W57 (2007)]에 따라 반복부 어레이부터 crRNA 서열을 추출하는데 사용될 수 있다. crRNA 서열은 CRISPR 반복부 어레이 내에 함유되며, 외래 스페이서 서열에 의해 간격을 둔 그의 특징적인 반복 서열에 의해 확인될 수 있다.
A. RNA-seq 라이브러리의 준비
인 실리코 확인된 개별 crRNA를 함유하는 추정상의 CRISPR 어레이는 RNA 시퀀싱 (RNA-seq)을 사용하여 추가로 검증될 수 있다.
추정상의 유형 I cas 유전자 및 crRNA 구성성분을 포함하는 것으로서 확인된 종으로부터의 세포는 상업적 저장소 (예를 들어, ATCC; 미국 버지니아주 마나사스; 독일 미생물 및 세포 배양 컬렉션 게엠베하 (DSMZ); 독일 브라운슈바이크)로부터 조달될 수 있다.
세포를 중간-대수기로 성장시키고, 트리졸 시약 (시그마 알드리치 (SigmaAldrich; 미국 미주리주 세인트 루이스))을 사용하여 전체 RNA를 준비하고 이를 DNaseI (페르멘타스 (Fermentas; 리투아니아 빌니우스))로 처리할 수 있다.
10 μg의 전체 RNA를 리보-제로 rRNA 제거 키트 (일루미나; 미국 캘리포니아주 샌디에이고)로 처리할 수 있고, 나머지 RNA는 RNA 클린 및 농축기 (자이모 리서치 (Zymo Research; 미국 캘리포니아주 어빈))를 사용하여 정제할 수 있다.
제조업체의 지침에 따라 TRUSEQ™ 소형 RNA 라이브러리 준비 키트 (일루미나; 미국 캘리포니아주 샌디에이고)를 사용하여 라이브러리를 준비할 수 있다. 이로 인해 어댑터 서열을 갖는 cDNA가 생성될 것이다.
이로써 생성되는 cDNA 라이브러리는 MiSeq 서열 분석기 (일루미나; 미국 캘리포니아주 샌디에이고)를 사용하여 시퀀싱할 수 있다.
B. 시퀀싱 데이터의 프로세싱
cDNA 라이브러리의 시퀀싱 판독값은, 예를 들어, 하기 방법을 사용하여 프로세싱될 수 있다.
어댑터 서열은 cutadapt 1.1 (pypi.python.org/pypi/cutadapt/1.1)을 사용하여 제거할 수 있으며, 판독 품질을 개선시키기 위해 판독값의 3' 말단으로부터 약 15개의 뉴클레오티드를 트리밍할 수 있다.
판독값은 보타이 2 (www.bowtie-bio.sourceforge.net/bowtie2/index.shtml)를 사용하여 각각의 종의 게놈 (즉, 그로부터 추정상의 crRNA가 확인되어야 함)에 정렬될 수 있다. 보타이 2에 의해 생성되는 서열 정렬/맵 (SAM) 파일은 후속 시퀀싱 분석 단계를 위해 SAM툴 (www.samtools.sourceforge.net/)을 사용하여 이진 정렬/맵 (BAM) 파일로 변환될 수 있다.
CRISPR 로커스 또는 로커스들에 대한 판독값 커버리지 매핑은 베드툴(BedTools) (bedtools.readthedocs.org/ en/latest/)를 사용하여 BAM 파일로부터 계산할 수 있다.
이전 단계에서 생성된 바와 같은 BED 파일을 통합 게놈학 뷰어(Integrative Genomics Viewer) (IGV; www.broadinstitute.org/igv/)에 부하하여 시퀀싱 판독값 누적을 시각화할 수 있다. 판독값 누적을 사용하여, 전사된 추정상의 crRNA 서열의 5' 및 3' 말단을 확인할 수 있다. RNA-seq 데이터를 사용하여, 추정상의 crRNA 요소가 생체내에서 활발하게 전사되는지 검증할 수 있다.
추정상의 crRNA는 실시예 17A의 안내에 따라 프로그래밍가능한 DNA 표적화를 수행할 수 있는 능력에 관하여 동족 유형 I cas 유전자로 시험할 수 있다.
실시예 16
캐스케이드 가이드 RNA 백본에서의 변화에 내성이 있는 부위에 대한 프로빙
본 실시예는 유형 I 가이드 crRNA에 대한 다양한 변화의 생성 및 시험, 및 캐스케이드 폴리뉴클레오티드 복합체를 구축하는데 사용하기 위한 적합성을 설명한다. 아래에 기재된 방법은 문헌 [Briner, A., et al., Mol. Cell 56:333-339 (2014)]을 각색한 것이다.
변화는 crRNA 백본에 도입될 수 있으며, 이로써 생성되는 조작된 crRNA는 동족 캐스케이드 복합체를 사용하여 시험되어, 조작되기 쉬운 유형 I 가이드 crRNA 백본 내의 영역 또는 위치를 용이하게 확인해줄 수 있다
유형 I CRISPR 시스템 (예를 들어, 이. 콜라이 캐스케이드)로부터의 crRNA가 조작을 위해 선택될 수 있다. crRNA 서열은 하기 영역 중 하나 이상으로부터 선택된 영역 내의 핵산 서열 내로 하나 이상의 염기 변화 (예를 들어, 치환, 변화, 돌연변이, 결실 및/또는 삽입)를 도입하기 위해 인 실리코 조작될 수 있다: 스페이서의 5'에 있는 핵산 서열 (5' 핸들), 스페이서 요소, 유형 I CRISPR 반복부 스템 서열, 또는 유형 I CRISPR 반복부 스템 서열의 3' (3' 핸들).
염기 변화는 또한, crRNA 영역 중 임의의 것의 수소 염기 쌍 상호작용에서 미스매치를 도입하거나, 또는 두 염기의 치환을 통해 대체 수소 염기 쌍 상호작용을 도입하는 염기 쌍 돌연변이를 도입하기 위해 사용될 수 있으며, 여기서 대체 수소 염기 쌍 상호작용은 원래 수소 염기 쌍 상호작용과 상이하다 (예를 들어, 원래 수소 염기 쌍 상호작용은 왓슨-크릭 염기 쌍형성이고, 두 염기의 치환은 역 후그스틴 염기 쌍형성을 형성함). 염기의 치환은 또한 crRNA 백본 내에서 수소 염기 쌍 상호작용을 도입하는데 사용될 수 있다.
crRNA의 영역은 독립적으로 조작되어, 2차 구조 요소를 crRNA 백본 내로 도입할 수 있다. 이러한 2차 구조 요소는 하기를 포함하나 이에 제한되지는 않는다: 스템-루프 요소, 스템 요소, 슈도-노트, 및 리보자임. 더욱이, crRNA 백본은 5' 단부, 3' 단부 또는 crRNA 내부의 결실을 통해 crRNA 백본의 일부분을 결실하도록 조작될 수 있다. 대체 백본 구조가 또한 도입될 수 있다.
인 실리코 설계된 crRNA 서열은 합성을 위해 상업적 제조업체에 제공될 수 있다.
조작된 crRNA는 개별 캐스케이드 서브유닛 단백질 (즉, Cas6, Cas5 등)에 의한 결합을 지원할 수 있거나, 또는 캐스케이드 단백질 복합체의 완전한 형성을 지원할 수 있거나, 또는 뉴클레아제 (예를 들어, Cas3)의 동원을 통한 이중-가닥 DNA 표적 서열의 변형 및 캐스케이드 복합체의 형성을 지원할 수 있는 능력에 관하여 평가할 수 있다. 개별 캐스케이드 서브유닛 단백질에 대한 crRNA 결합 및 캐스케이드 단백질 복합체 어셈블리는 문헌 [Jore, M., et al., Nature Structural & Molecular Biology 18:529-536 (2011)]과 유사한 방식으로 나노-ESI 질량 분석법으로 평가할 수 있다. crRNA의 생화학적 특징규명 및 뉴클레아제의 동원을 통한 이중-가닥 DNA 표적 서열의 캐스케이드 단백질 복합체 변형은 실시예 6 및 7에 기재된 것들과 유사한 방식으로 수행될 수 있다. 캐스케이드 복합체의 형성 및 뉴클레아제의 동원을 통한 이중-가닥 DNA 표적 서열의 변형을 지원할 수 있는 조작된 crRNA는 실시예 8A, 실시예 8B, 실시예 8C, 및 실시예 8D에 기재된 방법을 사용하여 세포에서의 활성에 관하여 검증될 수 있다.
실시예 17
DNA 표적 결합 서열을 포함하는 캐스케이드 복합체 가이드의 스크리닝
본 실시예는 인간 gDNA (gDNA)에 존재하는 DNA 표적 서열을 변형시키고 이들 부위에서의 절단 활성 수준을 측정하기 위해 본 발명의 유형 I CRISPR 단백질 및 유형 I 가이드 crRNA를 사용하는 것을 예시한다.
표적 부위 (DNA 표적 서열)는 먼저, gDNA로부터 선택될 수 있다. 유형 I 가이드 crRNA는 상기 선택한 서열을 표적화하도록 설계될 수 있다. 검정 (예를 들어, 실시예 7에 기재된 바와 같음)을 수행하여 DNA 표적 서열 절단 수준을 결정할 수 있다.
A. gDNA로부터 DNA 표적 서열을 선택하는 것
캐스케이드 단백질 복합체 (예를 들어, 이. 콜라이 유형 I-E 캐스케이드)에 대한 PAM 서열 (예를 들어, ATG)은 선택된 게놈 영역 내에서 확인될 수 있다.
ATG PAM 서열에 3' 인접한 하나 이상의 캐스케이드 DNA 표적 서열 (예를 들어, 32개 뉴클레오티드 길이)이 확인될 수 있다.
핵산 표적 서열의 선택 기준은 하기를 포함할 수 있으나 이에 제한되지는 않는다: 게놈 내의 다른 영역과의 상동성; 퍼센트 G-C 함량; 융점; 스페이서 내의 단일 중합체의 존재; 두 서열 사이의 거리; 및 관련 기술분야의 통상의 기술자에게 공지된 다른 기준.
캐스케이드 DNA 표적 서열과 혼성화되는 DNA 표적 결합 서열은 가이드 crRNA에 혼입될 수 있다. 가이드 crRNA 구축물의 핵산 서열은 전형적으로 상업적 제조업체에 제공되고 그에 의해 합성된다.
본원에 기재된 바와 같이, 가이드 crRNA는 동족 유형 I 캐스케이드 단백질 복합체와 함께 사용되어 crRNA/캐스케이드 단백질 복합체를 형성할 수 있다.
B. 절단 백분율 및 특이성의 결정
가이드 crRNA와 관련된 시험관내 절단 백분율 및 특이성 (즉, 표적-이탈 결합의 양)은, 예를 들어, 실시예 7에 기재된 절단 검정을 사용하여 결정될 수 있고 하기와 같이 비교될 수 있다:
(1) 가이드 crRNA에 대해 단일 DNA 표적 서열 만이 확인되거나 선택되는 경우에, 각각의 DNA 표적 서열에 대한 절단 백분율 및 특이성이 결정될 수 있다. 원하는 경우에, 절단 백분율 및/또는 특이성은 가이드 crRNA를 조작하는 것, 또는 이펙터 단백질/이펙터 단백질 결합 서열을 도입하여 가이드 crRNA 또는 캐스케이드 서브유닛 단백질을 조작하는 것, 또는 리간드/리간드 결합 모이어티를 도입하여 가이드 crRNA 또는 캐스케이드 서브유닛 단백질을 조작하는 것을 포함하나 이에 제한되지는 않는 방법을 사용하여 추가 실험에서 변경될 수 있다.
(2) 가이드 crRNA에 대해 다수의 DNA 표적 서열이 확인되거나 선택되는 경우에, 절단 검정으로부터 수득된 백분율 절단 데이터 및 부위 특이성 데이터를, 표적 결합 서열을 포함하는 상이한 DNA 사이에 비교하여 원하는 절단 백분율 및 특이성을 갖는 DNA 표적 서열을 확인할 수 있다. 절단 백분율 데이터 및 특이성 데이터는 다양한 적용에 대한 선택의 기본이 되는 기준을 제공한다. 예를 들어, 일부 상황에서는, 가이드 crRNA의 활성이 가장 중요한 요인이 될 수 있다. 다른 상황에서는, 절단 부위의 특이성이 절단 백분율보다 상대적으로 더 중요할 수 있다. 원하는 경우에, 절단 백분율 및/또는 특이성은 가이드 crRNA를 조작하는 것, 이펙터 단백질/이펙터 단백질 결합 서열을 도입하여 가이드 crRNA 또는 캐스케이드 서브유닛 단백질을 조작하는 것, 또는 리간드/리간드 결합 모이어티를 도입하여 가이드 crRNA 또는 캐스케이드 서브유닛 단백질을 조작하는 것을 포함하나 이에 제한되지는 않는 방법을 사용하여 추가 실험에서 변경될 수 있다.
또 다른 한편으론, 또는 시험관내 분석에 더하여, 가이드 crRNA의 세포 내 절단 백분율 및 특이성은, 예를 들어, 실시예 8C 및 실시예 8D에 기재된 방법을 사용하여 수득될 수 있고, 하기와 같이 비교될 수 있다:
(1) 가이드 crRNA에 대해 단일 DNA 표적 서열 만이 확인되거나 선택되는 경우에, 각각의 DNA 표적 서열에 대한 절단 백분율 및 특이성이 결정될 수 있다. 원하는 경우에, 절단 백분율 및/또는 특이성은 가이드 crRNA를 조작하는 것, 또는 이펙터 단백질/이펙터 단백질 결합 서열을 도입하여 가이드 crRNA 또는 캐스케이드 서브유닛 단백질을 조작하는 것, 또는 리간드/리간드 결합 모이어티를 도입하여 가이드 crRNA 또는 캐스케이드 서브유닛 단백질을 조작하는 것을 포함하나 이에 제한되지는 않는 방법을 사용하여 추가 실험에서 변경될 수 있다.
(2) 가이드 crRNA에 대해 다수의 DNA 표적 서열이 확인되거나 선택되는 경우에, 절단 검정으로부터 수득된 백분율 절단 데이터 및 부위 특이성 데이터를, 표적 결합 서열을 포함하는 상이한 DNA 사이에 비교하여 원하는 절단 백분율 및 특이성을 갖는 DNA 표적 서열을 확인할 수 있다. 절단 백분율 데이터 및 특이성 데이터는 다양한 적용에 대한 선택의 기본이 되는 기준을 제공한다. 예를 들어, 일부 상황에서는, 가이드 crRNA의 활성이 가장 중요한 요인이 될 수 있다. 다른 상황에서는, 절단 부위의 특이성이 절단 백분율보다 상대적으로 더 중요할 수 있다. 원하는 경우에, 절단 백분율 및/또는 특이성은 가이드 crRNA를 조작하는 것, 이펙터 단백질/이펙터 단백질 결합 서열을 도입하여 가이드 crRNA 또는 캐스케이드 서브유닛 단백질을 조작하는 것, 또는 리간드/리간드 결합 모이어티를 도입하여 가이드 crRNA 또는 캐스케이드 서브유닛 단백질을 조작하는 것을 포함하나 이에 제한되지는 않는 방법을 사용하여 추가 실험에서 변경될 수 있다.
실시예 18
효율적인 FokI-캐스케이드 복합체 게놈 편집을 위해 FokI-Cas8 링커 조성과 인터스페이서 거리를 다양하게 하는 것
본 실시예는 FokI-Cas8 및 다양한 길이의 링커 폴리펩티드를 포함하는 다수의 융합 단백질의 설계 및 시험 뿐만 아니라 효율적인 게놈 편집을 위하여 인터스페이서 거리를 다양하게 하는 것의 효과를 예시한다.
A. 표적 세포로 형질감염될 FokI 융합 단백질을 포함하는 이. 콜라이 유형 I-E 캐스케이드 복합체 구성성분을 코딩하는 벡터의 생산
최소 CRISPR 어레이는 ADAMTSL1PCSK9의 두 가지 상이한 유전자에서 또는 그 근처에서 인간 게놈 내의 로커스 세트를 표적화하도록 설계되었다. 인터스페이서 거리는 14 내지 60 bp의 범위이고, 2 bp씩 증가하였다. 각각의 인터스페이서 거리에 대해 4개의 표적이 설계되었다. 표적은 AAG 또는 ATG PAM 서열에 의해 플랭킹되었다. "반복부-스페이서-반복부-스페이서-반복부" 서열을 함유하는 가이드에 대한 코딩 서열은 서열식별번호: 454를 사용하여 실시예 9A에 기재된 바와 같이 클로닝하였다. 서열식별번호: 625 내지 서열식별번호: 816은 최소 CRISPR 어레이를 생성하는데 사용되는 올리고뉴클레오티드 서열의 전체 세트에 대한 서열을 제공한다.
FokI-캐스케이드 RNP 서브유닛 단백질 구성성분 코딩 유전자를, 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터; 2A 바이러스 펩티드 "리보솜-스키핑" 서열을 통해 연결된 cas 유전자; 30-aa 링커 (서열식별번호: 455)로 연결된 FokI 및 Cas8을 포함하는 융합 단백질을 포함하는 벡터로 클로닝하였다. 다양한 길이 및 아미노산 조성의 부가의 링커 폴리펩티드 서열을 설계하고 이러한 벡터에서 FokI를 Cas8 단백질에 연결하는데 사용하였다. 부가의 링커 폴리펩티드 서열이 표 43에 열거된다.
Figure pct00061
B. FokI-캐스케이드 RNP 복합체 구성성분을 코딩하는 벡터의 형질감염
형질감염 조건은 하기 변형을 수반하여 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, 5 μl의 플라스미드 벡터 용액을 96-웰 플레이트의 개별 웰로 옮겼다. 각각의 웰은 FokI-캐스케이드 RNP 복합체 서브유닛 단백질 구성성분을 코딩하는 플라스미드 2.4 μg 및 최소 CRISPR 어레이를 코딩하는 플라스미드 ~1-2 μg을 함유하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱은 하기 변형을 수반하여 본질적으로 실시예 8C에 기재된 바와 같이 수행되었다. 실시예 8C의 표 36으로부터의 프라이머 Y 및 Z 대신, 표적-특이적 프라이머는 서열식별번호: 825 내지 서열식별번호: 1016이었다.
D. 심층 시퀀싱 데이터 분석
심층 시퀀싱 데이터 분석은 본질적으로 실시예 8D에 기재된 바와 같이 수행되었다. 도 31a 및 도 31b는 데이터 분석의 결과를 제시한다. 도 31a 및 도 31b에서, 퍼센트 게놈 편집은 FokI-Cas8 링커 유형 (도 31a, 도 31b, 수직축 14-60 AA) 및 인터스페이서 거리 (n=1) (도 31a, 도 32b, 수평축, 인터스페이서 거리 5-50 bp)의 함수로서 제시된다. 도 31a에서, 우측에 있는 회색 스케일 수직 막대는 indel의 백분율이다. 도 32b에서, 셀 내의 값은 퍼센트 indel이다. 데이터의 초기 분석은 17개 및 20개 아미노산의 FokI-Cas8 링커 (각각 서열식별번호: 821 및 서열식별번호: 822) 및 ~26 bp 및 ~30-32 bp의 인터스페이서 거리의 경우에 게놈 편집이 가장 높았다는 것을 보여주었다. 데이터가 재처리되었고 1000개 미만의 서열 판독값을 갖는 샘플이 제거되었는데, 이는 낮은 적용 범위로 인해 부풀려진 편집 값을 함유할 수 있기 때문이다 (모든 관련 샘플이 >1000 판독값을 함유한 경우에만 부위가 유지되었음). 도 31a 및 도 31b에 제시된 이러한 데이터는, 17개 및 20개 아미노산의 FokI-Cas8 링커 (각각 서열식별번호: 821 및 서열식별번호: 822) 및 ~30-32 bp의 인터스페이서 거리의 경우에 게놈 편집이 가장 높았다는 것을 보여주었다. 따라서, Fok1-Cas8 융합 단백질을 포함하는 유형 I CRISPR-Cas 복합체를 사용한 효율적인 게놈 편집은 FokI-Cas8 융합 단백질의 링커 폴리펩티드 길이 및 인터스페이서 거리를 다양하게 함으로써 달성되었다. 링커 폴리펩티드의 아미노산 조성이 본원에서 논의된다.
실시예 19
게놈 편집을 위하여 캐스케이드 상동체를 확인하는 것
본 실시예는 게놈 편집의 효율을 평가하기 위한 다수의 상동체 캐스케이드 복합체의 설계 및 시험을 예시한다.
A. 상동체 캐스케이드 복합체로 시험하기 위한 부위의 확인
부가의 상동체 캐스케이드 복합체를 시험하기 위해 부위 패널을 확인하였다. 구체적으로, 최소 CRISPR 어레이는 30-bp 인터스페이서 거리를 갖는 인간 게놈에서의 로커스 세트를 표적화하도록 설계되었고, AAG 또는 ATG PAM 서열에 의해 플랭킹되었다. "반복부-스페이서-반복부-스페이서-반복부" 서열을 함유하는 가이드 폴리뉴클레오티드를 실시예 9A에 기재된 방법에 따라 서열식별번호: 454를 사용하여 클로닝하였다. 최소 CRISPR 어레이를 생성하기 위해 사용되는 올리고뉴클레오티드 서열의 전체 세트가 서열식별번호: 1017 내지 서열식별번호: 1130으로서 제시된다 (Hsa33F, 서열식별번호: 1017, 및 Hsa33R, 서열식별번호: 1074, 한 쌍을 예시함). TRAC 로커스를 표적화하는 가이드를 포함하는 양성 대조군이 포함되었다 (서열식별번호: 454).
FokI-캐스케이드 RNP 서브유닛 단백질 구성성분 코딩 유전자를, 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터; 2A 바이러스 펩티드 "리보솜-스키핑" 서열을 통해 연결된 cas 유전자; 30-aa 링커 (서열식별번호: 455)로 연결된 FokI 및 Cas8을 포함하는 융합 단백질을 포함하는 벡터로 클로닝하였다.
B. FokI-캐스케이드 RNP 복합체 구성성분을 코딩하는 벡터의 형질감염
형질감염 조건은 하기 변형을 수반하여 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, 5 μl의 플라스미드 벡터 용액을 96-웰 플레이트의 개별 웰로 옮겼다. 각각의 웰은 FokI-캐스케이드 RNP 서브유닛 단백질 구성성분을 코딩하는 플라스미드 3 μg 및 최소 CRISPR 어레이를 코딩하는 플라스미드 0.3 μg을 함유하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱은 하기 변형을 수반하여 본질적으로 실시예 8C에 기재된 바와 같이 수행되었다. 실시예 8C의 표 36으로부터의 프라이머 Y 및 Z 대신, 본 실시예에 사용된 표적-특이적 프라이머는 서열식별번호: 1131 내지 서열식별번호: 1244였다.
D. 심층 시퀀싱 데이터 분석
심층 시퀀싱 데이터 분석은 본질적으로 실시예 8D에 기재된 바와 같이 수행되었다. 도 32는 데이터 분석의 결과를 제시한다. 도 32에서, 퍼센트 게놈 편집 (도 32, 수직축, % 편집)은 실시예 8A로부터의 표적 Hsa07 이외에도, 58개의 시험 부위에 대항하여 플로팅된다 (도 32, 수평축, "표적"; 이들 최소 CRISPR 어레이를 생성하는데 사용되는 올리고뉴클레오티드 서열은 상기에 논의됨) (n=3). 도 32에 제시된 바와 같이, 편집 범위는 ~6% 내지 검출 한계 미만이었다. 이들 데이터로부터, AAG PAM을 수반하는 8개 부위의 패널 (Hsa07 뿐만 아니라 하기 표적 Hsa37, Hsa43, Hsa46, Hsa60, Hsa77, Hsa88, 및 Hsa126에 상응하는 표적 1, 3-5, 10, 13 및 16)을, 게놈 편집에 관하여 상동체 캐스케이드 복합체를 시험하기 위해 선택되었다.
E. 게놈 편집에 관하여 FokI 뉴클레아제를 사용하여 시험하기 위한 상동체 캐스케이드 복합체의 확인
상이한 유형 I 시스템으로부터의 Cas8 단백질 서열을 psi-BLASTp에 대한 질의로서 사용하여 상동체 선택을 위한 계통 발생 트리를 생성하였다. 구체적으로, 푸소박테리움 뉴클레아툼(Fusobacterium nucleatum) (WP_008798978.1)로부터의 Cas8이 유형 I-B에 사용되었고, 바실루스 할로두란스 (WP_010896519.1)로부터의 Cas8이 유형 I-C에 사용되었으며, 이. 콜라이 (WP_001050401.1)로부터의 Cas8이 유형 I-E에 사용되었고, 슈도모나스 아에루기노사 (WP_003139224.1)로부터의 Cas8이 유형 I-F에 사용되었으며, 슈와넬라 푸트레파시엔스 (WP_011919226.1)로부터의 Cas5가 유형 I-Fv2에 사용되었다.
다음으로, psi-BLASTp는 각각의 유형 I 시스템에 대해 수천 개의 상동체가 확인될 때까지 여러 번 반복되었다. 이러한 정보로부터, 계통 발생 트리는 인터랙티브 트리 오브 라이프 온라인(interactive Tree of Life online) 소프트웨어 (iTOL, itol.embl.de/login.cgi에서 액세스가능)를 사용하여 구축되었다. 상기 트리는 가변적 분지 길이를 사용하여 클레이드를 자동 붕괴시킨 후 시각적으로 검사하였다.
이어서, 주요 클레이드 내에 속하는 유기체의 목록을 출력하고, 선택을 위해 수동으로 검사하였다. 이러한 단계에서는, 유형 I-E 내의 12개의 상동체 뿐만 아니라 유형 I-B, I-C, I-F 및 I-Fv2에 대한 2-3개의 대표적인 상동체에 대해 계통 발생 트리의 상이한 영역으로부터 샘플링된 상동체를 선택하는데에 우선 순위를 두었다. 상기 계통 발생 분석을 기반으로 하여 cas8cas5 후보를 NCBI에 입력하고, 내인성 숙주 박테리움 내의 게놈 컨텍스트를 NCBI의 게놈 그래픽 브라우저에서 시각적으로 검사하였다. 캐스케이드 상동체는 단지, (1) 37℃에서 성장하는 유기체에서 발견된 경우; (2) 그들의 cas 유전자 오페론이 무손상이고, 예상되는 캐스케이드 서브유닛 단백질 코딩 유전자, cas3 유전자, 및 무손상 획득 유전자 (즉, cas1cas2) 모두를 갖는 경우; (3) 그들의 cas 유전자 오페론이 하나 이상의 CRISPR 어레이에 의해 플랭킹된 경우; 및 (4) 그들의 CRISPR 어레이가 > 10개의 스페이서를 함유한 경우에만 선택되었다. 일부 상동체의 경우에, CRISPRfinder 프로그램 (crispr.i2bc.paris-saclay.fr/Server/)을 사용하여 추정상의 PAM 서열을 확인하였다. 상기 기준에 기반하여, 표 44에 나타낸 22개의 상동체 캐스케이드 복합체를 선택하였다.
Figure pct00062
Figure pct00063
* 문헌 [Sinkunas, T., et al., EMBO J. 32:385-394 (2013)]에 의해 확인된 바와 같지만; 본원에 제시된 데이터는 스트렙토코쿠스 써모필루스 균주 ND07이 생체내에서 단일 A를 PAM 서열로서 활용할 수 있다는 것을 명확하게 보여준다.
F. 표적 세포로의 형질감염을 위해 22개의 별개의 종으로부터의 FokI-캐스케이드 RNP 구성성분을 코딩하는 벡터의 생산
각각의 상동체로부터의 각각의 cas 유전자에 대한 서열은 FokI 뉴클레아제와 Cas8을 포함하는 융합 단백질을 포함하는 폴리시스트론성 구축물의 일부로서 합성되었다. 각각의 유형 I-E 캐스케이드 복합체 상동체에 대해, 적절한 PAM 서열을 가진 로커스를 표적화하는 ~7-8개의 가이드 세트가 생성되었다. 각각의 유형 I-B, I-C, I-F, 및 I-Fv2 캐스케이드 상동체에 대해, 적절한 PAM 서열을 가진 로커스를 표적화하는 ~2-7개의 가이드 세트가 생성되었다. 각각의 캐스케이드 복합체 상동체 시스템은 그의 동족 가이드를 프로세싱하기 위해 고유한 반복부 서열 (서열식별번호: 1267 내지 서열식별번호: 1288)을 필요로 하였다. "반복부-스페이서-반복부-스페이서-반복부" 서열을 함유하는 가이드에 대한 코딩 서열은 서열식별번호: 454에 대해 실시예 9A에 기재된 방법을 사용하여 클로닝되었다. 올리고뉴클레오티드는 5' 단부에서 인산화되고 오버행 서열이 첨부되어, 적절한 반복부 서열을 갖는 플라스미드 벡터로 클로닝할 수 있었다. 22개의 캐스케이드 복합체 상동체에 대한 최소 CRISPR 어레이를 생성하는데 사용된 올리고뉴클레오티드 서열의 전체 세트가 (서열식별번호: 1289 내지 서열식별번호: 1400)로서 제시된다.
FokI-캐스케이드 RNP 서브유닛 단백질 구성성분 코딩 유전자를, 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터; 2A 바이러스 펩티드 "리보솜-스키핑" 서열을 통해 연결된 cas 유전자; 30-aa 링커로 연결된 FokI 및 Cas8을 포함하는 융합 단백질을 포함하는 벡터로 클로닝하였다.
G. FokI-캐스케이드 RNP 복합체를 코딩하는 플라스미드의 형질감염
형질감염 조건은 하기 변형을 수반하여 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, 5 μl의 플라스미드 벡터 용액을 96-웰 플레이트의 개별 웰로 옮겼다. 각각의 웰은 FokI-캐스케이드 RNP 서브유닛 단백질 구성성분을 코딩하는 플라스미드 1.5 μg 및 최소 CRISPR 어레이를 코딩하는 플라스미드 ~0.5-1.5 μg을 함유하였다. 실험을 삼중으로 수행하였고, 이는 양성 대조군으로서 8개 부위 (실시예 8A로부터의 Hsa07 및 실시예 19F 및 실시예 19G로부터의 Hsa37, Hsa43, Hsa46, Hsa60, Hsa77, Hsa88, Hsa126)를 표적화한 이. 콜라이로부터의 FokI-캐스케이드 RNP 복합체 (서열식별번호: 455)를 포함하였다. 이전에 기재된 바와 같이, 하기 올리고뉴클레오티드를 사용하여 이. 콜라이 양성 대조군과 함께 사용되는 최소 CRISPR 어레이를 생성하였다: Hsa37 (서열식별번호: 1019; 서열식별번호: 1076), Hsa43 (서열식별번호: 1024; 서열식별번호: 1081), Hsa46 (서열식별번호: 1027; 서열식별번호: 1084), Hsa60 (서열식별번호: 1037; 서열식별번호: 1094), Hsa77 (서열식별번호: 1045; 서열식별번호: 1102), Hsa88 (서열식별번호: 1050; 서열식별번호: 1107), Hsa126 (서열식별번호: 1072; 서열식별번호: 1129).
H. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱은 하기 변형을 수반하여 본질적으로 실시예 8C에 기재된 바와 같이 수행되었다. 실시예 8C의 표 36으로부터의 프라이머 Y 및 Z 대신, 본 실시예에 사용된 표적-특이적 프라이머는 서열식별번호: 1401 내지 서열식별번호: 1512였다. 유형 I-E RNP 복합체와 유형 I-B, I-C, I-F, 및 I-Fv2 RNP 복합체 둘 다에 대해, 이. 콜라이 유형 I-E 캐스케이드를 포함하는 대조군 샘플이 비교를 위해 포함되었고, 실시예 8A로부터의 표적 Hsa07 및 본 실시예로부터의 Hsa37, Hsa43, Hsa46, Hsa60, Hsa77, Hsa88, Hsa126에 상응하는 표적-특이적 프라이머로 서열 분석하였다. 보다 구체적으로, 하기 표적-특이적 증폭 프라이머가 이들 표적에 사용되었다: Hsa37 (서열식별번호: 1133; 서열식별번호: 1190), Hsa43 (서열식별번호: 1138; 서열식별번호: 1195), Hsa46 (서열식별번호: 1141; 서열식별번호: 1198), Hsa60 (서열식별번호: 1151; 서열식별번호: 1208), Hsa77 (서열식별번호: 1159; 서열식별번호: 1216), Hsa88 (서열식별번호: 1164; 서열식별번호: 1221), Hsa126 (서열식별번호: 1186; 서열식별번호: 1243).
I. 심층 시퀀싱 데이터 분석
심층 시퀀싱 데이터 분석은 본질적으로 실시예 8D에 기재된 바와 같이 수행되었다. 도 33a 및 도 33b는 이러한 실험의 결과를 제시한다. 도 33a에서, 수직축은 퍼센트 편집 (도 33a, % 편집)이고 수평축 상의 숫자는 유형 I-E 상동체 시스템에 상응하는 서열식별번호이다. 많은 유형 I-E FokI-캐스케이드 상동체를 사용한 경우에 편집이 관찰되었다 (도 33a). 슈도모나스 종 S-6-2로부터의 변이체를 사용한 경우에 가장 높은 편집이 관찰되었지만, 다른 상동체 (즉, 살모넬라 엔테리카, 게오써모박터 종 EPR-M, 메타노셀라 아르보리자에 MRE50, 및 에스. 써모필루스 (균주 ND07))는 이. 콜라이와 대략 등가인 편집을 나타냈다. 도 33b에서, 수직축은 퍼센트 편집 (도 33b, % 편집)이고 수평축 상의 숫자는 유형 I-B, I-C, I-F, 및 I-Fv2 상동체 시스템에 상응하는 서열식별번호이다. 유형 I-B, I-C, I-F, 및 I-Fv2로부터 유래된 FokI-캐스케이드 RNP를 사용한 경우의 편집은 검출 한계 미만이었다 (도 33b).
본 실시예는 게놈 편집 능력을 제공하는 유형 I 시스템을 확인하기 위해 유형 I 상동체를 스크리닝하는 방법을 제공한다. 부가의 유형 I 상동체 스크리닝은 실시예 22에 기재되어 있다.
실시예 20
효율적인 게놈 편집을 위해 슈도모나스 종 S-6-2에서 FokI-Cas8 링커 길이와 인터스페이서 거리를 다양하게 하는 것
본 실시예는 FokI-Cas8 및 다양한 길이의 링커 폴리펩티드를 포함하는 다수의 융합 단백질의 설계 및 시험 뿐만 아니라 슈도모나스 종 S-6-2 유형 I-E CRISPR-Cas 시스템을 사용한 효율적인 게놈 편집을 위해 인터스페이서 거리를 다양하게 하는 것의 효과를 예시한다.
A. 표적 세포로 형질감염될 FokI-캐스케이드 RNP 구성성분을 코딩하는 벡터의 생산
최소 CRISPR 어레이는 인간 게놈 내의 로커스 세트를 표적화하도록 설계되었다. 인터스페이서 거리는 23 내지 34 bp의 범위이고, 1 bp씩 증가하였다. 각각의 인터스페이서 거리에 대해 8개의 표적이 설계되었고, 표적은 AAG PAM 서열에 의해 플랭킹되었다. 최소 CRISPR 어레이는 FokI-캐스케이드 표적화를 가능하게 하는 "반복부-스페이서-반복부-스페이서-반복부" 서열을 코딩하는 고유한 프라이머 및 3개의 올리고뉴클레오티드 (서열식별번호: 1513 내지 서열식별번호: 1515)를 사용하여 PCR-기반 어셈블리 (올리고-주형화 PCR 증폭)로 생성되었다. 최소 CRISPR 어레이를 생성하기 위한 고유한 올리고뉴클레오티드 서열의 전체 세트는 서열식별번호: 1516 내지 서열식별번호: 1704였다. PCR-어셈블리된 가이드는 본질적으로 제조업체의 지침에 따라 SPRI셀렉트® (베크만 쿨터; 미국 캘리포니아주 파사데나) 비드를 사용하여 정제 및 농축되었다.
FokI-캐스케이드 RNP 서브유닛 단백질 구성성분 코딩 유전자를, 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터, 2A "리보솜-스키핑" 서열을 통해 연결된 cas 유전자, 및 30-aa 링커 (서열식별번호: 1748)로 Cas8에 부착된 FokI를 포함하는 벡터로 클로닝하였다. 다양한 길이의 부가의 링커 폴리펩티드 서열을 설계하고, 이를 Cas8 단백질에 FokI를 연결하는데 사용하여 융합 단백질을 형성하였다. 링커 폴리펩티드 서열이 표 45에 열거된다.
Figure pct00064
B. FokI-캐스케이드 RNP 복합체 구성성분을 코딩하는 벡터의 형질감염
형질감염 조건은 하기 변형을 수반하는 것을 제외하고는, 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, 5 μl의 플라스미드 벡터 용액을 96-웰 플레이트의 개별 웰로 옮겼다. 각각의 웰은 FokI-캐스케이드 RNP 단백질 구성성분을 코딩하는 플라스미드 5 μg 및 최소 CRISPR 어레이를 코딩하는 선형 PCR 산물 ~0.1-0.5 μg을 함유하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱은 본질적으로 실시예 8C에 기재된 바와 같이 수행되었다. 실시예 8C의 표 36으로부터의 프라이머 Y 및 Z 대신, 표적-특이적 프라이머는 서열식별번호: 1705 내지 서열식별번호: 1803이었다.
심층 시퀀싱 데이터 분석은 본질적으로 실시예 8D에 기재된 바와 같이 수행되었다. 도 34는 95개 부위에서의 게놈 편집 (도 34, 수직축, "% 편집")을 제시한다 (n=1). 도 34에서, 수평축은 염기 쌍 단위의 인터스페이서 길이에 상응한다 (도 34, bp 인터스페이서). 링커 길이는 좌측에서 우측으로, 17AA (도 34, 열린 막대), 20AA (도 34, 크로스-해치 막대), 및 30AA (도 34, 스트립된 막대)의 3개의 막대 그래프로 표시된다. 편집 범위는 ~50% (도 34, 오차 막대, 평균 +/- 1 s.d.를 나타냄) 내지 검출 한계 미만이었으며, 인터스페이서 거리 및 링커 폴리펩티드 길이와 관련이 있었다. 링커 폴리펩티드의 아미노산 조성이 본원에 논의된다. ~30-33 bp의 인터스페이서 거리 및 17개 및 20개 아미노산의 링커 폴리펩티드 길이가 매우 효율적인 편집을 제공하였다.
본 발명을 지원하기 위해 수행된, 본 실시예에 제시된 바와 본질적으로 동일한 프로토콜을 따르는 부가의 실험으로부터의 데이터가 도 41a, 도 41b, 및 도 41c에 제시된다. 이들 도면에서, 수직축은 편집 효율 (%)이고 수평축은 bp 단위의 인터스페이서 거리 (23-34 bp)이다. 데이터는 3개의 캐스케이드 상동체 변이체인 FokI-Pse캐스케이드 (도 41a), FokI-Eco캐스케이드 (도 41b), 및 FokI-Sth캐스케이드 (도 41c)에 대한 FokI-Cas8 링커 길이 및 인터스페이서 거리의 스크리닝을 확장하였다. 퍼센트 편집 효율은 17 aa, 20 aa, 및 30 aa의 FokI-Cas8 링커 길이 (도 41a, 도 41b, 및 도 41c: 좌측에서 우측으로, 17 aa, 20 aa, 및 30 aa) 및 인터스페이서 거리의 함수로서 표시된다. 각각의 점은 단일 게놈 부위를 나타내며, 인터스페이서 거리당 7-8개 부위를 시험하였다. 평균은 막대 그래프로 표시된다. 이들 데이터로부터 알 수 있는 바와 같이, ~30-33 bp의 인터스페이서 거리와 17, 20 및 30개 아미노산의 링커 폴리펩티드 길이는 FokI-Pse캐스케이드에 대한 효율적인 편집을 제공하였고, ~31-33 bp의 인터스페이서 거리 및 17, 20, 및 30개 아미노산의 링커 폴리펩티드 길이는 FokI-Eco캐스케이드에 대해 효율적인 편집을 제공하였으며, ~29-31 bp의 인터스페이서 거리 및 17, 20, 및 30개 아미노산의 링커 폴리펩티드 길이는 FokI-Sth캐스케이드에 대해 효율적인 편집을 제공하였다.
실시예 21
FokI-캐스케이드 게놈 편집을 가능하게 하기 위해 Cas3-FokI 및 FokI-Cas8을 활용하는 것
본 실시예는 FokI의 이량체화를 유도하여 인간 게놈 내의 로커스에서 이중-가닥 파손을 생성하기 위해 Cas3-FokI 및 FokI-캐스케이드를 사용하는 것을 예시한다 (예를 들어, 도 16a, 도 16b, 및 도 16c 참조). 보다 구체적으로, 본 실시예는 게놈 편집 효율에 영향을 주기 위한 다수의 Cas3-FokI 링커 조성과 길이 및 FokI-Cas8 링커 조성과 길이의 설계 및 시험을 상세히 설명한다.
A. 표적 세포로 형질감염될 FokI-Cas3 및 FokI-캐스케이드 RNP 구성성분을 코딩하는 벡터의 생산
최소 CRISPR 어레이는 인간 게놈에서 AAG PAM에 의해 플랭킹된 3개의 별개의 부위를 표적화하도록 설계되었다. 가이드에 의해 지시된 이. 콜라이 FokI-캐스케이드 이량체를 사용하여 인터스페이서 편집을 지원하는 것으로 이전에 제시된 부위를 선택되었으므로, 이는 FokI-캐스케이드 결합에 허용되는 것으로 공지되어 있다 (예를 들어, Hsa37, Hsa43 및 Hsa46).
상기 실시예에 기재된 FokI-캐스케이드 시스템은 2개의 FokI 캐스케이드 복합체를 사용하였으며 (예를 들어, 도 15a, 도 15b, 및 도 15c 참조); 따라서, 제1 핵산 표적 부위를 명시하는 제1 가이드 서열 및 제2 핵산 표적 부위를 명시하는 제2 가이드 서열이 사용될 수 있다. Cas3-FokI-FokI-캐스케이드 시스템은 단일 PAM 만 필요하기 때문에, "반복부-스페이서-반복부"를 포함하는 가이드는 기능적 캐스케이드 복합체가 핵산 표적 부위에 결합하는 것을 용이하게 하기에 충분해야 한다. "반복부-스페이서-반복부-스페이서-반복부"를 함유하는 폴리뉴클레오티드가 또한 사용될 수 있지만, 전형적으로 이러한 실시양태에서, 2개의 스페이서 서열은 캐스케이드 복합체가 동일한 핵산 표적 서열에 결합하는 것을 지시하는데; 즉 2개의 스페이서는 동일한 서열을 가질 수 있다. 가이드는 서열식별번호: 454를 사용하여 본질적으로 실시예 9A에 기재된 바와 같이 클로닝된다. 하기 어닐링된 올리고뉴클레오티드가 최소 CRISPR 어레이의 생성에 사용된다: Hsa37 (서열식별번호: 1019; 서열식별번호: 1076), Hsa43 (서열식별번호: 1024; 서열식별번호: 1081), 및 Hsa46 (서열식별번호: 1027; 서열식별번호: 1084).
실시예 9A에 기재된 바와 같이, FokI-캐스케이드 RNP 단백질 구성성분 코딩 유전자를, 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터를 함유하는 플라스미드 벡터로 클로닝한다. cas 유전자는 2A "리보솜-스키핑" 서열을 통해 연결된다. 더욱이, FokI는 30-aa 링커 (서열식별번호: 455)를 사용하여 Cas8과 융합된다. 다양한 길이 및 조성의 부가의 링커 서열이 설계되고, 이를 사용하여 FokI를 Cas8 단백질에 연결한다. 이러한 서열의 예가 표 46에 열거되어 있다.
이. 콜라이로부터의 Cas3 단백질은 30-aa 링커를 사용하여 C-말단 상에서 FokI와 융합된다. 이러한 융합물은 N-말단 상의 NLS 서열 (서열식별번호: 1806)로 추가로 조작된다. 다양한 길이 및 조성의 부가의 링커 서열이 설계되고, 이를 사용하여 FokI를 Cas3 단백질에 연결한다 (표 46 및 서열식별번호: 1804 내지 서열식별번호: 1807).
Cas3 단백질의 헬리카제 또는 뉴클레아제 활성이 불활성화되는 부가의 Cas3-FokI 융합 구축물이 생성된다 (서열식별번호: 1808 내지 서열식별번호: 1815). 헬리카제 및 뉴클레아제 활성은 Cas3 단백질의 D452A 및 D75A 돌연변이를 각각 생성함으로써 손상된다 (예를 들어, 문헌 [Mulepati, S., et al., J. Biol. Chem. 288:22184-22192 (2013)] 참조).
Figure pct00065
B. FokI-캐스케이드 RNP 복합체를 코딩하는 플라스미드의 형질감염
형질감염 조건은 하기 변형을 수반하여 실시예 8B에 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, 5 μl의 플라스미드 벡터 용액을 96-웰 플레이트의 개별 웰로 옮겼다. 각각의 웰은 하기 3가지 구성성분을 포함한다: FokI-캐스케이드 RNP 단백질 구성성분의 세트를 코딩하는 플라스미드 3 μg, Cas3-FokI를 코딩하는 플라스미드 3 μg, 및 최소 CRISPR 어레이를 코딩하는 플라스미드 0.5 μg. 96-웰 플레이트는 상기 3가지 구성성분의 모든 조합을 제공하기 위해 매트릭스로서 설정된다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱은 하기 변형을 수반하여 실시예 8C에 기재된 바와 같이 수행되었다. 실시예 8C의 표 36으로부터의 프라이머 Y 및 Z 대신, 본 실시예에 사용된 표적-특이적 프라이머는 하기와 같다: 서열식별번호: 1133 및 서열식별번호: 1190 (Hsa37 표적 부위), 서열식별번호: 1138 및 서열식별번호: 1195 (Hsa43 표적 부위), 및 서열식별번호: 1141 및 서열식별번호: 1198 (Hsa46 표적 부위).
D. 심층 시퀀싱 데이터 분석
FokI-캐스케이드 결합 부위 PAM 서열의 상류에서 ~1 bp 내지 ~25 bp의 indel이 집계되는 것을 제외하고는, 실시예 8D에 기재된 바와 같이 심층 시퀀싱 데이터 분석을 수행한다. 이러한 방식으로, 가장 효율적인 편집을 지원하는 FokI-Cas8 링커 서열, Cas3-FokI 링커 서열 및 Cas3 변이체의 조합을 결정할 수 있다.
실시예 22
조작된 상동체 FokI-캐스케이드 복합체를 스크리닝하는 것
본 실시예는 게놈 편집의 효율을 평가하기 위해 상이한 수의 서브유닛을 갖는 다수의 상동 캐스케이드 복합체의 설계 및 시험을 예시한다. 본 실시예는 실시예 19에 기재된 분석을 확장한 것이다.
A. FokI-캐스케이드 RNP 복합체에 대한 표적 세포로 형질감염될 DNA 주형 구성성분의 생산
최소 CRISPR 어레이는 2개의 FokI-캐스케이드 RNP 복합체가 인간 게놈 내의 gDNA의 반대 가닥에 있는 인접한 로커스를 표적화하도록 설계되었다. FokI-캐스케이드 구축물은 3개 또는 4개의 유전자를 함유하는 11개의 상동 종 각각으로부터 유래되었다: 에프. 뉴클레아툼(F. nucleatum) (Fnu, 유형 I-B), 씨. 페투스(C. fetus) (Cfe, 유형 I-B), 오. 스플란크니쿠스(O. splanchnicus) (Osp, 유형 I-B), 비. 할로두란스(B. halodurans) (Bhe, 유형 I-C), 디. 불가리스(D. vulgaris) (Dvu, 유형 I-C), 브이. 콜레라에(V. cholerae) 균주 L15 (Vch, 유형 I-F), 케이. 옥시토카(K. oxytoca) (Koh, 유형 I-F), 피. 아에루기노사(P. aeruginosa) (Pae, 유형 I-F), 에스. 푸트레파시엔스(S. putrefaciens) (Spu, I-Fv2), 아시네토박터(Acinetobacter) (Aci, 유형 I-Fv2), 브이. 콜레라에 균주 HE48 (Vch_v2, 유형 I-Fv2).
제1 및 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체가 설계되었으며, 여기서 제1 가이드 폴리뉴클레오티드는 제1 핵산 표적 서열에 결합할 수 있는 제1 스페이서를 포함하였고, 제2 가이드 폴리뉴클레오티드는 제2 핵산 표적에 결합할 수 있는 제2 스페이서를 포함하였으며, 제1 핵산 표적 서열의 PAM 및 제2 핵산 표적 서열의 PAM은 14개 염기 쌍 내지 60개 염기 쌍의 인터스페이서 거리를 가졌다. 2개의 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체는, PAM이 가이드 RNA 표적 서열 대비 안쪽을 향하도록 배향되었다 (즉, PAM-인 배향). PAM 서열은 유형 I-B의 경우에 TCA이고, 유형 I-C의 경우에 TTC이며, 유형 I-F, I-Fv2의 경우에 CC였다 (유형 I-F 및 유형 I-Fv2는 CRISPR 어레이에서 상이한 반복부 서열을 가지고 있다; 표 47 및 표 44 참조).
Figure pct00066
최소 CRISPR 어레이는 FokI-캐스케이드 RNP 복합체 표적화를 가능하게 하는 "반복부-스페이서-반복부-스페이서-반복부" 서열을 코딩하는 고유한 프라이머 및 3개의 올리고뉴클레오티드를 사용하여 본질적으로 본원에 기재된 바와 같이 (예를 들어, 실시예 20A; 또한 도 42a 및 도 42b) PCR-기반 올리고-주형화 어셈블리로 생성되었다. 유형 I-B 및 유형 1-C의 경우에, 비-범용 역방향 올리고뉴클레오티드 프라이머가 사용되었다. PCR-어셈블리된 최소 CRISPR 어레이는 본질적으로 실시예 20A에 기재된 바와 같이 SPRI셀렉트® 비드 (베크만 쿨터; 미국 캘리포니아주 파사데나)를 사용하여 정제 및 농축시켰다.
조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체에서, FokI 코딩 서열을 유형 I-B, I-C, I-F 복합체의 경우에는 Cas8의 N-말단과 융합시키고, 유형 I-Fv2 복합체의 경우에는 Cas5의 N-말단과 융합시켰다. FokI-캐스케이드 RNP 단백질 구성성분 코딩 유전자를, 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터, 2A "리보솜-스키핑" 서열을 통해 연결된 cas 유전자, 및 30-aa 링커로 Cas8에 부착된 (또는 유형 I-Fv2 상동체의 경우에는 30-aa 링커로 Cas5에 부착된) FokI 단량체를 포함하는 벡터 (표 44 및 표 47 참조)로 클로닝하였다.
B. 조작된 FokI-캐스케이드 RNP 복합체 구성성분을 코딩하는 벡터의 형질감염
형질감염 조건은 하기 변형을 수반하여 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, DNA 주형을 함유하는 용액 5 μl를 96-웰 플레이트의 개별 웰로 옮겼으며, 여기서 웰은 상동 FokI-캐스케이드 복합체의 구성성분을 코딩하는 각각의 플라스미드 약 1.5 μg 뿐만 아니라 최소 CRISPR 어레이를 코딩하는 선형 PCR 산물 0.4 μg을 함유하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱은 본질적으로 실시예 8C에 기재된 바와 같이 수행되었다. 그러나, 실시예 8C의 표 36으로부터의 프라이머 Y 및 Z 대신, 상이한 표적-특이적 프라이머가 사용되었다. 도 43은 데이터 분석 결과를 제시한다. 도 43에서, 퍼센트 게놈 편집은 FokI-캐스케이드 상동체 변이체 (도 43, 수평축, 11개의 상동체 변이체는 상기 제시된 약어로써 확인되고, 수평축 상에 동일한 순서로 발생함) 및 인터스페이서 거리 (도 43, 수직축, 14-60 bp)의 함수로서 제시되며; 우측에 있는 회색 스케일 수직 막대는 indel의 백분율이다. 주어진 인터스페이서 거리에서의 각각의 측정은 4개의 표적 부위 (표적 부위당 n=1) 전체에 걸친 평균 편집을 나타낸다. 조작된 FokI-캐스케이드 오르소로그 복합체의 대부분을 사용한 편집은 시험된 표적 부위 전체에 걸쳐 검출 한계 미만인 반면, 조작된 비브리오 콜레라 균주 L15 (유형 I-F) FokI-캐스케이드 복합체를 사용한 편집 범위는 검출 한계 미만 내지 ~2% indel이었으며, 26 bp 내지 28 bp의 인터스페이서 거리의 경우에 가장 높은 편집이 관찰되었다. 편집은 또한, 42 bp 내지 46 bp의 인터스페이서 거리에서 검출 한계 미만 내지 ~1.5% 범위의 조작된 비브리오 콜레라 균주 HE48 (유형 I-Fv2) FokI-캐스케이드 복합체를 사용하여 관찰되었다.
본 실시예에서의 데이터는 본원에 기재된 방법이, 게놈 편집에 효과적인 상동 캐스케이드 복합체를 확인하기 위해 효과적으로 적용될 수 있다는 것을 예시한다.
실시예 23
mCas3 단백질을 사용하여 세포에서의 결실 길이를 제한하는 것
본 실시예는 게놈 편집 (예를 들어, 인간 세포)에서 사용하기 위해, 생성되는 Cas3 유도 결실이 wtCas3 단백질로 생성된 것들에 비해 더 짧도록 Cas3 단백질을 돌연변이시키는 방법을 예시한다.
A. 캐스케이드 및 Cas3 DNA 주형 구성성분의 생산
최소 CRISPR 어레이는 인간 게놈에서의 chr2 (HZGJ 유전자) 상의 AAG PAM을 사용하여 이. 콜라이 캐스케이드 (Eco캐스케이드) RNP 복합체가 게놈 로커스를 표적화하도록 설계되었다. 그 다음, 최소 CRISPR 어레이는 Eco캐스케이드 RNP 표적화를 가능하게 하는 "반복부-스페이서-반복부-스페이서-반복부" 서열을 코딩하는 고유한 프라이머 (서열식별번호: 1818) 및 3개의 올리고뉴클레오티드 (서열식별번호: 1513 내지 서열식별번호: 1515; 실시예 20A)를 사용하여 PCR-기반 어셈블리로 생성되었다. 이로써 생성된 앰플리콘은 최소 CRISPR 어레이의 발현을 구동하는 hu6 프로모터를 함유한다. 이러한 최소 CRISPR 어레이의 경우에, 두 스페이서 서열 모두에 동일한 서열이 사용되었다. PCR-어셈블리된 최소 CRISPR 어레이는 SPRI셀렉트® 비드 (베크만 쿨터; 미국 캘리포니아주 파사데나)를 사용하여 정제 및 농축되었다.
이. 콜라이 Cas3 (EcoCas3) 돌연변이체 변이체의 패널은 DNA 뉴클레아제 활성을 유지하면서 DNA에 대한 돌연변이체 단백질의 DNA 전위 전진성 (즉, DNA 길이에 따른 이동)을 감소시키기 위해 설계되었다.
단일-가닥 DNA 기질에 결합된 써모비피다 푸스카 Cas3의 결정 구조 (문헌 [Huo, Y., et al., Nat. Struct. Mol. Biol. (9):771-777 (2014)]), 기능성 단백질 도메인의 위치, 및 다른 Cas3 오르소로그와의 상동성를 참조하여, EcoCas3에서의 24개의 별개의 돌연변이 세트 (이. 콜라이 (P38036) Cas3 아미노산 서열: 유니프로트(UniProt)KB - P38036 (CAS3_ECOLI))를 만들어 헬리카제 도메인에서의 ATP 결합/가수분해 영역 (즉, G317A, S318A, G319A, K320N, T321N, Q297E, D452E, E453N, R662A, R665Q) 또는 헬리카제 도메인의 ssDNA 루프 결합/ssDNA 경로 보존된 영역 (즉, T346A, Q347N, G375A, K412G, T423A, D425H, Q426T, H601A, A602V, R603Q, R609S, T635A, Q636A, Q640H)을 조정하였다. 표 48는 EcoCas3 야생형 단백질 및 돌연변이체 단백질, 서열 (뉴클레오티드 서열)을 코딩하는 플라스미드, 및 상응하는 아미노산 서열을 열거한다.
Figure pct00067
Figure pct00068
* 야생형 EcoCas3 단백질 서열 대비
Eco캐스케이드 RNP 단백질 구성성분 코딩 유전자 뿐만 아니라 야생형 (wt) 및 돌연변이체 EcoCas3 유전자는 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터를 함유하는 벡터로 클로닝되었다. Eco캐스케이드 RNP cas 유전자는 2A "리보솜-스키핑" 서열을 통해 연결되었고, 모든 유전자는 N-말단 NLS 서열을 함유하여 코딩된 단백질을 핵으로 유도하였다 (Eco캐스케이드 폴리시스트론성 플라스미드 뉴클레오티드 서열, 서열식별번호: 1871, 폴리시스트론성 아미노산 서열, 서열식별번호: 1872).
B. 조작된 Eco캐스케이드 RNP, 야생형 EcoCas3 단백질, 및 돌연변이체 EcoCas3 단백질을 코딩하는 벡터의 형질감염
형질감염 조건은 하기 변형을 수반하여, 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다: 뉴클레오펙션 전에, DNA 주형을 함유하는 용액 6 μl를 96-웰 플레이트의 개별 웰로 옮겼으며, 여기서 웰은 Eco캐스케이드 복합체 단백질을 코딩하는 플라스미드 3 μg, 야생형 또는 돌연변이체 EcoCas3 단백질을 코딩하는 플라스미드 1 μg, 및 최소 CRISPR 어레이를 코딩하는 선형 PCR 산물 0.2 μg을 함유하였다. 형질감염 후 대략 4일에 gDNA를 수거하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱은 본질적으로 실시예 8C에 기재된 바와 같이 수행되었다. 그러나, 실시예 8C의 표 36으로부터의 프라이머 Y 및 Z 대신, 표적-특이적 프라이머는 서열식별번호: 1873 내지 서열식별번호: 1874였으며; 또한, MiSeq 시약 키트 v3, 600 사이클 (일루미나; 미국 캘리포니아주 샌디에이고)을 사용하였다. 심층 시퀀싱 데이터 분석은 하기 변형을 수반하여 본질적으로 실시예 8D에 기재된 바와 같이 수행되었다: (1) 앰플리콘 (앰플리콘 위치: chr2:68156987-68157510; 길이 = 524 뉴클레오티드) 창 내의 임의의 곳에 있는 적어도 하나의 판독값과 3개 초과의 뉴클레오티드 결실이 있는 고유한 판독값 클래스가 집계되었고 (본원에서 "고유한 결실 클래스"로서 지칭됨; 증폭 편향이 긴 결실을 수반한 산물에 대한 판독값 계수에 영향을 미칠 수 있기 때문에, 판독값 계수에 의해 클래스에 가중치가 부여되지 않았음), (2) 삽입 또는 다수의 결실이 있는 판독값 클래스는 폐기되었으며, (3) 결실 시작 부위와 중지 부위가 샘플 사이에 비교 매핑되었다.
도 45a, 도 45b, 도 45c, 및 도 45d는 야생형 EcoCas3 단백질 (n=21)을 포함하거나, EcoCas3 단백질 (n=3), 또는 돌연변이체 EcoCas3 단백질 (n=3)이 결여되는 Eco캐스케이드 RNP 복합체를 사용한 HZGJ 로커스에서의 게놈 편집을 제시한다. 도 45a는 수직축 상에 고유한 결실 클래스의 수 (도 45a, 0 내지 600)를 제시하고, 수평축 상에 EcoCas3 단백질 변이체 (도 45a, 좌측에서 우측으로, 야생형 대조군 (WT), Cas3 단백질이 없는 대조군, 및 표 48에 주어진 순서대로 m1Cas3 단백질 내지 m24Cas3 단백질)를 제시한다. 여기에서, 524 bp 앰플리콘 창 내에 고유한 결실 클래스의 수를 증가시킨 Cas3 돌연변이체 변이체가, 감소된 전위 전진성 (즉, DNA 길이에 따른 이동)에 대한 후보였다. 도 45b는 수직축 상에 염기 쌍의 평균 결실 길이를 제시하고, 수평축 상에 EcoCas3 단백질 변이체를 제시한다 (도 45a에 대해서와 동일한 순서). 고유한 결실 클래스 측정과 마찬가지로, 524 bp 앰플리콘 창 내에서 더 작은 결실 길이를 초래한 Cas3 돌연변이체 변이체가, 감소된 전위 전진성에 대한 후보였다. 도 45c는 수직축 상에 Eco캐스케이드 PAM의 상류 (즉, Cas3 닉킹 부위 근처)의 6 bp 부위 및 수평축 상의 EcoCas3 단백질 변이체 (도 45a에 대해서와 동일한 순서) 대비 평균 결실 시작 위치 (bp)를 제시한다. 도 45d는 수직축 상에 Eco캐스케이드 PAM의 상류 (즉, Cas3 예상 닉킹 부위 근처)의 6 bp 부위 및 수평축 상의 EcoCas3 단백질 변이체 (도 45a에 대해서와 동일한 순서) 대비 평균 결실 중지 위치 (bp)를 제시한다. 여기에서, EcoCas3 예상 닉킹 부위에 더 가까운 결실 시작 및 중지 위치를 나타낸 Cas3 돌연변이체는 감소된 전위 전진성 (즉, DNA 길이에 따른 이동)에 대한 강력한 후보로 간주되었다. 취합해 보면, 앰플리콘 창 내에서 증가된 고유한 결실 클래스, 앰플리콘 창 내에서 더 짧은 결실 클래스, 및 앰플리콘 창 내의 위치-시프트된 결실 클래스의 일부 조합을 나타낸 Cas3 돌연변이체는, 감소된 전위 전진성에 대한 강력한 후보였다.
몇 가지 돌연변이체는 결실 길이 감소를 나타내는 변경된 복구 패턴을 제공하였다. 야생형 EcoCas3 단백질에 비해, 돌연변이체 EcoCas3 단백질 D452H와 A602V 둘 다는 (1) 앰플리콘 창 내에서의 고유한 결실 클래스 수가 크게 증가했으며, 이는 더 짧은 결실을 나타낼 수 있고, (2) 앰플리콘 창 내에서, 결실은 야생형 EcoCas3 단백질에 비해 EcoCas3 개시 부위에 더 가깝게 시프트했으며, 이는 또한 더 짧은 결실을 나타낼 수 있다. 돌연변이체 EcoCas3 단백질 A602V는 또한, 야생형 EcoCas3 단백질에 비해 앰플리콘 창 내에서 더 작은 결실을 나타냈다. 돌연변이 D452H와 A602V 둘 다는 ssDNA 루프 결합에 영향을 미칠 것으로 예측되었다. 본 실시예에서의 데이터는 인간 세포 내로 도입되고 발현될 때 캐스케이드 RNP 복합체와 연합하여, 돌연변이가 Cas3 단백질 내로 도입하여 wtCas3 단백질에 비해 결실 길이를 감소시킬 수 있고, 세포에서 gDNA 내에서의 결실 길이를 조정하기 위한 돌연변이를 포함하는 Cas3를 만들고 사용하는 방법에 관한 안내를 제공할 수 있다는 것을 명확하게 보여준다.
실시예 24
로드블록을 사용하여 Cas3 유도된 결실 길이를 제한하는 것
Cas3 단백질과 연합된 캐스케이드 RNP 복합체에 의해 촉진되는 결실 길이를 제한 및/또는 규정하는 몇 가지 방법이 본 출원에 기재되어 있다. 본 실시예는 단백질 로드블록을 사용하여 Cas3 결실을 제한할 수 있는 방법을 예시한다.
A. Cas3 단백질 및 Eco캐스케이드 RNP DNA 주형 구성성분의 생산
최소 CRISPR 어레이는 인간 게놈에서의 chr2 (HZGJ 유전자) 상의 AAG PAM을 사용하여 이. 콜라이 캐스케이드 (Eco캐스케이드) RNP가 게놈 로커스를 표적화하도록 설계되었다. 그 다음, 최소 CRISPR 어레이는 본질적으로 실시예 20A에 기재된 바와 같이, Eco캐스케이드 RNP 표적화를 가능하게 하는 "반복부-스페이서-반복부-스페이서-반복부" 서열을 코딩하는 프라이머 및 3개의 올리고뉴클레오티드 (서열식별번호: 1513 내지 서열식별번호: 1515)를 사용하여 PCR-기반 어셈블리로 생성되었다. 이러한 최소 CRISPR 어레이의 경우에, 두 스페이서 서열이 동일하였다. PCR 어셈블리된 가이드는 주로 제조업체의 지침에 따라 SPRI셀렉트® (베크만 쿨터; 미국 캘리포니아주 파사데나) 비드를 사용하여 정제 및 농축시켰다. 조작된 Eco캐스케이드 단백질 구성성분 코딩 유전자 뿐만 아니라 이. 콜라이 Cas3 (EcoCas3) 유전자는 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터를 함유하는 벡터로 클로닝되었다. Eco캐스케이드 RNP cas 유전자는 2A "리보솜-스키핑" 서열을 통해 연결되었고 (플라스미드 뉴클레오티드 서열, 서열식별번호: 1871; 폴리시스트론성 단백질 서열, 서열식별번호: 1872), 모든 유전자는 N-말단 NLS 서열을 함유하여 코딩된 단백질을 핵으로 유도하였다.
B. dCas9-VP64/sgRNA RNP 복합체의 생산
dCas9-VP64/sgRNA RNP 복합체의 sgRNA 구성성분 [여기서 복합체는 캐스케이드 RNP 복합체와 연합된 Cas3 단백질의 전위 전진성 (즉, DNA를 따라 이동)을 중지하기 위한 로드블록으로서 사용되어야 함]은 시험관내 전사에 의해 생산되었다 (T7 신속 고 수율 RNA 합성 키트, 뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치). 5' 중첩 프라이머를 사용한 PCR을 사용하여, sgRNA 구성성분의 전사를 위한 dsDNA 주형을 어셈블리하였다. dsDNA 주형은 DNA 서열의 5' 단부에 T7 프로모터를 혼입하였다. sgRNA 주형을 생산하는데 사용되는 구성성분, 주형 및 프라이머는 표 49에 제시되어 있다.
Figure pct00069
sgRNA DNA 주형을 어셈블리하기 위한 PCR 반응은 하기를 포함하는 반응 혼합물을 사용하여 다음과 같이 수행되었다: 40 nM 농도의 하나의 "내부" DNA 프라이머 (서열식별번호: 1889 내지 서열식별번호: 1899), 500 nM 농도의 2개의 "외부" DNA 프라이머 (서열식별번호: 1887 및 서열식별번호: 1888; T7 프로모터 및 RNA 서열의 3' 말단을 함유함). PCR 반응은 본질적으로 제조업체의 지침에 따라 Q5 핫 스타트 고 충실도 2X 마스터 믹스 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)를 사용하여 수행되었다. PCR 어셈블리 반응은 하기 열 순환 조건을 사용하여 수행되었다: 2분 동안 98℃, 98℃에서 10초, 58℃에서 20초, 72℃에서 20초, 및 72℃에서 1분 동안 최종 연장의 11 사이클.
대략 0.25 내지 0.5 μg의 각각의 sgRNA DNA 주형을 T7 고 수율 RNA 합성 키트 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)를 사용하여 37℃에서 대략 16시간 동안 전사하였다. 전사 반응은 DNAse I 처리 (뉴 잉글랜드 바이오랩스; 미국 매사추세츠주 입스위치)였다. C-말단과 융합된 VP64 이펙터 도메인을 갖고 NLS 태그가 VP64의 C-말단 상에 첨부된 dCas9 단백질 (D10A & H840A; 예를 들어, 문헌 [Sander, J.D., et al., Nat. Biotechnol. 32:347-355 (2014)] 참조) (N-NLS-VP64 코딩 서열-dCas9 코딩 서열-C)은 이. 콜라이 (BL21 (DE3))에서 박테리아 발현 벡터로부터 발현되었고, 본질적으로 문헌 [Jinek, M., et al., Science 337:816-821 (2012)]에 기재된 바와 같이 친화성 크로마토그래피, 이온 교환 크로마토그래피 (IEC) 및 크기 배제 크로마토그래피 (SEC)를 사용하여 정제되었다.
C. EcoCas3 및 Eco캐스케이드 RNP 복합체 구성성분 뿐만 아니라 dCas9-VP64/sgRNA RNP 복합체의 구성성분을 코딩하는 벡터의 형질감염
HEK293 세포의 형질감염은 하기 변형을 수반하여 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다:
Cas3/Eco캐스케이드 RNP 복합체 형성의 경우에는, EcoCas3 단백질 및 Eco캐스케이드 단백질을 코딩하는 DNA 주형을 함유하는 용액 4 μL를 96-웰 플레이트의 개별 웰로 옮겼으며, 여기서 상기 웰은 Eco캐스케이드 단백질을 코딩하는 플라스미드 3 μg, 최소 CRISPR 어레이를 코딩하는 선형 PCR 산물 0.2 μg, 및 EcoCas3을 코딩하는 플라스미드 0, 1 또는 3 μg을 함유하였고;
Cas3-Eco캐스케이드 RNP 복합체 형성의 경우에는, Cas3-Eco캐스케이드 단백질 구성성분을 코딩하는 플라스미드 3 μg (여기서 Cas3은 17-aa 링커를 사용하여 Cas8 단백질에 연결되었음) 및 최소 CRISPR 어레이를 코딩하는 선형 PCR 산물 0.2 μg을 함유하였다.
그 다음, dCas9-VP64/sgRNA RNP 복합체를 어셈블리하였다. 구체적으로, sgRNA를 95℃에서 2분 동안 인큐베이션한 다음, 약 5분 동안 실온으로 평형화되게 할 수 있다. dCas9-VP64 단백질을 반응 완충제 (20 mM HEPES, pH 7.5, 100 mM KCL, 5 mM MgCl2, 5% 글리세롤) 중의 sgRNA와 1:3 비로 37℃에서 10분 동안 혼합하였다. 어셈블리된 dCas9-VP64/sgRNA RNP 복합체를, 세포로의 형질감염을 위해 다양한 용량으로 96-웰 플레이트의 웰로 옮겨져, 각각의 Cas3/Eco캐스케이드 또는 Cas3-Eco캐스케이드 혼합물이 0, 5, 20, 또는 50 pmol의 dCas9-VP64 로드블록을 수용한 매트릭스를 확립하였다. 뉴클레오펙션 후 4일에 세포로부터 gDNA를 수거하였다.
D. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱 및 데이터 분석은 본질적으로 실시예 23C에 기재된 바와 같이 수행되었다. 도 46a, 도 46b, 및 도 46c는 dCas9-VP64/sgRNA RNP 복합체 로드블록의 부재 또는 존재 하에 Cas3/Eco캐스케이드 (1 μg 또는 3 μg의 Cas3 발현 플라스미드를 사용함, 각각 도 46a 및 도 46b) 또는 Cas3-Eco캐스케이드 (도 46c)에 대하여, 표시된 dCas9-VP64/sgRNA RNP 복합체가 결합하도록 표적화된 위치 (즉, 로드블록의 위치, 도 46a, 도 46b, 도 46c, 흑색 화살표)와 관련하여 HZGJ 로커스에서의 결실 시작 부위 (도 46a, 도 46b, 및 도 46c, 열린 화살표는 예상 Cas3 닉킹 부위를 표시함)의 빈도를 명확하게 보여주는 일련의 히트 맵을 제시한다. 총 11개의 로드블록 (F1 내지 F6 및 R1 내지 R5)이 HZGJ 로커스에서 평가되었다. 도 46a, 도 46b, 및 도 46c에서 "F"는 dCas9-VP64/sgRNA RNP 복합체의 정방향 배향을 지칭하며, 여기서 정방향 배향은 dCas9-VP64/sgRNA RNP 복합체의 핵산 표적 결합 부위와 연합된 PAM이, Eco캐스케이드 RNP 복합체의 핵산 표적 결합 부위의 PAM을 향해 마주하였다는 것을 의미하고; "R"은 dCas9-VP64/sgRNA RNP 복합체의 역방향 배향을 지칭하며, 여기서 역방향 배향은 dCas9-VP64/sgRNA RNP 복합체의 핵산 표적 결합 부위와 연합된 PAM이, Eco캐스케이드 RNP 복합체의 핵산 표적 결합 부위의 PAM과 마주하지 않았다는 것을 의미한다. 표적 부위 인디케이터 (F1 내지 F6 및 R1 내지 R5)의 우측에 있는 숫자 1, 2, 3 및 4는 각각 dCas9-VP64/sgRNA RNP 복합체의 0, 5, 20 또는 50 pmol에 상응한다. 각각의 히트 맵 위의 숫자 (-440 내지 +100)는 앰플리콘 창 내의 bp에 상응하며, 여기서 0 부위는 Eco캐스케이드 RNP PAM의 상류 6 bp로 지정되었다. 각각의 히트 맵의 좌측에 있는 회색 스케일 막대는 돌연변이체 클래스의 분율 (0.0-0.5)을 나타낸다. 결실 시작 부위는 로드블록 F4, F5 및 F6에 대한 dCas9-VP64/sgRNA RNP 복합체 로드블록 배치 부위 근처에서 고도로 강화된 것으로 나타났다.
도 47a 및 도 47b는 3 μg의 Cas3-Eco캐스케이드 및 0 pmol (도 47a) 또는 50 pmol (도 47b) dCas9-VP64/sgRNA RNP 복합체 로드블록으로 뉴클레오펙션된 샘플에 대한 앰플리콘 창 내의 모든 결실에 대한 데이터를 제시한다. 도 47a 및 도 47b에서, 열린 화살표는 EcoCas3 단백질 닉 부위의 상대적 위치를 나타낸다. 도 47b에서, 흑색 화살표는 로드블록 배치 (즉, dCas9-VP64/sgRNA RNP 복합체에 대한 표적 결합 부위)를 표시한다. 도 47a 및 도 47b에서, 수직축은 결실의 3' 단부를 나타내고, 단위는 앰플리콘 창 내의 bp이며, "0" 부위는 Eco캐스케이드 RNP PAM의 상류 6 bp로 지정된 부위이며; 수평축은 결실의 5' 단부를 나타내고, 단위는 앰플리콘 창 내의 bp이며, "0" 부위는 Eco캐스케이드 RNP PAM의 하류 6 bp로 지정되었다. 도 47a 및 도 47b에서, 수평 파선은 결실의 3' 단부의 평균 위치를 나타내고, 수직 파선은 결실의 5' 단부의 평균 위치를 나타낸다. 도 47a 및 도 47b 각각의 상단의 막대 그래프는 결실의 5' 단부의 분포에 상응하고, 곡선은 결실의 5' 단부의 커널 밀도 추정을 나타낸다. 유사하게, 도 47a 및 도 47b 각각의 우측에 있는 막대 그래프는 결실의 3' 단부의 분포에 상응하고, 곡선은 결실의 3' 단부의 커널 밀도 추정을 나타낸다. 결실 시작 부위는 도 47b에서의 흑색 화살표 근처에 고도로 강화되며, 이는 로드블록이 Cas3가 로드블록의 상류에 있는 gDNA를 결실시키는 것을 방지하였다는 것을 강력하게 시사한다.
본 실시예에서의 데이터는 캐스케이드 RNP 복합체와 연합된 Cas3 단백질에 의해 매개되는 결실의 길이를 제어하기 위해 단백질 로드블록을 사용하는 것을 지원하며; 따라서, 캐스케이드 RNP 복합체와 연합된 Cas3 단백질을 사용하여 세포의 gDNA에서 규정된 길이를 갖는 결실의 형성을 촉진시키는 방법을 제공한다.
실시예 25
캐스케이드 복합체에 연결된 ATPase 결핍성 돌연변이체를 사용하여, 쌍형성된 닉킹을 통해 표적화된 게놈 결실을 유도하는 것
본 실시예는 Cas3 ATPase 결핍성 돌연변이체 단백질 (mCas3 단백질)을 사용하여, 표적화된 결실을 유도하기 위해 게놈 DNA의 반대 가닥 상에 쌍형성된 닉킹을 촉진시킬 수 있는 방법을 예시한다.
A. mCas3 단백질/Eco캐스케이드 및 mCas3 단백질-Eco캐스케이드 RNP 복합체 DNA 주형 구성성분의 생산
최소 CRISPR 어레이는 2개의 이. 콜라이 캐스케이드 (Eco캐스케이드) (서열식별번호: 1871) RNP 복합체가 인간 게놈 내의 gDNA의 반대 가닥 상의 인접한 로커스를 표적화하도록 만들었다. 헬리카제 활성을 갖지 않으므로 닉킹 활성 만을 갖는 ATPase-결핍성 변이체인 이. 콜라이 D452A mCas3 단백질 (mCas3[D452A]) (예를 들어, 문헌 [Mulepati, S., et al., J. Biol. Chem. 288:22184-22192 (2013)] 참조)은 Eco캐스케이드 RNP 복합체 동원 후 쌍형성된-닉킹을 통해 표적화된 결실을 유도하도록 설계되었다. mCas3[D452A] 단백질은 Eco캐스케이드 (서열식별번호: 1900)로부터 별도로 단일 구성성분으로서 발현되거나, 또는 17개 아미노산 폴리펩티드 링커를 통해 Eco캐스케이드 RNP 복합체 (서열식별번호: 1901) 내의 Cas8 단백질에 연결된 융합 단백질로서 발현되었다. mCas3[D452A] 단백질이 단일 구성성분으로서 발현될 때, 코딩 서열은 발현 벡터 상에 존재하였으며, 여기서 그의 발현은 CMV 프로모터의 제어 하에 있었다. Cas3[D452A] 단백질/Eco캐스케이드는 Eco캐스케이드로부터의 별도의 구성성분으로서 발현된 mCas3[D452A] 단백질을 지칭한다. mCas3[D452A] 단백질-캐스케이드 RNP는 Eco캐스케이드 RNP 복합체 내의 Cas8 단백질에 연결된 융합 단백질로서의 mCas3[D452A]을 지칭한다. mCas3[D452A] 단백질-캐스케이드 RNP 단백질 구성성분 코딩 유전자는 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터, 2A "리보솜-스키핑" 서열을 통해 연결된 cas 유전자, 및 mCas3[D452A]-Cas8 융합 단백질을 만들기 위해 17-aa 링커 (서열식별번호: 1901)를 사용하여 Cas8에 부착된 Cas3의 ATPase-결핍성 돌연변이체 변이체 (D452A)를 포함하는 벡터로 클로닝되었다. mCas3[D452A] 단백질이 Cas8 단백질과의 융합 단백질로서 발현되었을 때, 이러한 융합 단백질은 Eco캐스케이드 RNP 복합체의 일부로서 어셈블리되었다 (mCas3[D452A] 단백질-Eco캐스케이드 RNP 복합체).
두 가이드 표적 서열 사이의 거리 (가이드 오프셋)은 1 bp 내지 120 bp였다. Eco캐스케이드 RNP 복합체는 PAM이 가이드 RNA 표적 서열 대비 안쪽 (PAM-인) 또는 바깥 쪽 (PAM-아웃)을 향하도록 배향되었다. 핵산 표적 서열과 연합된 PAM 서열은 AAT, ATA, AAC, AAA, GAG, ATG, AGG, 또는 AAG로부터 선택되었다.
최소 CRISPR 어레이는 캐스케이드 RNP가 인접한 로커스를 표적화할 수 있게 하는 "반복부-스페이서-반복부-스페이서-반복부" 서열을 코딩하는 고유한 프라이머 및 3개의 올리고뉴클레오티드 (서열식별번호: 1513 내지 서열식별번호: 1515)를 사용하여 PCR-기반 어셈블리로 생성되었다. 이로써 생성된 앰플리콘은 가이드에 대한 코딩 서열을 포함하는 최소 CRISPR 어레이의 발현을 구동하는 hu6 프로모터를 함유할 것이다 (예를 들어, 실시예 20A; 도 42a 참조). PCR-어셈블리된 최소 CRISPR 어레이는 본질적으로 제조업체의 지침에 따라 SPRI셀렉트® (베크만 쿨터; 미국 캘리포니아주 파사데나) 비드를 사용하여 정제 및 농축되었다.
B. FokI-캐스케이드 RNP 복합체 구성성분을 코딩하는 벡터의 형질감염
형질감염 조건은 하기 변형을 수반하여, 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, DNA 주형을 함유하는 용액 5 μl를 96-웰 플레이트의 개별 웰로 옮겼다. mCas3[D452A] 단백질/Eco캐스케이드 RNP 복합체 발현의 경우에, 웰은 mCas3[D452A] 단백질을 코딩하는 플라스미드 1.5 μg 및 Eco캐스케이드를 코딩하는 플라스미드 1.5 μg 뿐만 아니라 최소 CRISPR 어레이를 코딩하는 선형 PCR 산물 0.3 μg을 함유하였다. mCas3[D452A] 단백질-Eco캐스케이드 RNP 복합체 발현의 경우에, 웰은 mCas3[D452A]-Eco캐스케이드 단백질 (mCas3[D452A]-Cas8 융합 단백질 포함)을 코딩하는 플라스미드 3 μg 뿐만 아니라 최소 CRISPR 어레이를 코딩하는 선형 PCR 산물 0.3 μg을 함유하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
수많은 표적 부위를 포함하는 6개의 로커스를 gDNA의 반대 가닥 상의 쌍형성된 닉킹에 관하여 시험하였다 (HZGJ 로커스, 30개 표적 부위; NPHP3-ACAD11 로커스, 60개 표적 부위; JAK1 로커스 1, 49개 표적 부위; JAK1 로커스 2, 33개 표적 부위; NMNAT2 로커스, 38개 표적 부위; 및 ERBB2 로커스, 26개 표적 부위). gDNA의 반대 가닥 상의 쌍형성된 닉킹은 mCas3[D452A] 단백질/Eco캐스케이드 RNP 복합체와, 표적 부위에 대한 캐스케이드 복합체의 결합을 지시한 가이드를 포함하는 mCas3[D452A] 단백질-Eco캐스케이드 RNP 복합체 둘 다에 대해 시험되었다.
심층 시퀀싱은 본질적으로 실시예 8C에 기재된 바와 같이 수행되었고, 상이한 표적 특이적 프라이머가 상기 기재된 표적에 상응하여 사용된 것을 제외하고는 실시예 8D에 기재된 바와 같이 분석되었다.
표 50은 표시된 표적 부위를 표적화하는 mCas3[D452A] 단백질-Eco캐스케이드 RNP 복합체에 대한 30개의 HZGJ 표적 부위 전반에 걸친 예시적인 편집 데이터를 보여준다. 도 48은 mCas3[D452A]/Eco캐스케이드 또는 mCas3[D452A]-Eco캐스케이드를 사용한 경우의 30개의 HZGJ 표적 부위에서의 예시적인 게놈 편집 데이터를 제시한다. 도 48에서, 수직축은 % indel이고 수평축은 bp 단위의 인터스페이서 거리이다. 여기에서, 캐스케이드 복합체의 각각의 쌍에 대해, 하나의 RNP가 특별한 표적 부위에 고정되었고, 제2 RNP는 상이한 표적 부위에서 일정 범위의 거리에 걸쳐 상류 또는 하류로 향하였다. 도 48에서, 흑색 원과 이들을 연결하는 흑색 선은 mCas3-Eco캐스케이드를 사용한 편집에 상응하고, 회색 원과 이들을 연결하는 회색 선은 mCas3/Eco캐스케이드를 사용한 편집에 상응한다. mCas3/Eco캐스케이드를 사용한 편집은 대부분의 부위에 대해 검출 한계 미만인 반면, mCas3-Eco캐스케이드를 사용한 편집은 검출 한계 미만 내지 ~4% indel의 범위였다. mCas3-Eco캐스케이드는 일정 범위의 가이드 RNA 오프셋에 걸쳐 표적화된 결실을 가능하게 하였지만, PAM-아웃 입체 배치에서 가장 높았다.
Figure pct00070
Figure pct00071
본 실시예에 제시된 바와 본질적으로 동일한 프로토콜을 따르는 부가의 로커스로부터의 데이터는 캐스케이드 RNP 복합체가 PAM-아웃 입체 배치으로 배향되었을 때, mCas3[D452A]-Eco캐스케이드 샘플을 사용한 경우에 최상의 게놈 편집이 달성되었다는 것을 보여 주었다. 검출 한계를 초과하는 편집은 238개 표적 부위 중 26개에서 관찰되었고, 0.1% 초과의 편집은 mCas3[D452A]/Eco캐스케이드를 사용한 경우에 238개 표적 부위 중 1개에서 관찰된 반면 (즉, 대부분의 부위에 대하여 검출 한계 미만임), mCas3[D452A]-Eco캐스케이드를 사용한 경우에 검출 한계 초과의 편집은 242개 표적 부위 중 128개에서 관찰되었고, 0.1% 초과의 편집은 238개 표적 부위 중 1개에서 관찰되었다. mCas3[D452A]-Eco캐스케이드는 일정 범위의 가이드 오프셋에 걸쳐 표적화된 결실을 가능하게 하였으며, 캐스케이드 RNP 복합체가 PAM-아웃 입체 배치로 있을 때 가장 높았다.
본 실시예에서의 데이터는 mCas3 단백질을 포함하는 캐스케이드 RNP 복합체를 사용하여 gDNA의 반대 가닥 상에 쌍형성된 닉킹을 제공할 수 있으며, 따라서 숙주 세포 (예를 들어, 인간 세포)의 게놈에서 표적화된 결실을 촉진할 수 있다는 것을 보여준다.
실시예 26
게놈 결실을 생성하기 위한 Cas3 ATPase 결핍성 돌연변이체
Cas3 단백질과 연합된 캐스케이드 RNP 복합체에 의해 촉진되는 결실 길이를 제한 및/또는 규정하는 몇 가지 방법이 본 출원에 기재되어 있다. 본 실시예는 비-쌍형성된 ATPase 결핍성 돌연변이체 Cas3 단백질을 사용하여 표적화된 게놈 결실을 생성할 수 있으며; 따라서 단일 캐스케이드 RNP 복합체를 사용하여 단일 부위에서 닉킹을 제공하는 방법을 예시한다.
A. 표적 세포로의 형질감염을 위한 슈도모나스 종 S-6-2 Cas3 변이체 및 Pse캐스케이드 RNP 복합체 구성성분의 생산
최소 CRISPR 어레이는 슈도모나스 종 S-6-2 캐스케이드 (Pse캐스케이드) RNP 복합체가 인간 게놈 내의 TRAC 로커스에서 8개의 표적 (서열식별번호: 1902 내지 서열식별번호: 1909)을 표적화하도록 설계되었다. 이들 서열은 표 51에 제시되어 있다.
Figure pct00072
최소 CRISPR 어레이는 본질적으로 실시예 25A에 기재된 바와 같이, Pse캐스케이드 RNP 복합체 표적화를 가능하게 하는 "반복부-스페이서-반복부-스페이서-반복부" 서열을 코딩하는 고유한 프라이머 및 3개의 올리고뉴클레오티드 (서열식별번호: 1513 내지 서열식별번호: 1515)를 사용하여 PCR-기반 어셈블리로 생성되었다. 이러한 최소 CRISPR 어레이의 경우에, 두 스페이서 서열이 동일하였다. 최소 CRISPR 어레이를 생성하기 위한 올리고뉴클레오티드 서열의 전체 세트가 표 52에 제시된다.
Figure pct00073
PCR 어셈블리된 가이드는 주로 제조업체의 지침에 따라 SPRI셀렉트® (베크만 쿨터; 미국 캘리포니아주 파사데나) 비드를 사용하여 정제 및 농축시켰다.
ATPase/헬리카제 활성을 갖지 않으므로 닉킹 활성 만을 갖는 슈도모나스 종 S-6-2 Cas3 (PseCas3; 서열식별번호: 1918)의 D448A ATPase 돌연변이체 변이체 (mPseCas3으로 명명됨; 서열식별번호: 1919)는 표적화된 결실을 유도하도록 설계되었다. 평가 기준으로서, PseCas3의 D75A 뉴클레아제 데드 변이체 (서열식별번호: 1920)가 또한 생성되었으며 (dPseCas3*로 명명됨), 또한 PseCas3의 ATPase 뉴클레아제 이중 돌연변이체 변이체 (서열식별번호: 1921) (dblmPseCas3으로 명명됨)가 생성되었다. 각각의 표적에 대한 PAM 서열은 AAG였다.
Pse캐스케이드 RNP 복합체 단백질 구성성분 코딩 유전자 뿐만 아니라 돌연변이체 PseCas3 유전자는 포유동물 세포에서의 전달 및 발현을 가능하게 하는 CMV 프로모터를 함유하는 벡터로 클로닝되었다. Pse캐스케이드 RNP 복합체 cas 유전자는 2A "리보솜-스키핑" 서열을 통해 연결되었고, 모든 유전자는 N-말단 NLS 서열을 함유하여 코딩된 단백질을 핵으로 유도하였다. 그 서열이 표 53에 제시되어 있다.
Figure pct00074
B. FokI-캐스케이드 RNP 복합체 구성성분을 코딩하는 벡터의 형질감염
형질감염 조건은 하기 변형을 수반하여, 본질적으로 실시예 8B에 기재된 바와 같이 수행되었다. 뉴클레오펙션 전에, DNA 주형을 함유하는 용액 6 μl를 96-웰 플레이트의 개별 웰로 옮겼으며, 여기서 웰은 Pse캐스케이드 단백질 구성성분을 코딩하는 플라스미드 3 μg, 최소 CRISPR 어레이를 코딩하는 선형 PCR 산물 0.2 μg, 및 mPseCas3, dPseCas3*, 또는 dblmCas3을 코딩하는 플라스미드 1 μg을 함유하였다.
C. 형질감염된 세포로부터의 gDNA의 심층 시퀀싱
심층 시퀀싱은 본질적으로 실시예 8C에 기재된 바와 같이 수행되었다. 그러나, 실시예 8C의 표 36으로부터의 프라이머 Y 및 Z 대신, TRAC1 내지 TRAC8 표적 부위 각각에 대한 정방향 및 역방향 표적-특이적 프라이머 뿐만 아니라 MiSeq 시약 키트 v3, 600 사이클 (일루미나; 미국 캘리포니아주 샌디에이고)을 사용하였다.
도 49는 mPseCas3, dPseCas3*, 또는 dblmCas3 각각과 연합된 Pse캐스케이드 RNP 복합체를 사용한 경우의 8개 TRAC 표적 부위에서의 게놈 편집을 제시한다 (n=2). 도 49에서, 수직축은 % 편집이고, 수평축은 TRAC 로커스에서의 표적 부위를 나타낸다. 수평축에 따른 막대의 순서는 mPseCas3 (흑색 막대), dPseCas3* (회색 막대), 및 dblmCas3 (줄무늬 막대)이다. 표적 부위에서의 편집은 dPseCas3* 또는 dblmPseCas3 Pse캐스케이드 RNP 복합체를 사용한 경우에 거의 관찰되지 않았지만, mPseCas3 Pse캐스케이드 RNP 복합체를 사용한 경우에 표적 부위에서의 결실에 의해 검출된 바와 같이 약 7% 이하의 게놈 편집에 도달하였다. 이들 데이터는 ATPase/헬리카제 활성을 갖지 않으므로, 닉킹 활성 만을 갖는 mPseCas3 단백질이 단일 표적 (즉, 쌍형성된-닉킹 입체 배치가 아님)에서 Pse캐스케이드 RNP 복합체와 함께 사용하여 예상 절단 부위에서 결실을 생성할 수 있다는 것을 보여준다.
관련 기술분야의 통상의 기술자에게 명백한 바와 같이, 본 발명의 취지 및 범주를 벗어나지 않고서도 상기 실시양태의 다양한 변형 및 변이가 이루어질 수 있다. 이러한 변형 및 변이는 본 발명의 범주 내에 있다.
SEQUENCE LISTING <110> CARIBOU BIOSCIENCES, INC <120> ENGINEERED CASCADE COMPONENTS AND CASCADE COMPLEXES <130> CBI032.30 <150> US 16/420,061 <151> 2019-05-22 <150> US 16/262,773 <151> 2019-01-30 <150> US 16/104,875 <151> 2018-08-17 <150> US 62/807,717 <151> 2019-02-19 <150> US 62/684,735 <151> 2018-06-13 <160> 1927 <170> PatentIn version 3.5 <210> 1 <211> 1509 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(1509) <223> Cas8 <400> 1 atgaatttgc ttattgataa ctggatccct gtacgcccgc gaaacggggg gaaagtccaa 60 atcataaatc tgcaatcgct atactgcagt agagatcagt ggcgattaag tttgccccgt 120 gacgatatgg aactggccgc tttagcactg ctggtttgca ttgggcaaat tatcgccccg 180 gcaaaagatg acgttgaatt tcgacatcgc ataatgaatc cgctcactga agatgagttt 240 caacaactca tcgcgccgtg gatagatatg ttctacctta atcacgcaga acatcccttt 300 atgcagacca aaggtgtcaa agcaaatgat gtgactccaa tggaaaaact gttggctggg 360 gtaagcggcg cgacgaattg tgcatttgtc aatcaaccgg ggcagggtga agcattatgt 420 ggtggatgca ctgcgattgc gttattcaac caggcgaatc aggcaccagg ttttggtggt 480 ggttttaaaa gcggtttacg tggaggaaca cctgtaacaa cgttcgtacg tgggatcgat 540 cttcgttcaa cggtgttact caatgtcctc acattacctc gtcttcaaaa acaatttcct 600 aatgaatcac atacggaaaa ccaacctacc tggattaaac ctatcaagtc caatgagtct 660 atacctgctt cgtcaattgg gtttgtccgt ggtctattct ggcaaccagc gcatattgaa 720 ttatgcgatc ccattgggat tggtaaatgt tcttgctgtg gacaggaaag caatttgcgt 780 tataccggtt ttcttaagga aaaatttacc tttacagtta atgggctatg gccccatccg 840 cattcccctt gtctggtaac agtcaagaaa ggggaggttg aggaaaaatt tcttgctttc 900 accacctccg caccatcatg gacacaaatc agccgagttg tggtagataa gattattcaa 960 aatgaaaatg gaaatcgcgt ggcggcggtt gtgaatcaat tcagaaatat tgcgccgcaa 1020 agtcctcttg aattgattat ggggggatat cgtaataatc aagcatctat tcttgaacgg 1080 cgtcatgatg tgttgatgtt taatcagggg tggcaacaat acggcaatgt gataaacgaa 1140 atagtgactg ttggtttggg atataaaaca gccttacgca aggcgttata tacctttgca 1200 gaagggttta aaaataaaga cttcaaaggg gccggagtct ctgttcatga gactgcagaa 1260 aggcatttct atcgacagag tgaattatta attcccgatg tactggcgaa tgttaatttt 1320 tcccaggctg atgaggtaat agctgattta cgagacaaac ttcatcaatt gtgtgaaatg 1380 ctatttaatc aatctgtagc tccctatgca catcatccta aattaataag cacattagcg 1440 cttgcccgcg ccacgctata caaacattta cgggagttaa aaccgcaagg agggccatca 1500 aatggctga 1509 <210> 2 <211> 483 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(483) <223> Cse2 <400> 2 atggctgatg aaattgatgc aatggcttta tatcgagcct ggcaacaact ggataatgga 60 tcatgtgcgc aaattagacg tgtttcagaa cctgatgaat tacgcgatat ccctgcgttt 120 tataggctgg tgcaaccttt tggttgggaa aacccacgtc accagcaggc tcttttgcgc 180 atggtgtttt gcctgagcgc aggaaagaat gtcatccgac atcaggacaa aaaatcggag 240 caaacaacag gtatctcgtt gggaagagct ttagccaata gtggaagaat taacgagcgc 300 cgtatctttc aattaattcg ggctgacaga acagccgata tggtccagtt acgtcgatta 360 cttactcacg ccgaacccgt acttgactgg ccattaatgg ccaggatgtt gacctggtgg 420 ggaaagcgcg aacgccagca acttctggaa gattttgtat tgaccacaaa caaaaatgcg 480 taa 483 <210> 3 <211> 1092 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(1092) <223> Cas7 <400> 3 atgtctaact ttatcaatat tcatgttctg atctctcaca gcccttcatg tctgaaccgc 60 gacgatatga acatgcagaa agacgctatt ttcggcggca aaagacgagt aagaatttca 120 agtcaaagcc ttaaacgtgc gatgcgtaaa agtggttatt acgcacaaaa tattggtgaa 180 tccagtctca gaaccattca tcttgcacaa ttacgtgatg ttcttcggca aaaacttggt 240 gaacgttttg accaaaaaat catcgataag acattagcgc tgctctccgg taaatcagtt 300 gatgaagccg aaaagatttc tgccgatgcg gttactccct gggttgtggg agaaatagcc 360 tggttctgtg agcaggttgc aaaagcagag gctgataatc tggatgataa aaagctgctc 420 aaagttctta aggaagatat tgccgccata cgtgtgaatt tacagcaggg tgttgatatt 480 gcgcttagtg gaagaatggc aaccagcggc atgatgactg agttgggaaa agttgatggt 540 gcaatgtcca ttgcgcatgc gatcactact catcaggttg attctgatat tgactggttc 600 accgctgtag atgatttaca ggaacaaggt tctgcacatc tgggaactca ggaattttca 660 tcgggtgttt tttatcgtta tgccaacatt aacctcgctc aacttcagga aaatttaggt 720 ggtgcctcca gggagcaggc tctggaaatt gcaacccatg ttgttcatat gctggcaaca 780 gaggtccctg gagcaaaaca gcgtacttat gccgctttta accctgcgga tatggtaatg 840 gttaatttct ccgatatgcc actttctatg gcaaatgctt ttgaaaaagc ggttaaagcg 900 aaagatggct ttttgcaacc gtctatacag gcgtttaatc aatattggga tcgcgttgcc 960 aatggatatg gtctgaacgg agctgctgcg caattcagct tatctgatgt agacccaatt 1020 actgctcaag ttaaacaaat gcctacttta gaacagttaa aatcctgggt tcgtaataat 1080 ggcgaggcgt ga 1092 <210> 4 <211> 675 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(675) <223> Cas5 <400> 4 atgagatctt atttgatctt gcggcttgct gggccaatgc aagcctgggg gcagccgacc 60 tttgaaggaa cgcgacctac cggaagattt ccgacccgaa gcgggttatt agggctactc 120 ggggcttgtc ttgggatcca acgtgatgat acttcttcat tacaggcgtt atcagagagt 180 gtgcaatttg cagtgcgctg cgatgaactc attcttgacg atcgtcgtgt gtctgtaacg 240 gggttgcgtg attaccatac agtccttgga gcgcgagaag attaccgtgg tttgaaaagt 300 catgaaacga ttcaaacatg gcgcgaatat ttatgtgatg cctcctttac cgtcgctctc 360 tggttaacac cccatgcaac gatggttatc tcagaacttg aaaaagcagt attaaagcct 420 cggtatacac cttacctggg gcggagaagt tgcccactaa cacacccgct ttttttgggg 480 acatgtcagg catcggatcc tcagaaggcg ctattaaatt atgagcccgt tggcggcgat 540 atatatagtg aggaatcagt tacagggcat catttaaaat ttacggcgcg cgacgaaccg 600 atgatcacct tgcctcgaca atttgcttcc cgagaatggt atgtgattaa aggaggtatg 660 gatgtatctc agtaa 675 <210> 5 <211> 600 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(600) <223> Cas6 <400> 5 atgtatctca gtaaagtcat cattgccagg gcctggagca gggatcttta ccaacttcac 60 cagggattat ggcatttatt tccaaacaga ccggatgctg ctcgtgattt tctttttcat 120 gttgagaagc gaaacacacc agaaggctgt catgttttat tgcagtcagc gcaaatgcct 180 gtttcaactg ccgttgcgac agtcattaaa actaaacagg ttgaatttca acttcaggtt 240 ggtgttccac tctattttcg gcttcgggca aatccgatca aaactattct cgacaatcaa 300 aagcgcctgg acagtaaagg gaatattaaa cgctgtcggg ttccgttaat aaaagaagca 360 gaacaaatcg cgtggttgca acgtaaattg ggcaatgcgg cgcgcgttga agatgtgcat 420 cccatatcgg aacggccaca gtatttttct ggtgatggta aaagtggaaa gatccaaacg 480 gtttgctttg aaggtgtgct caccatcaac gacgcgccag cgttaataga tcttgtacag 540 caaggtattg ggccagctaa atcgatggga tgtggcttgc tatctttggc tccactgtga 600 <210> 6 <211> 1509 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(1509) <223> Cas8 <400> 6 atgaatctgc tgattgataa ttggattccg gttcgtccgc gtaatggtgg taaagttcag 60 attattaatc tgcagagcct gtattgtagc cgtgatcagt ggcgtctgag cctgccgcgt 120 gatgatatgg aactggcagc actggcactg ctggtttgta ttggtcagat tattgcaccg 180 gcaaaagatg atgttgaatt tcgccatcgt attatgaatc cgctgaccga agatgaattt 240 cagcagctga ttgccccgtg gattgatatg ttttatctga atcatgcaga acatccgttt 300 atgcagacca aaggtgttaa agcaaatgat gttaccccga tggaaaaact gctggccggt 360 gttagcggtg caaccaattg tgcatttgtt aatcagccgg gtcagggtga agcactgtgt 420 ggtggttgta ccgcaattgc actgtttaat caggcgaatc aggccccggg ttttggtggt 480 ggttttaaaa gcggtctgcg tggtggtaca ccggttacca cctttgttcg tggtattgat 540 ctgcgtagca ccgttctgct gaatgttctg accctgccgc gtctgcagaa acagtttccg 600 aatgaaagcc ataccgaaaa tcagccgacc tggattaaac cgattaaaag caatgaaagc 660 attccggcaa gcagcattgg ttttgtgcgt ggtctgtttt ggcagccggc acatattgaa 720 ctgtgtgatc cgattggtat tggtaaatgt agctgttgtg gtcaggaaag caatctgcgt 780 tataccggct ttctgaaaga gaaatttacc tttaccgtta atggtctgtg gccgcatccg 840 catagcccgt gtctggttac cgtgaaaaaa ggtgaagttg aagaaaaatt tctggcattt 900 accaccagcg caccgagctg gacccagatt agccgtgttg ttgttgataa aattattcag 960 aatgaaaatg gcaatcgtgt tgcagcagtt gtgaatcagt ttcgtaatat tgcgccgcag 1020 agcccgctgg aactaattat gggtggttat cgtaataatc aggcaagcat tctggaacgc 1080 cgtcatgatg ttctgatgtt taatcagggt tggcagcagt atggtaatgt gattaatgaa 1140 attgtgaccg ttggtctggg ctataaaacc gcactgcgta aagcgctgta tacctttgcc 1200 gaaggcttta aaaacaaaga ttttaaaggt gcaggcgtta gcgttcatga aaccgccgaa 1260 cgtcattttt atcgtcagag cgaactgctg attccggatg tgctggcaaa tgttaatttt 1320 agccaggcag atgaagttat tgcagatctg cgcgataaac tgcatcagct gtgtgaaatg 1380 ctgtttaatc agagcgttgc accgtatgca catcatccga aactgattag caccctggcc 1440 ctggcacgtg caaccctgta taaacatctg cgtgaactga aaccgcaggg tggtccgagc 1500 aatggttaa 1509 <210> 7 <211> 483 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(483) <223> Cse2 <400> 7 atggcagatg aaattgatgc aatggcactg tatcgtgcat ggcagcagct ggataatggt 60 agctgtgcac agattcgtcg tgttagcgaa ccggatgaac tgcgtgatat tccggcattt 120 tatcgtctgg ttcagccgtt tggttgggaa aatccgcgtc atcagcaggc actgctgcgt 180 atggtttttt gtctgagcgc aggtaaaaat gttattcgtc atcaggataa aaaaagcgaa 240 cagaccaccg gtattagcct gggtcgtgca ctggcaaata gcggtcgtat taatgaacgt 300 cgtatttttc agctgattcg tgcagatcgt accgcagata tggttcagct gcgtcgtctg 360 ctgacccatg cagaaccggt tctggattgg ccgctgatgg cacgtatgct gacctggtgg 420 ggtaaacgtg aacgtcagca gctgctggaa gattttgttc tgaccaccaa taaaaatgcc 480 taa 483 <210> 8 <211> 1092 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(1092) <223> Cas7 <400> 8 atgagcaact ttattaatat tcatgtgctg attagccata gcccgagctg cctgaatcgt 60 gatgatatga atatgcagaa agatgccatt tttggcggta aacgtcgtgt tcgtattagc 120 agccagagcc tgaaacgtgc aatgcgtaaa agcggttatt atgcacagaa tattggtgaa 180 agcagcctgc gtaccattca tctggcacag ctgcgtgatg ttctgcgtca gaaactgggt 240 gaacgttttg atcagaaaat tattgataaa accctggcac tgctgagtgg caaaagcgtt 300 gatgaagcag aaaaaattag cgcagatgca gttaccccgt gggttgttgg tgaaattgcc 360 tggttttgcg aacaggttgc caaagccgaa gcagataatc tggatgataa aaaactgctg 420 aaagttctga aagaagatat tgccgccatt cgtgttaatc tgcagcaggg tgttgatatt 480 gcactgagcg gtcgtatggc aaccagcggt atgatgaccg aactgggtaa agttgatggt 540 gcaatgagca ttgcacatgc aattaccacc catcaggttg atagcgatat tgattggttt 600 accgcagttg atgatctgca ggaacagggt agcgcacatc tgggtacaca ggaatttagc 660 agcggtgtgt tttatcgtta tgcaaatatt aatctggccc agctgcagga aaatctgggt 720 ggtgcaagcc gtgaacaggc actggaaatt gcaacccatg ttgttcatat gctggcaacc 780 gaagttccgg gtgcaaaaca gcgtacctat gcagccttta atccggcaga tatggttatg 840 gttaatttta gcgatatgcc gctgtcaatg gcaaatgcct ttgaaaaagc agtgaaagcc 900 aaagatggtt ttctgcagcc gagcattcag gcatttaatc agtattggga tcgtgttgca 960 aatggctatg gtctgaatgg tgcagcagca cagtttagcc tgagcgatgt tgatccgatt 1020 accgcacagg ttaaacagat gccgaccctg gaacagctga aaagctgggt tcgtaataat 1080 ggtgaagcat aa 1092 <210> 9 <211> 675 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(675) <223> Cas5 <400> 9 atgcgtagct atctgattct gcgtctggca ggtccgatgc aggcatgggg tcagccgaca 60 tttgaaggta cacgtccgac aggtcgtttt ccgacacgta gtggtctgct gggtctgctg 120 ggtgcatgtc tgggtattca gcgtgatgat accagcagtc tgcaggcact gagcgaaagc 180 gtgcagtttg cagttcgttg tgatgaactg attctggatg atcgtcgtgt tagcgtgacc 240 ggtctgcgtg attatcatac cgttctgggt gcacgtgaag attatcgtgg tctgaaaagc 300 catgaaacca ttcagacctg gcgtgaatat ctgtgtgatg caagttttac cgttgcactg 360 tggctgaccc cgcatgcaac aatggttatt agcgaactgg aaaaagcagt tctgaaaccg 420 cgttataccc cgtatctggg tcgtcgtagc tgtccgctga cccatccgct gtttctgggt 480 acatgtcagg caagcgatcc gcagaaagca ctgctgaatt atgaaccggt tggtggtgat 540 atttatagcg aagaaagcgt taccggtcat catctgaaat ttaccgcacg tgatgaaccg 600 atgattaccc tgccgcgtca gtttgcaagc cgtgaatggt atgttattaa aggtggtatg 660 gatgttagcc agtaa 675 <210> 10 <211> 600 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(600) <223> Cas6 <400> 10 atgtatctga gcaaagttat tattgcacgt gcatggagcc gtgatctgta tcagctgcat 60 cagggtctgt ggcatctgtt tccgaatcgt ccggatgcag cccgtgattt tctgtttcat 120 gttgaaaaac gtaatacccc ggaaggttgt catgttctgc tgcagagcgc acagatgccg 180 gttagcaccg cagttgcaac cgttattaaa accaaacagg tggaatttca gctgcaggtt 240 ggtgttccgc tgtattttcg tctgcgtgcc aatccgatta aaaccattct ggataatcag 300 aaacgtctgg atagcaaagg taatattaaa cgttgccgcg tgccgctgat taaagaagcc 360 gaacagattg catggctgca gcgtaaactg ggtaatgcag cacgtgttga agatgttcat 420 ccgattagcg aacgtccgca gtattttagc ggtgatggta aaagcggtaa aattcagacc 480 gtttgttttg aaggtgttct gaccattaat gatgcaccgg cactgattga tctggttcag 540 cagggtattg gtccggcaaa aagcatgggt tgtggtctgc tgagtctggc cccgctgtaa 600 <210> 11 <211> 1509 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(1509) <223> Cas8 <400> 11 atgaatttgc tcattgataa ttggattccg gtgcgccccc ggaacggtgg gaaagtgcag 60 atcatcaatt tgcaaagtct ctactgttcc agggaccagt ggagactcag cctgccacgg 120 gatgatatgg agctggcggc gttggctctg ctcgtatgca tcggccagat tattgcgcca 180 gcaaaggatg acgttgaatt ccggcatcgg ataatgaacc cccttactga agatgagttc 240 cagcagctta tcgccccatg gatcgacatg ttctacctca accacgccga gcatcctttt 300 atgcagacca agggagtcaa ggcgaatgat gtgactccca tggagaagct gctggccggt 360 gtatctgggg cgaccaactg cgcattcgtg aatcagcctg gacaggggga ggccctctgt 420 ggaggctgca ctgctatagc actttttaac caagctaatc aagcccccgg ctttggtgga 480 gggtttaaga gtggattgag ggggggcact cccgtaacca cttttgtgag gggaattgat 540 ctgaggtcta ctgtgttgct gaacgtcctc acactcccaa ggctccagaa gcagttccca 600 aacgaaagtc ataccgaaaa ccagcccaca tggatcaagc ccatcaaatc taatgagagc 660 ataccggcta gcagtattgg atttgtacgg ggtctgttct ggcagccagc tcacatcgag 720 ctgtgtgatc ctattgggat cggcaagtgc tcttgttgtg ggcaggagtc caaccttagg 780 tatactggat ttctgaaaga gaagtttacc tttacagtaa atgggctctg gccccacccc 840 cactcacctt gccttgtgac agtgaaaaag ggggaagtcg aggagaagtt tctggccttt 900 acaacttctg ccccttcctg gactcagatt tccagagtgg tggtagataa gataattcaa 960 aacgagaatg gcaatagagt ggccgccgtg gtgaaccagt ttcgcaacat cgcccctcag 1020 tcccccctgg agctgattat gggcggttat cggaataacc aggccagtat actcgagcga 1080 cggcacgatg tcctcatgtt caatcaaggt tggcagcaat atggcaatgt gattaacgag 1140 atcgtaaccg tgggcctggg atataagacc gccctgcgga aggcgttgta tacttttgca 1200 gaaggcttta agaataagga ttttaagggt gccggcgtga gtgtccatga aacagctgaa 1260 cggcactttt atcggcagtc cgagctgttg ataccagacg tgctggctaa tgtgaacttc 1320 tcacaggccg acgaagtgat cgctgatctg cgggataaac tgcaccaact gtgcgagatg 1380 ctgtttaatc aaagcgtcgc tccttatgcc caccacccaa agctgatctc cacgctggcc 1440 ctggcgcgcg ccacacttta taaacatctc cgcgaactga aaccccaggg gggccccagc 1500 aatggctaa 1509 <210> 12 <211> 483 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(483) <223> Cse2 <400> 12 atggccgacg agattgacgc aatggcactt taccgggcct ggcagcagtt ggataatggt 60 tcatgtgccc agattcgcag agttagtgaa cctgacgaac tgagagatat ccccgcgttt 120 tacagacttg tccaaccgtt cggatgggag aacccacggc accaacaagc actccttcga 180 atggtcttct gtttgtccgc aggaaaaaat gtaatcagac accaagacaa aaagagcgag 240 caaaccacag gtatcagcct gggcagggca cttgccaact ctgggcggat caacgaaagg 300 agaatttttc agctgatacg cgctgatcgg actgcggaca tggtgcagct gcgcagactc 360 cttactcatg ccgaacctgt cctggattgg cccctgatgg cacgcatgct gacttggtgg 420 ggaaagagag aaagacagca actgcttgaa gacttcgtgc tcactacaaa taagaatgcc 480 taa 483 <210> 13 <211> 1092 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(1092) <223> Cas7 <400> 13 atgtcaaatt ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga 60 gacgacatga atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc 120 agccaaagtc ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag 180 tcctcattgc ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg 240 gaaagattcg accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg 300 gacgaggctg aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct 360 tggttttgtg aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg 420 aaggtcctta aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc 480 gcattgtccg gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga 540 gccatgagta tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc 600 acagcagtag atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct 660 tccggggtgt tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg 720 ggagcctctc gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca 780 gaggtacctg gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg 840 gtaaatttct ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca 900 aaggacgggt tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg 960 aacggctatg gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata 1020 actgcacagg tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac 1080 ggcgaagcct aa 1092 <210> 14 <211> 675 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(675) <223> Cas5 <400> 14 atgcggagct atctcatcct gagactggcc ggaccaatgc aggcctgggg acagcctacc 60 ttcgaaggta cacgccccac aggccgcttt cctaccagga gcggcctgct gggcctgctt 120 ggcgcttgtc ttgggatcca gcgcgatgat actagctccc tgcaagcact gtcagagagc 180 gtgcagtttg ccgtaagatg cgacgaactg atccttgatg ataggcgggt cagtgtcact 240 ggtctccggg actaccacac ggtgctgggg gcccgggagg attatagggg cctgaaaagt 300 cacgagacga ttcaaacctg gcgcgaatat ctgtgcgatg ccagcttcac cgtggccctg 360 tggctgactc cacatgccac tatggtcatc agtgaactgg aaaaggctgt tcttaagcct 420 cgatatactc cgtatctggg ccgccggagt tgtccactta cacacccact tttcctcggc 480 acctgccagg ccagcgaccc tcaaaaggcc cttctgaatt acgagccagt tggcggtgac 540 atatacagcg aagagtccgt gacgggacac catcttaagt tcaccgctcg ggacgagccc 600 atgattaccc tcccacggca gttcgcatca agggagtggt acgtcataaa ggggggcatg 660 gatgtgagtc agtaa 675 <210> 15 <211> 600 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(600) <223> Cas6 <400> 15 atgtatctgt caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac 60 cagggtctgt ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac 120 gttgaaaaaa gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg 180 gtgagcacag ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta 240 ggggttccac tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag 300 aagaggctcg acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct 360 gagcaaatcg cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac 420 ccgattagtg aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca 480 gtctgtttcg agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag 540 cagggcatag gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctgtaa 600 <210> 16 <211> 502 <212> PRT <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(502) <223> Cas8 <400> 16 Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly 1 5 10 15 Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp 20 25 30 Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 35 40 45 Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp 50 55 60 Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe 65 70 75 80 Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala 85 90 95 Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr 100 105 110 Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala 115 120 125 Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val 165 170 175 Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 180 185 190 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln 195 200 205 Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser 210 215 220 Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu 245 250 255 Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr 260 265 270 Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val 275 280 285 Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala 290 295 300 Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln 305 310 315 320 Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn 325 330 335 Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn 355 360 365 Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val 370 375 380 Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala 385 390 395 400 Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His 405 410 415 Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 420 425 430 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 435 440 445 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln 450 455 460 Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala 465 470 475 480 Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln 485 490 495 Gly Gly Pro Ser Asn Gly 500 <210> 17 <211> 160 <212> PRT <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(160) <223> Cse2 <400> 17 Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln 1 5 10 15 Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp 20 25 30 Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly 35 40 45 Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys 50 55 60 Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu 65 70 75 80 Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg 85 90 95 Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala 100 105 110 Asp Met Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu 115 120 125 Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu 130 135 140 Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala 145 150 155 160 <210> 18 <211> 363 <212> PRT <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(363) <223> Cas7 <400> 18 Met Ser Asn Phe Ile Asn Ile His Val Leu Ile Ser His Ser Pro Ser 1 5 10 15 Cys Leu Asn Arg Asp Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly 20 25 30 Gly Lys Arg Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met 35 40 45 Arg Lys Ser Gly Tyr Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg 50 55 60 Thr Ile His Leu Ala Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly 65 70 75 80 Glu Arg Phe Asp Gln Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser 85 90 95 Gly Lys Ser Val Asp Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr 100 105 110 Pro Trp Val Val Gly Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys 115 120 125 Ala Glu Ala Asp Asn Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys 130 135 140 Glu Asp Ile Ala Ala Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile 145 150 155 160 Ala Leu Ser Gly Arg Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly 165 170 175 Lys Val Asp Gly Ala Met Ser Ile Ala His Ala Ile Thr Thr His Gln 180 185 190 Val Asp Ser Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu 195 200 205 Gln Gly Ser Ala His Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe 210 215 220 Tyr Arg Tyr Ala Asn Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly 225 230 235 240 Gly Ala Ser Arg Glu Gln Ala Leu Glu Ile Ala Thr His Val Val His 245 250 255 Met Leu Ala Thr Glu Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala 260 265 270 Phe Asn Pro Ala Asp Met Val Met Val Asn Phe Ser Asp Met Pro Leu 275 280 285 Ser Met Ala Asn Ala Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe 290 295 300 Leu Gln Pro Ser Ile Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala 305 310 315 320 Asn Gly Tyr Gly Leu Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp 325 330 335 Val Asp Pro Ile Thr Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln 340 345 350 Leu Lys Ser Trp Val Arg Asn Asn Gly Glu Ala 355 360 <210> 19 <211> 224 <212> PRT <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(224) <223> Cas5 <400> 19 Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro Met Gln Ala Trp 1 5 10 15 Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly Arg Phe Pro Thr 20 25 30 Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu Gly Ile Gln Arg 35 40 45 Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser Val Gln Phe Ala 50 55 60 Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg Val Ser Val Thr 65 70 75 80 Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg Glu Asp Tyr Arg 85 90 95 Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg Glu Tyr Leu Cys 100 105 110 Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro His Ala Thr Met 115 120 125 Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro Arg Tyr Thr Pro 130 135 140 Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro Leu Phe Leu Gly 145 150 155 160 Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu Asn Tyr Glu Pro 165 170 175 Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr Gly His His Leu 180 185 190 Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu Pro Arg Gln Phe 195 200 205 Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met Asp Val Ser Gln 210 215 220 <210> 20 <211> 199 <212> PRT <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(199) <223> Cas6 <400> 20 Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu 1 5 10 15 Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp 20 25 30 Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn Thr Pro Glu 35 40 45 Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val Ser Thr Ala 50 55 60 Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln Leu Gln Val 65 70 75 80 Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile 85 90 95 Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile Lys Arg Cys 100 105 110 Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp Leu Gln Arg 115 120 125 Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro Ile Ser Glu 130 135 140 Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys Ile Gln Thr 145 150 155 160 Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala Pro Ala Leu Ile 165 170 175 Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys Ser Met Gly Cys Gly 180 185 190 Leu Leu Ser Leu Ala Pro Leu 195 <210> 21 <211> 888 <212> PRT <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(888) <223> Cas3 <400> 21 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 22 <211> 1455 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(1455) <223> Cas8 <400> 22 atgacggttt cgttgaatct gatcactgac cgctggatcc ccgtcctaga caccacaggc 60 acccgccata cgattgcacc ctgggagatg gccgattcct cgttcgtcgc cccggactgg 120 ccgcgccccg atctgaacac ggcctgcctg gagctgctga tcggcctcgt ccgtctggcc 180 gatccgcctg cccatcccga cgattgggag gataggcaag ctccggatgc tgatcgcttg 240 cgcgaccgcc ttgctccttt cgccccagcc ttcaaccttc tgggtgatgg gccgcggttc 300 atgcaggaaa tgggggggct ggttggcgat gtccgagcca ctgacgtgct tttcattgat 360 tccggtggtg atggcggtgc gctgacagtg cgtgaaggac gataccccaa cctggacctg 420 cccacggcgg caatggcgct ttatgccatg cagacgcagg ccccatcggg tggacggggt 480 aatctgacat cgctgcgcgg cggcggcccg atgacggtgc tggtcgatcc aggtggcggg 540 atgtggcctc tcatttgggc caacgtgcca gacggcaaac ctgtcgtgcc aaatgttctg 600 ccatggatga ggcgcacggt gacttcagaa actggagtgc ggttcttccc acatcaagga 660 gatgcagccg aggtgttctt cggtatgccg cgtcggttgt ggctagaggc tcggaacgac 720 agtgtcactg gggtgatcca gcgaccctcc ggcacgaaat acgtgggctg gcgtcatccc 780 ctgacgccct actatcgcca gaaggcgggt gacacgccgc tacctgtgcg gccgcgcgcc 840 ggggtgtttg gttatcgcca ctggctaggt attgctgccg aacagggcag tgatctgcgc 900 gagcgccctg cgacggtaga ggcgtgggaa agtcgcggtc ttggccgccg agctgacatc 960 attgtggccg gctgggcaat ggagaacatg aaggctcgcg attacatatg gtcgcgggcg 1020 ccgctggtga ccctgcccga agagcgagcg gcctttctcc gcgatatgat cgaagcggcc 1080 gatttacttt cggcagccct gcgtggtgcc ctagccacgc ttctgggcga gggagagggg 1140 cgtgaggcgg cgcgggaagc gttctatgtc cgcacgcagg ccgccttcga ggggtgggtt 1200 tcttgtctgg ataccattgc tctggacgcc gctgcgcgtg gctggctggc cgacatgcgc 1260 aaggtggcgc tggagatttt cgaggtgctg gcgctgcccg gtttggcgga tcgcactatc 1320 ctcgttcaac aggaaatcgt cgccgcgcat cgcgggctga ccggcagctt ctcgggctat 1380 ggaaagcttg ggaccaaggc gtttggcgtt ctgaacctac ctgtgccgac acgcaagaag 1440 gaggcggcga catga 1455 <210> 23 <211> 525 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(525) <223> Cse2 <400> 23 atgagcgatc gcaagcaggt catcggcaca tggtggcgga ccaggattgg tgcccgcaac 60 tccaccgcgg cgcgtgcgct ggcggccagg ctgaaccggg gcgagggggt ggacgtgctc 120 gcggagcggg cagtcttcga gcttggccgg gacttgggct tcctgaagca acccaaacgt 180 ctggtgctgc ttgtgcgggt gctggcggcg gtgcgtgagg atcggggggg agcgttgcca 240 ctaagactgg ggcaggggga tcctccaccc ctatcgccgt tgcgttttca gcgtcttttg 300 cgcgccgaag gcgaggagtt gaccacgctt ctgcgccgcg ccctccctat ggtcacacgg 360 acctgcgacg tgggcgcgct tggcgccgat ctgcttgact ggtctgactc cacccgcgcc 420 cgctgggcct tcgcctattt cggcgcgacc ccgcccgcca gaatcaacaa ctccagacca 480 acccctgaaa cgcccgccct atccgatcag gagaccgagg aatga 525 <210> 24 <211> 1083 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(1083) <223> Cas7 <400> 24 atgacgacct ttttgcaatt tcatgtgctg acgacctatc ccccgtcgaa ccctaaccgc 60 gacgatcagg gccgtccgaa gcaggccaat ctcggcggcg ctccccggct acggctatcg 120 tcgcaatcga tcaagcgggc aatgcgtgag agcccggcat ttcagcaggg tcttgatggc 180 catatcggca cgcgaacgaa gcgactgggc gaagaaatcc gcgaagagtt ggccaagcga 240 gagggcgtgt cgaccgatca ggcgctcgat gtggcttcaa aggtcgccgc gatcttctct 300 aagctggagg cgccgggcaa ggataaggtg caaaaaccac ttaccaccac tctggccttc 360 gtgtcgcccg acgaatgggc attggcccgc gatctggcga gccggatgtt ggcgggcgag 420 gagatgccga aggacaagga actgaagcgt ctggttctcc gccgtgccga cggggcagtg 480 gatatcgcca tgttcggccg gatgctggcg gatgaaccgg gctacaaccg cgaggccgcc 540 gtgcaggtga gccacgccat caccacccat cgcgccattg ccgaggacga ttggtattcc 600 gccgtcgacg atcttaacaa gcgcgaggat tcaggtgccg gacacttggg cgagcatggt 660 ttcggttcgg gcgtctatta cctctatgcc tgcgtcaacg tcgatcttct ggtagagaac 720 ctcgcgggcg atcgggcact cgccgcccgt ggtctcgaag cgttggcaaa ggcgctcgct 780 accgcaacac cacgcgggaa gcagaacagc catgcccacc acccccgcgc gatctatgtc 840 cgcgccgaac gcgggccgca acagccgcgc gacctgaccg gggccttctt ttctgctgtg 900 gacctgaagt cgaatgacat cgagcggaca tcaatcatcg cactggagag aaccgccgaa 960 cagattgatc gcgcctacgg tgccgcttgt gacgataccg cggtaatgga cgtgaaggag 1020 gggaatggca ctctggccga gatcgctgcc ttttctggcg cgtcggtatc tgccaatgcg 1080 tga 1083 <210> 25 <211> 765 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(765) <223> Cas5 <400> 25 atggcactct ggccgagatc gctgcctttt ctggcgcgtc ggtatctgcc aatgcgtgag 60 catttggtct ttaccttggc cgcggctgtc gcctcgatgg gcgaactggc agggcacgag 120 cggcgtggca cctggtcttg gccgggacgg tcgtcagttc tgggcttgtg cgcagcagcc 180 cttggtatcc ggcgtgatgg cgatttcagt gcgcttgacg gactcgggct ggcagtggct 240 gtgttcgata caggcgaacc gctgcgggat tttcacacag ccgtcagtat cccgtcgtca 300 gtagcaaaga gaccgcagtc gcgtgcagat gcgttgcgga tcgacgctgg acgcagcaat 360 tccacgatca cattgcgcga ttaccgggtc ggagtgcttt atggtgtcgc gttgtggggc 420 gacggcctcc cgactgttgc agagaatctg gtcgaggctc tgcaacggcc gaccttcacg 480 ctctacttgg ggcgtaagtc ctgccccttg gcggccccgc ttgcgccacg tgtcctgacg 540 gcacccgacg ctgcggcggc gctgacagac ggaatgacgc taccaccgtg gcgtgctggt 600 gcccgtgcag gccagatcgc taccgaagag gaattgcccg cacctcgcac ggaaacccgc 660 cacgaccggc ccactgatcg caccgcatgg catttcgccc cgcgcgcggt gcgtctcgtt 720 ccctgtgata tcgcacctcg cactgctgga caggtggctg catga 765 <210> 26 <211> 708 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(708) <223> Cas6 <400> 26 atgaccctct ggctatcccg agtccgcatc gctcgtggtg ctgatcttga tacgctgcgg 60 ccgctcttgg acccaagtgc gctgcatccg gcggcgatgg acccaaagat gttgggctct 120 caaacagacg cgcatcaccg cctgatctgg acgctgtttg ccgatagtcg tgaccggcgc 180 cgcgatttcc tgtggcgagc cgagggtgca gggaagttca ctttgctgtc gctgcgtcca 240 cctacggcgt cacgagtgtt tgaggcaccc gaggtgaagg ctttctctcc tgatcttttg 300 cccggtgacc ggctggcctt cgctttgcgc gccaacgcaa cccgagaccg ggccgggtca 360 gccaagggac ggcgagtcga tgtggtgatg cacgccttgc ataacgtgcc gcccgaggac 420 cgcgctgcgg cccggatgac tctggctcag gacgccgcct cggattggtt gacggggcag 480 ggcgcgcgcg cgggcttcgt gccggaagag gtgacagcag gtgattattc cgtggccgca 540 cttccaagcc acactggtag gcgaaagggg cagccgcagt atggtatcct cgatctgacc 600 ggcgtgctgc gcgtgaccga tccggcggct ttccttgcac ggctgggcca gggctttggt 660 agggcacgtg gttttggttg cgggcttatg ctgatccggc gggcctga 708 <210> 27 <211> 1455 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(1455) <223> Cas8 <400> 27 atgacagtga gcctgaatct gatcaccgat cgctggattc ccgtgctgga cacaaccgga 60 acacggcaca ccatcgcacc ttgggagatg gccgacagct cctttgtggc cccagattgg 120 cccagacctg acctgaacac cgcctgtctg gagctgctga tcggactggt gcgcctggcc 180 gatccccctg cacaccccga cgattgggag gacaggcagg cccctgacgc agataggctg 240 agggatagac tggcaccttt tgccccagcc ttcaatctgc tgggcgacgg cccacgcttc 300 atgcaggaga tgggaggact ggtgggcgat gtgcgggcaa cagacgtgct gtttatcgat 360 tccggcggcg acggaggcgc cctgaccgtg agagagggca ggtacccaaa cctggacctg 420 ccaacagcag caatggcact gtatgcaatg cagacccagg cacctagcgg cggaagagga 480 aatctgacat ccctgagggg aggaggacca atgaccgtgc tggtggaccc cggaggagga 540 atgtggcctc tgatctgggc aaacgtgccc gacggcaagc cagtggtgcc taatgtgctg 600 ccttggatga gaaggacagt gaccagcgag accggcgtga ggttctttcc acaccagggc 660 gatgccgccg aggtgttctt tggaatgcca cgccggctgt ggctggaggc acgcaacgac 720 tccgtgacag gcgtgatcca gcggccctct ggcaccaagt atgtgggctg gcgccaccca 780 ctgacaccct actataggca gaaggcaggc gataccccac tgcccgtgag gcctagggca 840 ggcgtgttcg gatacaggca ctggctggga atcgcagcag agcagggctc tgacctgagg 900 gagagaccag caaccgtgga ggcctgggag agccgcggac tgggcagaag ggccgatatc 960 atcgtggccg gctgggccat ggagaatatg aaggcaaggg actatatctg gtcccgggca 1020 cctctggtga cactgccaga ggagagagcc gcctttctga gggatatgat cgaggccgcc 1080 gacctgctgt ctgccgccct gaggggcgcc ctggccaccc tgctgggcga gggcgagggc 1140 agagaggccg ccagggaggc cttttacgtg agaacacagg ccgccttcga gggctgggtg 1200 agctgtctgg ataccatcgc cctggacgca gcagcaaggg gatggctggc cgatatgcgg 1260 aaggtggccc tggagatctt cgaggtgctg gccctgccag gactggcaga cagaaccatc 1320 ctggtgcagc aggagatcgt ggcagcacac aggggactga caggcagctt ctccggctac 1380 ggcaagctgg gcaccaaggc ctttggcgtg ctgaacctgc ctgtgccaac acggaagaag 1440 gaggccgcca cctaa 1455 <210> 28 <211> 525 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(525) <223> Cse2 <400> 28 atgagcgaca ggaagcaggt catcggcaca tggtggagaa ccaggatcgg cgccagaaac 60 tccaccgcag caagggccct ggcagcacgg ctgaatagag gagagggagt ggatgtgctg 120 gcagagaggg ccgtgtttga gctgggaagg gacctgggct tcctgaagca gccaaagcgc 180 ctggtgctgc tggtgcgggt gctggcagcc gtgagggagg ataggggagg cgccctgcct 240 ctgaggctgg gccagggcga ccctccaccc ctgagcccac tgcggtttca gagactgctg 300 agggcagaag gagaggagct gacaaccctg ctgaggcgcg ccctgccaat ggtgacacgc 360 acctgcgacg tgggcgccct gggagcagac ctgctggatt ggtccgactc tacacgcgca 420 agatgggcct ttgcctattt cggcgccacc cctccagcca gaatcaacaa tagcaggcca 480 acacccgaga cccccgccct gtccgatcag gagacagagg agtaa 525 <210> 29 <211> 1083 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(1083) <223> Cas7 <400> 29 atgaccacat ttctgcagtt ccacgtgctg accacatatc ccccttctaa ccctaatagg 60 gacgatcagg gccggccaaa gcaggcaaac ctgggaggag caccaaggct gcggctgagc 120 tcccagtcta tcaagagggc aatgagggag agccctgcat tccagcaggg cctggatgga 180 cacatcggca cacggaccaa gagactgggc gaggagatca gggaggagct ggcaaagagg 240 gagggcgtga gcaccgatca ggccctggac gtggcatcta aggtggcagc catcttcagc 300 aagctggagg cccccggcaa ggacaaggtg cagaagcctc tgaccacaac cctggccttt 360 gtgagcccag atgagtgggc actggcaaga gacctggcat ccaggatgct ggcaggagag 420 gagatgccca aggataagga gctgaagcgc ctggtgctgc ggagagcaga tggagcagtg 480 gacatcgcaa tgttcggaag gatgctggca gacgagccag gatataacag ggaggcagca 540 gtgcaggtga gccacgcaat cacaacccac agagccatcg ccgaggacga ttggtactct 600 gccgtggacg atctgaataa gagggaggat agcggcgcag gacacctggg agagcacgga 660 tttggctccg gcgtgtacta tctgtacgcc tgcgtgaacg tggatctgct ggtggagaat 720 ctggcaggcg accgcgccct ggcagcaagg ggcctggagg ccctggcaaa ggccctggca 780 acagcaaccc caagaggcaa gcagaactct cacgcccacc accccagggc aatctatgtg 840 agggcagaga ggggaccaca gcagcctagg gacctgaccg gcgccttctt ttctgccgtg 900 gatctgaaga gcaatgacat cgagcggaca tccatcatcg ccctggagag aaccgccgag 960 cagatcgata gggcatacgg agcagcatgc gacgatacag ccgtgatgga cgtgaaggag 1020 ggaaacggca ccctggcaga gatcgcagcc ttcagcggcg catctgtgag cgccaatgca 1080 taa 1083 <210> 30 <211> 765 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(765) <223> Cas5 <400> 30 atggcactgt ggcctcggtc tctgccattc ctggcccgga gatacctgcc aatgcgggag 60 cacctggtgt ttacactggc cgccgccgtg gcctccatgg gagagctggc aggacacgag 120 aggaggggca cctggtcttg gcccggcaga tctagcgtgc tgggcctgtg cgcagccgcc 180 ctgggcatcc ggcgggacgg cgatttctcc gccctggacg gactgggact ggcagtggcc 240 gtgtttgata caggagagcc actgagggac ttccacaccg ccgtgtccat cccatcctct 300 gtggccaaga ggccacagtc tcgggcagat gccctgcgca tcgacgcagg ccggagcaac 360 tccacaatca ccctgcgcga ttacagggtg ggcgtgctgt atggagtggc cctgtggggc 420 gacggactgc ctaccgtggc cgagaatctg gtggaggccc tgcagcgccc aacattcacc 480 ctgtacctgg gccggaagag ctgtccactg gcagcaccac tggcaccccg cgtgctgaca 540 gccccagatg cagcagccgc cctgacagac ggaatgaccc tgccaccatg gagagcagga 600 gcaagggcag gccagatcgc aaccgaggag gagctgcctg caccaagaac agagaccaga 660 cacgataggc caacagacag gaccgcctgg cactttgcac caagggccgt gcggctggtg 720 ccttgcgata tcgccccaag aacagcagga caggtggcag cataa 765 <210> 31 <211> 708 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(708) <223> Cas6 <400> 31 atgacactgt ggctgagccg ggtgcggatc gcaagaggag cagacctgga taccctgagg 60 ccactgctgg accccagcgc cctgcaccca gcagcaatgg accccaagat gctgggctcc 120 cagacagacg cccaccacag actgatctgg accctgtttg ccgattccag agacaggcgc 180 cgggacttcc tgtggagggc agagggcgcc ggcaagttta cactgctgag cctgagaccc 240 cctaccgcct ccagggtgtt tgaggcccct gaggtgaagg ccttcagccc agatctgctg 300 ccaggcgaca ggctggcctt cgccctgcgg gccaacgcca cccgcgatcg ggccggctcc 360 gccaagggca gaagggtgga cgtggtcatg cacgccctgc acaatgtgcc acccgaggat 420 agggcagcag caaggatgac actggcacag gatgcagcaa gcgactggct gaccggacag 480 ggagccagag caggattcgt gcccgaggag gtgacagcag gcgactactc cgtggccgcc 540 ctgccttctc acaccggccg gagaaagggc cagccacagt atggcatcct ggatctgaca 600 ggcgtgctga gagtgaccga ccctgcagcc tttctggcaa ggctgggaca gggatttgga 660 agagcaaggg gattcggatg cggactgatg ctgatcagaa gggcataa 708 <210> 32 <211> 484 <212> PRT <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(484) <223> Cas8 <400> 32 Met Thr Val Ser Leu Asn Leu Ile Thr Asp Arg Trp Ile Pro Val Leu 1 5 10 15 Asp Thr Thr Gly Thr Arg His Thr Ile Ala Pro Trp Glu Met Ala Asp 20 25 30 Ser Ser Phe Val Ala Pro Asp Trp Pro Arg Pro Asp Leu Asn Thr Ala 35 40 45 Cys Leu Glu Leu Leu Ile Gly Leu Val Arg Leu Ala Asp Pro Pro Ala 50 55 60 His Pro Asp Asp Trp Glu Asp Arg Gln Ala Pro Asp Ala Asp Arg Leu 65 70 75 80 Arg Asp Arg Leu Ala Pro Phe Ala Pro Ala Phe Asn Leu Leu Gly Asp 85 90 95 Gly Pro Arg Phe Met Gln Glu Met Gly Gly Leu Val Gly Asp Val Arg 100 105 110 Ala Thr Asp Val Leu Phe Ile Asp Ser Gly Gly Asp Gly Gly Ala Leu 115 120 125 Thr Val Arg Glu Gly Arg Tyr Pro Asn Leu Asp Leu Pro Thr Ala Ala 130 135 140 Met Ala Leu Tyr Ala Met Gln Thr Gln Ala Pro Ser Gly Gly Arg Gly 145 150 155 160 Asn Leu Thr Ser Leu Arg Gly Gly Gly Pro Met Thr Val Leu Val Asp 165 170 175 Pro Gly Gly Gly Met Trp Pro Leu Ile Trp Ala Asn Val Pro Asp Gly 180 185 190 Lys Pro Val Val Pro Asn Val Leu Pro Trp Met Arg Arg Thr Val Thr 195 200 205 Ser Glu Thr Gly Val Arg Phe Phe Pro His Gln Gly Asp Ala Ala Glu 210 215 220 Val Phe Phe Gly Met Pro Arg Arg Leu Trp Leu Glu Ala Arg Asn Asp 225 230 235 240 Ser Val Thr Gly Val Ile Gln Arg Pro Ser Gly Thr Lys Tyr Val Gly 245 250 255 Trp Arg His Pro Leu Thr Pro Tyr Tyr Arg Gln Lys Ala Gly Asp Thr 260 265 270 Pro Leu Pro Val Arg Pro Arg Ala Gly Val Phe Gly Tyr Arg His Trp 275 280 285 Leu Gly Ile Ala Ala Glu Gln Gly Ser Asp Leu Arg Glu Arg Pro Ala 290 295 300 Thr Val Glu Ala Trp Glu Ser Arg Gly Leu Gly Arg Arg Ala Asp Ile 305 310 315 320 Ile Val Ala Gly Trp Ala Met Glu Asn Met Lys Ala Arg Asp Tyr Ile 325 330 335 Trp Ser Arg Ala Pro Leu Val Thr Leu Pro Glu Glu Arg Ala Ala Phe 340 345 350 Leu Arg Asp Met Ile Glu Ala Ala Asp Leu Leu Ser Ala Ala Leu Arg 355 360 365 Gly Ala Leu Ala Thr Leu Leu Gly Glu Gly Glu Gly Arg Glu Ala Ala 370 375 380 Arg Glu Ala Phe Tyr Val Arg Thr Gln Ala Ala Phe Glu Gly Trp Val 385 390 395 400 Ser Cys Leu Asp Thr Ile Ala Leu Asp Ala Ala Ala Arg Gly Trp Leu 405 410 415 Ala Asp Met Arg Lys Val Ala Leu Glu Ile Phe Glu Val Leu Ala Leu 420 425 430 Pro Gly Leu Ala Asp Arg Thr Ile Leu Val Gln Gln Glu Ile Val Ala 435 440 445 Ala His Arg Gly Leu Thr Gly Ser Phe Ser Gly Tyr Gly Lys Leu Gly 450 455 460 Thr Lys Ala Phe Gly Val Leu Asn Leu Pro Val Pro Thr Arg Lys Lys 465 470 475 480 Glu Ala Ala Thr <210> 33 <211> 174 <212> PRT <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(174) <223> Cse2 <400> 33 Met Ser Asp Arg Lys Gln Val Ile Gly Thr Trp Trp Arg Thr Arg Ile 1 5 10 15 Gly Ala Arg Asn Ser Thr Ala Ala Arg Ala Leu Ala Ala Arg Leu Asn 20 25 30 Arg Gly Glu Gly Val Asp Val Leu Ala Glu Arg Ala Val Phe Glu Leu 35 40 45 Gly Arg Asp Leu Gly Phe Leu Lys Gln Pro Lys Arg Leu Val Leu Leu 50 55 60 Val Arg Val Leu Ala Ala Val Arg Glu Asp Arg Gly Gly Ala Leu Pro 65 70 75 80 Leu Arg Leu Gly Gln Gly Asp Pro Pro Pro Leu Ser Pro Leu Arg Phe 85 90 95 Gln Arg Leu Leu Arg Ala Glu Gly Glu Glu Leu Thr Thr Leu Leu Arg 100 105 110 Arg Ala Leu Pro Met Val Thr Arg Thr Cys Asp Val Gly Ala Leu Gly 115 120 125 Ala Asp Leu Leu Asp Trp Ser Asp Ser Thr Arg Ala Arg Trp Ala Phe 130 135 140 Ala Tyr Phe Gly Ala Thr Pro Pro Ala Arg Ile Asn Asn Ser Arg Pro 145 150 155 160 Thr Pro Glu Thr Pro Ala Leu Ser Asp Gln Glu Thr Glu Glu 165 170 <210> 34 <211> 360 <212> PRT <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(360) <223> Cas7 <400> 34 Met Thr Thr Phe Leu Gln Phe His Val Leu Thr Thr Tyr Pro Pro Ser 1 5 10 15 Asn Pro Asn Arg Asp Asp Gln Gly Arg Pro Lys Gln Ala Asn Leu Gly 20 25 30 Gly Ala Pro Arg Leu Arg Leu Ser Ser Gln Ser Ile Lys Arg Ala Met 35 40 45 Arg Glu Ser Pro Ala Phe Gln Gln Gly Leu Asp Gly His Ile Gly Thr 50 55 60 Arg Thr Lys Arg Leu Gly Glu Glu Ile Arg Glu Glu Leu Ala Lys Arg 65 70 75 80 Glu Gly Val Ser Thr Asp Gln Ala Leu Asp Val Ala Ser Lys Val Ala 85 90 95 Ala Ile Phe Ser Lys Leu Glu Ala Pro Gly Lys Asp Lys Val Gln Lys 100 105 110 Pro Leu Thr Thr Thr Leu Ala Phe Val Ser Pro Asp Glu Trp Ala Leu 115 120 125 Ala Arg Asp Leu Ala Ser Arg Met Leu Ala Gly Glu Glu Met Pro Lys 130 135 140 Asp Lys Glu Leu Lys Arg Leu Val Leu Arg Arg Ala Asp Gly Ala Val 145 150 155 160 Asp Ile Ala Met Phe Gly Arg Met Leu Ala Asp Glu Pro Gly Tyr Asn 165 170 175 Arg Glu Ala Ala Val Gln Val Ser His Ala Ile Thr Thr His Arg Ala 180 185 190 Ile Ala Glu Asp Asp Trp Tyr Ser Ala Val Asp Asp Leu Asn Lys Arg 195 200 205 Glu Asp Ser Gly Ala Gly His Leu Gly Glu His Gly Phe Gly Ser Gly 210 215 220 Val Tyr Tyr Leu Tyr Ala Cys Val Asn Val Asp Leu Leu Val Glu Asn 225 230 235 240 Leu Ala Gly Asp Arg Ala Leu Ala Ala Arg Gly Leu Glu Ala Leu Ala 245 250 255 Lys Ala Leu Ala Thr Ala Thr Pro Arg Gly Lys Gln Asn Ser His Ala 260 265 270 His His Pro Arg Ala Ile Tyr Val Arg Ala Glu Arg Gly Pro Gln Gln 275 280 285 Pro Arg Asp Leu Thr Gly Ala Phe Phe Ser Ala Val Asp Leu Lys Ser 290 295 300 Asn Asp Ile Glu Arg Thr Ser Ile Ile Ala Leu Glu Arg Thr Ala Glu 305 310 315 320 Gln Ile Asp Arg Ala Tyr Gly Ala Ala Cys Asp Asp Thr Ala Val Met 325 330 335 Asp Val Lys Glu Gly Asn Gly Thr Leu Ala Glu Ile Ala Ala Phe Ser 340 345 350 Gly Ala Ser Val Ser Ala Asn Ala 355 360 <210> 35 <211> 254 <212> PRT <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(254) <223> Cas5 <400> 35 Met Ala Leu Trp Pro Arg Ser Leu Pro Phe Leu Ala Arg Arg Tyr Leu 1 5 10 15 Pro Met Arg Glu His Leu Val Phe Thr Leu Ala Ala Ala Val Ala Ser 20 25 30 Met Gly Glu Leu Ala Gly His Glu Arg Arg Gly Thr Trp Ser Trp Pro 35 40 45 Gly Arg Ser Ser Val Leu Gly Leu Cys Ala Ala Ala Leu Gly Ile Arg 50 55 60 Arg Asp Gly Asp Phe Ser Ala Leu Asp Gly Leu Gly Leu Ala Val Ala 65 70 75 80 Val Phe Asp Thr Gly Glu Pro Leu Arg Asp Phe His Thr Ala Val Ser 85 90 95 Ile Pro Ser Ser Val Ala Lys Arg Pro Gln Ser Arg Ala Asp Ala Leu 100 105 110 Arg Ile Asp Ala Gly Arg Ser Asn Ser Thr Ile Thr Leu Arg Asp Tyr 115 120 125 Arg Val Gly Val Leu Tyr Gly Val Ala Leu Trp Gly Asp Gly Leu Pro 130 135 140 Thr Val Ala Glu Asn Leu Val Glu Ala Leu Gln Arg Pro Thr Phe Thr 145 150 155 160 Leu Tyr Leu Gly Arg Lys Ser Cys Pro Leu Ala Ala Pro Leu Ala Pro 165 170 175 Arg Val Leu Thr Ala Pro Asp Ala Ala Ala Ala Leu Thr Asp Gly Met 180 185 190 Thr Leu Pro Pro Trp Arg Ala Gly Ala Arg Ala Gly Gln Ile Ala Thr 195 200 205 Glu Glu Glu Leu Pro Ala Pro Arg Thr Glu Thr Arg His Asp Arg Pro 210 215 220 Thr Asp Arg Thr Ala Trp His Phe Ala Pro Arg Ala Val Arg Leu Val 225 230 235 240 Pro Cys Asp Ile Ala Pro Arg Thr Ala Gly Gln Val Ala Ala 245 250 <210> 36 <211> 235 <212> PRT <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(235) <223> Cas6 <400> 36 Met Thr Leu Trp Leu Ser Arg Val Arg Ile Ala Arg Gly Ala Asp Leu 1 5 10 15 Asp Thr Leu Arg Pro Leu Leu Asp Pro Ser Ala Leu His Pro Ala Ala 20 25 30 Met Asp Pro Lys Met Leu Gly Ser Gln Thr Asp Ala His His Arg Leu 35 40 45 Ile Trp Thr Leu Phe Ala Asp Ser Arg Asp Arg Arg Arg Asp Phe Leu 50 55 60 Trp Arg Ala Glu Gly Ala Gly Lys Phe Thr Leu Leu Ser Leu Arg Pro 65 70 75 80 Pro Thr Ala Ser Arg Val Phe Glu Ala Pro Glu Val Lys Ala Phe Ser 85 90 95 Pro Asp Leu Leu Pro Gly Asp Arg Leu Ala Phe Ala Leu Arg Ala Asn 100 105 110 Ala Thr Arg Asp Arg Ala Gly Ser Ala Lys Gly Arg Arg Val Asp Val 115 120 125 Val Met His Ala Leu His Asn Val Pro Pro Glu Asp Arg Ala Ala Ala 130 135 140 Arg Met Thr Leu Ala Gln Asp Ala Ala Ser Asp Trp Leu Thr Gly Gln 145 150 155 160 Gly Ala Arg Ala Gly Phe Val Pro Glu Glu Val Thr Ala Gly Asp Tyr 165 170 175 Ser Val Ala Ala Leu Pro Ser His Thr Gly Arg Arg Lys Gly Gln Pro 180 185 190 Gln Tyr Gly Ile Leu Asp Leu Thr Gly Val Leu Arg Val Thr Asp Pro 195 200 205 Ala Ala Phe Leu Ala Arg Leu Gly Gln Gly Phe Gly Arg Ala Arg Gly 210 215 220 Phe Gly Cys Gly Leu Met Leu Ile Arg Arg Ala 225 230 235 <210> 37 <211> 90 <212> DNA <213> Oceanicola sp. HL-35 <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 37 ctgttccccg cacacgcggg gatgaaccgg gttcttcgat ctgcgcatcc atgatgccgc 60 cctgttcccc gcacacgcgg ggatgaaccg 90 <210> 38 <211> 1554 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(1554) <223> Cas8 <400> 38 atggatttgt taagtgatac ctggctgcag tgccgccatc gtgatggcac gctgaagccg 60 atagctattg ggcagatagg gctagaagac tgtttagagc tggttgcgcc acgccccgac 120 ttccgtggtg cgctctatca gtttctgatc gggttgctgc aaaccgccta cgcgccagag 180 gatcttcagg agtggcgtga tcgctatgcc aacccaccta ccgctgatga cctggcagag 240 gttttcgctc cttaccgcga cgccttccag ctggaaaact cagggcctac ctttatgcag 300 gacctgacct tgcccgatga cgtcaatcag ctgccggtgc tggagctgtt gattgatgcc 360 ggctcatcga gcaatcagta tttcaacaag ccggcggttg agcacggcat gtgcgagggc 420 tgctttaccc aggcgttgct caccatgcag ttgaacgcgc cctctggcgg acgaggcatt 480 cggacctcgc tgcgtggtgg cggtccgttg acgaccttgc tggtgccagc cgaacagaac 540 gcgacgcttt ggcaaaagct ctggctcaac gtcttgcctc ttgatgcact cgatcacccg 600 ccgatcaaga tgctcagtga cgtattgccc tggctggcac caacccgcac cagcgatgac 660 aaacagggcc aggatacacc gccggagtcg gtgcacccct tgcaggcgta ctggagcatg 720 ccgcggcgca ttcgcctgga tgcagccacc ttggatcagg gggattgcgc ggtatgcggt 780 gcccagaatg taaagcgtat ccgtcattac cgtacccgcc atggcggcac caactacacc 840 gggacatgga ctcacccgct gacaccctac agcctggact cgaaaggaga aaagccgccg 900 ctctcgatca aggggcgtca ggccgggcga ggttaccgtg actggctggg tctggtactt 960 ggtaatgaag atcaccagcc ggatgccgcg caggttgttc ggcacttcac cgccaaactg 1020 ggcaagccgt ccgtgcgctt gtggtgcttc ggtttcgata tgtcgaacat gaaagcgttg 1080 tgctggtacg acagtctgtt gccggtacac ggcgtggcac ctgacgttca gcggaagttt 1140 acccgcagcg tcaagcaggt gctggattcg gccaatgaca tggcctccgt tctgcacaaa 1200 caggtcaaag cggcctggtt tcgccgtccg ggcgatgccg gtcaggagcc tgccgtgacg 1260 caaagttttt ggcagggctc tgagacggcc ttttatcagg tgctggagca gctcagcaag 1320 ctcgattttg acagcgcggc cgagttggca gcgatctaca gagcctggtt gcaggccacg 1380 cgtcgtctgg tgctaagtct gtttgaccac tgggtgctga gcggtccgct ggaagatatg 1440 gacatgcaac gcgtggtcaa ggcccgggct gatctggcca aagagctgaa tactggcaag 1500 gcacaaaagc cgctgtggac aatcgttaat caacatctca aggagcaggc atga 1554 <210> 39 <211> 642 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(642) <223> Cse2 <400> 39 atgaagccga gaaagcccag attgaacgag gcccagcagc gctgggtgcg cgactggtgg 60 cgcgccttgc agccccgcgc cgagggtgat gaacccatac ccggcgagct gtctgtcatg 120 gggaggggtg agcgggcaca actgcgccgc tgcaccgatg ccgatgagct gcttacccag 180 tcagccaccc tgctgctggc gcaccgtttg gttgcactca atggtgagcg aggccctttg 240 cctgataatt ccttgagcta cgagcgcatg gcctgggtgg ccggggtgct ggctaacgtc 300 aaggacgacc tgcgtgacgg caagagtctg gctacgcacc ttgggcaggc tgctgatgcc 360 gagcgcccgc cgatgagcga actgcgtttc agggctatgc agcgcggcac ggcgatgcag 420 gagctattcc tgcattggcg tcgggcgttg caactggccg ggggcaagac tgatgtggca 480 cacctggcag atgacctgct gagctggcag atagagcagg gccagtctgc tgctcaggcg 540 agcaacgggg tcaaatttca ctgggcctat gactactatc tgagcgcccg ggaccgggca 600 gccgccaaag aacctgaatt caacaaggag atatccaaat ga 642 <210> 40 <211> 1035 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(1035) <223> Cas7 <400> 40 atgactcgtt ttgtgcaatt gcacctgctg acgtcctacc cgcccgccaa ccttaaccgc 60 gatgatctgg gcaacccgaa aaccgcacgc ctaggcggtg ttgaacgtct gcgtgtgtcc 120 tcgcaaagtc tcaaacgcgc ttggcgtacc tcggagctgt ttcagcaaca gttggccggg 180 actatcggca cgcgcaccaa gcgccttggt atcgaggttt tcgaggcact gctgggtgct 240 ggtgtcactg agaagcaggc gcgtgagtgg gctggacaaa tcgccaaggt ttacggggct 300 gcgaaaaagg ataatccact ggaaatcgag cagctggtcc atatcgcgcc tgaagagcgt 360 gcttcgctgg atcaactggt ggccaccctt gccgcggaaa aacgcggccc aacggatgag 420 gagttggacg ccctgctgca ccaccagaca gcggtggata tcgccatgtt tggtcgcatg 480 ctggcctcca aaacacagtt caacggagag gccgcagtgc aggtagccca tgccatcggc 540 gtgcacgcat cggctattga ggatgactac ttcaccgccg ttgacgatct caaccgcaat 600 gatcctggcg ctgcgcatat cggtgaatcc ggtttcgccg ctgcagtgtt ctaccagtac 660 atctgcatcg accgcgatct gctgaaacgg aatctggggg gcgatgaagt gctgactcaa 720 aaggcactcc gggctctgac tgaagcggcg ctcaaagtgg ggcccagcgg caagcaaaac 780 agcttcgcca gccgggcttt cgcccacttt gcgctggccg agaaaggcac tgatcagccg 840 cgctctctgt cactggcctt cgtcaaaccg gtggccggca cagactatgc cggtgatgcc 900 gttgcggcct tgcaacaggt gcgcgacaac atggacaagg tctatggagt ctgcgctgaa 960 agccgctgcc agttcaatgt gctgacgggt gaagggtcag tggccgacct gcttgatttt 1020 gtcgccgcgg agtga 1035 <210> 41 <211> 768 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(768) <223> Cas5 <400> 41 atgactgact atctactgct gcggctctat ggcccgctgg ccagctgggg cgagattgca 60 gtcggcgaat cgcgacactc ggcggtacaa ccgtcgcgtt ccgcgctgct tggtttgctg 120 ggtgcagcgc tgggtatcga gcggcacgat gatgccgctc agcaggcgct tgtggacggt 180 taccgctttg cgatcaagct ggaatgcata ggttcgccct tgcgtgacta tcacacggtt 240 caggtaggcg tgccgccgcg caagttccag tttcgctcac gtcgtcagga attggctgcc 300 gacaaagtcg atactattct gtcgacccgt gagtaccgct gtgacagcct cgcgttggtt 360 gctgtggaag ccttgcccgg tgcgccggtg gacttggcct ccctggccga agcgctgcgt 420 aagccgcgct tcgccttgta tctggggcgc aaatcctgcc cgcttgcttt gccgttgagt 480 ccaaaaattc ttgccgccag cagtgtgcgt gaggtgttcg acaatctgga attgccttcc 540 ttgctgggtt tgttggatcg ctatcagccc gagcaagcct ggccaagtcg acaggaccaa 600 caggcactac gtcccggtgt cgcgcgatac tattgggaag acgggatgac tgctggcatg 660 gcgccgagct ttgaggccca acgacatgat cagccactct cccgtcgccg ctggcagttt 720 gcaccgcgcc gcgaatgggt ggccttgaat gatggagggc agtcatga 768 <210> 42 <211> 663 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(663) <223> Cas6 <400> 42 atgagccatt atttctcgct tgttagactg atcggcagtc cgcgtcacga tgcctggctg 60 cgtgacttgt cgcgccatgg tgaagcctac agggatcatg cgttgatctg gcgcctgttc 120 ccgggcgatg gcgctgcacg tgactttgtt ttccgccgcc ttgaggacga aaaaagtttc 180 tatgtggttt cagcacgacc accacaggcc gatgcggggt tattccatat ccagagcaaa 240 gcctattcgc ctgagttggc cgagggtgat tgggtgcgat tcgacctgcg tgccaatccc 300 accgtcagcg tgcgccggga aaatggtcgc tcacagcgtc atgatgtgct gatgcacgcc 360 aagcagcttg ccagcacaga aaaatcggca ctacctgagc ggctggaagc agcaggcagg 420 gaatggctga aagacagggc ggaacgctgg ggactggatt tgcgtactga cagtcttatg 480 caaaacggtt atcgccagca gcggttgaag cgcaagggta aacacatcgc tttttccacg 540 ttggactatc agggcattgc ccaggtgacg gaccctgaac aattgcgccg ggcactgctc 600 gacggggttg gacacagcaa gggctttggc tgcgggctgt tgctggtaaa acgtgtggac 660 tga 663 <210> 43 <211> 1554 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(1554) <223> Cas8 <400> 43 atggacctgc tgtctgatac atggctgcag tgcaggcaca gggacggcac cctgaagcct 60 atcgccatcg gccagatcgg cctggaggac tgtctggagc tggtggcacc tcggcccgac 120 ttccggggcg ccctgtacca gttcctgatc ggcctgctgc agacagccta tgccccagag 180 gacctgcagg agtggagaga tagatacgcc aaccctccaa ccgccgacga tctggccgag 240 gtgtttgccc cttataggga tgccttccag ctggagaact ccggcccaac attcatgcag 300 gacctgaccc tgccagacga tgtgaatcag ctgcccgtgc tggagctgct gatcgacgca 360 ggctcctcta gcaaccagta ctttaataag ccagcagtgg agcacggaat gtgcgagggc 420 tgtttcacac aggccctgct gaccatgcag ctgaatgcac catccggcgg aaggggcatc 480 agaacatctc tgaggggagg aggacctctg accacactgc tggtgccagc cgagcagaac 540 gccaccctgt ggcagaagct gtggctgaat gtgctgcccc tggacgccct ggatcaccca 600 cctatcaaga tgctgtctga tgtgctgcca tggctggcac caacccggac aagcgacgat 660 aagcagggcc aggacacacc acccgagtct gtgcacccac tgcaggccta ctggagcatg 720 cctaggcgga tcagactgga cgcagccacc ctggaccagg gcgattgcgc cgtgtgcgga 780 gcacagaacg tgaagcgcat ccggcactac agaacaaggc acggcggcac caattatacc 840 ggcacatgga cccaccccct gaccccttat tctctggata gcaagggcga gaagcctcca 900 ctgagcatca agggccggca ggcaggaagg ggatacaggg actggctggg actggtgctg 960 ggaaacgagg accaccagcc tgatgccgcc caggtggtga ggcacttcac agccaagctg 1020 ggcaagccat ccgtgcgcct gtggtgcttt ggcttcgaca tgagcaatat gaaggccctg 1080 tgctggtacg attccctgct gccagtgcac ggagtggccc ctgacgtgca gaggaagttt 1140 acccgcagcg tgaagcaggt gctggactct gccaacgata tggccagcgt gctgcacaag 1200 caggtgaagg ccgcctggtt cagaaggccc ggcgacgcag gacaggagcc tgcagtgaca 1260 cagtcttttt ggcagggcag cgagaccgcc ttctatcagg tgctggagca gctgtccaag 1320 ctggactttg attctgccgc agagctggca gcaatctaca gagcatggct gcaggcaacc 1380 cgccggctgg tgctgagcct gttcgatcac tgggtgctgt ccggccctct ggaggacatg 1440 gatatgcagc gggtggtgaa ggcaagagca gacctggcca aggagctgaa cacaggcaag 1500 gcccagaagc cactgtggac catcgtgaat cagcacctga aggagcaggc ctaa 1554 <210> 44 <211> 642 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(642) <223> Cse2 <400> 44 atgaagccaa ggaagcctcg gctgaatgag gcccagcaga gatgggtgag ggattggtgg 60 agggccctgc agccaagggc agagggcgac gagccaatcc ctggagagct gagcgtgatg 120 ggaaggggag agagggcaca gctgcggaga tgtaccgacg ccgatgagct gctgacacag 180 tccgccaccc tgctgctggc acacaggctg gtggccctga acggagagag aggaccactg 240 cccgataata gcctgtccta tgagaggatg gcatgggtgg caggcgtgct ggcaaacgtg 300 aaggacgatc tgagagatgg caagtccctg gccacccacc tgggacaggc agcagacgca 360 gagaggcctc caatgtctga gctgcgcttt cgggccatgc agagaggcac agccatgcag 420 gagctgttcc tgcactggag gcgcgccctg cagctggcag gaggcaagac cgacgtggca 480 cacctggcag acgatctgct gagctggcag atcgagcagg gacagtctgc cgcacaggcc 540 agcaatggcg tgaagtttca ctgggcctac gactactatc tgtctgccag agatagggcc 600 gccgccaagg agccagagtt caacaaggag atcagcaaat aa 642 <210> 45 <211> 1035 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(1035) <223> Cas7 <400> 45 atgacacgct ttgtgcagct gcacctgctg acctcttatc cccctgccaa cctgaatagg 60 gacgatctgg gaaaccctaa gacagcaagg ctgggaggag tggagagact gagggtgagc 120 tcccagtctc tgaagcgcgc ctggcggaca agcgagctgt ttcagcagca gctggcagga 180 accatcggaa ccagaacaaa gaggctgggc atcgaggtgt tcgaggccct gctgggagca 240 ggagtgaccg agaagcaggc aagggagtgg gcaggacaga tcgcaaaggt gtacggagcc 300 gccaagaagg ataaccccct ggagatcgag cagctggtgc acatcgcccc tgaggagagg 360 gccagcctgg accagctggt ggccacactg gcagcagaga agagaggacc aaccgacgag 420 gagctggatg ccctgctgca ccaccagaca gccgtggaca tcgccatgtt tggcaggatg 480 ctggccagca agacccagtt caatggagag gcagcagtgc aggtggcaca cgcaatcgga 540 gtgcacgcct ccgccatcga ggacgattac ttcaccgccg tggacgatct gaaccgcaat 600 gatccaggag cagcacacat cggagagtcc ggctttgccg ccgccgtgtt ctaccagtat 660 atctgcatcg accgggatct gctgaagaga aacctgggcg gcgacgaggt gctgacacag 720 aaggccctgc gcgccctgac cgaggccgcc ctgaaggtcg gccccagcgg caagcagaat 780 tcctttgcct ctagggcctt tgcccacttc gccctggccg agaagggcac agatcagcca 840 cgctccctgt ctctggcctt cgtgaagcca gtggcaggaa ccgactacgc aggcgatgcc 900 gtggccgccc tgcagcaggt gagggacaac atggataagg tgtatggcgt gtgcgccgag 960 tcccgctgtc agtttaatgt gctgacagga gagggctctg tggcagacct gctggatttc 1020 gtggcagcag agtaa 1035 <210> 46 <211> 768 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(768) <223> Cas5 <400> 46 atgaccgact acctgctgct gaggctgtat ggaccactgg catcctgggg agagatcgca 60 gtgggagagt ctaggcacag cgccgtgcag ccttctcgca gcgccctgct gggactgctg 120 ggagccgccc tgggcatcga gagacacgac gatgcagcac agcaggccct ggtggatgga 180 taccggttcg ccatcaagct ggagtgtatc ggctctcccc tgagagacta tcacaccgtg 240 caagtgggag tgccaccaag gaagttccag tttagaagcc ggagacagga gctggcagca 300 gacaaggtgg atacaatcct gtccaccaga gagtataggt gcgattctct ggccctggtg 360 gcagtggagg ccctgccagg agcacccgtg gacctggcca gcctggcaga ggccctgcgc 420 aagccaaggt ttgccctgta cctgggaagg aagagctgtc cactggccct gcctctgtcc 480 ccaaagatcc tggccgcctc tagcgtgcgc gaggtgttcg ataacctgga gctgccttct 540 ctgctgggcc tgctggacag gtaccagcct gagcaggcct ggccaagcag acaggatcag 600 caggccctga ggccaggagt ggcaaggtac tattgggagg acggaatgac agcaggaatg 660 gcaccttctt ttgaggccca gaggcacgat cagccactga gcaggcgccg gtggcagttc 720 gcaccaagaa gggagtgggt ggccctgaac gatggaggac agtcctaa 768 <210> 47 <211> 663 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(663) <223> Cas6 <400> 47 atgtctcact acttcagcct ggtgaggctg atcggctccc ctaggcacga cgcctggctg 60 agggatctga gcagacacgg agaggcctac agggaccacg ccctgatctg gagactgttc 120 cctggcgacg gagcagcaag ggatttcgtg tttcgccggc tggaggatga gaagtccttt 180 tatgtggtgt ctgccaggcc acctcaggca gacgcaggac tgttccacat ccagtccaag 240 gcctactctc cagagctggc agagggcgac tgggtgaggt tcgatctgcg cgccaacccc 300 acagtgtctg tgagaaggga gaatggcaga agccagaggc acgatgtgct gatgcacgcc 360 aagcagctgg ccagcaccga gaagtccgcc ctgcccgagc ggctggaggc agcaggaaga 420 gagtggctga aggacagggc agagcggtgg ggcctggacc tgagaaccga ttccctgatg 480 cagaacggct acagacagca gaggctgaag cgcaagggca agcacatcgc cttttctaca 540 ctggactatc agggcatcgc ccaggtgacc gatcccgagc agctgcgccg ggccctgctg 600 gacggagtgg gacactccaa gggattcgga tgcggactgc tgctggtgaa gcgggtggat 660 taa 663 <210> 48 <211> 517 <212> PRT <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(517) <223> Cas8 <400> 48 Met Asp Leu Leu Ser Asp Thr Trp Leu Gln Cys Arg His Arg Asp Gly 1 5 10 15 Thr Leu Lys Pro Ile Ala Ile Gly Gln Ile Gly Leu Glu Asp Cys Leu 20 25 30 Glu Leu Val Ala Pro Arg Pro Asp Phe Arg Gly Ala Leu Tyr Gln Phe 35 40 45 Leu Ile Gly Leu Leu Gln Thr Ala Tyr Ala Pro Glu Asp Leu Gln Glu 50 55 60 Trp Arg Asp Arg Tyr Ala Asn Pro Pro Thr Ala Asp Asp Leu Ala Glu 65 70 75 80 Val Phe Ala Pro Tyr Arg Asp Ala Phe Gln Leu Glu Asn Ser Gly Pro 85 90 95 Thr Phe Met Gln Asp Leu Thr Leu Pro Asp Asp Val Asn Gln Leu Pro 100 105 110 Val Leu Glu Leu Leu Ile Asp Ala Gly Ser Ser Ser Asn Gln Tyr Phe 115 120 125 Asn Lys Pro Ala Val Glu His Gly Met Cys Glu Gly Cys Phe Thr Gln 130 135 140 Ala Leu Leu Thr Met Gln Leu Asn Ala Pro Ser Gly Gly Arg Gly Ile 145 150 155 160 Arg Thr Ser Leu Arg Gly Gly Gly Pro Leu Thr Thr Leu Leu Val Pro 165 170 175 Ala Glu Gln Asn Ala Thr Leu Trp Gln Lys Leu Trp Leu Asn Val Leu 180 185 190 Pro Leu Asp Ala Leu Asp His Pro Pro Ile Lys Met Leu Ser Asp Val 195 200 205 Leu Pro Trp Leu Ala Pro Thr Arg Thr Ser Asp Asp Lys Gln Gly Gln 210 215 220 Asp Thr Pro Pro Glu Ser Val His Pro Leu Gln Ala Tyr Trp Ser Met 225 230 235 240 Pro Arg Arg Ile Arg Leu Asp Ala Ala Thr Leu Asp Gln Gly Asp Cys 245 250 255 Ala Val Cys Gly Ala Gln Asn Val Lys Arg Ile Arg His Tyr Arg Thr 260 265 270 Arg His Gly Gly Thr Asn Tyr Thr Gly Thr Trp Thr His Pro Leu Thr 275 280 285 Pro Tyr Ser Leu Asp Ser Lys Gly Glu Lys Pro Pro Leu Ser Ile Lys 290 295 300 Gly Arg Gln Ala Gly Arg Gly Tyr Arg Asp Trp Leu Gly Leu Val Leu 305 310 315 320 Gly Asn Glu Asp His Gln Pro Asp Ala Ala Gln Val Val Arg His Phe 325 330 335 Thr Ala Lys Leu Gly Lys Pro Ser Val Arg Leu Trp Cys Phe Gly Phe 340 345 350 Asp Met Ser Asn Met Lys Ala Leu Cys Trp Tyr Asp Ser Leu Leu Pro 355 360 365 Val His Gly Val Ala Pro Asp Val Gln Arg Lys Phe Thr Arg Ser Val 370 375 380 Lys Gln Val Leu Asp Ser Ala Asn Asp Met Ala Ser Val Leu His Lys 385 390 395 400 Gln Val Lys Ala Ala Trp Phe Arg Arg Pro Gly Asp Ala Gly Gln Glu 405 410 415 Pro Ala Val Thr Gln Ser Phe Trp Gln Gly Ser Glu Thr Ala Phe Tyr 420 425 430 Gln Val Leu Glu Gln Leu Ser Lys Leu Asp Phe Asp Ser Ala Ala Glu 435 440 445 Leu Ala Ala Ile Tyr Arg Ala Trp Leu Gln Ala Thr Arg Arg Leu Val 450 455 460 Leu Ser Leu Phe Asp His Trp Val Leu Ser Gly Pro Leu Glu Asp Met 465 470 475 480 Asp Met Gln Arg Val Val Lys Ala Arg Ala Asp Leu Ala Lys Glu Leu 485 490 495 Asn Thr Gly Lys Ala Gln Lys Pro Leu Trp Thr Ile Val Asn Gln His 500 505 510 Leu Lys Glu Gln Ala 515 <210> 49 <211> 213 <212> PRT <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(213) <223> Cse2 <400> 49 Met Lys Pro Arg Lys Pro Arg Leu Asn Glu Ala Gln Gln Arg Trp Val 1 5 10 15 Arg Asp Trp Trp Arg Ala Leu Gln Pro Arg Ala Glu Gly Asp Glu Pro 20 25 30 Ile Pro Gly Glu Leu Ser Val Met Gly Arg Gly Glu Arg Ala Gln Leu 35 40 45 Arg Arg Cys Thr Asp Ala Asp Glu Leu Leu Thr Gln Ser Ala Thr Leu 50 55 60 Leu Leu Ala His Arg Leu Val Ala Leu Asn Gly Glu Arg Gly Pro Leu 65 70 75 80 Pro Asp Asn Ser Leu Ser Tyr Glu Arg Met Ala Trp Val Ala Gly Val 85 90 95 Leu Ala Asn Val Lys Asp Asp Leu Arg Asp Gly Lys Ser Leu Ala Thr 100 105 110 His Leu Gly Gln Ala Ala Asp Ala Glu Arg Pro Pro Met Ser Glu Leu 115 120 125 Arg Phe Arg Ala Met Gln Arg Gly Thr Ala Met Gln Glu Leu Phe Leu 130 135 140 His Trp Arg Arg Ala Leu Gln Leu Ala Gly Gly Lys Thr Asp Val Ala 145 150 155 160 His Leu Ala Asp Asp Leu Leu Ser Trp Gln Ile Glu Gln Gly Gln Ser 165 170 175 Ala Ala Gln Ala Ser Asn Gly Val Lys Phe His Trp Ala Tyr Asp Tyr 180 185 190 Tyr Leu Ser Ala Arg Asp Arg Ala Ala Ala Lys Glu Pro Glu Phe Asn 195 200 205 Lys Glu Ile Ser Lys 210 <210> 50 <211> 344 <212> PRT <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(344) <223> Cas7 <400> 50 Met Thr Arg Phe Val Gln Leu His Leu Leu Thr Ser Tyr Pro Pro Ala 1 5 10 15 Asn Leu Asn Arg Asp Asp Leu Gly Asn Pro Lys Thr Ala Arg Leu Gly 20 25 30 Gly Val Glu Arg Leu Arg Val Ser Ser Gln Ser Leu Lys Arg Ala Trp 35 40 45 Arg Thr Ser Glu Leu Phe Gln Gln Gln Leu Ala Gly Thr Ile Gly Thr 50 55 60 Arg Thr Lys Arg Leu Gly Ile Glu Val Phe Glu Ala Leu Leu Gly Ala 65 70 75 80 Gly Val Thr Glu Lys Gln Ala Arg Glu Trp Ala Gly Gln Ile Ala Lys 85 90 95 Val Tyr Gly Ala Ala Lys Lys Asp Asn Pro Leu Glu Ile Glu Gln Leu 100 105 110 Val His Ile Ala Pro Glu Glu Arg Ala Ser Leu Asp Gln Leu Val Ala 115 120 125 Thr Leu Ala Ala Glu Lys Arg Gly Pro Thr Asp Glu Glu Leu Asp Ala 130 135 140 Leu Leu His His Gln Thr Ala Val Asp Ile Ala Met Phe Gly Arg Met 145 150 155 160 Leu Ala Ser Lys Thr Gln Phe Asn Gly Glu Ala Ala Val Gln Val Ala 165 170 175 His Ala Ile Gly Val His Ala Ser Ala Ile Glu Asp Asp Tyr Phe Thr 180 185 190 Ala Val Asp Asp Leu Asn Arg Asn Asp Pro Gly Ala Ala His Ile Gly 195 200 205 Glu Ser Gly Phe Ala Ala Ala Val Phe Tyr Gln Tyr Ile Cys Ile Asp 210 215 220 Arg Asp Leu Leu Lys Arg Asn Leu Gly Gly Asp Glu Val Leu Thr Gln 225 230 235 240 Lys Ala Leu Arg Ala Leu Thr Glu Ala Ala Leu Lys Val Gly Pro Ser 245 250 255 Gly Lys Gln Asn Ser Phe Ala Ser Arg Ala Phe Ala His Phe Ala Leu 260 265 270 Ala Glu Lys Gly Thr Asp Gln Pro Arg Ser Leu Ser Leu Ala Phe Val 275 280 285 Lys Pro Val Ala Gly Thr Asp Tyr Ala Gly Asp Ala Val Ala Ala Leu 290 295 300 Gln Gln Val Arg Asp Asn Met Asp Lys Val Tyr Gly Val Cys Ala Glu 305 310 315 320 Ser Arg Cys Gln Phe Asn Val Leu Thr Gly Glu Gly Ser Val Ala Asp 325 330 335 Leu Leu Asp Phe Val Ala Ala Glu 340 <210> 51 <211> 255 <212> PRT <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(255) <223> Cas5 <400> 51 Met Thr Asp Tyr Leu Leu Leu Arg Leu Tyr Gly Pro Leu Ala Ser Trp 1 5 10 15 Gly Glu Ile Ala Val Gly Glu Ser Arg His Ser Ala Val Gln Pro Ser 20 25 30 Arg Ser Ala Leu Leu Gly Leu Leu Gly Ala Ala Leu Gly Ile Glu Arg 35 40 45 His Asp Asp Ala Ala Gln Gln Ala Leu Val Asp Gly Tyr Arg Phe Ala 50 55 60 Ile Lys Leu Glu Cys Ile Gly Ser Pro Leu Arg Asp Tyr His Thr Val 65 70 75 80 Gln Val Gly Val Pro Pro Arg Lys Phe Gln Phe Arg Ser Arg Arg Gln 85 90 95 Glu Leu Ala Ala Asp Lys Val Asp Thr Ile Leu Ser Thr Arg Glu Tyr 100 105 110 Arg Cys Asp Ser Leu Ala Leu Val Ala Val Glu Ala Leu Pro Gly Ala 115 120 125 Pro Val Asp Leu Ala Ser Leu Ala Glu Ala Leu Arg Lys Pro Arg Phe 130 135 140 Ala Leu Tyr Leu Gly Arg Lys Ser Cys Pro Leu Ala Leu Pro Leu Ser 145 150 155 160 Pro Lys Ile Leu Ala Ala Ser Ser Val Arg Glu Val Phe Asp Asn Leu 165 170 175 Glu Leu Pro Ser Leu Leu Gly Leu Leu Asp Arg Tyr Gln Pro Glu Gln 180 185 190 Ala Trp Pro Ser Arg Gln Asp Gln Gln Ala Leu Arg Pro Gly Val Ala 195 200 205 Arg Tyr Tyr Trp Glu Asp Gly Met Thr Ala Gly Met Ala Pro Ser Phe 210 215 220 Glu Ala Gln Arg His Asp Gln Pro Leu Ser Arg Arg Arg Trp Gln Phe 225 230 235 240 Ala Pro Arg Arg Glu Trp Val Ala Leu Asn Asp Gly Gly Gln Ser 245 250 255 <210> 52 <211> 220 <212> PRT <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(220) <223> Cas6 <400> 52 Met Ser His Tyr Phe Ser Leu Val Arg Leu Ile Gly Ser Pro Arg His 1 5 10 15 Asp Ala Trp Leu Arg Asp Leu Ser Arg His Gly Glu Ala Tyr Arg Asp 20 25 30 His Ala Leu Ile Trp Arg Leu Phe Pro Gly Asp Gly Ala Ala Arg Asp 35 40 45 Phe Val Phe Arg Arg Leu Glu Asp Glu Lys Ser Phe Tyr Val Val Ser 50 55 60 Ala Arg Pro Pro Gln Ala Asp Ala Gly Leu Phe His Ile Gln Ser Lys 65 70 75 80 Ala Tyr Ser Pro Glu Leu Ala Glu Gly Asp Trp Val Arg Phe Asp Leu 85 90 95 Arg Ala Asn Pro Thr Val Ser Val Arg Arg Glu Asn Gly Arg Ser Gln 100 105 110 Arg His Asp Val Leu Met His Ala Lys Gln Leu Ala Ser Thr Glu Lys 115 120 125 Ser Ala Leu Pro Glu Arg Leu Glu Ala Ala Gly Arg Glu Trp Leu Lys 130 135 140 Asp Arg Ala Glu Arg Trp Gly Leu Asp Leu Arg Thr Asp Ser Leu Met 145 150 155 160 Gln Asn Gly Tyr Arg Gln Gln Arg Leu Lys Arg Lys Gly Lys His Ile 165 170 175 Ala Phe Ser Thr Leu Asp Tyr Gln Gly Ile Ala Gln Val Thr Asp Pro 180 185 190 Glu Gln Leu Arg Arg Ala Leu Leu Asp Gly Val Gly His Ser Lys Gly 195 200 205 Phe Gly Cys Gly Leu Leu Leu Val Lys Arg Val Asp 210 215 220 <210> 53 <211> 90 <212> DNA <213> Pseudomonas sp. S-6-2 <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 53 gtgttccccg cacctgcggg gatgaaccgg gccggggcgt ttgcgctgtc aggggcgtcc 60 cgtgttcccc gcacctgcgg ggatgaaccg 90 <210> 54 <211> 1536 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(1536) <223> Cas8 <400> 54 atggatttaa ccaaagagaa atggcttccc gtcatattct caaacggcga aaaaacgaga 60 atatcattac gcgatcttct ggataaccgc attcaggatc ttgcataccc ccggcccgat 120 tttcaggggg ctgcatggca aatgctgatt ggtattttac aatgtaccgt cgcgccggaa 180 gataaagaag aatgggcaga tatctggcat gaaagtatcg aattcgaaca atgggagaag 240 gcgttaaata cgatttctct ggctctacag ttcggcgagc aaaaaccttc cttcctgcaa 300 agttttgatc ctctcgatag tgaatatggt tctattgccg ggctgctggt ggatgcgccg 360 ggcggtaatg cgctcaagct caataaagat cattttgtaa aacgtggcaa cgtagaacaa 420 atatgtcctc actgcgcggc gatagcgcta tttgcgattc aaaccaattc acctgccggc 480 ggggcgggtt accgggtagg gatgcgcggc ggtggtccgc tgactacgct ggtggtaccg 540 caggaagaag ataaatatcc actatggaaa aaactttggc ttaacgtttt gccgcaggaa 600 gagccgccga atgttacaca gcatccactc atttttccct ggcttgcgcc gacgaaaacc 660 agcgaaaaag cggggaatgt ggtcacaccg gataatgcgc accccttgca agcctactgg 720 ggaatgccgc ggcgcataga actggatttc acccacactg tggcaggtat ctgcgatttg 780 tgcggggagc atcacgaatc actgctactg caaatgcgta gtaaaaatta tggcgttcag 840 tacgacagtt ggttacatcc tttctcccca tatcggcagg cattgaaaga tccatccgca 900 ccctggctgg cgtttaaagg gcagccgggc gggttaagtt ataaagactg gttggggctg 960 atgctcaatc gtgaggataa gttcaacaaa atgcagcctg caaaggtcgt tcgtgccgct 1020 ggtcagcgga acaaaatgag cctgtggtgc tttgcctggg atatggataa ggccaaggtc 1080 cgctgctggt atcagcaccg tattccgctc attagcgttt cgcacgaaga gcaatttctc 1140 gctgtgctta acattgtgct ggtgctggct agtgagtcgc tgtcgctgtt acggaacgcg 1200 ttaaagagcg ccaaattcga ttgtccgaaa gaagccaaaa tggattttag tatggtggat 1260 atcgccttct ggcaggaaac cgaacccgct tttcggacgt tgcaagaggc gctggctgtc 1320 gatccgcttc ggcaggatac acagactcgt cacgcagtaa gtcagtggga ggcggaatta 1380 gcacactatc tatttcacgt ttttgatcgt gatgccctga ccaaccccga ctgcccggac 1440 gatatcctgc agcgccagct gacggcccga caggatttag ccagcagcta tcgtaaacat 1500 aaagcgcgca aggatgtgtt ggcgctggtc gaataa 1536 <210> 55 <211> 603 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(603) <223> Cse2 <400> 55 atgctgaata gcaatacagc agtgttatgc agaattctcc accccgatgc gcagaaggcg 60 ctacttgact ggtttgctac gctgtctgag cgttacgagc gcaaggatgg taaacgagtc 120 aacggtcgcg cctggcgggc tgagttgaaa agaatggcgc cgccatatgg cgtaatgata 180 tgtgaagggc atgacgctct ccgccaggcg ctgcttaaac atatgcgact gcaacctctt 240 gatgagatgg ctctggcgct gtttgtcagc gtcgctgtgc atattaagag ccataaggcg 300 aatattagtt tcgctgcaca attaggggaa aagcttaaag gttctacgcc gtgcgtttct 360 gttctgcgtt ttgaacgttt gcaaaaagcg tccgacccgg aaacattttg ccagttgttg 420 attcaggcag tgaagattcg cggtacggag ggggtgaatg ttctttcact tgccgatggc 480 attttcctgt ggatggaaga gtggcaacga cgcgaaaacc atcagccgga attccgtaac 540 ccctttgaac gaaatcgcat ccgttgggcg aacgaatatc tttccacgtc gcgtggcaaa 600 taa 603 <210> 56 <211> 1065 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(1065) <223> Cas7 <400> 56 ttgataatga caacttttat tcaactgcat ttattgactg cttatgcgcc cgctaacctg 60 aatcgtgatg agtctggcag accgaagacc gcgtttatgg gaggagttga gcgtttacgc 120 gtatcgtcgc aaagtctgaa gcgtgcctgg cgggtgtcgg aaacttttga agcggcaatg 180 gatggtttta tgggtaagcg tactcgtcga attggcgtgg attatgttta tcgtccgatg 240 aaagatgccg gaattgaaga aaaaattgct aagagttcgt ctgagttaat cgctaagcaa 300 tttggcaagc ttaaaagtga taaagatgcg aaaccggaaa aaaatctcga aattgagcag 360 atcgttcacg tcagtaacca tgaaattagt ttgattaagc aactggttga tacgctaatt 420 gccgacaaac gcgaacctaa cgatgaagaa gtggagttgt tgcgcaaaga gcagcgtagc 480 gtagatatgg cgctgtttgg ccgtatgctg gcgtcatcgc ctgagttcaa cgtcgaggct 540 gcttgtcagg tatcccatgc gttgggcgta agtgccgtga ccgttgagtc tgattttttc 600 accgccgttg acgatctgaa taataaagag gaagacgcag gttccgggca tatgggcgag 660 cagggttttg cctcggcgct tttctatacc tatgtctgta tcagccgcga tctgctggtg 720 gaaaacctgg gtggtaacga agaactggcg aagcgtacta tcgcggcact cactgaaaca 780 gcgttaaccg tctcgccaac cggtaaacaa aacagcttcg cttctcgtgc ctatgccacc 840 tatgcgttgg ccgaagtcgg gcaaaaacaa ccgcgttctc tggcggcggc atttttccag 900 ccggtacgcg ataccgatca aattccggcg gcaataaccc gtttaaaaca gcagcgcgcc 960 agcttcgata acgtatacgg aaactgtgca gacgattatc gcgagttgaa cgttcaggaa 1020 ggtacgggat ctctggcgga attactggcc tttgttagcc agtaa 1065 <210> 57 <211> 726 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(726) <223> Cas5 <400> 57 atgaaggaat atctggtttt tcagctctat gcgccgctgg cgtcgtgggg ggaagaagcg 60 tctggcgaga ttcgccactc agctacggtt cccacgcgct ctgcgctatt gggtctgctt 120 gccgcagcgt taggaattcg tcgcgacgaa gaagcgcggc tgaataactt taaccggcac 180 tatcatctgg cggtgcacgc gttggcttca caagatcgct ggttgcggga ttatcacacg 240 gttagcgcgc cgcgagaaaa caaaaagaat cgttattaca cgcgccggga tgaactgact 300 ctcgcgccgg atgaagtggg gacgcttatc tcgcagcgag aatatcgctg cgacggctac 360 tggcatgtgg caataagcgc cacgcctgat gcaccacatt cgcttagcga attgcgagag 420 gcgctgctga caccgcattt tccgctctat ctggggagaa aatcctgccc gctggcgtta 480 ccgttagcgg cgcgtttaat gaccggcacc ttaaaagagg tattcaccca tgctgtggag 540 gagatttccg cagcggaatt aagtggattt accctgcgtg agggtatttg ttattgggat 600 gatcctgatg aggagagtct ggtctggcaa caaaagcagc atagcaataa ccagccagtt 660 agccgccaac gctggcagtt tggcggctac acccgcttca atgggccgtt gcaggagaga 720 acataa 726 <210> 58 <211> 705 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(705) <223> Cas6 <400> 58 atgtatcttt ctcgtattca actccggttt aataatttgc gaccggagat gttggcaaag 60 tggaattcag ccaggcctta tgccagccac cagtggttat ggcagctctt tccggaacag 120 gaattgcgtc agtttctgtt tcgcgaagag gcgcatggcg gcttttttat gctctcggca 180 ataccgccgt tatcgcagca ctccctgttt cttattgaaa ccaaaccatt taatccgcaa 240 ctgacaaatg gtcttgagct tgattttcaa ctacgagcta acccggtgat aacccgtaac 300 ggtaagcgca gtgacgtgat gatgaacgcg aaacatcagg cgaaggcgaa tggtgtggag 360 aaagaacggt ggtgggagct tcaacagcag gccgcgcagg cgtggctgga acaacaaggg 420 cagcagcatg gtttccggtt gattgcaccg gaacctgatg atttcgctat gtgggctggt 480 gacgagtaca gtgaattgca ggcacattgt ggatgcgtgc aagcgtatca gcagcatcgt 540 tttgtccgta aagaccagca aaaaccgatc actttcagta gcgttgattt tagcggtgcg 600 ctctgtatca ccgatgcagc actgtttaaa caggctttat tttccggatt aggtaaaagt 660 aaagcgctgg gctgcggaat gctgatggta aaaaggaaac gctga 705 <210> 59 <211> 1536 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(1536) <223> Cas8 <400> 59 atggacctga ccaaagagaa gtggctgcct gtgatctttt ctaacggcga gaagacaaga 60 atcagcctga gggacctgct ggataatcgc atccaggacc tggcctatcc tcggccagat 120 ttccagggag cagcatggca gatgctgatc ggcatcctgc agtgtaccgt ggccccagag 180 gacaaggagg agtgggccga tatctggcac gagtctatcg agtttgagca gtgggagaag 240 gccctgaaca caatcagcct ggccctgcag ttcggcgagc agaagccctc ttttctgcag 300 agcttcgacc ctctggattc cgagtacggc tctatcgcag gactgctggt ggacgcacca 360 ggaggcaacg ccctgaagct gaataaggat cactttgtga agagaggcaa cgtggagcag 420 atctgcccac actgtgcagc aatcgccctg ttcgccatcc agaccaatag ccctgcagga 480 ggagcaggct atagggtggg aatgagggga ggaggaccac tgaccacact ggtggtgcct 540 caggaggagg acaagtaccc actgtggaag aagctgtggc tgaacgtgct gccacaggag 600 gagcccccta atgtgaccca gcacccactg atctttccct ggctggcccc taccaagaca 660 tccgagaagg ccggcaacgt ggtgacacct gataatgccc acccactgca ggcctactgg 720 ggaatgccaa ggaggatcga gctggacttc acccacacag tggcaggaat ctgcgacctg 780 tgcggagagc accacgagtc cctgctgctg cagatgcgct ctaagaacta cggcgtgcag 840 tatgactctt ggctgcaccc ctttagccct tataggcagg ccctgaagga cccctccgcc 900 ccatggctgg ccttcaaggg acagccagga ggactgtctt acaaggactg gctgggcctg 960 atgctgaaca gggaggataa gtttaataag atgcagccag caaaggtggt gcgcgcagca 1020 ggccagcgga ataagatgag cctgtggtgc ttcgcctggg acatggataa ggccaaggtg 1080 cgctgttggt accagcacag aatccccctg atctccgtgt ctcacgagga gcagttcctg 1140 gccgtgctga acatcgtgct ggtgctggcc agcgagtccc tgtctctgct gcggaatgcc 1200 ctgaagagcg ccaagtttga ctgccctaag gaggccaaga tggacttttc catggtggat 1260 atcgccttct ggcaggagac cgagcctgcc ttcagaacac tgcaggaggc cctggcagtg 1320 gacccactga gacaggatac ccagacaagg cacgccgtga gccagtggga ggcagagctg 1380 gcccactatc tgtttcacgt gttcgaccgc gatgccctga ccaaccctga ttgtccagac 1440 gatatcctgc agagacagct gacagcaagg caggacctgg caagctccta caggaagcac 1500 aaggcccgga aggatgtgct ggccctggtg gagtaa 1536 <210> 60 <211> 603 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(603) <223> Cse2 <400> 60 atgctgaaca gcaataccgc cgtgctgtgc agaatcctgc accctgacgc ccagaaggcc 60 ctgctggatt ggttcgccac actgagcgag cggtacgagc ggaaggacgg caagcgcgtg 120 aacggaagag catggagggc agagctgaag aggatggcac caccctacgg cgtgatgatc 180 tgtgagggac acgacgccct gagacaggcc ctgctgaagc acatgaggct gcagcctctg 240 gatgagatgg cactggccct gttcgtgagc gtggcagtgc acatcaagtc tcacaaggcc 300 aacatcagct tcgccgcaca gctgggagag aagctgaagg gctccacccc atgcgtgtct 360 gtgctgcgct ttgagcggct gcagaaggcc agcgaccccg agaccttctg tcagctgctg 420 atccaggccg tgaagatcag gggcacagag ggcgtgaatg tgctgtccct ggccgatggc 480 atcttcctgt ggatggagga gtggcagagg cgcgagaacc accagccaga gtttcgcaac 540 cccttcgaga ggaatcgcat ccggtgggcc aatgagtacc tgtctaccag ccgcggcaag 600 taa 603 <210> 61 <211> 1065 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(1065) <223> Cas7 <400> 61 atgatcatga ccaccttcat ccagctgcac ctgctgaccg catacgcacc tgccaacctg 60 aatagagacg agagcggcag gccaaagaca gccttcatgg gaggagtgga gcggctgaga 120 gtgagctccc agagcctgaa gagagcctgg agggtgtccg agacctttga ggccgccatg 180 gatggcttca tgggcaagag aacacggaga atcggcgtgg actacgtgta taggcctatg 240 aaggatgccg gcatcgagga gaagatcgcc aagtctagct ccgagctgat cgccaagcag 300 ttcggcaagc tgaagagcga caaggatgcc aagccagaga agaacctgga gatcgagcag 360 atcgtgcacg tgagcaatca cgagatctcc ctgatcaagc agctggtgga caccctgatc 420 gccgataaga gggagccaaa cgacgaggag gtggagctgc tgcgcaagga gcagcggtcc 480 gtggatatgg ccctgtttgg ccgcatgctg gcctctagcc ccgagttcaa tgtggaggca 540 gcatgccagg tgtctcacgc cctgggcgtg agcgccgtga ccgtggagtc cgacttcttt 600 acagccgtgg acgatctgaa caataaggag gaggatgcag gctccggcca catgggagag 660 cagggatttg cctctgccct gttctacacc tacgtgtgca tcagccgcga cctgctggtg 720 gagaacctgg gaggcaatga ggagctggcc aagcggacaa tcgccgccct gaccgagaca 780 gccctgaccg tgagccctac aggcaagcag aacagctttg cctcccgcgc atacgcaacc 840 tatgccctgg cagaagtggg acagaagcag ccacgctccc tggcagcagc cttctttcag 900 cccgtgcggg acaccgatca gatccctgcc gccatcacac gcctgaagca gcagcgggcc 960 tcttttgaca acgtgtacgg caattgcgcc gacgattata gggagctgaa cgtgcaggag 1020 ggaaccggct ccctggcaga gctgctggcc ttcgtgtctc agtaa 1065 <210> 62 <211> 726 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(726) <223> Cas5 <400> 62 atgaaggagt acctggtgtt tcagctgtat gcacctctgg caagctgggg agaggaggcc 60 tccggcgaga tcagacactc tgccaccgtg ccaacaaggt ccgccctgct gggactgctg 120 gcagccgccc tgggcatccg gcgggatgag gaggccagac tgaacaattt caataggcac 180 taccacctgg cagtgcacgc cctggcatcc caggacagat ggctgaggga ttatcacacc 240 gtgtctgccc cccgcgagaa caagaagaat cggtactata ccaggaggga cgagctgaca 300 ctggcccctg atgaagtggg cacactgatc tctcagcgcg agtaccggtg cgacggctat 360 tggcacgtgg caatcagcgc cacccccgat gcacctcact ccctgtctga gctgcgggag 420 gccctgctga caccacactt ccccctgtac ctgggcagaa agagctgtcc actggccctg 480 cctctggcag caaggctgat gaccggcaca ctgaaggagg tgtttaccca cgcagtggag 540 gagatcagcg ccgcagagct gtccggcttc acactgagag agggcatctg ctattgggac 600 gatcctgacg aggagtccct ggtgtggcag cagaagcagc acagcaacaa tcagccagtg 660 tccagacaga ggtggcagtt tggcggctac accaggttca acggaccact gcaggagagg 720 acataa 726 <210> 63 <211> 705 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(705) <223> Cas6 <400> 63 atgtatctga gcagaatcca gctgaggttt aacaatctga gacccgagat gctggccaag 60 tggaactccg ccaggcctta cgcctctcac cagtggctgt ggcagctgtt ccctgagcag 120 gagctgagac agttcctgtt tagggaggag gcccacggcg gcttctttat gctgagcgcc 180 atcccacccc tgtcccagca ctctctgttt ctgatcgaga ccaagccttt caacccacag 240 ctgacaaatg gcctggagct ggactttcag ctgagagcca accccgtgat cacccgcaat 300 ggcaagcggt ccgatgtgat gatgaacgcc aagcaccagg ccaaggccaa tggcgtggag 360 aaggagcggt ggtgggagct gcagcagcag gcagcacagg cctggctgga gcagcagggc 420 cagcagcacg gctttagact gatcgcccca gagcccgacg atttcgccat gtgggcaggc 480 gacgagtaca gcgagctgca ggcacactgc ggatgcgtgc aggcctatca gcagcacaga 540 ttcgtgagga aggatcagca gaagccaatc accttttcct ctgtggactt ctccggcgcc 600 ctgtgcatca cagatgccgc cctgtttaag caggccctgt tctccggcct gggcaagtct 660 aaggccctgg gctgcggcat gctgatggtg aagaggaaga gataa 705 <210> 64 <211> 511 <212> PRT <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(511) <223> Cas8 <400> 64 Met Asp Leu Thr Lys Glu Lys Trp Leu Pro Val Ile Phe Ser Asn Gly 1 5 10 15 Glu Lys Thr Arg Ile Ser Leu Arg Asp Leu Leu Asp Asn Arg Ile Gln 20 25 30 Asp Leu Ala Tyr Pro Arg Pro Asp Phe Gln Gly Ala Ala Trp Gln Met 35 40 45 Leu Ile Gly Ile Leu Gln Cys Thr Val Ala Pro Glu Asp Lys Glu Glu 50 55 60 Trp Ala Asp Ile Trp His Glu Ser Ile Glu Phe Glu Gln Trp Glu Lys 65 70 75 80 Ala Leu Asn Thr Ile Ser Leu Ala Leu Gln Phe Gly Glu Gln Lys Pro 85 90 95 Ser Phe Leu Gln Ser Phe Asp Pro Leu Asp Ser Glu Tyr Gly Ser Ile 100 105 110 Ala Gly Leu Leu Val Asp Ala Pro Gly Gly Asn Ala Leu Lys Leu Asn 115 120 125 Lys Asp His Phe Val Lys Arg Gly Asn Val Glu Gln Ile Cys Pro His 130 135 140 Cys Ala Ala Ile Ala Leu Phe Ala Ile Gln Thr Asn Ser Pro Ala Gly 145 150 155 160 Gly Ala Gly Tyr Arg Val Gly Met Arg Gly Gly Gly Pro Leu Thr Thr 165 170 175 Leu Val Val Pro Gln Glu Glu Asp Lys Tyr Pro Leu Trp Lys Lys Leu 180 185 190 Trp Leu Asn Val Leu Pro Gln Glu Glu Pro Pro Asn Val Thr Gln His 195 200 205 Pro Leu Ile Phe Pro Trp Leu Ala Pro Thr Lys Thr Ser Glu Lys Ala 210 215 220 Gly Asn Val Val Thr Pro Asp Asn Ala His Pro Leu Gln Ala Tyr Trp 225 230 235 240 Gly Met Pro Arg Arg Ile Glu Leu Asp Phe Thr His Thr Val Ala Gly 245 250 255 Ile Cys Asp Leu Cys Gly Glu His His Glu Ser Leu Leu Leu Gln Met 260 265 270 Arg Ser Lys Asn Tyr Gly Val Gln Tyr Asp Ser Trp Leu His Pro Phe 275 280 285 Ser Pro Tyr Arg Gln Ala Leu Lys Asp Pro Ser Ala Pro Trp Leu Ala 290 295 300 Phe Lys Gly Gln Pro Gly Gly Leu Ser Tyr Lys Asp Trp Leu Gly Leu 305 310 315 320 Met Leu Asn Arg Glu Asp Lys Phe Asn Lys Met Gln Pro Ala Lys Val 325 330 335 Val Arg Ala Ala Gly Gln Arg Asn Lys Met Ser Leu Trp Cys Phe Ala 340 345 350 Trp Asp Met Asp Lys Ala Lys Val Arg Cys Trp Tyr Gln His Arg Ile 355 360 365 Pro Leu Ile Ser Val Ser His Glu Glu Gln Phe Leu Ala Val Leu Asn 370 375 380 Ile Val Leu Val Leu Ala Ser Glu Ser Leu Ser Leu Leu Arg Asn Ala 385 390 395 400 Leu Lys Ser Ala Lys Phe Asp Cys Pro Lys Glu Ala Lys Met Asp Phe 405 410 415 Ser Met Val Asp Ile Ala Phe Trp Gln Glu Thr Glu Pro Ala Phe Arg 420 425 430 Thr Leu Gln Glu Ala Leu Ala Val Asp Pro Leu Arg Gln Asp Thr Gln 435 440 445 Thr Arg His Ala Val Ser Gln Trp Glu Ala Glu Leu Ala His Tyr Leu 450 455 460 Phe His Val Phe Asp Arg Asp Ala Leu Thr Asn Pro Asp Cys Pro Asp 465 470 475 480 Asp Ile Leu Gln Arg Gln Leu Thr Ala Arg Gln Asp Leu Ala Ser Ser 485 490 495 Tyr Arg Lys His Lys Ala Arg Lys Asp Val Leu Ala Leu Val Glu 500 505 510 <210> 65 <211> 200 <212> PRT <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(200) <223> Cse2 <400> 65 Met Leu Asn Ser Asn Thr Ala Val Leu Cys Arg Ile Leu His Pro Asp 1 5 10 15 Ala Gln Lys Ala Leu Leu Asp Trp Phe Ala Thr Leu Ser Glu Arg Tyr 20 25 30 Glu Arg Lys Asp Gly Lys Arg Val Asn Gly Arg Ala Trp Arg Ala Glu 35 40 45 Leu Lys Arg Met Ala Pro Pro Tyr Gly Val Met Ile Cys Glu Gly His 50 55 60 Asp Ala Leu Arg Gln Ala Leu Leu Lys His Met Arg Leu Gln Pro Leu 65 70 75 80 Asp Glu Met Ala Leu Ala Leu Phe Val Ser Val Ala Val His Ile Lys 85 90 95 Ser His Lys Ala Asn Ile Ser Phe Ala Ala Gln Leu Gly Glu Lys Leu 100 105 110 Lys Gly Ser Thr Pro Cys Val Ser Val Leu Arg Phe Glu Arg Leu Gln 115 120 125 Lys Ala Ser Asp Pro Glu Thr Phe Cys Gln Leu Leu Ile Gln Ala Val 130 135 140 Lys Ile Arg Gly Thr Glu Gly Val Asn Val Leu Ser Leu Ala Asp Gly 145 150 155 160 Ile Phe Leu Trp Met Glu Glu Trp Gln Arg Arg Glu Asn His Gln Pro 165 170 175 Glu Phe Arg Asn Pro Phe Glu Arg Asn Arg Ile Arg Trp Ala Asn Glu 180 185 190 Tyr Leu Ser Thr Ser Arg Gly Lys 195 200 <210> 66 <211> 354 <212> PRT <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(354) <223> Cas7 <400> 66 Met Ile Met Thr Thr Phe Ile Gln Leu His Leu Leu Thr Ala Tyr Ala 1 5 10 15 Pro Ala Asn Leu Asn Arg Asp Glu Ser Gly Arg Pro Lys Thr Ala Phe 20 25 30 Met Gly Gly Val Glu Arg Leu Arg Val Ser Ser Gln Ser Leu Lys Arg 35 40 45 Ala Trp Arg Val Ser Glu Thr Phe Glu Ala Ala Met Asp Gly Phe Met 50 55 60 Gly Lys Arg Thr Arg Arg Ile Gly Val Asp Tyr Val Tyr Arg Pro Met 65 70 75 80 Lys Asp Ala Gly Ile Glu Glu Lys Ile Ala Lys Ser Ser Ser Glu Leu 85 90 95 Ile Ala Lys Gln Phe Gly Lys Leu Lys Ser Asp Lys Asp Ala Lys Pro 100 105 110 Glu Lys Asn Leu Glu Ile Glu Gln Ile Val His Val Ser Asn His Glu 115 120 125 Ile Ser Leu Ile Lys Gln Leu Val Asp Thr Leu Ile Ala Asp Lys Arg 130 135 140 Glu Pro Asn Asp Glu Glu Val Glu Leu Leu Arg Lys Glu Gln Arg Ser 145 150 155 160 Val Asp Met Ala Leu Phe Gly Arg Met Leu Ala Ser Ser Pro Glu Phe 165 170 175 Asn Val Glu Ala Ala Cys Gln Val Ser His Ala Leu Gly Val Ser Ala 180 185 190 Val Thr Val Glu Ser Asp Phe Phe Thr Ala Val Asp Asp Leu Asn Asn 195 200 205 Lys Glu Glu Asp Ala Gly Ser Gly His Met Gly Glu Gln Gly Phe Ala 210 215 220 Ser Ala Leu Phe Tyr Thr Tyr Val Cys Ile Ser Arg Asp Leu Leu Val 225 230 235 240 Glu Asn Leu Gly Gly Asn Glu Glu Leu Ala Lys Arg Thr Ile Ala Ala 245 250 255 Leu Thr Glu Thr Ala Leu Thr Val Ser Pro Thr Gly Lys Gln Asn Ser 260 265 270 Phe Ala Ser Arg Ala Tyr Ala Thr Tyr Ala Leu Ala Glu Val Gly Gln 275 280 285 Lys Gln Pro Arg Ser Leu Ala Ala Ala Phe Phe Gln Pro Val Arg Asp 290 295 300 Thr Asp Gln Ile Pro Ala Ala Ile Thr Arg Leu Lys Gln Gln Arg Ala 305 310 315 320 Ser Phe Asp Asn Val Tyr Gly Asn Cys Ala Asp Asp Tyr Arg Glu Leu 325 330 335 Asn Val Gln Glu Gly Thr Gly Ser Leu Ala Glu Leu Leu Ala Phe Val 340 345 350 Ser Gln <210> 67 <211> 241 <212> PRT <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(241) <223> Cas5 <400> 67 Met Lys Glu Tyr Leu Val Phe Gln Leu Tyr Ala Pro Leu Ala Ser Trp 1 5 10 15 Gly Glu Glu Ala Ser Gly Glu Ile Arg His Ser Ala Thr Val Pro Thr 20 25 30 Arg Ser Ala Leu Leu Gly Leu Leu Ala Ala Ala Leu Gly Ile Arg Arg 35 40 45 Asp Glu Glu Ala Arg Leu Asn Asn Phe Asn Arg His Tyr His Leu Ala 50 55 60 Val His Ala Leu Ala Ser Gln Asp Arg Trp Leu Arg Asp Tyr His Thr 65 70 75 80 Val Ser Ala Pro Arg Glu Asn Lys Lys Asn Arg Tyr Tyr Thr Arg Arg 85 90 95 Asp Glu Leu Thr Leu Ala Pro Asp Glu Val Gly Thr Leu Ile Ser Gln 100 105 110 Arg Glu Tyr Arg Cys Asp Gly Tyr Trp His Val Ala Ile Ser Ala Thr 115 120 125 Pro Asp Ala Pro His Ser Leu Ser Glu Leu Arg Glu Ala Leu Leu Thr 130 135 140 Pro His Phe Pro Leu Tyr Leu Gly Arg Lys Ser Cys Pro Leu Ala Leu 145 150 155 160 Pro Leu Ala Ala Arg Leu Met Thr Gly Thr Leu Lys Glu Val Phe Thr 165 170 175 His Ala Val Glu Glu Ile Ser Ala Ala Glu Leu Ser Gly Phe Thr Leu 180 185 190 Arg Glu Gly Ile Cys Tyr Trp Asp Asp Pro Asp Glu Glu Ser Leu Val 195 200 205 Trp Gln Gln Lys Gln His Ser Asn Asn Gln Pro Val Ser Arg Gln Arg 210 215 220 Trp Gln Phe Gly Gly Tyr Thr Arg Phe Asn Gly Pro Leu Gln Glu Arg 225 230 235 240 Thr <210> 68 <211> 234 <212> PRT <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(234) <223> Cas6 <400> 68 Met Tyr Leu Ser Arg Ile Gln Leu Arg Phe Asn Asn Leu Arg Pro Glu 1 5 10 15 Met Leu Ala Lys Trp Asn Ser Ala Arg Pro Tyr Ala Ser His Gln Trp 20 25 30 Leu Trp Gln Leu Phe Pro Glu Gln Glu Leu Arg Gln Phe Leu Phe Arg 35 40 45 Glu Glu Ala His Gly Gly Phe Phe Met Leu Ser Ala Ile Pro Pro Leu 50 55 60 Ser Gln His Ser Leu Phe Leu Ile Glu Thr Lys Pro Phe Asn Pro Gln 65 70 75 80 Leu Thr Asn Gly Leu Glu Leu Asp Phe Gln Leu Arg Ala Asn Pro Val 85 90 95 Ile Thr Arg Asn Gly Lys Arg Ser Asp Val Met Met Asn Ala Lys His 100 105 110 Gln Ala Lys Ala Asn Gly Val Glu Lys Glu Arg Trp Trp Glu Leu Gln 115 120 125 Gln Gln Ala Ala Gln Ala Trp Leu Glu Gln Gln Gly Gln Gln His Gly 130 135 140 Phe Arg Leu Ile Ala Pro Glu Pro Asp Asp Phe Ala Met Trp Ala Gly 145 150 155 160 Asp Glu Tyr Ser Glu Leu Gln Ala His Cys Gly Cys Val Gln Ala Tyr 165 170 175 Gln Gln His Arg Phe Val Arg Lys Asp Gln Gln Lys Pro Ile Thr Phe 180 185 190 Ser Ser Val Asp Phe Ser Gly Ala Leu Cys Ile Thr Asp Ala Ala Leu 195 200 205 Phe Lys Gln Ala Leu Phe Ser Gly Leu Gly Lys Ser Lys Ala Leu Gly 210 215 220 Cys Gly Met Leu Met Val Lys Arg Lys Arg 225 230 <210> 69 <211> 90 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 69 gtgttccccg cgccagcggg gataaaccgc agctttagca tcggtcgaca gcccatctgg 60 cgtgttcccc gcgccagcgg ggataaaccg 90 <210> 70 <211> 1518 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(1518) <223> Cas8 <400> 70 atggatttac ttgttgatcc atggatccct gtccgtgcgt ttgaggagag gcatccacaa 60 actattacgc tacaacgatt atgttgcagc gaagaaaaat ggctattaaa cctaccgcgc 120 gatgacatgg agctggcggc cttacaatta ctgatctgcc tgctgcaggt cacctgcgag 180 ccacgagatg acagcgaaat gcgcctaagg gttgccaggc cactttccga agaagagttc 240 gcagcattaa tgtcaccctg gcaccaaacc ttccaacttg atcatccgca aatgcctttt 300 atgcaggtaa aaggcgtgga agcgaaagag cccactccga tggaaaagct gatgaccggt 360 ttaagcgggg cgacaaattg cgctttcgtt aatcagccag ggcagggcga agcgttatgc 420 ggtggttgta cggcgatagc gctgtttaat caggcaaata acgccccagg ttttggaggc 480 ggttttaaga gtggattacg gggcggtacg ccgattacta ctttaattaa aggctcagat 540 ctgcgtacca ctatctggct aaatgtcctg accacaccgc gtcttcaatc ctctttcccg 600 ccagatagac ttaccgaaaa tcttcccacc tggaaacgcc ctatatccag tggaaaaaca 660 tttcctgccg ccacgattgg tttactgcgc gggctttttt ggcaacccgc acacattgaa 720 ctttgcccgc ctataggccc ggggcaatgt tgcgggtgcg gacagcagag caaccagcgt 780 tataacggtt ttctcaaggc taaattcaac tttacggttg aaggattatg gcctcatcca 840 cattccccgc gcgttctggt tgagaaaaaa ggcgttattg aacaaaagtt tctcgccttt 900 accaccgcag cgccttcatg gacgcaaata ggtcgcctac tggtggacaa agaaacccgg 960 caaggtgaag ggcgtcgggt ggcgacggtg gttgaacaat tcagggaggt gtacccgcgc 1020 ttcaggctgg cattgatcgt cggtggatat cgtaataatc aggcttctat tctggagcgt 1080 cgccacgatg tgctggtttt caatgatgga tggcaaaacg gtagcgatgt gatcaatgac 1140 attgttgaaa tggggctggg atacaaaact gctttgcgaa aagggttgta caccttcgtt 1200 gagggggcaa aaaatcacga tgttaaaggg gcgggtgtag cggtacacga agtggctgaa 1260 cgacattatt accgccgcag cgaactgctt attcccgcga tcctggcaag cattgattat 1320 tctcagccaa atgatgtcat tgcacgtctg agaaaagagc ttcatcaact ttgcgaagcg 1380 ctcttcaacc aggttactgc cccatatgcc catcatccca aattgatccg ctcattagca 1440 gtggcgcgcg cttcgcttca taaacatctc aatgaactta aaccacaagg agagttagcg 1500 tatgtcgacg gagattga 1518 <210> 71 <211> 492 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(492) <223> Cse2 <400> 71 atgtcgacgg agattgatgc aatggcgctc tataacgcct ggcagcaatt agataacggc 60 tcaagtgccc agctaagacg ggtaagcgag cctgatgagt tacgcgagat ccccgccttt 120 tatcgtctcg tccaaccctt tggctgggag aatcctgcca ataagcgtcc gttactgcgt 180 atggtttttt gcctgagcgc gggtaaagac gtcattcatc ataaagagaa aatcgatgat 240 tatccgtcag gcattagcct cggaagagcg ctggcaaaga gtggaaagat taacgaacgc 300 cgcgtttttc agcttgtccg tgcacagagt cccggcgaca tgattcaact gcgacggtta 360 ttaattcatg cagagcctgt tcttgactgg tctttattcg cccggcaact cacctggtgg 420 ggcaaacgag agcgccagca actgctggaa gattttatgt tggctacccc tgaatcaaac 480 aaaaaagcgt aa 492 <210> 72 <211> 1098 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(1098) <223> Cas7 <400> 72 atgaacaact ttatcaactt tcatgtcctg atttctcaca gcccttcttg cctgaaccgc 60 gacgatatga atatgcaaaa agacgcggtt ttcggcggca agcggcgtgt gcgtatttcg 120 agccagagct taaaacgtgc gatgcgcaaa agtgattact atgcccgtca tattggcgca 180 tccagtcttc gcactatcca tcttgaagag ctgcgtgacg tattacgtca aaaattatcc 240 ccgcgattcg aattgccgat aatcgataaa acgctgtctt tgttatcagg aaaaaccatt 300 gatgatgctg aaaaaattaa cggcgacgca gtaacgcctt gggtattggg cgaagtcgaa 360 tggttttgcg aacaggtaat gaaagcggaa gctgagcaac tggatgataa aaaactgctc 420 aaaatgctta aagatgatat tgccgcgatg cgcaccaatc ttcagcaggg ggttgatgtt 480 gcactgagcg gacgcatggc gaccagcggc ctgatgagcg aactcgggaa agttgatggt 540 gcaatgtcca ttgctcatgc catcaccaca catactgttg attccgatat tgactggttt 600 acagcagtag acgatctcca ggacttaggt tcggcgcacc ttggaaccca ggaattttct 660 tccggcgtgt tttatcgcta cgccagtctg aatattgccc agcttcagga gaaccttggc 720 ggtgtatctc gcgagcaggt ccttgaaatc gcagcgcatc ttgcgcatat gctggcgact 780 gaagtaccgg gcgcgaagca acataccttc gcggcattca acccggcgga catggtcatg 840 atcaattttt ctgatttccc cctttcgtta gccaatgctt ttgaaagccc gattaaagcc 900 aaagatggct atttgttacc ttctatcaac gcctttaatg agtactggca gcgtatagct 960 aaagggtatg gattaacagg accggcggca cagtttatgt tggccgaagc aagtatggcg 1020 ggcggaaatg tggtgtctgt tgagacactg gaacaactta aaaaatggat ttgccatgat 1080 ggcgaggcgt caagatga 1098 <210> 73 <211> 675 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(675) <223> Cas5 <400> 73 atgaaaccct acttaatcct gcggcttgcg ggaccgatgc aggcgtgggg gcaaccaaca 60 tttgagggca cacgaccgac agcgcgcttc cccacacgca gcggccttct tgggttgctg 120 ggcgcttgcc tgggcattca acgagacgac cgctcagcgt tacaggcgct ctctgaaagc 180 gtcaggtttg cggttcgttg cgaccagtca tttattgatg ggcgaaccat tcccgttacc 240 ggcttgcgtg attaccatac ggttatggat gcacgagagg attatcgtgg cttaaaaagc 300 cacgaaacca ttcagacctg gcgcgaatac ttgtgtgacg cggttttcac cgtggcggta 360 tgggagtctg aacaggcaac tctcaggctc ccggagctga aagttgcggt atgcaaacct 420 cgttttacgc cttttttggg acgtaaaagc tgcccgttaa cacagccgct ctttgttgat 480 ctttgtgatg ccatcaatcc gtatcaggcg ttggcaaatt atgctccagc aggaggagat 540 atttatagcg aagcgccgcc tgacggaccg tgccaaacat tcaccgtacg tgatgagccg 600 attattgcct taccgcgaca atttgccgcc agggagtggt acgtcataaa aggagcctcg 660 gatgtatctc agtaa 675 <210> 74 <211> 600 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(600) <223> Cas6 <400> 74 atgtatctca gtaaggtcat tattcagaac gcctggtgcc gggatgttta tcaatttcat 60 caggctatct ggcagctttt tccttctcaa cctgcccaaa aaagagcgtt tttatttcgt 120 attgaggcta aacatcccgg cagaggcgct gatgtattac ttcaatcgat ggaagcccct 180 gcttcatcgg ctgccgcgca agttcttgcc tgtaaacctt tagcatttca cctaaaagag 240 ggggatcagt tgcgcttccg tctgcgtgcc aacccaataa aaacgattaa agatgagcaa 300 caacgtctga atggtcgtgg ggaaatcaaa cgctgccgtg tgccactact taaagagcag 360 gaacaacacc agtggttaat acgaaaatta tcacttgcgg ctcgtctgga acatattgaa 420 tccactagtg agcttccgtt gtttttttct aaaaatggta cgggtgggaa aattcagccc 480 atgaattttg aaggcattct taccgtaacc agtgtgccgg cattgctgtc gctattaaat 540 aatggagtgg gtccggcaaa agcaatggga tgtgggctgt tatcacttgc ccgcccctga 600 <210> 75 <211> 1518 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(1518) <223> Cas8 <400> 75 atggatctgc tggtggaccc atggattccc gtgcgggcct ttgaggagag gcaccctcag 60 accatcacac tgcagcggct gtgctgttcc gaggagaagt ggctgctgaa tctgccaaga 120 gacgatatgg agctggccgc cctgcagctg ctgatctgcc tgctgcaggt gacctgtgag 180 cctagggacg attctgagat gaggctgcgg gtggcaaggc cactgtctga ggaggagttc 240 gccgccctga tgagcccttg gcaccagaca tttcagctgg accaccctca gatgccattc 300 atgcaggtga agggcgtgga ggccaaggag ccaaccccca tggagaagct gatgaccggc 360 ctgagcggcg ccacaaactg tgcctttgtg aatcagccag gacagggaga ggccctgtgc 420 ggaggatgta cagcaatcgc cctgttcaac caggcaaaca atgcaccagg atttggagga 480 ggcttcaaga gcggcctgag gggaggaacc cctatcacca cactgatcaa gggctccgat 540 ctgcgcacca caatctggct gaacgtgctg accacacccc ggctgcagtc ctcttttcct 600 ccagacagac tgaccgagaa tctgcccaca tggaagaggc ctatcagctc cggcaagacc 660 tttcctgcag caacaatcgg actgctgagg ggactgttct ggcagcctgc acacatcgag 720 ctgtgcccac ctatcggacc aggacagtgc tgtggatgtg gacagcagtc caaccagcgg 780 tacaatggct tcctgaaggc caagtttaat ttcacagtgg agggactgtg gcctcaccca 840 cactccccca gagtgctggt ggagaagaag ggcgtgatcg agcagaagtt tctggccttc 900 accacagccg ccccttcttg gacccagatc ggcaggctgc tggtggataa ggagacccgc 960 cagggagagg gcaggcgcgt ggccacagtg gtggagcagt ttcgggaggt gtaccctaga 1020 ttcaggctgg ccctgatcgt gggcggctat agaaacaatc aggccagcat cctggagcgg 1080 agacacgatg tgctggtgtt taacgacggc tggcagaatg gctccgatgt gatcaacgac 1140 atcgtggaga tgggcctggg ctacaagacc gccctgagga agggcctgta tacattcgtg 1200 gagggcgcca agaatcacga cgtgaaggga gcaggagtgg cagtgcacga ggtggccgag 1260 cgccactact ataggcgcag cgagctgctg atcccagcaa tcctggcctc catcgattat 1320 tctcagccta acgacgtgat cgcaaggctg cggaaggagc tgcaccagct gtgcgaggcc 1380 ctgttcaatc aggtgaccgc accatacgca caccacccaa agctgatccg gtctctggca 1440 gtggcaagag ccagcctgca caagcacctg aacgagctga agccacaggg agagctggca 1500 tacgtggatg gcgactaa 1518 <210> 76 <211> 492 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(492) <223> Cse2 <400> 76 atgagcaccg agatcgatgc catggccctg tataacgcct ggcagcagct ggacaatggc 60 agctccgccc agctgaggcg cgtgagcgag cctgatgagc tgagggagat cccagccttt 120 taccgcctgg tgcagccatt cggctgggag aaccccgcca ataagcgccc tctgctgcgg 180 atggtgtttt gcctgtccgc cggcaaggac gtgatccacc acaaggagaa gatcgacgat 240 tacccatccg gcatctctct gggacgggcc ctggcaaagt ctggcaagat caacgagcgg 300 agagtgttcc agctggtgag agcccagagc ccaggcgata tgatccagct gaggcgcctg 360 ctgatccacg cagagcccgt gctggactgg agcctgtttg caaggcagct gacctggtgg 420 ggcaagaggg agagacagca gctgctggag gatttcatgc tggccacacc cgagagcaac 480 aagaaggcat aa 492 <210> 77 <211> 1098 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(1098) <223> Cas7 <400> 77 atgaacaact tcatcaactt ccacgtgctg atctctcaca gcccatcctg cctgaaccgg 60 gacgatatga atatgcagaa ggatgccgtg ttcggcggca agcggagagt gagaatcagc 120 tcccagtccc tgaagagagc catgaggaag tctgactact atgcaaggca catcggagca 180 tctagcctgc gcacaatcca cctggaggag ctgagagatg tgctgaggca gaagctgtcc 240 cctcgctttg agctgccaat catcgacaag accctgtccc tgctgtctgg caagacaatc 300 gacgatgccg agaagatcaa cggcgacgca gtgaccccat gggtgctggg agaggtggag 360 tggttctgtg agcaggtcat gaaggccgag gccgagcagc tggacgataa gaagctgctg 420 aagatgctga aggacgatat cgccgccatg aggaccaatc tgcagcaggg agtggatgtg 480 gccctgagcg gcaggatggc cacatctggc ctgatgagcg agctgggcaa ggtggacgga 540 gcaatgtcca tcgcacacgc catcaccaca cacaccgtgg actctgatat cgactggttt 600 acagccgtgg acgatctgca ggatctgggc tccgcccacc tgggaaccca ggagttttcc 660 tctggcgtgt tctacagata tgcctccctg aacatcgccc agctgcagga gaatctggga 720 ggcgtgtctc gcgagcaggt gctggagatc gcagcacacc tggcacacat gctggcaacc 780 gaggtgccag gagcaaagca gcacacattt gccgccttca accccgccga tatggtcatg 840 atcaacttca gcgacttccc actgtccctg gccaacgcct ttgagagccc catcaaggcc 900 aaggacggct acctgctgcc ttccatcaac gccttcaatg agtactggca gcggatcgcc 960 aagggatatg gactgaccgg accagcagca cagttcatgc tggcagaggc cagcatggca 1020 ggaggaaacg tggtgtccgt ggagaccctg gagcagctga agaagtggat ctgccacgat 1080 ggagaggcca gccggtaa 1098 <210> 78 <211> 675 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(675) <223> Cas5 <400> 78 atgaagccat atctgatcct gagactggca ggaccaatgc aggcctgggg acagcctacc 60 tttgagggca ccagaccaac agcaaggttc ccaacacgct ccggcctgct gggactgctg 120 ggagcatgcc tgggcatcca gagggacgat cggtctgccc tgcaggccct gtctgagagc 180 gtgcggtttg ccgtgagatg tgatcagagc ttcatcgacg gccggaccat ccctgtgaca 240 ggcctgagag attaccacac cgtgatggat gccagggagg actatcgcgg cctgaagtct 300 cacgagacca tccagacatg gagggagtac ctgtgcgacg ccgtgtttac cgtggccgtg 360 tgggagagcg agcaggccac actgaggctg ccagagctga aggtggccgt gtgcaagccc 420 cggtttaccc ctttcctggg cagaaagtcc tgcccactga cacagcccct gttcgtggac 480 ctgtgcgacg ccatcaaccc ttaccaggcc ctggcaaatt atgcacctgc aggaggcgat 540 atctattctg aggcacctcc agacggacca tgccagacct ttacagtgcg ggacgagcct 600 atcatcgccc tgccaaggca gttcgcagca agggagtggt acgtgatcaa gggagcaagc 660 gacgtgagcc agtaa 675 <210> 79 <211> 600 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(600) <223> Cas6 <400> 79 atgtacctga gcaaagtgat catccagaat gcctggtgtc gcgacgtgta ccagtttcac 60 caggccatct ggcagctgtt cccctctcag cctgcccaga agcgggcctt cctgtttaga 120 atcgaggcaa agcacccagg aaggggagca gacgtgctgc tgcagagcat ggaggcacca 180 gcatctagcg ccgcagcaca ggtgctggcc tgcaagcccc tggcctttca cctgaaggag 240 ggcgatcagc tgaggttccg cctgagggcc aacccaatca agaccatcaa ggacgagcag 300 cagcggctga atggcagagg cgagatcaag agatgtaggg tgcccctgct gaaggagcag 360 gagcagcacc agtggctgat caggaagctg tccctggcag cacgcctgga gcacatcgag 420 tccacctctg agctgcccct gttcttttct aagaacggca caggcggcaa gatccagcct 480 atgaatttcg agggcatcct gaccgtgaca agcgtgcctg ccctgctgtc cctgctgaac 540 aatggagtgg gaccagcaaa ggcaatggga tgcggcctgc tgtctctggc aaggccataa 600 <210> 80 <211> 505 <212> PRT <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(505) <223> Cas8 <400> 80 Met Asp Leu Leu Val Asp Pro Trp Ile Pro Val Arg Ala Phe Glu Glu 1 5 10 15 Arg His Pro Gln Thr Ile Thr Leu Gln Arg Leu Cys Cys Ser Glu Glu 20 25 30 Lys Trp Leu Leu Asn Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 35 40 45 Gln Leu Leu Ile Cys Leu Leu Gln Val Thr Cys Glu Pro Arg Asp Asp 50 55 60 Ser Glu Met Arg Leu Arg Val Ala Arg Pro Leu Ser Glu Glu Glu Phe 65 70 75 80 Ala Ala Leu Met Ser Pro Trp His Gln Thr Phe Gln Leu Asp His Pro 85 90 95 Gln Met Pro Phe Met Gln Val Lys Gly Val Glu Ala Lys Glu Pro Thr 100 105 110 Pro Met Glu Lys Leu Met Thr Gly Leu Ser Gly Ala Thr Asn Cys Ala 115 120 125 Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Asn Asn Ala Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Ile Thr Thr Leu Ile 165 170 175 Lys Gly Ser Asp Leu Arg Thr Thr Ile Trp Leu Asn Val Leu Thr Thr 180 185 190 Pro Arg Leu Gln Ser Ser Phe Pro Pro Asp Arg Leu Thr Glu Asn Leu 195 200 205 Pro Thr Trp Lys Arg Pro Ile Ser Ser Gly Lys Thr Phe Pro Ala Ala 210 215 220 Thr Ile Gly Leu Leu Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Cys Pro Pro Ile Gly Pro Gly Gln Cys Cys Gly Cys Gly Gln Gln 245 250 255 Ser Asn Gln Arg Tyr Asn Gly Phe Leu Lys Ala Lys Phe Asn Phe Thr 260 265 270 Val Glu Gly Leu Trp Pro His Pro His Ser Pro Arg Val Leu Val Glu 275 280 285 Lys Lys Gly Val Ile Glu Gln Lys Phe Leu Ala Phe Thr Thr Ala Ala 290 295 300 Pro Ser Trp Thr Gln Ile Gly Arg Leu Leu Val Asp Lys Glu Thr Arg 305 310 315 320 Gln Gly Glu Gly Arg Arg Val Ala Thr Val Val Glu Gln Phe Arg Glu 325 330 335 Val Tyr Pro Arg Phe Arg Leu Ala Leu Ile Val Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Val Phe Asn 355 360 365 Asp Gly Trp Gln Asn Gly Ser Asp Val Ile Asn Asp Ile Val Glu Met 370 375 380 Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Gly Leu Tyr Thr Phe Val 385 390 395 400 Glu Gly Ala Lys Asn His Asp Val Lys Gly Ala Gly Val Ala Val His 405 410 415 Glu Val Ala Glu Arg His Tyr Tyr Arg Arg Ser Glu Leu Leu Ile Pro 420 425 430 Ala Ile Leu Ala Ser Ile Asp Tyr Ser Gln Pro Asn Asp Val Ile Ala 435 440 445 Arg Leu Arg Lys Glu Leu His Gln Leu Cys Glu Ala Leu Phe Asn Gln 450 455 460 Val Thr Ala Pro Tyr Ala His His Pro Lys Leu Ile Arg Ser Leu Ala 465 470 475 480 Val Ala Arg Ala Ser Leu His Lys His Leu Asn Glu Leu Lys Pro Gln 485 490 495 Gly Glu Leu Ala Tyr Val Asp Gly Asp 500 505 <210> 81 <211> 163 <212> PRT <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(163) <223> Cse2 <400> 81 Met Ser Thr Glu Ile Asp Ala Met Ala Leu Tyr Asn Ala Trp Gln Gln 1 5 10 15 Leu Asp Asn Gly Ser Ser Ala Gln Leu Arg Arg Val Ser Glu Pro Asp 20 25 30 Glu Leu Arg Glu Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly 35 40 45 Trp Glu Asn Pro Ala Asn Lys Arg Pro Leu Leu Arg Met Val Phe Cys 50 55 60 Leu Ser Ala Gly Lys Asp Val Ile His His Lys Glu Lys Ile Asp Asp 65 70 75 80 Tyr Pro Ser Gly Ile Ser Leu Gly Arg Ala Leu Ala Lys Ser Gly Lys 85 90 95 Ile Asn Glu Arg Arg Val Phe Gln Leu Val Arg Ala Gln Ser Pro Gly 100 105 110 Asp Met Ile Gln Leu Arg Arg Leu Leu Ile His Ala Glu Pro Val Leu 115 120 125 Asp Trp Ser Leu Phe Ala Arg Gln Leu Thr Trp Trp Gly Lys Arg Glu 130 135 140 Arg Gln Gln Leu Leu Glu Asp Phe Met Leu Ala Thr Pro Glu Ser Asn 145 150 155 160 Lys Lys Ala <210> 82 <211> 365 <212> PRT <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(365) <223> Cas7 <400> 82 Met Asn Asn Phe Ile Asn Phe His Val Leu Ile Ser His Ser Pro Ser 1 5 10 15 Cys Leu Asn Arg Asp Asp Met Asn Met Gln Lys Asp Ala Val Phe Gly 20 25 30 Gly Lys Arg Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met 35 40 45 Arg Lys Ser Asp Tyr Tyr Ala Arg His Ile Gly Ala Ser Ser Leu Arg 50 55 60 Thr Ile His Leu Glu Glu Leu Arg Asp Val Leu Arg Gln Lys Leu Ser 65 70 75 80 Pro Arg Phe Glu Leu Pro Ile Ile Asp Lys Thr Leu Ser Leu Leu Ser 85 90 95 Gly Lys Thr Ile Asp Asp Ala Glu Lys Ile Asn Gly Asp Ala Val Thr 100 105 110 Pro Trp Val Leu Gly Glu Val Glu Trp Phe Cys Glu Gln Val Met Lys 115 120 125 Ala Glu Ala Glu Gln Leu Asp Asp Lys Lys Leu Leu Lys Met Leu Lys 130 135 140 Asp Asp Ile Ala Ala Met Arg Thr Asn Leu Gln Gln Gly Val Asp Val 145 150 155 160 Ala Leu Ser Gly Arg Met Ala Thr Ser Gly Leu Met Ser Glu Leu Gly 165 170 175 Lys Val Asp Gly Ala Met Ser Ile Ala His Ala Ile Thr Thr His Thr 180 185 190 Val Asp Ser Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Asp 195 200 205 Leu Gly Ser Ala His Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe 210 215 220 Tyr Arg Tyr Ala Ser Leu Asn Ile Ala Gln Leu Gln Glu Asn Leu Gly 225 230 235 240 Gly Val Ser Arg Glu Gln Val Leu Glu Ile Ala Ala His Leu Ala His 245 250 255 Met Leu Ala Thr Glu Val Pro Gly Ala Lys Gln His Thr Phe Ala Ala 260 265 270 Phe Asn Pro Ala Asp Met Val Met Ile Asn Phe Ser Asp Phe Pro Leu 275 280 285 Ser Leu Ala Asn Ala Phe Glu Ser Pro Ile Lys Ala Lys Asp Gly Tyr 290 295 300 Leu Leu Pro Ser Ile Asn Ala Phe Asn Glu Tyr Trp Gln Arg Ile Ala 305 310 315 320 Lys Gly Tyr Gly Leu Thr Gly Pro Ala Ala Gln Phe Met Leu Ala Glu 325 330 335 Ala Ser Met Ala Gly Gly Asn Val Val Ser Val Glu Thr Leu Glu Gln 340 345 350 Leu Lys Lys Trp Ile Cys His Asp Gly Glu Ala Ser Arg 355 360 365 <210> 83 <211> 224 <212> PRT <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(224) <223> Cas5 <400> 83 Met Lys Pro Tyr Leu Ile Leu Arg Leu Ala Gly Pro Met Gln Ala Trp 1 5 10 15 Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Ala Arg Phe Pro Thr 20 25 30 Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu Gly Ile Gln Arg 35 40 45 Asp Asp Arg Ser Ala Leu Gln Ala Leu Ser Glu Ser Val Arg Phe Ala 50 55 60 Val Arg Cys Asp Gln Ser Phe Ile Asp Gly Arg Thr Ile Pro Val Thr 65 70 75 80 Gly Leu Arg Asp Tyr His Thr Val Met Asp Ala Arg Glu Asp Tyr Arg 85 90 95 Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg Glu Tyr Leu Cys 100 105 110 Asp Ala Val Phe Thr Val Ala Val Trp Glu Ser Glu Gln Ala Thr Leu 115 120 125 Arg Leu Pro Glu Leu Lys Val Ala Val Cys Lys Pro Arg Phe Thr Pro 130 135 140 Phe Leu Gly Arg Lys Ser Cys Pro Leu Thr Gln Pro Leu Phe Val Asp 145 150 155 160 Leu Cys Asp Ala Ile Asn Pro Tyr Gln Ala Leu Ala Asn Tyr Ala Pro 165 170 175 Ala Gly Gly Asp Ile Tyr Ser Glu Ala Pro Pro Asp Gly Pro Cys Gln 180 185 190 Thr Phe Thr Val Arg Asp Glu Pro Ile Ile Ala Leu Pro Arg Gln Phe 195 200 205 Ala Ala Arg Glu Trp Tyr Val Ile Lys Gly Ala Ser Asp Val Ser Gln 210 215 220 <210> 84 <211> 199 <212> PRT <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(199) <223> Cas6 <400> 84 Met Tyr Leu Ser Lys Val Ile Ile Gln Asn Ala Trp Cys Arg Asp Val 1 5 10 15 Tyr Gln Phe His Gln Ala Ile Trp Gln Leu Phe Pro Ser Gln Pro Ala 20 25 30 Gln Lys Arg Ala Phe Leu Phe Arg Ile Glu Ala Lys His Pro Gly Arg 35 40 45 Gly Ala Asp Val Leu Leu Gln Ser Met Glu Ala Pro Ala Ser Ser Ala 50 55 60 Ala Ala Gln Val Leu Ala Cys Lys Pro Leu Ala Phe His Leu Lys Glu 65 70 75 80 Gly Asp Gln Leu Arg Phe Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile 85 90 95 Lys Asp Glu Gln Gln Arg Leu Asn Gly Arg Gly Glu Ile Lys Arg Cys 100 105 110 Arg Val Pro Leu Leu Lys Glu Gln Glu Gln His Gln Trp Leu Ile Arg 115 120 125 Lys Leu Ser Leu Ala Ala Arg Leu Glu His Ile Glu Ser Thr Ser Glu 130 135 140 Leu Pro Leu Phe Phe Ser Lys Asn Gly Thr Gly Gly Lys Ile Gln Pro 145 150 155 160 Met Asn Phe Glu Gly Ile Leu Thr Val Thr Ser Val Pro Ala Leu Leu 165 170 175 Ser Leu Leu Asn Asn Gly Val Gly Pro Ala Lys Ala Met Gly Cys Gly 180 185 190 Leu Leu Ser Leu Ala Arg Pro 195 <210> 85 <211> 90 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 85 gtgttccccg cgccagcggg gataaaccgt tttaaaacag gatgtggccc gcctggtgct 60 ggtgttcccc gcgccagcgg ggataaaccg 90 <210> 86 <211> 1512 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(1512) <223> Cas8 <400> 86 atgaatctat tgaccgatcc gtggataccg gcacggcccc aaggcagggc gacagcgcag 60 aagttgacct tgcgacagct gctgtgtgaa gacgaacgct gggagttgcg tctgccacgt 120 gatgacatgg agatggcaac actgcaattg ctgatctgcc tgacccaggc gttggcaacg 180 ccggcagatt tgccggagct gaaacgacga attatgaagc ctttgggaca gcaggagttc 240 aatgccgcct acactccttt cgcggactgg ttccggctcg atcatccgca gtatccgttc 300 atgcaggtgc ggggagtgaa ggcgaaggag ccgacgccga tggataaact gctggccggg 360 ttgacggggg cgaccaacag ctgtttcgtc aaccaatcgg gattgggcga ggggctttgc 420 ccggcttgcg ctgctatcgc tttgtttaac caggcgatga atgtccctgg attcggtggg 480 ggattcaaag ccagtttgcg cggcagtgct ccggtcacca cactggtaca aggcgaacac 540 ctgcggcaaa ccatctggtt gaatgtgctg agcacggagt cggtcgaagc tctgcttccc 600 tggcatcggc aaacggaaga ccagaaaccg acctggatag ctccaatcaa atccgaaacc 660 ttttcatccc gaagtatcgg gtttctgcgg ggtctgttct ggcagccggc gcacattgag 720 ttgctgcccg ctgagtcggt cggagattgc agttgctgcg gtcaggggga cacggaagtg 780 tatcgcggat tcaataaggc gaaattcaat tacaccgtga ccggcatttg gccgcatcct 840 catggggcga gaacctctac tgtgaaaaag ggggaacagg aagagaagtt cgtttctttc 900 accaccgaag ctccctcctg gactcagttg ggtcgtttcg tggcacgccg tgcctttgtt 960 gacgccaaaa ctcccggtca ggaaccggcg gcggtgatcc gtcaggcgca aaaacttggt 1020 gtgcggttga ctctctgcat cggtggatat cgcaacaacc aagcctcgat tctggagcga 1080 cggcatgagt tgctacccct tggcgagggg tggaattcga aaccccagat tgttcaggat 1140 gttgtggata ctgccatcgg ctatcgcgat gcgctgaaca agtcactgta ttcctttttc 1200 aagggaggag ggagcaaggg cgccgggctg ccgatccatg aattcggcaa ggcccaattc 1260 taccgccgaa cggaagaagc catcctcgac agcttggctc gtctcgattt cagtaatcca 1320 cgtccggttc tactcgcgct tcagaaaaaa ctggatacag aggtcagggg actgtttgag 1380 gaagcggtcc gtccctatct gaacgacccc aacctgattc ataccatggc ggtttcccgc 1440 cggactttat acaaaaatct caacgtactg aaacctcaac aggagggagg agtcgatggc 1500 aaaagaaact ga 1512 <210> 87 <211> 480 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(480) <223> Cse2 <400> 87 atggcaaaag aaactgattt tatggatctg tatcaggcct ggcagcgatt gccgaacggg 60 ccaaaagccg agcttaagcg atgcggcgac ttgggtgatc tgcttgaaac ctcggcgttt 120 tatcgtctgc tcgccgggcg gggtgaagcg gaatggcaga agaaagctta tcagcgcatg 180 atcttctgcc tcccctgcat caaccacacg gaacagaaaa tccctctggg cgctgcgctg 240 gcgagaagtc gcaaggggag ccggtcggcg gtttcagaaa gccgtatgat tcaagttgtg 300 cgcagcgaag cgccgaacga catggttcag ttgcggcgga ttctcaagca cgccgaaccg 360 acagtcaact ggccgctgat ggcaaaacag ctttggtact gggatctcaa cgaacgcagt 420 aaacggagtt tgctcgaaga tttctttctc aatcacaccg acacatcaaa ggagggttaa 480 <210> 88 <211> 1095 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(1095) <223> Cas7 <400> 88 gtgcagaatt tcatcaacta tcacgttctc atttcgcaca gtccgtcttg cctcaaccgc 60 gacgacatga atatgcagaa gtcagccatc ttcggtggtg tgcgccgagt acggatttca 120 agccagagtc tgaaacgggc gatgcgtaaa agcgactatt atgctcagca ccttggtgaa 180 gcgagtatcc gcacaaagca tttgagtgga ctgcgggatc ggttgcacga aaggctggcg 240 gggcgttttt ctcccgaagt tatcgataaa actatcaagc tgctcatcga caaggacgtt 300 tccgtcgatg gaatcgtcga aggcgatgcc gtggcccctt gggcggtgga agagtttgcc 360 tggttctgcg agcgggttat gaatgcgcag gcggaagggc tggaagacaa ggctctgacc 420 aagcagttga aagaatctat cgccgcgatg cgacagacgc tggttggcgg gcttgatatc 480 gcattatccg ggcggatggc cacctcgggg ttgctcagtg aacttggcaa ggtcgatggt 540 gcgctggccg tggcgcatgc cttgaccacc cacacggttg atgccgatat cgactggttc 600 accgctgtgg atgatctgca ggaactggga tctgggcacc tcgacaccca ggaattctct 660 agtggggtgt tctatcgcta cgccagtctg aacatcggcc agttgcagga aaacctcggt 720 ggcgcaccac gcgaacaggc gctggagatt gccacgcacg tattgcagat gttggcgacg 780 gtagttccgt ctgctaagca gcagagtttt gccgcgcaca accttgctga cttggcgttg 840 gtttccttcg ccgatatccc ggtatcgctg gccaatgcct tcgaaaaacc ggtgcagcag 900 aaaaacggca gtggattccg tgaaccttcg attgctgcgc tgcacgacta ttggcagaag 960 gtgcatatcg gctacgggct ggaagaacgc tgcgggcagt ttgttttgaa caaagtggaa 1020 acgcctgccg ggatcgctgc gaaagagagc cttgaggacc tcaaaagttg ggtgcgcaac 1080 aacggagagg ggtga 1095 <210> 89 <211> 678 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(678) <223> Cas5 <400> 89 atgggcgact acctgattct gaaactgcag gggccgatgc aggcctgggg ggagcacagc 60 tttgaaggga cgcgcccttc gggcaacttc ccgacccgta gtgccctgct cggacttctt 120 ggtgcctgtc tcggcattcg ccggaatgaa tacgaacgtt tgcagcaatt ggcggacagc 180 gttcaatttg ccgtgcgtaa agatgctcgc cagacgcaaa ccgagtgggg ggagccgaaa 240 aagctgccga tggtcaagat gactgattac cacaccgtca aggacgcacg gcagagttac 300 attggcctca aaagccacga aaccattcag acctggcggg aatatctgct tgatgcggaa 360 tacagcgttg ctatctggga aaacgaggat gcagccgtgt cactggatga attggaaacg 420 gccgtgcgca aaccggtatt caccccttat cttgggcgac ggagctgtcc gttggcgcaa 480 ccgctgtttg gcaaaaggct taccgcggaa agtccgaacc aggccttgca ggctgttgaa 540 ccgagcggcg gtgtgattta cagcgaacag ccatcagatc gcagcatgcg cctgcgtgac 600 ctgccgatgg cgggtcaacc acgccagttc gcttcccgca ccgtctacat ccacggaggg 660 gatcatgtat ctgagtaa 678 <210> 90 <211> 609 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(609) <223> Cas6 <400> 90 atgtatctga gtaaggttat ggtgactggg gccgcctgtc gcaatcccta tgaaatccac 60 cgcagcctct ggcaactgtt tccagaagat cccgacgcca ggcgagacta cttgtttcgc 120 gtagagcgcg ccgggcggca gcaggctgaa atcttgttac agtcgcagcg aaaaccgagc 180 gattcagagt tgcgtaaggt ccgactgctg gcgacgcgag ggtatcaacc gaggctgcag 240 caggggcaac ggctgcgttt tgcgttgctg gccaacccgg tcaagaccat caacgatgaa 300 cgcggccgcc tgaatgccaa aggccaggtg aaaaaatgcc gggttccgct gattcgcgag 360 gaggaatggc ggagctggtt ggagcacaag ctgattggtt gtgcggagct ggagacgctg 420 gtcgctgaaa atcgtctgcc gataaatttc cgcaagccca aggaaaaacg tgtcgggaaa 480 attcagccgg tcagttttca ggggatttta cgggtatcta gcccggaagc tatgatgcag 540 gcaatctcta ccggcatcgg cccggctaaa gccttcggtt gcggcctgct gtcaatcgcc 600 cctgcgtga 609 <210> 91 <211> 1512 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(1512) <223> Cas8 <400> 91 atgaacctgc tgacagatcc ctggattccc gcaaggccac agggaagggc aaccgcacag 60 aagctgacac tgagacagct gctgtgcgag gacgagaggt gggagctgag actgcccagg 120 gacgatatgg agatggccac cctgcagctg ctgatctgtc tgacccaggc cctggcaaca 180 ccagcagatc tgcccgagct gaagcggaga atcatgaagc ccctgggcca gcaggagttt 240 aatgccgcct acaccccttt tgccgattgg ttccgcctgg accaccccca gtatcctttc 300 atgcaggtgc ggggagtgaa ggcaaaggag ccaacaccca tggacaagct gctggcagga 360 ctgaccggag caacaaacag ctgttttgtg aatcagtccg gcctgggaga gggactgtgc 420 ccagcctgtg ccgccatcgc cctgttcaac caggccatga atgtgcctgg ctttggagga 480 ggcttcaagg cctctctgag gggcagcgcc ccagtgacca cactggtgca gggagagcac 540 ctgaggcaga ccatctggct gaacgtgctg tctacagaga gcgtggaggc cctgctgcca 600 tggcacaggc agaccgagga ccagaagccc acatggatcg cccctatcaa gagcgagacc 660 ttcagctcca gatccatcgg ctttctgagg ggactgttct ggcagccagc acacatcgag 720 ctgctgcctg cagagagcgt gggcgattgc tcctgctgtg gccagggcga cacagaggtg 780 tacaggggct ttaacaaggc caagttcaat tataccgtga caggaatctg gcctcaccca 840 cacggagcac gcaccagcac agtgaagaag ggcgagcagg aggagaagtt cgtgagcttc 900 accacagagg cacctagctg gacccagctg ggccgctttg tggcaaggag ggccttcgtg 960 gatgcaaaga cacctggaca ggagccagca gccgtgatca ggcaggcaca gaagctgggc 1020 gtgcggctga ccctgtgcat cggaggctat aggaacaatc aggccagcat cctggagcgg 1080 agacacgagc tgctgccact gggagaggga tggaattcca agccccagat cgtgcaggat 1140 gtggtggaca cagccatcgg ctaccgcgac gccctgaaca agtccctgta ttctttcttt 1200 aagggaggag gctccaaggg agcaggactg cctatccacg agtttggcaa ggcccagttc 1260 tacaggcgca ccgaggaggc catcctggat tccctggcca gactggactt ttctaatccc 1320 aggcctgtgc tgctggccct gcagaagaag ctggatacag aggtgagagg cctgttcgag 1380 gaggccgtga ggccatacct gaacgacccc aatctgatcc acaccatggc cgtgagccgg 1440 agaacactgt ataagaacct gaatgtgctg aagccacagc aggagggagg agtggacggc 1500 aagagaaact aa 1512 <210> 92 <211> 480 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(480) <223> Cse2 <400> 92 atggccaagg agacagattt catggacctg taccaggcct ggcagagact gccaaacgga 60 ccaaaggcag agctgaagag gtgcggcgat ctgggcgacc tgctggagac cagcgccttt 120 tacagactgc tggcaggaag gggagaggca gagtggcaga agaaggccta tcagcggatg 180 atcttctgcc tgccctgtat caatcacaca gagcagaaga tccctctggg agccgccctg 240 gcacggagca gaaagggcag ccggagcgcc gtgagcgagt ctaggatgat ccaggtggtg 300 cgctccgagg caccaaacga tatggtgcag ctgaggcgca tcctgaagca cgcagagcca 360 accgtgaact ggcctctgat ggccaagcag ctgtggtact gggacctgaa tgagaggagc 420 aagcggagcc tgctggagga tttctttctg aaccacaccg acacaagcaa ggagggataa 480 <210> 93 <211> 1095 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(1095) <223> Cas7 <400> 93 atgcagaact ttatcaatta ccacgtgctg atctctcaca gcccatcctg cctgaaccgc 60 gacgatatga atatgcagaa gagcgccatc ttcggaggcg tgcggagagt gcggatcagc 120 tcccagagcc tgaagcgggc catgagaaag tccgactact atgcccagca cctgggcgag 180 gcctctatca gaaccaagca cctgagcggc ctgagggata ggctgcacga gcgcctggca 240 ggccggttca gccccgaagt gatcgacaag acaatcaagc tgctgatcga caaggatgtg 300 agcgtggatg gaatcgtgga gggcgacgca gtggcaccat gggcagtgga ggagtttgca 360 tggttctgtg agagagtgat gaacgcacag gcagagggcc tggaggataa ggccctgacc 420 aagcagctga aggagtccat cgccgccatg agacagacac tggtgggcgg cctggatatc 480 gccctgtctg gcaggatggc caccagcggc ctgctgtccg agctgggcaa ggtggacggc 540 gccctggcag tggcacacgc cctgaccaca cacaccgtgg acgccgatat cgactggttt 600 acagccgtgg acgatctgca ggagctgggc tctggccacc tggacaccca ggagttttct 660 agcggcgtgt tctacagata tgccagcctg aacatcggac agctgcagga gaatctggga 720 ggagcaccaa gggagcaggc cctggagatc gcaacccacg tgctgcagat gctggccaca 780 gtggtgccct ccgccaagca gcagtctttc gccgcccaca atctggccga tctggccctg 840 gtgtcctttg ccgacatccc cgtgagcctg gcaaacgcct tcgagaagcc agtgcagcag 900 aagaatggct ctggctttcg ggagccaagc atcgccgccc tgcacgacta ctggcagaag 960 gtgcacatcg gctatggcct ggaggagaga tgcggccagt tcgtgctgaa caaggtggag 1020 acccctgcag gaatcgcagc aaaggagtcc ctggaggatc tgaagtcttg ggtgcgcaac 1080 aatggagagg gataa 1095 <210> 94 <211> 678 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(678) <223> Cas5 <400> 94 atgggcgact atctgatcct gaagctgcag ggacctatgc aggcctgggg agagcacagc 60 tttgagggaa cccgcccatc cggcaatttc cccacacggt ctgccctgct gggactgctg 120 ggagcatgtc tgggcatccg gcggaacgag tacgagaggc tgcagcagct ggccgatagc 180 gtgcagtttg ccgtgagaaa ggacgccagg cagacccaga cagagtgggg cgagccaaag 240 aagctgccca tggtgaagat gaccgattac cacacagtga aggacgccag acagtcttat 300 atcggcctga agagccacga gaccatccag acatggaggg agtacctgct ggacgccgag 360 tattctgtgg ccatctggga gaatgaggat gcagccgtga gcctggacga gctggagacc 420 gccgtgagga agcccgtgtt caccccatac ctgggcaggc gcagctgccc actggcacag 480 cctctgttcg gcaagcgcct gaccgcagag tccccaaacc aggccctgca ggcagtggag 540 ccttccggcg gcgtgatcta ttctgagcag ccctctgatc gcagcatgag gctgagggac 600 ctgcctatgg caggacagcc aaggcagttc gcatctcgga ccgtgtacat ccacggaggc 660 gatcacgtgt ccgagtaa 678 <210> 95 <211> 609 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(609) <223> Cas6 <400> 95 atgtacctga gcaaagtgat ggtgaccgga gcagcatgta ggaacccata tgagatccac 60 cggtccctgt ggcagctgtt ccccgaggac cccgacgcac ggagagatta tctgttccgg 120 gtggagagag caggcaggca gcaggcagag atcctgctgc agagccagcg gaagccaagc 180 gactccgagc tgcgcaaggt gcggctgctg gcaaccagag gataccagcc aaggctgcag 240 cagggacagc ggctgagatt tgccctgctg gccaaccctg tgaagacaat caatgatgag 300 aggggccgcc tgaacgcaaa gggacaggtg aagaagtgca gggtgccact gatcagggag 360 gaggagtgga gaagctggct ggagcacaag ctgatcggat gtgcagagct ggagaccctg 420 gtggcagaga acaggctgcc catcaacttc agaaagccaa aggagaagag ggtgggcaag 480 atccagcccg tgagcttcca gggcatcctg agagtgtcct ctccagaggc catgatgcag 540 gccatctcta ccggcatcgg accagcaaag gccttcggct gcggactgct gagcatcgca 600 ccagcataa 609 <210> 96 <211> 503 <212> PRT <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(503) <223> Cas8 <400> 96 Met Asn Leu Leu Thr Asp Pro Trp Ile Pro Ala Arg Pro Gln Gly Arg 1 5 10 15 Ala Thr Ala Gln Lys Leu Thr Leu Arg Gln Leu Leu Cys Glu Asp Glu 20 25 30 Arg Trp Glu Leu Arg Leu Pro Arg Asp Asp Met Glu Met Ala Thr Leu 35 40 45 Gln Leu Leu Ile Cys Leu Thr Gln Ala Leu Ala Thr Pro Ala Asp Leu 50 55 60 Pro Glu Leu Lys Arg Arg Ile Met Lys Pro Leu Gly Gln Gln Glu Phe 65 70 75 80 Asn Ala Ala Tyr Thr Pro Phe Ala Asp Trp Phe Arg Leu Asp His Pro 85 90 95 Gln Tyr Pro Phe Met Gln Val Arg Gly Val Lys Ala Lys Glu Pro Thr 100 105 110 Pro Met Asp Lys Leu Leu Ala Gly Leu Thr Gly Ala Thr Asn Ser Cys 115 120 125 Phe Val Asn Gln Ser Gly Leu Gly Glu Gly Leu Cys Pro Ala Cys Ala 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Met Asn Val Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ala Ser Leu Arg Gly Ser Ala Pro Val Thr Thr Leu Val 165 170 175 Gln Gly Glu His Leu Arg Gln Thr Ile Trp Leu Asn Val Leu Ser Thr 180 185 190 Glu Ser Val Glu Ala Leu Leu Pro Trp His Arg Gln Thr Glu Asp Gln 195 200 205 Lys Pro Thr Trp Ile Ala Pro Ile Lys Ser Glu Thr Phe Ser Ser Arg 210 215 220 Ser Ile Gly Phe Leu Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Leu Pro Ala Glu Ser Val Gly Asp Cys Ser Cys Cys Gly Gln Gly 245 250 255 Asp Thr Glu Val Tyr Arg Gly Phe Asn Lys Ala Lys Phe Asn Tyr Thr 260 265 270 Val Thr Gly Ile Trp Pro His Pro His Gly Ala Arg Thr Ser Thr Val 275 280 285 Lys Lys Gly Glu Gln Glu Glu Lys Phe Val Ser Phe Thr Thr Glu Ala 290 295 300 Pro Ser Trp Thr Gln Leu Gly Arg Phe Val Ala Arg Arg Ala Phe Val 305 310 315 320 Asp Ala Lys Thr Pro Gly Gln Glu Pro Ala Ala Val Ile Arg Gln Ala 325 330 335 Gln Lys Leu Gly Val Arg Leu Thr Leu Cys Ile Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Glu Leu Leu Pro Leu Gly 355 360 365 Glu Gly Trp Asn Ser Lys Pro Gln Ile Val Gln Asp Val Val Asp Thr 370 375 380 Ala Ile Gly Tyr Arg Asp Ala Leu Asn Lys Ser Leu Tyr Ser Phe Phe 385 390 395 400 Lys Gly Gly Gly Ser Lys Gly Ala Gly Leu Pro Ile His Glu Phe Gly 405 410 415 Lys Ala Gln Phe Tyr Arg Arg Thr Glu Glu Ala Ile Leu Asp Ser Leu 420 425 430 Ala Arg Leu Asp Phe Ser Asn Pro Arg Pro Val Leu Leu Ala Leu Gln 435 440 445 Lys Lys Leu Asp Thr Glu Val Arg Gly Leu Phe Glu Glu Ala Val Arg 450 455 460 Pro Tyr Leu Asn Asp Pro Asn Leu Ile His Thr Met Ala Val Ser Arg 465 470 475 480 Arg Thr Leu Tyr Lys Asn Leu Asn Val Leu Lys Pro Gln Gln Glu Gly 485 490 495 Gly Val Asp Gly Lys Arg Asn 500 <210> 97 <211> 159 <212> PRT <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(159) <223> Cse2 <400> 97 Met Ala Lys Glu Thr Asp Phe Met Asp Leu Tyr Gln Ala Trp Gln Arg 1 5 10 15 Leu Pro Asn Gly Pro Lys Ala Glu Leu Lys Arg Cys Gly Asp Leu Gly 20 25 30 Asp Leu Leu Glu Thr Ser Ala Phe Tyr Arg Leu Leu Ala Gly Arg Gly 35 40 45 Glu Ala Glu Trp Gln Lys Lys Ala Tyr Gln Arg Met Ile Phe Cys Leu 50 55 60 Pro Cys Ile Asn His Thr Glu Gln Lys Ile Pro Leu Gly Ala Ala Leu 65 70 75 80 Ala Arg Ser Arg Lys Gly Ser Arg Ser Ala Val Ser Glu Ser Arg Met 85 90 95 Ile Gln Val Val Arg Ser Glu Ala Pro Asn Asp Met Val Gln Leu Arg 100 105 110 Arg Ile Leu Lys His Ala Glu Pro Thr Val Asn Trp Pro Leu Met Ala 115 120 125 Lys Gln Leu Trp Tyr Trp Asp Leu Asn Glu Arg Ser Lys Arg Ser Leu 130 135 140 Leu Glu Asp Phe Phe Leu Asn His Thr Asp Thr Ser Lys Glu Gly 145 150 155 <210> 98 <211> 364 <212> PRT <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(364) <223> Cas7 <400> 98 Met Gln Asn Phe Ile Asn Tyr His Val Leu Ile Ser His Ser Pro Ser 1 5 10 15 Cys Leu Asn Arg Asp Asp Met Asn Met Gln Lys Ser Ala Ile Phe Gly 20 25 30 Gly Val Arg Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met 35 40 45 Arg Lys Ser Asp Tyr Tyr Ala Gln His Leu Gly Glu Ala Ser Ile Arg 50 55 60 Thr Lys His Leu Ser Gly Leu Arg Asp Arg Leu His Glu Arg Leu Ala 65 70 75 80 Gly Arg Phe Ser Pro Glu Val Ile Asp Lys Thr Ile Lys Leu Leu Ile 85 90 95 Asp Lys Asp Val Ser Val Asp Gly Ile Val Glu Gly Asp Ala Val Ala 100 105 110 Pro Trp Ala Val Glu Glu Phe Ala Trp Phe Cys Glu Arg Val Met Asn 115 120 125 Ala Gln Ala Glu Gly Leu Glu Asp Lys Ala Leu Thr Lys Gln Leu Lys 130 135 140 Glu Ser Ile Ala Ala Met Arg Gln Thr Leu Val Gly Gly Leu Asp Ile 145 150 155 160 Ala Leu Ser Gly Arg Met Ala Thr Ser Gly Leu Leu Ser Glu Leu Gly 165 170 175 Lys Val Asp Gly Ala Leu Ala Val Ala His Ala Leu Thr Thr His Thr 180 185 190 Val Asp Ala Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu 195 200 205 Leu Gly Ser Gly His Leu Asp Thr Gln Glu Phe Ser Ser Gly Val Phe 210 215 220 Tyr Arg Tyr Ala Ser Leu Asn Ile Gly Gln Leu Gln Glu Asn Leu Gly 225 230 235 240 Gly Ala Pro Arg Glu Gln Ala Leu Glu Ile Ala Thr His Val Leu Gln 245 250 255 Met Leu Ala Thr Val Val Pro Ser Ala Lys Gln Gln Ser Phe Ala Ala 260 265 270 His Asn Leu Ala Asp Leu Ala Leu Val Ser Phe Ala Asp Ile Pro Val 275 280 285 Ser Leu Ala Asn Ala Phe Glu Lys Pro Val Gln Gln Lys Asn Gly Ser 290 295 300 Gly Phe Arg Glu Pro Ser Ile Ala Ala Leu His Asp Tyr Trp Gln Lys 305 310 315 320 Val His Ile Gly Tyr Gly Leu Glu Glu Arg Cys Gly Gln Phe Val Leu 325 330 335 Asn Lys Val Glu Thr Pro Ala Gly Ile Ala Ala Lys Glu Ser Leu Glu 340 345 350 Asp Leu Lys Ser Trp Val Arg Asn Asn Gly Glu Gly 355 360 <210> 99 <211> 225 <212> PRT <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(225) <223> Cas5 <400> 99 Met Gly Asp Tyr Leu Ile Leu Lys Leu Gln Gly Pro Met Gln Ala Trp 1 5 10 15 Gly Glu His Ser Phe Glu Gly Thr Arg Pro Ser Gly Asn Phe Pro Thr 20 25 30 Arg Ser Ala Leu Leu Gly Leu Leu Gly Ala Cys Leu Gly Ile Arg Arg 35 40 45 Asn Glu Tyr Glu Arg Leu Gln Gln Leu Ala Asp Ser Val Gln Phe Ala 50 55 60 Val Arg Lys Asp Ala Arg Gln Thr Gln Thr Glu Trp Gly Glu Pro Lys 65 70 75 80 Lys Leu Pro Met Val Lys Met Thr Asp Tyr His Thr Val Lys Asp Ala 85 90 95 Arg Gln Ser Tyr Ile Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp 100 105 110 Arg Glu Tyr Leu Leu Asp Ala Glu Tyr Ser Val Ala Ile Trp Glu Asn 115 120 125 Glu Asp Ala Ala Val Ser Leu Asp Glu Leu Glu Thr Ala Val Arg Lys 130 135 140 Pro Val Phe Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro Leu Ala Gln 145 150 155 160 Pro Leu Phe Gly Lys Arg Leu Thr Ala Glu Ser Pro Asn Gln Ala Leu 165 170 175 Gln Ala Val Glu Pro Ser Gly Gly Val Ile Tyr Ser Glu Gln Pro Ser 180 185 190 Asp Arg Ser Met Arg Leu Arg Asp Leu Pro Met Ala Gly Gln Pro Arg 195 200 205 Gln Phe Ala Ser Arg Thr Val Tyr Ile His Gly Gly Asp His Val Ser 210 215 220 Glu 225 <210> 100 <211> 202 <212> PRT <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(202) <223> Cas6 <400> 100 Met Tyr Leu Ser Lys Val Met Val Thr Gly Ala Ala Cys Arg Asn Pro 1 5 10 15 Tyr Glu Ile His Arg Ser Leu Trp Gln Leu Phe Pro Glu Asp Pro Asp 20 25 30 Ala Arg Arg Asp Tyr Leu Phe Arg Val Glu Arg Ala Gly Arg Gln Gln 35 40 45 Ala Glu Ile Leu Leu Gln Ser Gln Arg Lys Pro Ser Asp Ser Glu Leu 50 55 60 Arg Lys Val Arg Leu Leu Ala Thr Arg Gly Tyr Gln Pro Arg Leu Gln 65 70 75 80 Gln Gly Gln Arg Leu Arg Phe Ala Leu Leu Ala Asn Pro Val Lys Thr 85 90 95 Ile Asn Asp Glu Arg Gly Arg Leu Asn Ala Lys Gly Gln Val Lys Lys 100 105 110 Cys Arg Val Pro Leu Ile Arg Glu Glu Glu Trp Arg Ser Trp Leu Glu 115 120 125 His Lys Leu Ile Gly Cys Ala Glu Leu Glu Thr Leu Val Ala Glu Asn 130 135 140 Arg Leu Pro Ile Asn Phe Arg Lys Pro Lys Glu Lys Arg Val Gly Lys 145 150 155 160 Ile Gln Pro Val Ser Phe Gln Gly Ile Leu Arg Val Ser Ser Pro Glu 165 170 175 Ala Met Met Gln Ala Ile Ser Thr Gly Ile Gly Pro Ala Lys Ala Phe 180 185 190 Gly Cys Gly Leu Leu Ser Ile Ala Pro Ala 195 200 <210> 101 <211> 90 <212> DNA <213> Geothermobacter sp. EPR-M <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 101 ctgttccccg cacccgcggg gatgaaccgg tcatctattt ttaatggacg atatttttca 60 actgttcccc gcacccgcgg ggatgaaccg 90 <210> 102 <211> 1509 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(1509) <223> Cas8 <400> 102 atgaatctgc ttgaagaccc ttggattccc gtgcgtgccg atggcggtac gggcgctttc 60 caactgctga cctatcggca gctactttgc gaacccggca actggcaggt gagcttgccg 120 cgtgacgatc tggagctggc ctgtgtgcaa ttgctggtgt gcatgactca ggtgatgttc 180 ttgccggaaa acgacgctgt ttggcggaag cggttgactg aagctttgac gcgtgaagag 240 ttcaccgccg gcacagaacc gtgcctggat tggttcgatc tcgaccaccc gacccagcct 300 ttcatgcaat cacgaggagt gagggccgcc gaggacacgc ccattcagaa gctgctgatt 360 ggcctgccgg aaggaaacaa ccacgctttc ttcaacgagg cgggcgaagt gcgccaccta 420 tcggtaacag tggcagcaat tgccctgttc aatcaggcta ctaattgccc cagtttcggc 480 ggcggcttca agggcagcct acgtggaggc gcgccaatca ccacactggt gaatggcgag 540 aatttgcgcg aaaccgtctg gtgtaatgta ctcacacgct cccgtttggc tgcgcgccag 600 atcgccatgc ccggattgga tcgggaccgt ccaacctggg tcgagcctat ccaggaaaaa 660 gccaccattc cctggaacac catcggtttg gcgcgaggct tgttttggca gccggcgcgg 720 gtggaactgg tgaggtccat ggccgctgca ccttgcgatg tgatgggcgg cgcgcccaca 780 ttgggatacg tgggatttcg caaggagaaa ttcaacttta ccgtggaggg agtgtggccc 840 caccctcatg gcgcaataac catgaccttg aaaaaaggcg cgcttgaaca aaagttcgcc 900 agcttcacga ccaccgcgcc ggcatggacc cagctctccg aattcgtcgt gcccaaaggc 960 gtcaatgatc ccggagccaa agagggctcc attcccgcag gaccggttac acaagccagc 1020 gagctaggcg aaagcggttt acacctgctc gttggcggct atcgcaccaa tcaagcttcc 1080 gtgttggaac ggcgccacga aatgatgagc ctggcccgag gctggcggga tgacaaaagc 1140 cgcctgccca aattggtcga aatgggcaaa gaggcaaaaa aagccttgcg cggcaagctc 1200 tatttcgccg ttcagggcaa taaagacaaa gggcttaaag gtattggcgc ggccatccac 1260 gaaaccgccg agaaactgtt ttacgcccga accgaaagtc tgatccacga aaccttttcc 1320 aatgaactca cgttcaagca gtgggccacc gcccgcaagg cttttgtcca ggaattggcc 1380 ggccattgcc gcgcaatttt tgaggagctg actgcacctt atgcgatgaa accggagttg 1440 attccggtta tcgcctgggc gcggcgcagc ctgaatttcg atcttaccaa gctgatggag 1500 gatgcatga 1509 <210> 103 <211> 456 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(456) <223> Cse2 <400> 103 atgactgccg aattgccgga ttttgtcgcg ctgaaaatgc actacgacga cgagagcttt 60 ccgaccggcg cacgtgccga gctgcgccgt gctgccgaac cggatgatgt ggcgttgacc 120 ccggcgctct accgcttatt ccccggcgag cggccgagcg accgccactt acgtgtcgcc 180 tatctcctgc cctatgccaa acacgcggct aaagccaagt cgttgggtgc gcaactggcg 240 gaagccaagg tggcggaagc acgggttctg caagtggccc gcgctcatga accgctcgat 300 gtggtccagt tacgtcgcct cttgatgcag gttgaagccg cagtggactg gtcggcgttc 360 ggcccgatgg tgtggttttg gaacgaacga gccaaacgtc agctcatcga ggatttctat 420 atcgcccgtt tttcccccgt cacaggagct aaataa 456 <210> 104 <211> 1137 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(1137) <223> Cas7 <400> 104 atgaccaaga agaacttcat caacttccat gtactcattt cccacagccc ctcctgtctc 60 aaccgggacg atatgaacat gcagaaaacc gccgtatttg gtggcgtcaa ccgggtgcgg 120 atttccagcc aatctctgaa gcgggcgata cgcaagagcg attactacca agccaatttg 180 ggcgcaccat cggtgcgcac ccgcgatttg aacaaactca aagcgcgttt caccgaactg 240 ctcaaagacc gctttgacgc cgaattgatt aaccgcgcgc tggagtggat ttccggcaag 300 gaaggtatcg ccgaaggcgt aacggccgac gccgttgcgc cctggtcggt ggatgaagta 360 acgcacttct gcgaaatcat tagcgccgac gaccagcaag atatcaagaa actggaaaag 420 cagattgaaa aagaggcgcg tcctttccgg gcggctatga gcaacaccgt ggacatcgcc 480 ttgtccggtc gtatggcgac cagtggattg atgagcaacc tgcccgtgga tggcgcgctc 540 gccgtcgctc acgccattac cacccatgcc gtcgagccgc aggacgtgga ctggttcacc 600 gccgtcgacg atttgaccca ggacgcgggc gatacgggag cgggacatct ggatacccag 660 cagttttcct ccggcgtgtt ctaccgttac gccagtctca acctgagaca actgcaagtg 720 aacctgggat tgatcgacca catcaaggcg gaggaaaccg ccgagtcccg ccaacgtgcg 780 ctggacatcg cccatcatgt attccattta ctggcgacgg tggtgccttc ggccaagcaa 840 cagtctttcg ccgctcacaa cttggcggac ttcgccatcg tcagcttcgc cgaccagccg 900 atttcgttag ccaatgcatt cgaagaaccg gtcagacgcg attacaaact ggcgggattc 960 ctcaaaccat ccattcagtg tttggccaat tactggggac gcatgaatcg cgcctacggt 1020 ctggacgaac aggcgcgcgc tttcgcggtc gatgcgagct tcgagatggg cggcaagcct 1080 cccctggact ccctgaaagc ggtggaagac tggatcgccg aggatggtca ggaataa 1137 <210> 105 <211> 681 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(681) <223> Cas5 <400> 105 atgccgcgtt atttgattct cctcctggac ggtcccatgc aagcgtgggg cacgcacacg 60 ttcgaagatt ttcgcccttg caatgcgttt ccgactcgca gcggtttgct cggactgcta 120 ggtgcctgcc tggggttgga ccggcgcgat accgaagcat tggagcaatt ggcgatgagc 180 gtcgagttcg ccgtacgcgc cgacagagag gtgttgcggc cggaagcgga agtacccaag 240 gcaaaagccg ctgtaaagct tcccgacttc cacacggtgg aggatgctcg caaggtagac 300 ggttccgcca acaagaaccc ggtggtttct cggcgcgaat acctgttcga tgccgctttc 360 accgtggcga tcggcgcaaa gcccgacggg ccggttacgc tggatgcaat tgccgaagct 420 ttgcggcgcc cgtgttttac gcctgtgctg ggacggcgtt cctgtcccat cgcccggcct 480 ttgctcgatg gcgaggccgt ggaggcgagc gatgcgaagg cggcactggc aaccatcgca 540 cctgtaggtg gcatgatcta taccgaaggc gaattgatct ccgcacaacc cttgcgggtc 600 cgcgacgtac ccatacaggg ccggcaccgg caattcagca ctcgactggt gtatctccat 660 aagggggaaa catgttcctg a 681 <210> 106 <211> 627 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(627) <223> Cas6 <400> 106 atgttcctga gccgtgtcga gattccttgg gatgcagtcc gcaaccctta cgaaattcat 60 cgccagcttt ggcggctgtt tcccggagag gacaaagaac cccggaagaa tgccgaggaa 120 ggacgccaag ggttcctgtt cagggtggaa aacaatcagc ctggccgccc gctgcgtttg 180 ttgattcagt ctcggcgagc gccagagcct acggctggat tgacgattgt aggtacgcgc 240 gaattccaac cccagccagc tcacgggcag cgcttggcat ttctactcac ctcaaatccg 300 gtcaaaacca ttatcgatgc acagcgagaa accaagtcgg gcaaaagctc cgaaaagtgc 360 cgtgtgccgt tgattcacga atccgaacag cgcgaatggt taaagcgcaa actcatcggt 420 gcgggagaat ttgaaggtgt caatgtggtg cctcacgccc cggtgttctt tcggaaaggc 480 aatcggggcg gcaagatagt catggtgact ttcgaaggcg tattgcgtgt aaacgagcca 540 ggaacgttga tcgcctattt ggaaaacggc atcggccccg ccaaagcctt cggttgcggt 600 ttgctgttag tacggcgctt gggataa 627 <210> 107 <211> 1509 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(1509) <223> Cas8 <400> 107 atgaatctgc tggaggaccc ttggattccc gtgcgggcag atggaggaac cggagcattc 60 cagctgctga catacaggca gctgctgtgc gagccaggaa actggcaggt gagcctgcca 120 agggacgatc tggagctggc ctgcgtgcag ctgctggtgt gcatgaccca ggtcatgttt 180 ctgcctgaga atgacgccgt gtggaggaag cgcctgaccg aggccctgac aagagaggag 240 ttcacagccg gcaccgagcc atgtctggac tggtttgacc tggatcaccc cacccagcct 300 ttcatgcagt ctaggggcgt gcgcgcagca gaggatacac caatccagaa gctgctgatc 360 ggcctgcctg agggcaacaa tcacgccttc tttaatgagg caggagaggt gcggcacctg 420 agcgtgaccg tggccgccat cgccctgttc aaccaggcca caaattgccc ttcctttggc 480 ggaggcttca agggctctct gaggggagga gcaccaatca ccacactggt caacggcgag 540 aatctgcggg agaccgtgtg gtgtaacgtg ctgacacggt ccagactggc agcaaggcag 600 atcgcaatgc caggcctgga cagggatagg cctacctggg tggagccaat ccaggagaag 660 gccaccatcc cctggaatac aatcggactg gcaaggggac tgttttggca gcctgcccgg 720 gtggagctgg tgagaagcat ggcagcagca ccttgcgacg tgatgggagg agcaccaacc 780 ctgggatatg tgggcttcag aaaggagaag tttaacttca cagtggaggg cgtgtggcca 840 cacccacacg gagccatcac aatgaccctg aagaagggcg ccctggagca gaagtttgcc 900 agcttcacca caaccgcacc tgcatggacc cagctgtccg agttcgtggt gccaaaggga 960 gtgaacgatc caggagcaaa ggagggctcc atcccagcag gaccagtgac ccaggcctcc 1020 gagctgggag agtctggcct gcacctgctg gtgggaggat acaggacaaa tcaggccagc 1080 gtgctggagc ggagacacga gatgatgtcc ctggcccggg gctggagaga cgataagagc 1140 cggctgccaa agctggtgga gatgggcaag gaggccaaga aggccctgag gggcaagctg 1200 tattttgccg tgcagggcaa caaggacaag ggcctgaagg gaatcggagc agcaatccac 1260 gagaccgccg agaagctgtt ctacgccaga acagagtctc tgatccacga gaccttcagc 1320 aatgagctga ccttcaagca gtgggccaca gccagaaagg cctttgtgca ggagctggca 1380 ggacactgta gggcaatctt cgaggagctg accgccccct acgccatgaa gcctgagctg 1440 atcccagtga tcgcatgggc aaggcgcagc ctgaacttcg acctgacaaa gctgatggag 1500 gatgcctaa 1509 <210> 108 <211> 456 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(456) <223> Cse2 <400> 108 atgacagcag agctgccaga ttttgtggcc ctgaagatgc actatgacga tgagtccttc 60 cccaccggag caagggcaga gctgaggcgc gcagccgagc ctgacgatgt ggccctgaca 120 ccagccctgt acaggctgtt tcctggagag aggccatctg acaggcacct gcgcgtggca 180 tacctgctgc cctatgccaa gcacgccgcc aaggccaaga gcctgggagc acagctggca 240 gaggcaaagg tggccgaggc ccgggtgctg caggtggcca gagcacacga gcccctggac 300 gtggtgcagc tgcggagact gctgatgcag gtggaggcag cagtggattg gtccgccttt 360 ggccctatgg tgtggttctg gaacgagcgg gccaagagac agctgatcga ggacttttat 420 atcgcccgct tctctccagt gaccggagca aagtaa 456 <210> 109 <211> 1137 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(1137) <223> Cas7 <400> 109 atgaccaaga agaactttat caatttccac gtgctgatca gccactcccc ttcttgcctg 60 aacagagacg atatgaatat gcagaagaca gccgtgttcg gcggcgtgaa tcgggtgaga 120 atcagctccc agtccctgaa gcgggccatc agaaagtctg actactatca ggccaacctg 180 ggagcaccaa gcgtgaggac ccgcgatctg aataagctga aggcccggtt tacagagctg 240 ctgaaggaca gattcgatgc cgagctgatc aacagggccc tggagtggat ctccggcaag 300 gagggcatcg cagagggagt gaccgcagac gcagtggccc catggtctgt ggatgaggtg 360 acacactttt gtgagatcat cagcgccgac gatcagcagg acatcaagaa gctggagaag 420 cagatcgaga aggaggcaag gcccttccgc gcagcaatga gcaacaccgt ggacatcgcc 480 ctgtccggca ggatggccac atctggcctg atgagcaatc tgccagtgga tggcgccctg 540 gcagtggcac acgcaatcac cacacacgcc gtggagcctc aggacgtgga ttggttcacc 600 gccgtggacg atctgacaca ggacgcaggc gataccggag caggacacct ggatacccag 660 cagttttcta gcggcgtgtt ctacagatat gcctccctga acctgcgcca gctgcaagtg 720 aatctgggcc tgatcgacca catcaaggca gaggagaccg cagagtctcg gcagagagcc 780 ctggatatcg cccaccacgt gtttcacctg ctggccacag tggtgccttc cgccaagcag 840 cagtctttcg ccgcccacaa cctggccgac tttgccatcg tgagcttcgc cgatcagcca 900 atctccctgg ccaatgcctt tgaggagccc gtgcggagag actacaagct ggccggcttc 960 ctgaagccat ccatccagtg cctggccaac tactggggcc ggatgaatag agcatatggc 1020 ctggacgagc aggcaagggc ctttgccgtg gatgccagct tcgagatggg cggcaagccc 1080 cctctggatt ccctgaaggc cgtggaggac tggatcgccg aggatggaca ggagtaa 1137 <210> 110 <211> 681 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(681) <223> Cas5 <400> 110 atgcctcggt acctgatcct gctgctggac ggaccaatgc aggcctgggg aacacacacc 60 tttgaggatt tcagaccctg caacgccttc cctaccagga gcggcctgct gggactgctg 120 ggagcctgtc tgggcctgga caggcgcgat acagaggccc tggagcagct ggccatgtcc 180 gtggagtttg ccgtgagggc agacagggag gtgctgaggc cagaggcaga ggtgccaaag 240 gcaaaggcag cagtgaagct gccagatttc cacaccgtgg aggacgcccg caaggtggat 300 ggctctgcca acaagaatcc cgtggtgagc cggagagagt atctgtttga cgcagccttc 360 accgtggcaa tcggagcaaa gcctgacgga ccagtgacac tggatgcaat cgcagaggcc 420 ctgaggcgcc cctgctttac ccctgtgctg ggccggagat cttgtccaat cgccagacca 480 ctgctggacg gagaggcagt ggaggccagc gatgccaagg ccgccctggc aaccatcgca 540 ccagtgggcg gcatgatcta tacagaggga gagctgatct ccgcccagcc actgagggtg 600 cgcgacgtgc ctatccaggg ccggcacaga cagttctcta cccgcctggt gtacctgcac 660 aagggcgaga catgcagcta a 681 <210> 111 <211> 627 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(627) <223> Cas6 <400> 111 atgtttctgt cccgcgtgga gatcccatgg gacgccgtgc ggaaccccta cgagatccac 60 aggcagctgt ggaggctgtt cccaggagag gataaggagc ctcgcaagaa tgccgaggag 120 ggcaggcagg gcttcctgtt tcgcgtggag aacaatcagc ccggccggcc tctgagactg 180 ctgatccaga gcaggagggc ccctgagcca acagcaggac tgaccatcgt gggcacaaga 240 gagtttcagc cacagcctgc acacggacag aggctggcct tcctgctgac atctaaccct 300 gtgaagacca tcatcgacgc ccagcgcgag accaagagcg gcaagtcctc tgagaagtgc 360 cgggtgccac tgatccacga gtccgagcag agggagtggc tgaagaggaa gctgatcgga 420 gcaggagagt tcgagggagt gaacgtggtg ccacacgcac ccgtgttctt tcggaagggc 480 aatagaggcg gcaagatcgt gatggtgacc tttgagggcg tgctgagggt gaacgagcca 540 ggcacactga tcgcctatct ggagaatggc atcggaccag caaaggcctt cggctgcgga 600 ctgctgctgg tgcggagact gggataa 627 <210> 112 <211> 502 <212> PRT <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(502) <223> Cas8 <400> 112 Met Asn Leu Leu Glu Asp Pro Trp Ile Pro Val Arg Ala Asp Gly Gly 1 5 10 15 Thr Gly Ala Phe Gln Leu Leu Thr Tyr Arg Gln Leu Leu Cys Glu Pro 20 25 30 Gly Asn Trp Gln Val Ser Leu Pro Arg Asp Asp Leu Glu Leu Ala Cys 35 40 45 Val Gln Leu Leu Val Cys Met Thr Gln Val Met Phe Leu Pro Glu Asn 50 55 60 Asp Ala Val Trp Arg Lys Arg Leu Thr Glu Ala Leu Thr Arg Glu Glu 65 70 75 80 Phe Thr Ala Gly Thr Glu Pro Cys Leu Asp Trp Phe Asp Leu Asp His 85 90 95 Pro Thr Gln Pro Phe Met Gln Ser Arg Gly Val Arg Ala Ala Glu Asp 100 105 110 Thr Pro Ile Gln Lys Leu Leu Ile Gly Leu Pro Glu Gly Asn Asn His 115 120 125 Ala Phe Phe Asn Glu Ala Gly Glu Val Arg His Leu Ser Val Thr Val 130 135 140 Ala Ala Ile Ala Leu Phe Asn Gln Ala Thr Asn Cys Pro Ser Phe Gly 145 150 155 160 Gly Gly Phe Lys Gly Ser Leu Arg Gly Gly Ala Pro Ile Thr Thr Leu 165 170 175 Val Asn Gly Glu Asn Leu Arg Glu Thr Val Trp Cys Asn Val Leu Thr 180 185 190 Arg Ser Arg Leu Ala Ala Arg Gln Ile Ala Met Pro Gly Leu Asp Arg 195 200 205 Asp Arg Pro Thr Trp Val Glu Pro Ile Gln Glu Lys Ala Thr Ile Pro 210 215 220 Trp Asn Thr Ile Gly Leu Ala Arg Gly Leu Phe Trp Gln Pro Ala Arg 225 230 235 240 Val Glu Leu Val Arg Ser Met Ala Ala Ala Pro Cys Asp Val Met Gly 245 250 255 Gly Ala Pro Thr Leu Gly Tyr Val Gly Phe Arg Lys Glu Lys Phe Asn 260 265 270 Phe Thr Val Glu Gly Val Trp Pro His Pro His Gly Ala Ile Thr Met 275 280 285 Thr Leu Lys Lys Gly Ala Leu Glu Gln Lys Phe Ala Ser Phe Thr Thr 290 295 300 Thr Ala Pro Ala Trp Thr Gln Leu Ser Glu Phe Val Val Pro Lys Gly 305 310 315 320 Val Asn Asp Pro Gly Ala Lys Glu Gly Ser Ile Pro Ala Gly Pro Val 325 330 335 Thr Gln Ala Ser Glu Leu Gly Glu Ser Gly Leu His Leu Leu Val Gly 340 345 350 Gly Tyr Arg Thr Asn Gln Ala Ser Val Leu Glu Arg Arg His Glu Met 355 360 365 Met Ser Leu Ala Arg Gly Trp Arg Asp Asp Lys Ser Arg Leu Pro Lys 370 375 380 Leu Val Glu Met Gly Lys Glu Ala Lys Lys Ala Leu Arg Gly Lys Leu 385 390 395 400 Tyr Phe Ala Val Gln Gly Asn Lys Asp Lys Gly Leu Lys Gly Ile Gly 405 410 415 Ala Ala Ile His Glu Thr Ala Glu Lys Leu Phe Tyr Ala Arg Thr Glu 420 425 430 Ser Leu Ile His Glu Thr Phe Ser Asn Glu Leu Thr Phe Lys Gln Trp 435 440 445 Ala Thr Ala Arg Lys Ala Phe Val Gln Glu Leu Ala Gly His Cys Arg 450 455 460 Ala Ile Phe Glu Glu Leu Thr Ala Pro Tyr Ala Met Lys Pro Glu Leu 465 470 475 480 Ile Pro Val Ile Ala Trp Ala Arg Arg Ser Leu Asn Phe Asp Leu Thr 485 490 495 Lys Leu Met Glu Asp Ala 500 <210> 113 <211> 151 <212> PRT <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(151) <223> Cse2 <400> 113 Met Thr Ala Glu Leu Pro Asp Phe Val Ala Leu Lys Met His Tyr Asp 1 5 10 15 Asp Glu Ser Phe Pro Thr Gly Ala Arg Ala Glu Leu Arg Arg Ala Ala 20 25 30 Glu Pro Asp Asp Val Ala Leu Thr Pro Ala Leu Tyr Arg Leu Phe Pro 35 40 45 Gly Glu Arg Pro Ser Asp Arg His Leu Arg Val Ala Tyr Leu Leu Pro 50 55 60 Tyr Ala Lys His Ala Ala Lys Ala Lys Ser Leu Gly Ala Gln Leu Ala 65 70 75 80 Glu Ala Lys Val Ala Glu Ala Arg Val Leu Gln Val Ala Arg Ala His 85 90 95 Glu Pro Leu Asp Val Val Gln Leu Arg Arg Leu Leu Met Gln Val Glu 100 105 110 Ala Ala Val Asp Trp Ser Ala Phe Gly Pro Met Val Trp Phe Trp Asn 115 120 125 Glu Arg Ala Lys Arg Gln Leu Ile Glu Asp Phe Tyr Ile Ala Arg Phe 130 135 140 Ser Pro Val Thr Gly Ala Lys 145 150 <210> 114 <211> 378 <212> PRT <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(378) <223> Cas7 <400> 114 Met Thr Lys Lys Asn Phe Ile Asn Phe His Val Leu Ile Ser His Ser 1 5 10 15 Pro Ser Cys Leu Asn Arg Asp Asp Met Asn Met Gln Lys Thr Ala Val 20 25 30 Phe Gly Gly Val Asn Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg 35 40 45 Ala Ile Arg Lys Ser Asp Tyr Tyr Gln Ala Asn Leu Gly Ala Pro Ser 50 55 60 Val Arg Thr Arg Asp Leu Asn Lys Leu Lys Ala Arg Phe Thr Glu Leu 65 70 75 80 Leu Lys Asp Arg Phe Asp Ala Glu Leu Ile Asn Arg Ala Leu Glu Trp 85 90 95 Ile Ser Gly Lys Glu Gly Ile Ala Glu Gly Val Thr Ala Asp Ala Val 100 105 110 Ala Pro Trp Ser Val Asp Glu Val Thr His Phe Cys Glu Ile Ile Ser 115 120 125 Ala Asp Asp Gln Gln Asp Ile Lys Lys Leu Glu Lys Gln Ile Glu Lys 130 135 140 Glu Ala Arg Pro Phe Arg Ala Ala Met Ser Asn Thr Val Asp Ile Ala 145 150 155 160 Leu Ser Gly Arg Met Ala Thr Ser Gly Leu Met Ser Asn Leu Pro Val 165 170 175 Asp Gly Ala Leu Ala Val Ala His Ala Ile Thr Thr His Ala Val Glu 180 185 190 Pro Gln Asp Val Asp Trp Phe Thr Ala Val Asp Asp Leu Thr Gln Asp 195 200 205 Ala Gly Asp Thr Gly Ala Gly His Leu Asp Thr Gln Gln Phe Ser Ser 210 215 220 Gly Val Phe Tyr Arg Tyr Ala Ser Leu Asn Leu Arg Gln Leu Gln Val 225 230 235 240 Asn Leu Gly Leu Ile Asp His Ile Lys Ala Glu Glu Thr Ala Glu Ser 245 250 255 Arg Gln Arg Ala Leu Asp Ile Ala His His Val Phe His Leu Leu Ala 260 265 270 Thr Val Val Pro Ser Ala Lys Gln Gln Ser Phe Ala Ala His Asn Leu 275 280 285 Ala Asp Phe Ala Ile Val Ser Phe Ala Asp Gln Pro Ile Ser Leu Ala 290 295 300 Asn Ala Phe Glu Glu Pro Val Arg Arg Asp Tyr Lys Leu Ala Gly Phe 305 310 315 320 Leu Lys Pro Ser Ile Gln Cys Leu Ala Asn Tyr Trp Gly Arg Met Asn 325 330 335 Arg Ala Tyr Gly Leu Asp Glu Gln Ala Arg Ala Phe Ala Val Asp Ala 340 345 350 Ser Phe Glu Met Gly Gly Lys Pro Pro Leu Asp Ser Leu Lys Ala Val 355 360 365 Glu Asp Trp Ile Ala Glu Asp Gly Gln Glu 370 375 <210> 115 <211> 226 <212> PRT <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(226) <223> Cas5 <400> 115 Met Pro Arg Tyr Leu Ile Leu Leu Leu Asp Gly Pro Met Gln Ala Trp 1 5 10 15 Gly Thr His Thr Phe Glu Asp Phe Arg Pro Cys Asn Ala Phe Pro Thr 20 25 30 Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu Gly Leu Asp Arg 35 40 45 Arg Asp Thr Glu Ala Leu Glu Gln Leu Ala Met Ser Val Glu Phe Ala 50 55 60 Val Arg Ala Asp Arg Glu Val Leu Arg Pro Glu Ala Glu Val Pro Lys 65 70 75 80 Ala Lys Ala Ala Val Lys Leu Pro Asp Phe His Thr Val Glu Asp Ala 85 90 95 Arg Lys Val Asp Gly Ser Ala Asn Lys Asn Pro Val Val Ser Arg Arg 100 105 110 Glu Tyr Leu Phe Asp Ala Ala Phe Thr Val Ala Ile Gly Ala Lys Pro 115 120 125 Asp Gly Pro Val Thr Leu Asp Ala Ile Ala Glu Ala Leu Arg Arg Pro 130 135 140 Cys Phe Thr Pro Val Leu Gly Arg Arg Ser Cys Pro Ile Ala Arg Pro 145 150 155 160 Leu Leu Asp Gly Glu Ala Val Glu Ala Ser Asp Ala Lys Ala Ala Leu 165 170 175 Ala Thr Ile Ala Pro Val Gly Gly Met Ile Tyr Thr Glu Gly Glu Leu 180 185 190 Ile Ser Ala Gln Pro Leu Arg Val Arg Asp Val Pro Ile Gln Gly Arg 195 200 205 His Arg Gln Phe Ser Thr Arg Leu Val Tyr Leu His Lys Gly Glu Thr 210 215 220 Cys Ser 225 <210> 116 <211> 208 <212> PRT <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(208) <223> Cas6 <400> 116 Met Phe Leu Ser Arg Val Glu Ile Pro Trp Asp Ala Val Arg Asn Pro 1 5 10 15 Tyr Glu Ile His Arg Gln Leu Trp Arg Leu Phe Pro Gly Glu Asp Lys 20 25 30 Glu Pro Arg Lys Asn Ala Glu Glu Gly Arg Gln Gly Phe Leu Phe Arg 35 40 45 Val Glu Asn Asn Gln Pro Gly Arg Pro Leu Arg Leu Leu Ile Gln Ser 50 55 60 Arg Arg Ala Pro Glu Pro Thr Ala Gly Leu Thr Ile Val Gly Thr Arg 65 70 75 80 Glu Phe Gln Pro Gln Pro Ala His Gly Gln Arg Leu Ala Phe Leu Leu 85 90 95 Thr Ser Asn Pro Val Lys Thr Ile Ile Asp Ala Gln Arg Glu Thr Lys 100 105 110 Ser Gly Lys Ser Ser Glu Lys Cys Arg Val Pro Leu Ile His Glu Ser 115 120 125 Glu Gln Arg Glu Trp Leu Lys Arg Lys Leu Ile Gly Ala Gly Glu Phe 130 135 140 Glu Gly Val Asn Val Val Pro His Ala Pro Val Phe Phe Arg Lys Gly 145 150 155 160 Asn Arg Gly Gly Lys Ile Val Met Val Thr Phe Glu Gly Val Leu Arg 165 170 175 Val Asn Glu Pro Gly Thr Leu Ile Ala Tyr Leu Glu Asn Gly Ile Gly 180 185 190 Pro Ala Lys Ala Phe Gly Cys Gly Leu Leu Leu Val Arg Arg Leu Gly 195 200 205 <210> 117 <211> 90 <212> DNA <213> Methylocaldum sp. 14B <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 117 ctgttcccca cgtacgtggg gatgaaccga cggcgtaatg gtaattgtta gccgacaagt 60 tctgttcccc acgtacgtgg ggatgaaccg 90 <210> 118 <211> 1632 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(1632) <223> Cas8 <400> 118 ttgaaaaatc gagtgaaaag aggtgaacat ttggtctcat ataacttgtt aacagaaccg 60 tggatcacat ccatcgacct gtccggaaac ccggtgcagg agggaatact ggcgactttg 120 aaaaacgcac ataagatcga cagtattttt gatccggctc ctccggtaga attcggaata 180 taccgcctgc tgatcgcttt tataacagat gtcttccagc ctcagggact ggaggatctg 240 gccgatctcc tcgaccgtaa gcggttagac cccacagcgc tggacgaata tgccgccagg 300 tggagagacc ggtttgatct gttcgacgaa aaatacccgt tcttacagca ggcaataacg 360 ggggtaataa agaaacctcc cgagccgatc tccaggttga tgcagcatct gccggcaggc 420 actaacgtct cccattttca ccatggacgc tgggatgaga actccttctc tttcgagcag 480 tgcgccaaag ggctggtgac tatagccccg ttcatgacag ccggcggcgc tggcctgtcc 540 ccaagcatta acggcagccc accttggtac gttcttgtaa aaggcaacaa cctgttcgag 600 actctcctct acaacgtctg ccagatacca atgactgtca aacctatcgg agattcacct 660 gtagcctgga ggaacgacaa acgaatcgat cccggcgatg aacctaaaac cttttccatc 720 gtcgaaggtc tgacctggag gcccaggatc attcagctta tcccgggaaa cggcaagggc 780 acatgcacgt atactggaga aaaagacgtt gacacggtca gccacatgca ttattacccg 840 ggacaaaaat cgcccgagcc aggcctgtgg gtcgatcctc aggtagcata taaaaagact 900 aaggatgcca tcaggccgct caggccggac gagaacaagg cgctgtggcg agacattggg 960 ccgttgatgc tcctgcaaca cggggactac tcgggcaaag acggaaaagt aagcttcgat 1020 cggccggcgg tagttactca gtacaaacag atggtcagca atggtatgat caaacgcagc 1080 gagcctttaa gactggaagt ttatggtatc cgcacagatg gaaaaatgaa gatttacgaa 1140 tggtaccatg aaaaactagc tcttcccata gaaatcttga aaaaggcaaa ctccggccga 1200 caaatacagg acgcgatgga cctcgcagat agcgtagctt acatactccg gaaagccatg 1260 aaaaaagcct acccgagaaa tgcaaaatct aacgagagtg gattcgacaa tctcattctg 1320 agcgttcagt cttcctactg gagccatctg aaaggccagt tcgaaagcat tttcttaaaa 1380 acgctgtctc aacaggacga aaatgatctc gacgcataca ctaagctcat ggaacagtgg 1440 aagaaaatac tggacgatac tggaaagaac gcgctcgata aaggcctcgg accgctggat 1500 actgacggcg attcgctacg ccgccaggtc aaggcgatga acgagtacag ttcaggcatc 1560 agatttgcgc tgtaccctga ttccatacag gcgaagaaaa agaatcgaca gaaaaataag 1620 gaggataaat ga 1632 <210> 119 <211> 591 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(591) <223> Cse2 <400> 119 atgaccgctc ccaacgaaaa caaagagcac cagaagagta aaaaggatga ggagttcctg 60 gcgaacttag caaagatggc cgaatccgat cgtggcggta tggccatcct gaagcgaaac 120 gccggcaaca cgatagcaga gtctcgcggc gcgatgaaaa ctttctatag cctgctacct 180 tacggcattt cagattcccc ctacgaggag atctacttcc tgatagccac tctgtacggg 240 cataataagt accgatttac aggggacttc ggacagacga tgaagcttgt aagagagagc 300 tcaaactcgg aaagcatcga ccagagagtg tcaactctgc tcgacagcga gttcaacatc 360 gtcgacggga taaaacccgg cgggggagaa ctcgcctatc ggctgcggca atgcgtgaaa 420 ctggccagcg gccacgagat cggggtagac tggtacaggc tcctgcagga cctgaaatac 480 tggggctacc cggaaaagag agtacagaag agatgggcca gatcatattt cggctacgga 540 aagccggtag aatctgaaac taaagagtca aaagaggagg caaaagcatg a 591 <210> 120 <211> 1176 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(1176) <223> Cas7 <400> 120 atgaaattaa tcgagataca catgatccag aaccacgctc cctgcaatct gaacagggat 60 gacacaggaa gcccgaaaga ctgcatgttc ggcggcatca ggcgatcgag gatatccagc 120 cagagcatca agcgcagcat caggatgtcc ccgatattca aggaagagat gaagggaatc 180 gaactggcga acaggacacg caggcttcct gaactcgtca aggccaagct catcagtgat 240 ggaatagacg aaaagatggc ggccatagcg gcagaaaagg ccaccggttt cggaaccaag 300 gacggtaaag aacgcgagga agacctgaac acggcccaga caatgttcat aacccagtct 360 gacgtcgacg ctgtagcatc ggtcatgaag gatgccatcc tgaaagccgg aaaccctaag 420 gcattcaagg acatgaaagc cgccgatctt caaaaagccg cagaactcaa gggatggcgg 480 cctgtaacac cggacctggc ccttttcggc cggatgatca catcggatgc attcatggac 540 atcgaggcat ccatgcaggt ggcccatgcg atctccacga acaaaatgga ccacgagttt 600 gattacttca ctgccgtgga tgaccttcag aagtcttccg acggccccgg agcagatatg 660 atcggcgacg tccagttcaa ctctgcctgc tactacaagt acttctcact ggattacgat 720 gccctgatac agaatctcgc aggcttgaaa cccggagata atgccacgga agccgataaa 780 aaagcctatg ctgaatcgct ggaaaacgcg aaaaaagtcg ccgcgatcac tatcaccgcc 840 tttctaaaag cggccatcta cacgacgccc agtggaaagc agaacagctt cgccgcgcat 900 cagctcccca gcgccgtcct tgtggaaatt cggccaacaa agacgccagt aagctacgct 960 aacgcgttcg ttgatccggc ccgcccgaga aacggtgtcg acatggtgga agataccctg 1020 aacaaattcg tgaaacatgt cgagctccag actgagaagt tcaacctgag atcgaccagg 1080 cggctctggt tcgttgcggg cgataaggcg ctcgccggaa cggaaacctg ccagacgatc 1140 aacgatctaa tatccggtat aaacagtgcc ctctaa 1176 <210> 121 <211> 684 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(684) <223> Cas5 <400> 121 atggacaacc cattgctcct gctgttgagg ctggaggggc caatgcagtc atgggggctg 60 aaagccaggt gggatatcag agataccggg gacgagccta ccaagtccgg catcatcgga 120 ctgctcggct gcgctctcgg atatgcccga aaggacccgc ggctgactga cgaactggac 180 tcacaacttc ggataggcat tcgtgtggag tgccccggcg aaatcgccag ggattaccac 240 acggtcagcg gagagcttcg gaccgccgaa ggtaagctcc gcgaaacgac gattgtatcc 300 ttcagagact atctccagga tgcagcgttc ctcgtagtac tcgaaggccc gggagaactg 360 cttaccagaa taagcaacgc tctgaaagac cctgtatggc caatctatct gggaagaaaa 420 tcctgcccac cgacccgccc cgtcttcgaa accctgacca ctgactatgc ttcgatagac 480 gatgcactga gccgacaccc gtggagttcc gggactatgg aagcccgcaa agcgcacccc 540 aaagaattaa aatgtatagt cgaagacctc tccggacctt accagaggac tgatcggatg 600 acgaaaagcc cggccagaat gtacggcatc aggcacgtcc ggatgagcac tgtaaaactt 660 caagcagaag gagagggcct ttaa 684 <210> 122 <211> 753 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(753) <223> Cas6 <400> 122 atgtatttat caagactgat cctgaacccg agaacaaggg ctgtcagaag agacctcgct 60 gactgccacg aacttcatcg gactattctg gggggctttc cggaccttaa tggaaaagga 120 ggcgaagcaa gggaaacctt cggcgttctc caccggatcg acatccaccc cagaagcggc 180 gcgatcgtac tactggtcca gtcgcaggaa aagcccgact ggtcaaagct gccagaaggc 240 tatctactcg aaaatacggg cacggaaaat ccagcctgta aggctataga cgaacagtac 300 gggaaaataa aggccggcga tgtctatgct ttccgtcttc gagccaatcc tacgaaaaag 360 atcggcacgt cccggattga ggacatcaaa gccggcaagc ctaaaaataa cgggcggcgg 420 gtgccgatca gaaacgagag cgaccagatc ctctggctga aaagaaaagg cgcggcagga 480 ggcttcgaac tcatgtccac gaagaggttt agcgaactct ccgatgtgct catcagtgaa 540 gaaggccatc agaaaatata caccttcgac actggaataa aagcaaaagt ccagaaaaac 600 gcccgggaaa atagattaac cttcggctcg gtccttttcg aaggcaccct gaaagtgaca 660 aatgcagaaa agttcctcga aaccctcaaa tccggcatcg gcagcggcaa agcctatggc 720 ttcggcctcc tatccttagc tccggcaagg tga 753 <210> 123 <211> 1632 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(1632) <223> Cas8 <400> 123 atgaagaatc gcgtgaagcg gggcgagcac ctggtgtctt ataacctgct gacagagcct 60 tggatcacct ctatcgatct gagcggcaat ccagtgcagg agggcatcct ggccaccctg 120 aagaacgccc acaagatcga tagcatcttt gaccctgccc ctccagtgga gttcggcatc 180 tacaggctgc tgatcgcctt tatcaccgac gtgttccagc cacagggcct ggaggacctg 240 gcagatctgc tggacaggaa gcggctggac cccacagccc tggacgagta cgcagcacgg 300 tggagagata ggtttgacct gttcgatgag aagtatccat tcctgcagca ggccatcacc 360 ggcgtgatca agaagccccc tgagcccatc tctcgcctga tgcagcacct gcctgccggc 420 acaaatgtga gccactttca ccacggccgg tgggacgaga actcttttag cttcgagcag 480 tgcgccaagg gcctggtgac aatcgcaccc ttcatgaccg caggaggagc aggcctgtcc 540 ccttctatca acggcagccc accctggtac gtgctggtga agggcaacaa tctgtttgag 600 acactgctgt ataacgtgtg ccagatcccc atgaccgtga agcctatcgg cgatagccca 660 gtggcctgga gaaacgacaa gaggatcgac cctggcgatg agccaaagac attctccatc 720 gtggagggac tgacctggag gcctcggatc atccagctga tcccaggcaa tggcaagggc 780 acctgtacat ataccggcga gaaggacgtg gataccgtgt cccacatgca ctactatcca 840 ggccagaagt ctcctgagcc aggactgtgg gtggaccccc aggtggcata caagaagaca 900 aaggatgcca tcagacccct gaggcctgac gagaataagg ccctgtggcg cgatatcgga 960 ccactgatgc tgctgcagca cggcgattac tctggcaagg acggcaaggt gagcttcgat 1020 cggccagccg tggtgaccca gtataagcag atggtgtcca acggcatgat caagcggagc 1080 gagccactgc ggctggaggt gtacggcatc cgcacagacg gcaagatgaa gatctacgag 1140 tggtatcacg agaagctggc cctgcccatc gagatcctga agaaggccaa ttccggccgg 1200 cagatccagg acgccatgga tctggccgac tctgtggcct acatcctgag aaaggccatg 1260 aagaaggcct atcctaggaa cgccaagtcc aatgagtctg gctttgacaa cctgatcctg 1320 agcgtgcagt ctagctattg gtcccacctg aagggccagt ttgagtctat cttcctgaag 1380 acactgagcc agcaggatga gaatgacctg gatgcctaca ccaagctgat ggagcagtgg 1440 aagaagatcc tggacgatac aggcaagaac gccctggaca agggactggg acccctggac 1500 accgatggcg actccctgcg gagacaggtg aaggccatga acgagtactc ctctggcatc 1560 agattcgccc tgtatcctga ctctatccag gccaagaaga agaacaggca gaagaataag 1620 gaggataagt aa 1632 <210> 124 <211> 591 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(591) <223> Cse2 <400> 124 atgacagccc caaacgagaa taaggagcac cagaagagca agaaggacga ggagttcctg 60 gccaacctgg caaagatggc agagagcgat aggggaggaa tggccatcct gaagcggaac 120 gccggcaata caatcgccga gagccggggc gccatgaaga ccttttacag cctgctgcca 180 tatggcatca gcgactcccc ctacgaggag atctatttcc tgatcgccac cctgtacggc 240 cacaacaagt ataggtttac aggcgacttc ggccagacca tgaagctggt gcgcgagtcc 300 tctaattctg agagcatcga tcagcgggtg agcacactgc tggattccga gtttaacatc 360 gtggacggca tcaagccagg aggaggagag ctggcataca ggctgaggca gtgcgtgaag 420 ctggcaagcg gccacgagat cggagtggat tggtatagac tgctgcagga cctgaagtac 480 tggggctatc cagagaagag ggtgcagaag cggtgggccc ggtcctactt cggctatggc 540 aagcccgtgg agtctgagac caaggagagc aaggaggagg caaaggcata a 591 <210> 125 <211> 1176 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(1176) <223> Cas7 <400> 125 atgaagctga tcgagatcca catgatccag aaccacgccc cctgcaacct gaatagagac 60 gataccggca gccctaagga ctgtatgttt ggaggcatcc ggcggagccg gatcagctcc 120 cagagcatca agagatccat caggatgtct cctatcttca aggaggagat gaagggcatc 180 gagctggcca atcgcacaag gcgcctgcca gagctggtga aggccaagct gatctccgat 240 ggcatcgacg agaagatggc agcaatcgca gcagagaagg caacaggctt tggcaccaag 300 gatggcaagg agcgggagga ggacctgaat acagcccaga ccatgttcat cacccagtcc 360 gacgtggatg ccgtggcctc tgtgatgaag gatgccatcc tgaaggccgg caaccccaag 420 gccttcaagg atatgaaggc agcagacctg cagaaggcag cagagctgaa gggatggaga 480 ccagtgacac ctgacctggc cctgtttggc aggatgatca ccagcgatgc cttcatggac 540 atcgaggcct ccatgcaggt ggcccacgcc atctctacaa ataagatgga tcacgagttt 600 gactacttca ccgccgtgga cgatctgcag aagtctagcg acggacctgg agcagatatg 660 atcggcgacg tgcagtttaa cagcgcctgc tactataagt acttctccct ggactatgat 720 gccctgatcc agaacctggc cggcctgaag ccaggcgata atgccaccga ggccgacaag 780 aaggcctatg ccgagtccct ggagaatgcc aagaaggtgg ccgccatcac catcacagcc 840 tttctgaagg ccgccatcta caccacacca tccggcaagc agaactcttt cgccgcacac 900 cagctgccaa gcgccgtgct ggtggagatc aggccaacca agacacccgt gtcctacgca 960 aacgccttcg tggaccccgc aaggccccgc aatggcgtgg atatggtgga ggacaccctg 1020 aacaagttcg tgaagcacgt ggagctgcag acagagaagt ttaacctgcg gagcacccgg 1080 agactgtggt tcgtggcagg cgacaaggcc ctggcaggaa ccgagacatg ccagacaatc 1140 aacgatctga tcagcggcat caattccgcc ctgtaa 1176 <210> 126 <211> 684 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(684) <223> Cas5 <400> 126 atggataacc cactgctgct gctgctgcgg ctggagggac caatgcagag ctggggcctg 60 aaggcaagat gggatatcag ggacacaggc gatgagccca ccaagagcgg catcatcgga 120 ctgctgggat gcgcactggg atacgccaga aaggacccca ggctgaccga cgagctggat 180 tcccagctgc gcatcggcat ccgggtggag tgtcctggcg agatcgccag ggactatcac 240 acagtgagcg gcgagctgcg caccgcagag ggcaagctgc gggagaccac aatcgtgtcc 300 tttagagatt acctgcagga cgcagccttc ctggtggtgc tggagggacc aggagagctg 360 ctgaccagga tctccaacgc cctgaaggac cccgtgtggc caatctacct gggcagaaag 420 tcttgccctc caacaaggcc cgtgttcgag accctgacca cagactatgc ctccatcgac 480 gatgccctga gccggcaccc ttggagctcc ggcaccatgg aggcaaggaa ggcacaccca 540 aaggagctga agtgtatcgt ggaggacctg tctggcccat accagagaac agataggatg 600 accaagagcc ccgccagaat gtatggcatc cgccacgtgc ggatgagcac cgtgaagctg 660 caggcagagg gagagggact gtaa 684 <210> 127 <211> 753 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(753) <223> Cas6 <400> 127 atgtacctgt ctcggctgat cctgaaccct aggacccgcg ccgtgaggcg cgacctggca 60 gattgtcacg agctgcaccg cacaatcctg ggcggctttc cagacctgaa cggcaaggga 120 ggagaggcaa gggagacctt cggcgtgctg cacagaatcg atatccaccc aaggagcggc 180 gcaatcgtgc tgctggtgca gagccaggag aagcccgact ggtccaagct gcctgagggc 240 tacctgctgg agaacaccgg cacagagaat cctgcctgca aggccatcga cgagcagtac 300 ggcaagatca aggcaggcga cgtgtacgcc ttccggctga gagccaatcc aacaaagaag 360 atcggcacca gccggatcga ggatatcaag gccggcaagc ccaagaacaa tggccggaga 420 gtgcctatcc gcaacgagag cgaccagatc ctgtggctga agaggaaggg agcagcagga 480 ggatttgagc tgatgagcac caagaggttc agcgagctgt ccgacgtgct gatctccgag 540 gagggccacc agaagatcta tacattcgat accggcatca aggccaaggt gcagaagaac 600 gccagagaga ataggctgac ctttggcagc gtgctgttcg agggcacact gaaggtgacc 660 aatgccgaga agtttctgga gacactgaag agcggcatcg gctccggcaa ggcctacgga 720 ttcggactgc tgtccctggc acctgcaagg taa 753 <210> 128 <211> 543 <212> PRT <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(543) <223> Cas8 <400> 128 Met Lys Asn Arg Val Lys Arg Gly Glu His Leu Val Ser Tyr Asn Leu 1 5 10 15 Leu Thr Glu Pro Trp Ile Thr Ser Ile Asp Leu Ser Gly Asn Pro Val 20 25 30 Gln Glu Gly Ile Leu Ala Thr Leu Lys Asn Ala His Lys Ile Asp Ser 35 40 45 Ile Phe Asp Pro Ala Pro Pro Val Glu Phe Gly Ile Tyr Arg Leu Leu 50 55 60 Ile Ala Phe Ile Thr Asp Val Phe Gln Pro Gln Gly Leu Glu Asp Leu 65 70 75 80 Ala Asp Leu Leu Asp Arg Lys Arg Leu Asp Pro Thr Ala Leu Asp Glu 85 90 95 Tyr Ala Ala Arg Trp Arg Asp Arg Phe Asp Leu Phe Asp Glu Lys Tyr 100 105 110 Pro Phe Leu Gln Gln Ala Ile Thr Gly Val Ile Lys Lys Pro Pro Glu 115 120 125 Pro Ile Ser Arg Leu Met Gln His Leu Pro Ala Gly Thr Asn Val Ser 130 135 140 His Phe His His Gly Arg Trp Asp Glu Asn Ser Phe Ser Phe Glu Gln 145 150 155 160 Cys Ala Lys Gly Leu Val Thr Ile Ala Pro Phe Met Thr Ala Gly Gly 165 170 175 Ala Gly Leu Ser Pro Ser Ile Asn Gly Ser Pro Pro Trp Tyr Val Leu 180 185 190 Val Lys Gly Asn Asn Leu Phe Glu Thr Leu Leu Tyr Asn Val Cys Gln 195 200 205 Ile Pro Met Thr Val Lys Pro Ile Gly Asp Ser Pro Val Ala Trp Arg 210 215 220 Asn Asp Lys Arg Ile Asp Pro Gly Asp Glu Pro Lys Thr Phe Ser Ile 225 230 235 240 Val Glu Gly Leu Thr Trp Arg Pro Arg Ile Ile Gln Leu Ile Pro Gly 245 250 255 Asn Gly Lys Gly Thr Cys Thr Tyr Thr Gly Glu Lys Asp Val Asp Thr 260 265 270 Val Ser His Met His Tyr Tyr Pro Gly Gln Lys Ser Pro Glu Pro Gly 275 280 285 Leu Trp Val Asp Pro Gln Val Ala Tyr Lys Lys Thr Lys Asp Ala Ile 290 295 300 Arg Pro Leu Arg Pro Asp Glu Asn Lys Ala Leu Trp Arg Asp Ile Gly 305 310 315 320 Pro Leu Met Leu Leu Gln His Gly Asp Tyr Ser Gly Lys Asp Gly Lys 325 330 335 Val Ser Phe Asp Arg Pro Ala Val Val Thr Gln Tyr Lys Gln Met Val 340 345 350 Ser Asn Gly Met Ile Lys Arg Ser Glu Pro Leu Arg Leu Glu Val Tyr 355 360 365 Gly Ile Arg Thr Asp Gly Lys Met Lys Ile Tyr Glu Trp Tyr His Glu 370 375 380 Lys Leu Ala Leu Pro Ile Glu Ile Leu Lys Lys Ala Asn Ser Gly Arg 385 390 395 400 Gln Ile Gln Asp Ala Met Asp Leu Ala Asp Ser Val Ala Tyr Ile Leu 405 410 415 Arg Lys Ala Met Lys Lys Ala Tyr Pro Arg Asn Ala Lys Ser Asn Glu 420 425 430 Ser Gly Phe Asp Asn Leu Ile Leu Ser Val Gln Ser Ser Tyr Trp Ser 435 440 445 His Leu Lys Gly Gln Phe Glu Ser Ile Phe Leu Lys Thr Leu Ser Gln 450 455 460 Gln Asp Glu Asn Asp Leu Asp Ala Tyr Thr Lys Leu Met Glu Gln Trp 465 470 475 480 Lys Lys Ile Leu Asp Asp Thr Gly Lys Asn Ala Leu Asp Lys Gly Leu 485 490 495 Gly Pro Leu Asp Thr Asp Gly Asp Ser Leu Arg Arg Gln Val Lys Ala 500 505 510 Met Asn Glu Tyr Ser Ser Gly Ile Arg Phe Ala Leu Tyr Pro Asp Ser 515 520 525 Ile Gln Ala Lys Lys Lys Asn Arg Gln Lys Asn Lys Glu Asp Lys 530 535 540 <210> 129 <211> 196 <212> PRT <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(196) <223> Cse2 <400> 129 Met Thr Ala Pro Asn Glu Asn Lys Glu His Gln Lys Ser Lys Lys Asp 1 5 10 15 Glu Glu Phe Leu Ala Asn Leu Ala Lys Met Ala Glu Ser Asp Arg Gly 20 25 30 Gly Met Ala Ile Leu Lys Arg Asn Ala Gly Asn Thr Ile Ala Glu Ser 35 40 45 Arg Gly Ala Met Lys Thr Phe Tyr Ser Leu Leu Pro Tyr Gly Ile Ser 50 55 60 Asp Ser Pro Tyr Glu Glu Ile Tyr Phe Leu Ile Ala Thr Leu Tyr Gly 65 70 75 80 His Asn Lys Tyr Arg Phe Thr Gly Asp Phe Gly Gln Thr Met Lys Leu 85 90 95 Val Arg Glu Ser Ser Asn Ser Glu Ser Ile Asp Gln Arg Val Ser Thr 100 105 110 Leu Leu Asp Ser Glu Phe Asn Ile Val Asp Gly Ile Lys Pro Gly Gly 115 120 125 Gly Glu Leu Ala Tyr Arg Leu Arg Gln Cys Val Lys Leu Ala Ser Gly 130 135 140 His Glu Ile Gly Val Asp Trp Tyr Arg Leu Leu Gln Asp Leu Lys Tyr 145 150 155 160 Trp Gly Tyr Pro Glu Lys Arg Val Gln Lys Arg Trp Ala Arg Ser Tyr 165 170 175 Phe Gly Tyr Gly Lys Pro Val Glu Ser Glu Thr Lys Glu Ser Lys Glu 180 185 190 Glu Ala Lys Ala 195 <210> 130 <211> 391 <212> PRT <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(391) <223> Cas7 <400> 130 Met Lys Leu Ile Glu Ile His Met Ile Gln Asn His Ala Pro Cys Asn 1 5 10 15 Leu Asn Arg Asp Asp Thr Gly Ser Pro Lys Asp Cys Met Phe Gly Gly 20 25 30 Ile Arg Arg Ser Arg Ile Ser Ser Gln Ser Ile Lys Arg Ser Ile Arg 35 40 45 Met Ser Pro Ile Phe Lys Glu Glu Met Lys Gly Ile Glu Leu Ala Asn 50 55 60 Arg Thr Arg Arg Leu Pro Glu Leu Val Lys Ala Lys Leu Ile Ser Asp 65 70 75 80 Gly Ile Asp Glu Lys Met Ala Ala Ile Ala Ala Glu Lys Ala Thr Gly 85 90 95 Phe Gly Thr Lys Asp Gly Lys Glu Arg Glu Glu Asp Leu Asn Thr Ala 100 105 110 Gln Thr Met Phe Ile Thr Gln Ser Asp Val Asp Ala Val Ala Ser Val 115 120 125 Met Lys Asp Ala Ile Leu Lys Ala Gly Asn Pro Lys Ala Phe Lys Asp 130 135 140 Met Lys Ala Ala Asp Leu Gln Lys Ala Ala Glu Leu Lys Gly Trp Arg 145 150 155 160 Pro Val Thr Pro Asp Leu Ala Leu Phe Gly Arg Met Ile Thr Ser Asp 165 170 175 Ala Phe Met Asp Ile Glu Ala Ser Met Gln Val Ala His Ala Ile Ser 180 185 190 Thr Asn Lys Met Asp His Glu Phe Asp Tyr Phe Thr Ala Val Asp Asp 195 200 205 Leu Gln Lys Ser Ser Asp Gly Pro Gly Ala Asp Met Ile Gly Asp Val 210 215 220 Gln Phe Asn Ser Ala Cys Tyr Tyr Lys Tyr Phe Ser Leu Asp Tyr Asp 225 230 235 240 Ala Leu Ile Gln Asn Leu Ala Gly Leu Lys Pro Gly Asp Asn Ala Thr 245 250 255 Glu Ala Asp Lys Lys Ala Tyr Ala Glu Ser Leu Glu Asn Ala Lys Lys 260 265 270 Val Ala Ala Ile Thr Ile Thr Ala Phe Leu Lys Ala Ala Ile Tyr Thr 275 280 285 Thr Pro Ser Gly Lys Gln Asn Ser Phe Ala Ala His Gln Leu Pro Ser 290 295 300 Ala Val Leu Val Glu Ile Arg Pro Thr Lys Thr Pro Val Ser Tyr Ala 305 310 315 320 Asn Ala Phe Val Asp Pro Ala Arg Pro Arg Asn Gly Val Asp Met Val 325 330 335 Glu Asp Thr Leu Asn Lys Phe Val Lys His Val Glu Leu Gln Thr Glu 340 345 350 Lys Phe Asn Leu Arg Ser Thr Arg Arg Leu Trp Phe Val Ala Gly Asp 355 360 365 Lys Ala Leu Ala Gly Thr Glu Thr Cys Gln Thr Ile Asn Asp Leu Ile 370 375 380 Ser Gly Ile Asn Ser Ala Leu 385 390 <210> 131 <211> 227 <212> PRT <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(227) <223> Cas5 <400> 131 Met Asp Asn Pro Leu Leu Leu Leu Leu Arg Leu Glu Gly Pro Met Gln 1 5 10 15 Ser Trp Gly Leu Lys Ala Arg Trp Asp Ile Arg Asp Thr Gly Asp Glu 20 25 30 Pro Thr Lys Ser Gly Ile Ile Gly Leu Leu Gly Cys Ala Leu Gly Tyr 35 40 45 Ala Arg Lys Asp Pro Arg Leu Thr Asp Glu Leu Asp Ser Gln Leu Arg 50 55 60 Ile Gly Ile Arg Val Glu Cys Pro Gly Glu Ile Ala Arg Asp Tyr His 65 70 75 80 Thr Val Ser Gly Glu Leu Arg Thr Ala Glu Gly Lys Leu Arg Glu Thr 85 90 95 Thr Ile Val Ser Phe Arg Asp Tyr Leu Gln Asp Ala Ala Phe Leu Val 100 105 110 Val Leu Glu Gly Pro Gly Glu Leu Leu Thr Arg Ile Ser Asn Ala Leu 115 120 125 Lys Asp Pro Val Trp Pro Ile Tyr Leu Gly Arg Lys Ser Cys Pro Pro 130 135 140 Thr Arg Pro Val Phe Glu Thr Leu Thr Thr Asp Tyr Ala Ser Ile Asp 145 150 155 160 Asp Ala Leu Ser Arg His Pro Trp Ser Ser Gly Thr Met Glu Ala Arg 165 170 175 Lys Ala His Pro Lys Glu Leu Lys Cys Ile Val Glu Asp Leu Ser Gly 180 185 190 Pro Tyr Gln Arg Thr Asp Arg Met Thr Lys Ser Pro Ala Arg Met Tyr 195 200 205 Gly Ile Arg His Val Arg Met Ser Thr Val Lys Leu Gln Ala Glu Gly 210 215 220 Glu Gly Leu 225 <210> 132 <211> 250 <212> PRT <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(250) <223> Cas6 <400> 132 Met Tyr Leu Ser Arg Leu Ile Leu Asn Pro Arg Thr Arg Ala Val Arg 1 5 10 15 Arg Asp Leu Ala Asp Cys His Glu Leu His Arg Thr Ile Leu Gly Gly 20 25 30 Phe Pro Asp Leu Asn Gly Lys Gly Gly Glu Ala Arg Glu Thr Phe Gly 35 40 45 Val Leu His Arg Ile Asp Ile His Pro Arg Ser Gly Ala Ile Val Leu 50 55 60 Leu Val Gln Ser Gln Glu Lys Pro Asp Trp Ser Lys Leu Pro Glu Gly 65 70 75 80 Tyr Leu Leu Glu Asn Thr Gly Thr Glu Asn Pro Ala Cys Lys Ala Ile 85 90 95 Asp Glu Gln Tyr Gly Lys Ile Lys Ala Gly Asp Val Tyr Ala Phe Arg 100 105 110 Leu Arg Ala Asn Pro Thr Lys Lys Ile Gly Thr Ser Arg Ile Glu Asp 115 120 125 Ile Lys Ala Gly Lys Pro Lys Asn Asn Gly Arg Arg Val Pro Ile Arg 130 135 140 Asn Glu Ser Asp Gln Ile Leu Trp Leu Lys Arg Lys Gly Ala Ala Gly 145 150 155 160 Gly Phe Glu Leu Met Ser Thr Lys Arg Phe Ser Glu Leu Ser Asp Val 165 170 175 Leu Ile Ser Glu Glu Gly His Gln Lys Ile Tyr Thr Phe Asp Thr Gly 180 185 190 Ile Lys Ala Lys Val Gln Lys Asn Ala Arg Glu Asn Arg Leu Thr Phe 195 200 205 Gly Ser Val Leu Phe Glu Gly Thr Leu Lys Val Thr Asn Ala Glu Lys 210 215 220 Phe Leu Glu Thr Leu Lys Ser Gly Ile Gly Ser Gly Lys Ala Tyr Gly 225 230 235 240 Phe Gly Leu Leu Ser Leu Ala Pro Ala Arg 245 250 <210> 133 <211> 90 <212> DNA <213> Methanocella arvoryzae MRE50 <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 133 aaagtcccca caggcgtggg ggtgaaccgt gatcagtaac ccggtcacca ttaaacagat 60 taaagtcccc acaggcgtgg gggtgaaccg 90 <210> 134 <211> 1701 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(1701) <223> Cas8 <400> 134 atgtgtgacc aacagtatgt tagtacactg aatgtattaa aagatccgtg gattccagtt 60 gtatttttgg atggaaagat aaaagatgtt ggaatcattg aatgctttag aaatgcagaa 120 aagattaaaa caatatcgaa ttctaagcca tatgaaaaga ttgcgatact acggtttttg 180 acagcgttca ttacggatgt atatcaactg gatagacgta ttgaacggca aaagttatat 240 gatgcgggat catttgaaat tgaacgtatt gagaattatg ttaaagaatg tgaagagaag 300 aatggagctt catttgtttt gggtgattct caaagatctt ttttttgctt taactataat 360 ccgcaagttg atacagaggg agtgaaatta tctgcagcgt atttgcattt ggaactgcct 420 catggcaata atcctattca catagttgcc cagagagagg aagattttga aggtgatacg 480 ctgcctcaat ttttgagggc tgcattagcg tttaatttat tcccgactgg aaacatgtta 540 aagggagcga atagtaaaac gggtgataac tgctatatag acggtgtggg gaaagatggc 600 aaacctaaat atacagctgc gtatggctcg atgggaataa atgcaggaag ttcaatggca 660 gcggctgaac cggttttctt ttggccagaa tgtgacaatt tgtttcatac acttgttatg 720 tgtatgcgca gtcaaggaga actacagaat aatttaaaat taaatgatcc accagctttt 780 tggaatgccg atgcagaacc taatcctaaa gcaggaaaac gtggtgatat agtaacttca 840 gtctcttttg tgtcaggtct tgcttttcag gcaagaagaa ttgtaccggt cattgaaaac 900 ggaaaagttt atgaatgcta tataagtaat ggttatacca attcgaatga aaacgtgtgg 960 catgatcctt ttgctgttag attgagaaat cataagtcgg gagaaatttt tcagatgccg 1020 gctaaagggg atcgagaaat gtggagaaat attggaaatt tgactgcatc tagagaagaa 1080 agctggcatt taatgccgga tgtccttaga ccaattaaaa aaagtgcaga tgctacagat 1140 tattatgaga atatttcttc tcttgcaatg atacctatga cccagaatgc aggatacagt 1200 gctatgttct atgatgatac agtacaaatt ccgaaagaat atttggaaga ctcatatttg 1260 ggtgaatatt taactacaag aatggaaata gtagaagaaa tttctaagat gtgggacaag 1320 cttaaaatat cggcgcttct ggataataag gataaatttt caggacatta tagagatgat 1380 gcactgcaag agtattgggt caagattcat caatttttat ttgatggcga tgatagcttc 1440 ttaaatcatg tgataagaat gtatcatgaa gattcttctt cttttgaaaa aacggcagat 1500 aaagcattat ttgaatattt aacgaagagt gttaaagaaa tatgcgaaaa agaagagaag 1560 aacacgaatt catggaatat gttggtgaaa ataatcaggc aaatacatgg taagaatggc 1620 tgtcttcata ttttttacgg aacgttaaag aaatattgga agaaggaggg aaaggataag 1680 aatgatacag gaagcatatg a 1701 <210> 135 <211> 498 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(498) <223> Cse2 <400> 135 atgatacagg aagcatatga aaaacttgca catgaggaaa aaaggttgtt tgctcattgt 60 gcaggtaaat taataaaaga cgctccaaaa gctattatac cgttttataa ggtggtgcca 120 agtgaaattg aaagtaaaaa cgggaaaaag tatacagttg atgaagatgc tttttttgct 180 gctttgtgtg taagatgcct attcgaaaaa attgagggcg ttacattaga acctgacata 240 ttaattagtg aaggaagaaa aaatcctaaa atatctttgg aaggttatga tagaagaatt 300 tcagcattaa tgtcaaatac tgaagctgaa ttttttattc caaaacttgc aaagttaatg 360 aattatacgc taaaaattac ttctaataaa ataccggatt gtgatcagtt atattgggat 420 attcataata ttggaagcaa tgaaaaagat gttcagcgac gttgggcacg tacaatatat 480 gtaaataatg aagagtga 498 <210> 136 <211> 1188 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(1188) <223> Cas7 <400> 136 atgagtaatt caaagtatca gttcttaaat ggaaagaaac ttgcagagtt tcatatgttg 60 aagctatatc cgtcatcagc attaaaccgc gatgatgcag gtgagcagaa aacgggaatg 120 tacaatggca cgcttaggaa tagaatttca agtcagtgta ttaaacgttc atggaggctt 180 tctgaaactt tcgaagatgt ttttgatgaa attggaatac gtactaagag aatgccagaa 240 tatgttggaa aaaaattggt tgagaatgga gtgccggaag aggatgtaat cagttttaag 300 aaaatccttt ctggtgaaaa ggttgatgaa aaatcatcta agaaaagtaa agctgatcag 360 gctatagacg aaggtaagcc agtaaagact gctgcattgt cattttattc agtggaggaa 420 cttgataaaa ttgctgagat atgtaaaaga atttatgatg atttggaaga gcctaaatcc 480 aaaaatctga agacaataaa aattgacaat attcagaagg aaatgcgtaa gtgcgttcat 540 ccgatgaata ttgatgttgc agcatttggg cgtatggtaa ctgacaacat gcttcgtccg 600 gtagaaggcg caatgcaggt ggcacaggca ttatcaacta atgctgcggt caaggaaaat 660 gactattttg tggcttgcga tgatctggta aaaggagaaa ccattgaaga tgtcggtggt 720 gaaatgcttg gagatattga ctataattct gcatgctatt atattcatgc aaatgcagat 780 ttagagcagt ttgcagaaaa tttgaaggat tgtgaaaaca tggaagaaat agtgaaagca 840 ttgccttcaa atatggtgga agtaatggca tatacagatc caacagcgag acagagtaca 900 atggaggcgc atgttcttcc agaggttatt tatgtggaac taaagagtaa aaagcgtcct 960 ttgaacagaa tgaaggcatt tgcggaaccg tgtaatagaa atattgctga aaagagtgct 1020 aaaaaacttg ctgattatat aaattgcaca aacgaaaaag ctgatttagg aataacaaat 1080 gcactgtggt attgtgagga tgaaagtgtt aaagcgcctg aaaatgttac tgtagtgaac 1140 agtataaaag aacttgagca aaagcttaat gagtggatga atgaatga 1188 <210> 137 <211> 483 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(483) <223> Cas5 <400> 137 atgaaaataa aaattgtttt agaaggtgca tttcaagcct ggggagtacc atctgaatat 60 acttggagag gaacatcgta ttatccgaca gctagaggaa ttgtaggttt gattggatgt 120 tgtatgggta taccaagggg agatgatagg cttgagcagc tattatcggt gttaaaaata 180 acatatgata taaacgaaga tgataatggg aacagaaaat caggatcaat acttacagat 240 tttcaggttg tgagaaagga agatggcggc aagttaaatg cagcgaatgg aggaactggc 300 gattcatatg gaatcatatt gcataaatcc tacataaatg atgcatcatt tacggttcat 360 atagagggtc ctgatgatct gatgaaagat gtatatgatg caatgcttga tccagtttgg 420 gttccatatc taggaagaaa aaattgtccg cctacagaac cacttattcc tgaaattgaa 480 tag 483 <210> 138 <211> 618 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(618) <223> Cas6 <400> 138 atgtatttaa caaaattaga attaaatata caaaacaaag ctgttcttca taatatgtca 60 aattgtgaat ggatgcataa gctgattctt gaaaaaggat ttggacatat tcaagccgaa 120 aatgcaagac agacgttaaa gatattatat gctgtagatg gcataaaagt ttatgttcaa 180 agtgctgtag aacccaaatt tgaaaattgt tcatattgga taagtactcc ggctaccatt 240 tgtattgatg cgatgaaaaa aatttgtggg acaggtatgg ctgtacattt taaatgtacg 300 tgtaatccaa cgaaaaagtt gatcgatggc ggaaagcgta tttttctatc atctgagaga 360 gagagagatg agtggattaa gcgtgtgatg gagcgttccg gagcagaagt tttggttgag 420 agtcagactt ctgactttac ggtatgggga atgaagaaag ataaaaaaac agataaatct 480 cacaaaattt atgctaaagc ggtcacatat tcaggtgcac taaaaataac agatgaagaa 540 aaattttggg aagcattttg taatggcata ggtcgagaaa aagcttatgg ttgtggaatg 600 ttaatgatac aggtttga 618 <210> 139 <211> 1701 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(1701) <223> Cas8 <400> 139 atgtgcgatc agcagtacgt gtctacactg aatgtgctga aggacccttg gattcccgtg 60 gtgtttctgg acggcaagat caaggatgtg ggcatcatcg agtgtttcag aaacgccgag 120 aagatcaaga ccatctctaa cagcaagcca tatgagaaga tcgccatcct gagatttctg 180 accgccttca tcacagacgt gtaccagctg gataggcgca tcgagaggca gaagctgtat 240 gacgccggct ctttcgagat cgagcgcatc gagaattacg tgaaggagtg cgaggagaag 300 aacggcgcca gctttgtgct gggcgatagc cagcggtcct tcttttgttt caactacaat 360 ccccaggtgg acaccgaggg agtgaagctg agcgccgcct atctgcacct ggagctgcct 420 cacggcaaca atccaatcca catcgtggcc cagagggagg aggactttga gggcgataca 480 ctgccacagt tcctgagggc cgccctggcc tttaatctgt tccctaccgg caacatgctg 540 aagggcgcca attctaagac aggcgacaac tgctacatcg atggcgtggg caaggacggc 600 aagcctaagt acaccgccgc ctatggcagc atgggcatca atgcaggctc tagcatggca 660 gcagcagagc ccgtgttctt ttggcctgag tgcgataacc tgtttcacac actggtcatg 720 tgcatgaggt cccagggcga gctgcagaac aatctgaagc tgaacgatcc tccagccttc 780 tggaatgcag acgcagagcc aaaccctaag gcaggcaaga ggggcgacat cgtgaccagc 840 gtgagcttcg tgagcggcct ggcattccag gcaaggagaa tcgtgccagt gatcgagaat 900 ggcaaggtgt acgagtgtta tatctctaac ggctacacaa acagcaatga gaacgtgtgg 960 cacgatccat ttgccgtgag gctgcgcaac cacaagtccg gcgagatctt ccagatgcca 1020 gcaaagggcg acagggagat gtggcgcaat atcggcaacc tgaccgcctc cagggaggag 1080 tcttggcacc tgatgccaga tgtgctgcgc cccatcaaga agagcgccga cgccacagat 1140 tactatgaga atatctcctc tctggccatg atcccaatga cccagaacgc cggctacagc 1200 gccatgttct atgacgatac agtgcagatc cccaaggagt acctggagga ttcctacctg 1260 ggcgagtatc tgaccacaag gatggagatc gtggaggaga tctctaagat gtgggacaag 1320 ctgaagatca gcgccctgct ggacaataag gataagtttt ccggccacta cagggacgat 1380 gccctgcagg agtattgggt gaagatccac cagtttctgt tcgacggcga cgattctttc 1440 ctgaaccacg tgatcagaat gtaccacgag gatagctcct cttttgagaa gaccgccgac 1500 aaggccctgt tcgagtatct gacaaagagc gtgaaggaga tctgcgagaa ggaggagaag 1560 aataccaact cctggaatat gctggtgaag atcatccgcc agatccacgg caagaacggc 1620 tgtctgcaca tcttctacgg caccctgaag aagtattgga agaaggaggg caaggacaag 1680 aacgatacag gcagcatcta a 1701 <210> 140 <211> 498 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(498) <223> Cse2 <400> 140 atgatccagg aggcctacga gaagctggcc cacgaggaga agcggctgtt tgcccactgt 60 gccggcaagc tgatcaagga cgccccaaag gccatcatcc ccttctacaa ggtggtgccc 120 tccgagatcg agtctaaaaa cggcaagaag tataccgtgg acgaggatgc cttctttgcc 180 gccctgtgcg tgaggtgtct gtttgagaag atcgagggcg tgacactgga gcccgatatc 240 ctgatcagcg agggccgcaa gaatcctaag atctccctgg agggctatga ccggagaatc 300 agcgccctga tgtccaacac cgaggccgag ttctttatcc ctaagctggc caagctgatg 360 aattacaccc tgaagatcac atccaacaag atcccagact gcgatcagct gtattgggat 420 atccacaata tcggctctaa cgagaaggac gtgcagaggc gctgggcaag gaccatctac 480 gtgaacaatg aggagtaa 498 <210> 141 <211> 1188 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(1188) <223> Cas7 <400> 141 atgagcaatt ccaagtacca gtttctgaac ggcaagaagc tggccgagtt ccacatgctg 60 aagctgtatc ctagctccgc cctgaacaga gacgatgccg gcgagcagaa gaccggcatg 120 tataatggca cactgaggaa cagaatctct agccagtgca tcaagcggtc ttggagactg 180 agcgagacct ttgaggacgt gttcgatgag atcggcatca ggacaaagcg catgccagag 240 tacgtgggca agaagctggt ggagaatggc gtgcccgagg aggatgtgat ctcttttaag 300 aagatcctga gcggcgagaa ggtggacgag aagtcctcta agaagtccaa ggccgaccag 360 gccatcgatg agggcaagcc tgtgaagacc gccgccctga gcttctactc cgtggaggag 420 ctggataaga tcgccgagat ctgcaagagg atctatgacg atctggagga gccaaagtcc 480 aagaatctga agacaatcaa gatcgacaac atccagaagg agatgcgcaa gtgcgtgcac 540 cccatgaata tcgatgtggc cgcctttggc aggatggtga ccgacaacat gctgaggcct 600 gtggagggag caatgcaggt ggcccaggcc ctgtctacaa atgccgccgt gaaggagaac 660 gattatttcg tggcctgcga cgatctggtg aagggagaga ccatcgagga cgtgggagga 720 gagatgctgg gcgacatcga ttacaatagc gcctgctact atatccacgc caacgccgat 780 ctggagcagt ttgccgagaa tctgaaggac tgtgagaaca tggaggagat cgtgaaggcc 840 ctgccatcta atatggtgga agtgatggcc tacaccgacc ccacagccag gcagagcacc 900 atggaggccc acgtgctgcc cgaagtgatc tacgtggagc tgaagagcaa gaagcggcca 960 ctgaacagaa tgaaggcctt cgccgagccc tgtaaccgca atatcgccga gaagtccgcc 1020 aagaagctgg ccgattacat caattgcacc aacgagaagg ccgacctggg catcacaaat 1080 gccctgtggt attgtgagga tgagagcgtg aaggccccag agaatgtgac cgtggtgaac 1140 tccatcaagg agctggagca gaagctgaat gagtggatga acgagtaa 1188 <210> 142 <211> 483 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(483) <223> Cas5 <400> 142 atgaagatca agatcgtgct ggagggagca ttccaggcct ggggagtgcc ttccgagtat 60 acctggcggg gcacatctta ctatccaacc gccagaggca tcgtgggcct gatcggctgc 120 tgtatgggca tccctagggg cgacgatcgc ctggagcagc tgctgtccgt gctgaagatc 180 acctacgaca tcaacgagga cgataacggc aatcggaagt ctggcagcat cctgacagat 240 tttcaggtgg tgagaaagga ggacggaggc aagctgaatg cagcaaacgg aggaaccggc 300 gatagctacg gcatcatcct gcacaagtct tatatcaatg acgccagctt cacagtgcac 360 atcgagggcc ctgacgatct gatgaaggac gtgtacgatg ccatgctgga ccccgtgtgg 420 gtgccttatc tgggcagaaa gaattgccct ccaaccgagc cactgatccc cgagattgaa 480 taa 483 <210> 143 <211> 618 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(618) <223> Cas6 <400> 143 atgtacctga ccaagctgga gctgaatatc cagaacaagg ccgtgctgca caatatgtct 60 aactgcgagt ggatgcacaa gctgatcctg gagaagggct ttggccacat ccaggccgag 120 aatgcccggc agacactgaa gatcctgtac gccgtggatg gcatcaaggt gtatgtgcag 180 tccgccgtgg agcccaagtt cgagaactgt tcttactgga tcagcacccc tgccacaatc 240 tgcatcgacg ccatgaagaa gatctgtggc accggcatgg ccgtgcactt taagtgcacc 300 tgtaacccca caaagaagct gatcgatggc ggcaagagaa tcttcctgag ctccgagcgg 360 gagagagacg agtggatcaa gagagtgatg gagagaagcg gcgccgaggt gctggtggag 420 tctcagacca gcgatttcac agtgtggggc atgaagaagg acaagaagac cgataagtcc 480 cacaagatct acgccaaggc cgtgacctat tctggcgccc tgaagatcac agacgaggag 540 aagttttggg aggccttctg caatggcatc ggccgggaga aggcctacgg ctgtggcatg 600 ctgatgatcc aagtctaa 618 <210> 144 <211> 566 <212> PRT <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(566) <223> Cas8 <400> 144 Met Cys Asp Gln Gln Tyr Val Ser Thr Leu Asn Val Leu Lys Asp Pro 1 5 10 15 Trp Ile Pro Val Val Phe Leu Asp Gly Lys Ile Lys Asp Val Gly Ile 20 25 30 Ile Glu Cys Phe Arg Asn Ala Glu Lys Ile Lys Thr Ile Ser Asn Ser 35 40 45 Lys Pro Tyr Glu Lys Ile Ala Ile Leu Arg Phe Leu Thr Ala Phe Ile 50 55 60 Thr Asp Val Tyr Gln Leu Asp Arg Arg Ile Glu Arg Gln Lys Leu Tyr 65 70 75 80 Asp Ala Gly Ser Phe Glu Ile Glu Arg Ile Glu Asn Tyr Val Lys Glu 85 90 95 Cys Glu Glu Lys Asn Gly Ala Ser Phe Val Leu Gly Asp Ser Gln Arg 100 105 110 Ser Phe Phe Cys Phe Asn Tyr Asn Pro Gln Val Asp Thr Glu Gly Val 115 120 125 Lys Leu Ser Ala Ala Tyr Leu His Leu Glu Leu Pro His Gly Asn Asn 130 135 140 Pro Ile His Ile Val Ala Gln Arg Glu Glu Asp Phe Glu Gly Asp Thr 145 150 155 160 Leu Pro Gln Phe Leu Arg Ala Ala Leu Ala Phe Asn Leu Phe Pro Thr 165 170 175 Gly Asn Met Leu Lys Gly Ala Asn Ser Lys Thr Gly Asp Asn Cys Tyr 180 185 190 Ile Asp Gly Val Gly Lys Asp Gly Lys Pro Lys Tyr Thr Ala Ala Tyr 195 200 205 Gly Ser Met Gly Ile Asn Ala Gly Ser Ser Met Ala Ala Ala Glu Pro 210 215 220 Val Phe Phe Trp Pro Glu Cys Asp Asn Leu Phe His Thr Leu Val Met 225 230 235 240 Cys Met Arg Ser Gln Gly Glu Leu Gln Asn Asn Leu Lys Leu Asn Asp 245 250 255 Pro Pro Ala Phe Trp Asn Ala Asp Ala Glu Pro Asn Pro Lys Ala Gly 260 265 270 Lys Arg Gly Asp Ile Val Thr Ser Val Ser Phe Val Ser Gly Leu Ala 275 280 285 Phe Gln Ala Arg Arg Ile Val Pro Val Ile Glu Asn Gly Lys Val Tyr 290 295 300 Glu Cys Tyr Ile Ser Asn Gly Tyr Thr Asn Ser Asn Glu Asn Val Trp 305 310 315 320 His Asp Pro Phe Ala Val Arg Leu Arg Asn His Lys Ser Gly Glu Ile 325 330 335 Phe Gln Met Pro Ala Lys Gly Asp Arg Glu Met Trp Arg Asn Ile Gly 340 345 350 Asn Leu Thr Ala Ser Arg Glu Glu Ser Trp His Leu Met Pro Asp Val 355 360 365 Leu Arg Pro Ile Lys Lys Ser Ala Asp Ala Thr Asp Tyr Tyr Glu Asn 370 375 380 Ile Ser Ser Leu Ala Met Ile Pro Met Thr Gln Asn Ala Gly Tyr Ser 385 390 395 400 Ala Met Phe Tyr Asp Asp Thr Val Gln Ile Pro Lys Glu Tyr Leu Glu 405 410 415 Asp Ser Tyr Leu Gly Glu Tyr Leu Thr Thr Arg Met Glu Ile Val Glu 420 425 430 Glu Ile Ser Lys Met Trp Asp Lys Leu Lys Ile Ser Ala Leu Leu Asp 435 440 445 Asn Lys Asp Lys Phe Ser Gly His Tyr Arg Asp Asp Ala Leu Gln Glu 450 455 460 Tyr Trp Val Lys Ile His Gln Phe Leu Phe Asp Gly Asp Asp Ser Phe 465 470 475 480 Leu Asn His Val Ile Arg Met Tyr His Glu Asp Ser Ser Ser Phe Glu 485 490 495 Lys Thr Ala Asp Lys Ala Leu Phe Glu Tyr Leu Thr Lys Ser Val Lys 500 505 510 Glu Ile Cys Glu Lys Glu Glu Lys Asn Thr Asn Ser Trp Asn Met Leu 515 520 525 Val Lys Ile Ile Arg Gln Ile His Gly Lys Asn Gly Cys Leu His Ile 530 535 540 Phe Tyr Gly Thr Leu Lys Lys Tyr Trp Lys Lys Glu Gly Lys Asp Lys 545 550 555 560 Asn Asp Thr Gly Ser Ile 565 <210> 145 <211> 165 <212> PRT <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(165) <223> Cse2 <400> 145 Met Ile Gln Glu Ala Tyr Glu Lys Leu Ala His Glu Glu Lys Arg Leu 1 5 10 15 Phe Ala His Cys Ala Gly Lys Leu Ile Lys Asp Ala Pro Lys Ala Ile 20 25 30 Ile Pro Phe Tyr Lys Val Val Pro Ser Glu Ile Glu Ser Lys Asn Gly 35 40 45 Lys Lys Tyr Thr Val Asp Glu Asp Ala Phe Phe Ala Ala Leu Cys Val 50 55 60 Arg Cys Leu Phe Glu Lys Ile Glu Gly Val Thr Leu Glu Pro Asp Ile 65 70 75 80 Leu Ile Ser Glu Gly Arg Lys Asn Pro Lys Ile Ser Leu Glu Gly Tyr 85 90 95 Asp Arg Arg Ile Ser Ala Leu Met Ser Asn Thr Glu Ala Glu Phe Phe 100 105 110 Ile Pro Lys Leu Ala Lys Leu Met Asn Tyr Thr Leu Lys Ile Thr Ser 115 120 125 Asn Lys Ile Pro Asp Cys Asp Gln Leu Tyr Trp Asp Ile His Asn Ile 130 135 140 Gly Ser Asn Glu Lys Asp Val Gln Arg Arg Trp Ala Arg Thr Ile Tyr 145 150 155 160 Val Asn Asn Glu Glu 165 <210> 146 <211> 395 <212> PRT <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(395) <223> Cas7 <400> 146 Met Ser Asn Ser Lys Tyr Gln Phe Leu Asn Gly Lys Lys Leu Ala Glu 1 5 10 15 Phe His Met Leu Lys Leu Tyr Pro Ser Ser Ala Leu Asn Arg Asp Asp 20 25 30 Ala Gly Glu Gln Lys Thr Gly Met Tyr Asn Gly Thr Leu Arg Asn Arg 35 40 45 Ile Ser Ser Gln Cys Ile Lys Arg Ser Trp Arg Leu Ser Glu Thr Phe 50 55 60 Glu Asp Val Phe Asp Glu Ile Gly Ile Arg Thr Lys Arg Met Pro Glu 65 70 75 80 Tyr Val Gly Lys Lys Leu Val Glu Asn Gly Val Pro Glu Glu Asp Val 85 90 95 Ile Ser Phe Lys Lys Ile Leu Ser Gly Glu Lys Val Asp Glu Lys Ser 100 105 110 Ser Lys Lys Ser Lys Ala Asp Gln Ala Ile Asp Glu Gly Lys Pro Val 115 120 125 Lys Thr Ala Ala Leu Ser Phe Tyr Ser Val Glu Glu Leu Asp Lys Ile 130 135 140 Ala Glu Ile Cys Lys Arg Ile Tyr Asp Asp Leu Glu Glu Pro Lys Ser 145 150 155 160 Lys Asn Leu Lys Thr Ile Lys Ile Asp Asn Ile Gln Lys Glu Met Arg 165 170 175 Lys Cys Val His Pro Met Asn Ile Asp Val Ala Ala Phe Gly Arg Met 180 185 190 Val Thr Asp Asn Met Leu Arg Pro Val Glu Gly Ala Met Gln Val Ala 195 200 205 Gln Ala Leu Ser Thr Asn Ala Ala Val Lys Glu Asn Asp Tyr Phe Val 210 215 220 Ala Cys Asp Asp Leu Val Lys Gly Glu Thr Ile Glu Asp Val Gly Gly 225 230 235 240 Glu Met Leu Gly Asp Ile Asp Tyr Asn Ser Ala Cys Tyr Tyr Ile His 245 250 255 Ala Asn Ala Asp Leu Glu Gln Phe Ala Glu Asn Leu Lys Asp Cys Glu 260 265 270 Asn Met Glu Glu Ile Val Lys Ala Leu Pro Ser Asn Met Val Glu Val 275 280 285 Met Ala Tyr Thr Asp Pro Thr Ala Arg Gln Ser Thr Met Glu Ala His 290 295 300 Val Leu Pro Glu Val Ile Tyr Val Glu Leu Lys Ser Lys Lys Arg Pro 305 310 315 320 Leu Asn Arg Met Lys Ala Phe Ala Glu Pro Cys Asn Arg Asn Ile Ala 325 330 335 Glu Lys Ser Ala Lys Lys Leu Ala Asp Tyr Ile Asn Cys Thr Asn Glu 340 345 350 Lys Ala Asp Leu Gly Ile Thr Asn Ala Leu Trp Tyr Cys Glu Asp Glu 355 360 365 Ser Val Lys Ala Pro Glu Asn Val Thr Val Val Asn Ser Ile Lys Glu 370 375 380 Leu Glu Gln Lys Leu Asn Glu Trp Met Asn Glu 385 390 395 <210> 147 <211> 160 <212> PRT <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(160) <223> Cas5 <400> 147 Met Lys Ile Lys Ile Val Leu Glu Gly Ala Phe Gln Ala Trp Gly Val 1 5 10 15 Pro Ser Glu Tyr Thr Trp Arg Gly Thr Ser Tyr Tyr Pro Thr Ala Arg 20 25 30 Gly Ile Val Gly Leu Ile Gly Cys Cys Met Gly Ile Pro Arg Gly Asp 35 40 45 Asp Arg Leu Glu Gln Leu Leu Ser Val Leu Lys Ile Thr Tyr Asp Ile 50 55 60 Asn Glu Asp Asp Asn Gly Asn Arg Lys Ser Gly Ser Ile Leu Thr Asp 65 70 75 80 Phe Gln Val Val Arg Lys Glu Asp Gly Gly Lys Leu Asn Ala Ala Asn 85 90 95 Gly Gly Thr Gly Asp Ser Tyr Gly Ile Ile Leu His Lys Ser Tyr Ile 100 105 110 Asn Asp Ala Ser Phe Thr Val His Ile Glu Gly Pro Asp Asp Leu Met 115 120 125 Lys Asp Val Tyr Asp Ala Met Leu Asp Pro Val Trp Val Pro Tyr Leu 130 135 140 Gly Arg Lys Asn Cys Pro Pro Thr Glu Pro Leu Ile Pro Glu Ile Glu 145 150 155 160 <210> 148 <211> 205 <212> PRT <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(205) <223> Cas6 <400> 148 Met Tyr Leu Thr Lys Leu Glu Leu Asn Ile Gln Asn Lys Ala Val Leu 1 5 10 15 His Asn Met Ser Asn Cys Glu Trp Met His Lys Leu Ile Leu Glu Lys 20 25 30 Gly Phe Gly His Ile Gln Ala Glu Asn Ala Arg Gln Thr Leu Lys Ile 35 40 45 Leu Tyr Ala Val Asp Gly Ile Lys Val Tyr Val Gln Ser Ala Val Glu 50 55 60 Pro Lys Phe Glu Asn Cys Ser Tyr Trp Ile Ser Thr Pro Ala Thr Ile 65 70 75 80 Cys Ile Asp Ala Met Lys Lys Ile Cys Gly Thr Gly Met Ala Val His 85 90 95 Phe Lys Cys Thr Cys Asn Pro Thr Lys Lys Leu Ile Asp Gly Gly Lys 100 105 110 Arg Ile Phe Leu Ser Ser Glu Arg Glu Arg Asp Glu Trp Ile Lys Arg 115 120 125 Val Met Glu Arg Ser Gly Ala Glu Val Leu Val Glu Ser Gln Thr Ser 130 135 140 Asp Phe Thr Val Trp Gly Met Lys Lys Asp Lys Lys Thr Asp Lys Ser 145 150 155 160 His Lys Ile Tyr Ala Lys Ala Val Thr Tyr Ser Gly Ala Leu Lys Ile 165 170 175 Thr Asp Glu Glu Lys Phe Trp Glu Ala Phe Cys Asn Gly Ile Gly Arg 180 185 190 Glu Lys Ala Tyr Gly Cys Gly Met Leu Met Ile Gln Val 195 200 205 <210> 149 <211> 90 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 149 gtattcccca cgcacgtggg ggtaaatccg ctgagtttaa ttacgcagcg gaagccggag 60 cggtattccc cacgcacgtg ggggtaaatc 90 <210> 150 <211> 1524 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(1524) <223> Cas8 <400> 150 atggagaacc gcttcaattt gattgatgaa ccctggattg cggtcgtgga tgtggggttg 60 gtcagtttaa ccgatatttt cagccagccg gaattacgcg ctttaggtgg gaatccggta 120 gaaaaaatcg cgctcactaa attgctactc gccatcgccc aggcagcagc gacgccgaca 180 gatgatagcg actggcagca gatgggctgg cagggaatgg cccattgctg cctgcagtac 240 cttgctaaat ggcatgaccg tttttatctg tatggcgaaa agccgttctt acagatgccc 300 gctattcagg ccgcggaatg taagtcattg ggagtattat caccggaggt gagtaccggc 360 aataccaccg ttttgaccga aagtcagcaa cagcagcaat taactgatgc agacaaagcg 420 ctagctattg ttatgcaaat gggctttggg ctcggaggca agaaaaccga taactctgtg 480 gtattaacgc cgggctatcg gggtaaacaa aacgacaagg gaaagccggg cagtggaaag 540 gccggggttt ctgtcgggca tatgggattg ttacattcgt tctggcaggg gaattcaatc 600 gtacagagca tttggctcaa tttgtttacc gctgaggata ttacgcagct ggcgatgtat 660 cccacgctgg ggactgctcc ctgggagcga atgccgacag gggaagatga tgacattgcg 720 cgctcgttga aagcgtcgtt gctgggccgc ttgatcttga tgggtaaatt ttgtctgtta 780 gctgaggacg gcattcacta tagcgatgga ataagccatg ccggttatct ggagggcaaa 840 accgacccct cggtgtccgt cgatttttca ggaaagaaac caaaggcgtt atgggttaat 900 ccgggtaaac gcccctggcg cgaactgacg tcgttattgc agtttattga gcaagatagc 960 ccccggggat atgaaacccg tcagcttagc cttcctctga agcggataac ccatcatgcg 1020 gagcagtttg cgctatggtc aggcggctta agggtgagta gtaatgcggg ggaacagtac 1080 gcttcaggga ccgatgatta tgttcagtca gaaatatggt tgtcatcaga tttaatcaat 1140 cacacatttt tagagtattt aaaatatgaa atgacgcagc ttgatgctgt gcaaaaacag 1200 ctttggggtg cagttgtacg ttattttcgc cagctatcag atattgataa atcagcgaca 1260 gggaaggctc aaccctttgt ggcaaagcag gccgaaaaag cgacgacgat attctggcaa 1320 ctttgtgaac gtcaggctca gaccctaatt aatgcttgct tgaattccgg tgaagaccat 1380 accgcgcgtc ttcagttacg aaaaattttt gccaggtacg ccgggcaggt ttttgatcag 1440 ctctgtcccg ccgacagtgc ccgtcaatta gatgcctggg cgctggcccg gcctaatttt 1500 tcccaatatc tcaccctcga ttaa 1524 <210> 151 <211> 567 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(567) <223> Cse2 <400> 151 atggatcagg ttcctgcaga cgttaccgcc gaaagcgccg gtaacgaatc gcctgccaaa 60 cgatttgtcg gttacgtgat tgagcgtatc gcgaaagaca atggctttgc cgcccgcctt 120 aaacgagcgg ataacccggc gaccgagtat cagagctggg aaatcctggc ggggtttggc 180 attgacctgg aaaaagagtg gcaacgcctg ccgtactgcg tcattggcgc cgcgctggca 240 aaggcgaaac cggccagcaa tggcacaatc actctggggg ccgccattgc cggttgttat 300 cccgaaggca atcagtctga acaggcgaaa gctcgcctgc gacggctgtt ggcctgtact 360 tcgaccagcg aagcgtgccg tattttgcgc ccgttgttgg cattaatggc cagccgcagt 420 gtgacgccgg atttcgcagg gctactcaac gaactgcagt ggttctccgg cagcagtcgc 480 gaacggatcc gcgcccgctg ggcgcaggaa ttctatcgtc gtgccggtga ggctgccggg 540 agtgaggcga ggaattcaca tgactga 567 <210> 152 <211> 1035 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(1035) <223> Cas7 <400> 152 atgactaccc cgttcagaaa cacccgtatt gagtttcata ttctgcagtc tttcccggtg 60 acctgcctta accgcgatga cgtgggcgcc cccaagtccg ccatcgttgg cggtgtgtcg 120 cgcgccagag tgtcatcgca gtgctggaag cgccaggtgc gtctggcgct gcctgatttt 180 ggtattcgtc tcggggtgcg tagtaaaaaa actgcctcac tgctggccaa cgcctgtcgc 240 gcactgggag cgagcgaaga acaggccacc ggatgcggtg aagcgatggc cgcttttttc 300 tccgatgata ccctgctgtt tctcagcgag gctgaggccg ccgcatttgc cgcttatgcg 360 cagggaaaag attttgacgc cgccagcctg aaagacaaag agctggtcaa agtcgccaaa 420 aaggtggtta acaataccct ggatgccctg gatattgcgc ttttcgggcg catggtggcc 480 aaagcggcgg atatgaacgt tgaggcggcg gcatcgttcg cgcatgccat ttccacccat 540 aaagtgagta atgagatcga gttttttacc gccgtggatg actgtaaaac ggaggatgaa 600 agcggttcgg cacatatggg cagcctggag tttaattcgg cgacctacta tcgctatgtc 660 agcttggatc tcgggcaact ggcgcagacg ttgggtgagg acgccgatat gaaaaccgcc 720 gtcgccgctt ttgttaaggc actctatgtc gccgtcccct cagcccgaca gacaacgcag 780 tccggggcct gcccgtggga atatgcccgc gtgttactgc gtaaaggtca gggtctgcag 840 gcttcattcg agcagccagt taagagtcag ggtgaaggct tcttatctcc cagtaaagcg 900 gcgctcaaaa actggttgca tacaaaagaa aaactctctg gctccttgtt cggcaaacaa 960 ggcgattatg agtggggtga ggacctcgac tacagcattg accgcctgat cgctgactta 1020 cagtcacatc tgtaa 1035 <210> 153 <211> 717 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(717) <223> Cas5 <400> 153 atgagacaaa ctacgcaata tatgctgctg tggcttgaag ggccgctgca gtcctggggg 60 ggcgattcaa agttcggtgt gcgcgatacg ctgaatttcc cgactcgctc gggcattctg 120 gggctgattt gctgtgcacg aggcgccgcg gggccagagg tcgagtggct ggcggagatg 180 aataacctgc cgatggaggt tcgcgcctac gcccgaaccg acaaggaggg ccagccgctc 240 ctgcgcgagc cgacattgtg cgatttccag atggttggca gcggatatga cgacagcgat 300 ccgtggcaaa gtctgctgat ccctaaaaca tccgatggaa agaaagccgt agggggtgga 360 acgaaaatga cctaccgcca ctatctccag gatgccgtat tcgccgtggt aatgggactt 420 ggcagccagc aagccgagtc gttaccagag gcgctacaaa atccggtatg ggatttatat 480 ctcggtcgta aaagctgcgt gcccagcgag ctgatctatc agggcatcta tgacagcgca 540 gaagcggcat ggcagcaggc caggacatta gctgagagta agcggcgcac gctgagttac 600 aaggtcattg aaggggaagg ggatggcgat gtcatcacgc ttaatgatgt cccggtgcag 660 ttcggccggc ataagcgtta ccgggatcgt caggtgaccg tgctggagtg cggctaa 717 <210> 154 <211> 648 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(648) <223> Cas6 <400> 154 atgactgacc tctttgcgag tgctttacat ctcgatcgcg ctgcggtgaa agcgctgaaa 60 ataagcgatg cctactccct acaccgggtg gtgtacagcc tgtttgctga cgcgcgtaca 120 gaccgggaga agtgcagcca tatttcgagc gggatcgcct atgccgacca gggcggggat 180 tttcatggcc gcaaaatatt gatcgtctct gacagacttc cggctgcaaa ggttgatggc 240 ctgtacggtg aggtcatcag taaatcgatt ccggccgcct ttctctccca ttcgcgttat 300 cgctttcagg tacaagtgaa tccggtacgg aaagataagc aaacgggtaa acgcgtcgcg 360 gtgaaaggcc gggccgatat tgcgcagtgg tttattcagc gagccgccag ccgctggggc 420 tttgacgttg accttcctgg cttgcaggtt gaggcgatgg aagtgctgca gtttaaagat 480 aaaggcggcc gccaggtaac gcttggcaag gcgacggtgc aggggctgct caccgtcacc 540 gaccgacaga agttccagca tagttttcat catggcattg gtaaagggcg agcctttggc 600 tgcggcctgc tgcagattgt gcccgttgtt gatgcgcttt tttcctga 648 <210> 155 <211> 1524 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(1524) <223> Cas8 <400> 155 atggagaaca ggttcaatct gatcgacgag ccctggatcg ccgtggtgga tgtgggcctg 60 gtgtccctga ccgacatctt ttctcagcca gagctgcgcg ccctgggagg aaatcctgtg 120 gagaagatcg ccctgacaaa gctgctgctg gcaatcgcac aggcagcagc aacccctaca 180 gacgattccg actggcagca gatgggatgg cagggaatgg cacactgctg tctgcagtac 240 ctggccaagt ggcacgatcg gttctacctg tatggcgaga agcccttcct gcagatgcct 300 gccatccagg cagcagagtg caagtccctg ggcgtgctga gccctgaggt gtccaccggc 360 aacaccacag tgctgacaga gtctcagcag cagcagcagc tgaccgatgc cgacaaggcc 420 ctggccatcg tgatgcagat gggcttcggc ctgggcggca agaagaccga caacagcgtg 480 gtgctgacac ccggctatcg gggcaagcag aatgataagg gcaagcctgg cagcggcaag 540 gcaggcgtgt ccgtgggaca catgggcctg ctgcactcct tctggcaggg caactctatc 600 gtgcagagca tctggctgaa tctgtttacc gccgaggaca tcacacagct ggccatgtac 660 ccaaccctgg gcacagcccc atgggagaga atgcccaccg gcgaggacga tgacatcgcc 720 agatccctga aggcctctct gctgggcagg ctgatcctga tgggcaagtt ctgtctgctg 780 gccgaggatg gcatccacta cagcgacggc atctcccacg ccggctatct ggagggcaag 840 accgatccca gcgtgtccgt ggacttcagc ggcaagaagc ctaaggccct gtgggtgaat 900 ccaggcaaga gaccctggag ggagctgaca tctctgctgc agtttatcga gcaggacagc 960 ccacgcggct atgagacccg gcagctgagc ctgcccctga agagaatcac acaccacgca 1020 gagcagtttg cactgtggtc cggcggactg agggtgagct ccaacgcagg agagcagtac 1080 gccagcggca ccgatgacta tgtgcagtcc gagatctggc tgtctagcga cctgatcaat 1140 cacaccttcc tggagtacct gaagtatgag atgacacagc tggatgcagt gcagaagcag 1200 ctgtggggag cagtggtgcg ctactttcgg cagctgtccg atatcgacaa gtctgccaca 1260 ggcaaggcac agcccttcgt ggcaaagcag gcagagaagg ccaccacaat cttttggcag 1320 ctgtgcgaga ggcaggcaca gaccctgatc aacgcctgtc tgaatagcgg cgaggaccac 1380 acagccagac tgcagctgag gaagatcttt gccagatatg ccggccaggt gttcgatcag 1440 ctgtgccctg ccgactccgc caggcagctg gatgcctggg cactggcccg gccaaacttc 1500 tctcagtacc tgaccctgga ttaa 1524 <210> 156 <211> 567 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(567) <223> Cse2 <400> 156 atggatcagg tgcctgcaga cgtgacagca gagtctgccg gcaatgagag cccagccaag 60 cggttcgtgg gctatgtgat cgagcggatc gccaaggata acggatttgc agcacgcctg 120 aagagggcag acaatccagc caccgagtat cagtcctggg agatcctggc cggcttcggc 180 atcgacctgg agaaggagtg gcagcgcctg ccatactgcg tgatcggagc cgccctggca 240 aaggcaaagc ctgcctctaa cggaaccatc acactgggag cagcaatcgc aggatgttac 300 cccgagggca atcagagcga gcaggcaaag gcaaggctgc ggagactgct ggcatgcacc 360 tccacatctg aggcctgtag aatcctgagg ccactgctgg ccctgatggc aagccgctcc 420 gtgacccccg acttcgcagg actgctgaac gagctgcagt ggtttagcgg ctctagcagg 480 gagcgcatcc gggcaagatg ggcacaggag ttttatagga gggcaggaga ggcagcaggc 540 tctgaggcca gaaacagcca cgactaa 567 <210> 157 <211> 1035 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(1035) <223> Cas7 <400> 157 atgaccacac ccttccgcaa cacccggatc gagtttcaca tcctgcagag cttccctgtg 60 acatgcctga atagagacga tgtgggagca ccaaagtctg ccatcgtggg aggcgtgagc 120 cgggccagag tgagctccca gtgttggaag agacaggtga ggctggccct gcctgacttt 180 ggcatcagac tgggcgtgag gtctaagaag accgccagcc tgctggcaaa cgcctgccgg 240 gccctgggag ccagcgagga gcaggccacc ggctgtggcg aggccatggc cgccttcttt 300 tctgacgata cactgctgtt tctgagcgag gcagaggcag cagccttcgc cgcctacgcc 360 cagggcaagg attttgacgc cgccagcctg aaggacaagg agctggtgaa ggtggccaag 420 aaggtggtga acaataccct ggatgccctg gacatcgccc tgttcggcag aatggtggcc 480 aaggcagcag atatgaacgt ggaggcagca gcctcctttg cccacgcaat ctccacacac 540 aaggtgtcta atgagatcga gttctttacc gccgtggacg attgcaagac agaggacgag 600 tccggctctg cccacatggg cagcctggag ttcaactccg ccacctacta tagatacgtg 660 tccctggatc tgggacagct ggcacagacc ctgggagagg atgccgacat gaagacagcc 720 gtggccgcct ttgtgaaggc cctgtacgtg gcagtgccat ccgccagaca gaccacacag 780 tctggcgcct gtccttggga gtatgcccgc gtgctgctgc ggaagggaca gggactgcag 840 gccagcttcg agcagcctgt gaagtcccag ggcgagggct ttctgagccc atccaaggcc 900 gccctgaaga attggctgca caccaaggag aagctgtctg gcagcctgtt cggcaagcag 960 ggcgactacg agtggggcga ggatctggac tatagcatcg atcgcctgat cgcagacctg 1020 cagtcccacc tgtaa 1035 <210> 158 <211> 717 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(717) <223> Cas5 <400> 158 atgaggcaga ccacacagta catgctgctg tggctggagg gaccactgca gtcctgggga 60 ggcgactcta agtttggcgt gagagatacc ctgaatttcc ctacaaggtc cggcatcctg 120 ggcctgatct gctgtgcaag gggagcagca ggccctgagg tggagtggct ggccgagatg 180 aacaatctgc caatggaggt gagagcctat gccaggaccg acaaggaggg acagcctctg 240 ctgagggagc caacactgtg cgatttccag atggtgggca gcggctacga cgattccgac 300 ccctggcagt ctctgctgat ccctaagacc agcgatggca agaaggcagt gggaggagga 360 accaagatga catacaggca ctatctgcag gatgccgtgt ttgcagtggt catgggactg 420 ggcagccagc aggcagagtc cctgcctgag gccctgcaga acccagtgtg ggacctgtac 480 ctgggccgga agtcttgcgt gcctagcgag ctgatctacc agggcatcta tgattccgcc 540 gaggcagcat ggcagcaggc aagaaccctg gccgagagca agcggagaac actgtcctat 600 aaagtgatcg agggcgaggg cgatggcgac gtgatcaccc tgaacgacgt gcctgtgcag 660 ttcggccgcc acaagaggta ccgcgatagg caggtcaccg tgctggagtg cggataa 717 <210> 159 <211> 648 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(648) <223> Cas6 <400> 159 atgaccgatc tgtttgcatc tgccctgcac ctggacaggg cagcagtgaa ggccctgaag 60 atctccgatg cctactctct gcaccgggtg gtgtatagcc tgttcgcaga tgcaaggaca 120 gacagggaga agtgctccca catctcctct ggcatcgcat acgcagatca gggaggcgac 180 tttcacggac gcaagatcct gatcgtgagc gacaggctgc cagcagcaaa ggtggatgga 240 ctgtacggcg aagtgatctc taagagcatc cctgccgcct ttctgtccca cagccggtat 300 aggttccagg tgcaagtgaa tccagtgagg aaggacaagc agaccggcaa gagagtggcc 360 gtgaagggca gggccgatat cgcacagtgg ttcatccaga gggcagcatc ccggtggggc 420 tttgatgtgg acctgccagg actgcaggtg gaggcaatgg aggtgctgca gttcaaggac 480 aagggaggcc gccaggtgac cctgggcaag gcaacagtgc agggactgct gaccgtgaca 540 gatagacaga agtttcagca ctctttccac cacggaatcg gcaagggaag ggccttcggc 600 tgcggactgc tgcagatcgt gccagtggtg gacgccctgt ttagctaa 648 <210> 160 <211> 507 <212> PRT <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(507) <223> Cas8 <400> 160 Met Glu Asn Arg Phe Asn Leu Ile Asp Glu Pro Trp Ile Ala Val Val 1 5 10 15 Asp Val Gly Leu Val Ser Leu Thr Asp Ile Phe Ser Gln Pro Glu Leu 20 25 30 Arg Ala Leu Gly Gly Asn Pro Val Glu Lys Ile Ala Leu Thr Lys Leu 35 40 45 Leu Leu Ala Ile Ala Gln Ala Ala Ala Thr Pro Thr Asp Asp Ser Asp 50 55 60 Trp Gln Gln Met Gly Trp Gln Gly Met Ala His Cys Cys Leu Gln Tyr 65 70 75 80 Leu Ala Lys Trp His Asp Arg Phe Tyr Leu Tyr Gly Glu Lys Pro Phe 85 90 95 Leu Gln Met Pro Ala Ile Gln Ala Ala Glu Cys Lys Ser Leu Gly Val 100 105 110 Leu Ser Pro Glu Val Ser Thr Gly Asn Thr Thr Val Leu Thr Glu Ser 115 120 125 Gln Gln Gln Gln Gln Leu Thr Asp Ala Asp Lys Ala Leu Ala Ile Val 130 135 140 Met Gln Met Gly Phe Gly Leu Gly Gly Lys Lys Thr Asp Asn Ser Val 145 150 155 160 Val Leu Thr Pro Gly Tyr Arg Gly Lys Gln Asn Asp Lys Gly Lys Pro 165 170 175 Gly Ser Gly Lys Ala Gly Val Ser Val Gly His Met Gly Leu Leu His 180 185 190 Ser Phe Trp Gln Gly Asn Ser Ile Val Gln Ser Ile Trp Leu Asn Leu 195 200 205 Phe Thr Ala Glu Asp Ile Thr Gln Leu Ala Met Tyr Pro Thr Leu Gly 210 215 220 Thr Ala Pro Trp Glu Arg Met Pro Thr Gly Glu Asp Asp Asp Ile Ala 225 230 235 240 Arg Ser Leu Lys Ala Ser Leu Leu Gly Arg Leu Ile Leu Met Gly Lys 245 250 255 Phe Cys Leu Leu Ala Glu Asp Gly Ile His Tyr Ser Asp Gly Ile Ser 260 265 270 His Ala Gly Tyr Leu Glu Gly Lys Thr Asp Pro Ser Val Ser Val Asp 275 280 285 Phe Ser Gly Lys Lys Pro Lys Ala Leu Trp Val Asn Pro Gly Lys Arg 290 295 300 Pro Trp Arg Glu Leu Thr Ser Leu Leu Gln Phe Ile Glu Gln Asp Ser 305 310 315 320 Pro Arg Gly Tyr Glu Thr Arg Gln Leu Ser Leu Pro Leu Lys Arg Ile 325 330 335 Thr His His Ala Glu Gln Phe Ala Leu Trp Ser Gly Gly Leu Arg Val 340 345 350 Ser Ser Asn Ala Gly Glu Gln Tyr Ala Ser Gly Thr Asp Asp Tyr Val 355 360 365 Gln Ser Glu Ile Trp Leu Ser Ser Asp Leu Ile Asn His Thr Phe Leu 370 375 380 Glu Tyr Leu Lys Tyr Glu Met Thr Gln Leu Asp Ala Val Gln Lys Gln 385 390 395 400 Leu Trp Gly Ala Val Val Arg Tyr Phe Arg Gln Leu Ser Asp Ile Asp 405 410 415 Lys Ser Ala Thr Gly Lys Ala Gln Pro Phe Val Ala Lys Gln Ala Glu 420 425 430 Lys Ala Thr Thr Ile Phe Trp Gln Leu Cys Glu Arg Gln Ala Gln Thr 435 440 445 Leu Ile Asn Ala Cys Leu Asn Ser Gly Glu Asp His Thr Ala Arg Leu 450 455 460 Gln Leu Arg Lys Ile Phe Ala Arg Tyr Ala Gly Gln Val Phe Asp Gln 465 470 475 480 Leu Cys Pro Ala Asp Ser Ala Arg Gln Leu Asp Ala Trp Ala Leu Ala 485 490 495 Arg Pro Asn Phe Ser Gln Tyr Leu Thr Leu Asp 500 505 <210> 161 <211> 188 <212> PRT <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(188) <223> Cse2 <400> 161 Met Asp Gln Val Pro Ala Asp Val Thr Ala Glu Ser Ala Gly Asn Glu 1 5 10 15 Ser Pro Ala Lys Arg Phe Val Gly Tyr Val Ile Glu Arg Ile Ala Lys 20 25 30 Asp Asn Gly Phe Ala Ala Arg Leu Lys Arg Ala Asp Asn Pro Ala Thr 35 40 45 Glu Tyr Gln Ser Trp Glu Ile Leu Ala Gly Phe Gly Ile Asp Leu Glu 50 55 60 Lys Glu Trp Gln Arg Leu Pro Tyr Cys Val Ile Gly Ala Ala Leu Ala 65 70 75 80 Lys Ala Lys Pro Ala Ser Asn Gly Thr Ile Thr Leu Gly Ala Ala Ile 85 90 95 Ala Gly Cys Tyr Pro Glu Gly Asn Gln Ser Glu Gln Ala Lys Ala Arg 100 105 110 Leu Arg Arg Leu Leu Ala Cys Thr Ser Thr Ser Glu Ala Cys Arg Ile 115 120 125 Leu Arg Pro Leu Leu Ala Leu Met Ala Ser Arg Ser Val Thr Pro Asp 130 135 140 Phe Ala Gly Leu Leu Asn Glu Leu Gln Trp Phe Ser Gly Ser Ser Arg 145 150 155 160 Glu Arg Ile Arg Ala Arg Trp Ala Gln Glu Phe Tyr Arg Arg Ala Gly 165 170 175 Glu Ala Ala Gly Ser Glu Ala Arg Asn Ser His Asp 180 185 <210> 162 <211> 344 <212> PRT <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(344) <223> Cas7 <400> 162 Met Thr Thr Pro Phe Arg Asn Thr Arg Ile Glu Phe His Ile Leu Gln 1 5 10 15 Ser Phe Pro Val Thr Cys Leu Asn Arg Asp Asp Val Gly Ala Pro Lys 20 25 30 Ser Ala Ile Val Gly Gly Val Ser Arg Ala Arg Val Ser Ser Gln Cys 35 40 45 Trp Lys Arg Gln Val Arg Leu Ala Leu Pro Asp Phe Gly Ile Arg Leu 50 55 60 Gly Val Arg Ser Lys Lys Thr Ala Ser Leu Leu Ala Asn Ala Cys Arg 65 70 75 80 Ala Leu Gly Ala Ser Glu Glu Gln Ala Thr Gly Cys Gly Glu Ala Met 85 90 95 Ala Ala Phe Phe Ser Asp Asp Thr Leu Leu Phe Leu Ser Glu Ala Glu 100 105 110 Ala Ala Ala Phe Ala Ala Tyr Ala Gln Gly Lys Asp Phe Asp Ala Ala 115 120 125 Ser Leu Lys Asp Lys Glu Leu Val Lys Val Ala Lys Lys Val Val Asn 130 135 140 Asn Thr Leu Asp Ala Leu Asp Ile Ala Leu Phe Gly Arg Met Val Ala 145 150 155 160 Lys Ala Ala Asp Met Asn Val Glu Ala Ala Ala Ser Phe Ala His Ala 165 170 175 Ile Ser Thr His Lys Val Ser Asn Glu Ile Glu Phe Phe Thr Ala Val 180 185 190 Asp Asp Cys Lys Thr Glu Asp Glu Ser Gly Ser Ala His Met Gly Ser 195 200 205 Leu Glu Phe Asn Ser Ala Thr Tyr Tyr Arg Tyr Val Ser Leu Asp Leu 210 215 220 Gly Gln Leu Ala Gln Thr Leu Gly Glu Asp Ala Asp Met Lys Thr Ala 225 230 235 240 Val Ala Ala Phe Val Lys Ala Leu Tyr Val Ala Val Pro Ser Ala Arg 245 250 255 Gln Thr Thr Gln Ser Gly Ala Cys Pro Trp Glu Tyr Ala Arg Val Leu 260 265 270 Leu Arg Lys Gly Gln Gly Leu Gln Ala Ser Phe Glu Gln Pro Val Lys 275 280 285 Ser Gln Gly Glu Gly Phe Leu Ser Pro Ser Lys Ala Ala Leu Lys Asn 290 295 300 Trp Leu His Thr Lys Glu Lys Leu Ser Gly Ser Leu Phe Gly Lys Gln 305 310 315 320 Gly Asp Tyr Glu Trp Gly Glu Asp Leu Asp Tyr Ser Ile Asp Arg Leu 325 330 335 Ile Ala Asp Leu Gln Ser His Leu 340 <210> 163 <211> 238 <212> PRT <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(238) <223> Cas5 <400> 163 Met Arg Gln Thr Thr Gln Tyr Met Leu Leu Trp Leu Glu Gly Pro Leu 1 5 10 15 Gln Ser Trp Gly Gly Asp Ser Lys Phe Gly Val Arg Asp Thr Leu Asn 20 25 30 Phe Pro Thr Arg Ser Gly Ile Leu Gly Leu Ile Cys Cys Ala Arg Gly 35 40 45 Ala Ala Gly Pro Glu Val Glu Trp Leu Ala Glu Met Asn Asn Leu Pro 50 55 60 Met Glu Val Arg Ala Tyr Ala Arg Thr Asp Lys Glu Gly Gln Pro Leu 65 70 75 80 Leu Arg Glu Pro Thr Leu Cys Asp Phe Gln Met Val Gly Ser Gly Tyr 85 90 95 Asp Asp Ser Asp Pro Trp Gln Ser Leu Leu Ile Pro Lys Thr Ser Asp 100 105 110 Gly Lys Lys Ala Val Gly Gly Gly Thr Lys Met Thr Tyr Arg His Tyr 115 120 125 Leu Gln Asp Ala Val Phe Ala Val Val Met Gly Leu Gly Ser Gln Gln 130 135 140 Ala Glu Ser Leu Pro Glu Ala Leu Gln Asn Pro Val Trp Asp Leu Tyr 145 150 155 160 Leu Gly Arg Lys Ser Cys Val Pro Ser Glu Leu Ile Tyr Gln Gly Ile 165 170 175 Tyr Asp Ser Ala Glu Ala Ala Trp Gln Gln Ala Arg Thr Leu Ala Glu 180 185 190 Ser Lys Arg Arg Thr Leu Ser Tyr Lys Val Ile Glu Gly Glu Gly Asp 195 200 205 Gly Asp Val Ile Thr Leu Asn Asp Val Pro Val Gln Phe Gly Arg His 210 215 220 Lys Arg Tyr Arg Asp Arg Gln Val Thr Val Leu Glu Cys Gly 225 230 235 <210> 164 <211> 215 <212> PRT <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(215) <223> Cas6 <400> 164 Met Thr Asp Leu Phe Ala Ser Ala Leu His Leu Asp Arg Ala Ala Val 1 5 10 15 Lys Ala Leu Lys Ile Ser Asp Ala Tyr Ser Leu His Arg Val Val Tyr 20 25 30 Ser Leu Phe Ala Asp Ala Arg Thr Asp Arg Glu Lys Cys Ser His Ile 35 40 45 Ser Ser Gly Ile Ala Tyr Ala Asp Gln Gly Gly Asp Phe His Gly Arg 50 55 60 Lys Ile Leu Ile Val Ser Asp Arg Leu Pro Ala Ala Lys Val Asp Gly 65 70 75 80 Leu Tyr Gly Glu Val Ile Ser Lys Ser Ile Pro Ala Ala Phe Leu Ser 85 90 95 His Ser Arg Tyr Arg Phe Gln Val Gln Val Asn Pro Val Arg Lys Asp 100 105 110 Lys Gln Thr Gly Lys Arg Val Ala Val Lys Gly Arg Ala Asp Ile Ala 115 120 125 Gln Trp Phe Ile Gln Arg Ala Ala Ser Arg Trp Gly Phe Asp Val Asp 130 135 140 Leu Pro Gly Leu Gln Val Glu Ala Met Glu Val Leu Gln Phe Lys Asp 145 150 155 160 Lys Gly Gly Arg Gln Val Thr Leu Gly Lys Ala Thr Val Gln Gly Leu 165 170 175 Leu Thr Val Thr Asp Arg Gln Lys Phe Gln His Ser Phe His His Gly 180 185 190 Ile Gly Lys Gly Arg Ala Phe Gly Cys Gly Leu Leu Gln Ile Val Pro 195 200 205 Val Val Asp Ala Leu Phe Ser 210 215 <210> 165 <211> 89 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <220> <221> misc_feature <222> (1)..(89) <223> CRISPR <400> 165 gtcttcccca cacgcgtggg ggtgtttccg gctctttttt atctccttca tccttcgcta 60 tgtcttcccc acacgcgtgg gggtgtttc 89 <210> 166 <211> 1569 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(1569) <223> Cas8 <400> 166 atgactgaac actacaacct gctggatacc ccctggctgc cggtccgcct ggcgaacggc 60 gaggtccgcg agatggggct gctggaggtg taccgcgagg ccgagcgtat cagcgccctg 120 gcggaaaccg agccgccgag tctgattgca cagtaccgcc tgctgctggc cattacccac 180 cgggcgcttt tgctggagta cggcgcgtgg aaggatagtg gcaggctgcg ttggttccgc 240 gaggggttgc ccattgacgt cgtggaacgc tacctggagc gttggcgaga gcgtttctgg 300 ctgttccatc cacagtatcc gttcatgcaa gtcgcggcct tggctagcgc cgcggaaacc 360 tgcgacaaac agaagccctg ggcccagatt tccctggcca gcgccaacgg caatacccct 420 gtcgtgttcg accactccta tgacctggcg ccttccgcgg tgagtgcgga ccgggcgttg 480 tgcgccttgc tgggcttcct acagttcact ccgggcgggt tggtcaagac tgttcgcgat 540 tcggacaaag ccggcgcact ggccaatacg gcggcggtgg tacccctggc ggacagtctg 600 gcgaaaaccc tgtgcctggc cttgcacccg gcctcgggcg aagcagcctt cgatttgcct 660 gcctgggagc gggaagcctt gacgattccg caactggccg ccgaccccat tcttgccagc 720 gggcctaacg atcgctacac ccggcagtcg cgagcagtgt tgttgctgcc ggaggaagag 780 ggctgcgtcc gctggattcg tttcgccgcc ggccaggcgc tggccgacga tgtccaggcg 840 ccggacccca tggccagcta ccgccccggc gccaacaaca gcatggtccg gctgagcttc 900 ggtgaagggc gggtgttctg gcgcgacctg ccgagcttgc tgccggacag cgcggcggct 960 ggctcgaaac gggctgccgt tctcgactgg gcttccaacc tgcgcagcat cggcgccgat 1020 gcgccgtcct cgatgctgct ggtcgccgga ttggccagcg accaggccaa actgttgcgc 1080 tggcgctccg agaccgttgt cctgcctgcg gccctgctcg actcggaggg ctgtgccaac 1140 gaactgcgcc gttgtatccg ggaatcggaa gacctgtacg gcgaactgcg caagatcgcc 1200 gtggcaatgc tcgccgaggc gttgcccgat cctgccagca aggacacctg ggcgagggct 1260 cgtacgtcgt ttgacaacgg tccggctgcg gccacctatt tcgccttgct ggagcgctcg 1320 ttgccctcgc tcatggccct catcggcggc gataggttgg agatgctgga cgaagccgag 1380 gcgttctggc gaagccgcct gctggcagcc ctcgaggtcg cctggcaggg cgtgcgggaa 1440 ggcctgggcc tgtcggtcgc agcgttgcgt gcggaggcca aggtccggcc gcgctacctg 1500 gcgttgctgc gtcgttaccg tagcgaacgt acctcttcca ctccacttgc agaggagcag 1560 tgtgcatga 1569 <210> 167 <211> 531 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(531) <223> Cse2 <400> 167 atgagtgctg ccgaacatcc tttcatcggc catctgcagc gcttgcagaa tgatcgcggt 60 gcgctggccg ttctacggcg cagcctgggc ttcgcgccgg gtgcctatgt gccggcctat 120 ccctatgtgg aacgcttcgt cggtgccgag aggcatgcgc aggatgcctg gcgcctggca 180 ctgtatctga ccgccggatt gttcgccagc catcccggac aggggcgggc gagcctggcg 240 atgcgcttcg gcgaactgat gaaagcgcgc aacagcgcga gcatcgaaaa gcgtttcatc 300 gccttgctgg ctgccgatgc ggaaaacctg ccggtgtatc tgcgccaggc cgtgagcctg 360 ttggcggcgg acaagctcgc cttcgactat ggcgccttgc tcgacgacct tgcccattgg 420 ctcgaccctt acctgcctgt tgcgcgcggc gacgccattc gccagcgctg ggccagggat 480 ttctacgcgg cgctggccaa cacaaccgac acctcccttc acaaggattg a 531 <210> 168 <211> 1143 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(1143) <223> Cas7 <400> 168 atgaatttgt tcatcgagtt ccatctgatc cagaacttcg ctccgtccaa cctcaaccgt 60 gacgataccg gagcgcccaa ggatgccatc tttggcggtc accgtcgggc tcgcgtcagc 120 agccagtgct tcaagcgtgc gatccgcctg actgcccacg agcaggagtt ggtcgcgccc 180 gaacatcgcg gcgtgcgcac caagaagctc aaggcattgc tgctggagcg gcttgccgga 240 cgcgatcccg ccgaggccga gggcaagatc gagacggcgc tggcggccgc ggggctcaag 300 ctcaaggacg atggcaagac cgaatacctg ctgtttctcg gcgaagcgga gattgccggt 360 ttcgccgcgc tgatcgagca gcgctgggat gaactgggca gcgccgcgcc ggctggcgag 420 aaaaagggca agaaggaagc caaggcgaac gtgccgacgg aagtgatcaa gcaggccagg 480 gccctgctcg acggtggcaa ggccgttgac gtggcgctgt tcgggcggat gctcgccgat 540 ctgcccgaag tcaatcagga cgcggcctgc caggtggccc atgcgatcag tacccatcgt 600 gtcgagcgcg agttcgatta cttcaccgcc gtcgacgatc gcggtggccc ggacgaaagc 660 ggcgccggca tgatcggcca ggtggagttc aattccgcca cgctgtatcg ctacgcagtg 720 gtcgacctgc gcaagttgct cggcaacctg cagaacgacg gcgagctggt gctgtcggcg 780 ctggaagcgt tcacccaggc catggtccgg gcgatcccgt cgggcaagca gaacaccttc 840 gcggcgcaca acctgccggc cttcgtcggt atctgcttgc gccacgcggg cccgctgaac 900 ctggccaacg cctttgagaa accggtcgtc gcgcgtgccg atgcctccct cagcgagcgc 960 tccgttgccg agttggcccg ccacgaccag caattggcct cggtctatgg tgacagccgc 1020 gaccgctggg cttatctgga catcagcggt gcctggccga aggagcgtgg cgagccggcc 1080 ggcaacctgc agcaactcgc cgattggctg cgcagccagg tttccagccg tctgggaggc 1140 tga 1143 <210> 169 <211> 663 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(663) <223> Cas5 <400> 169 atggctacct tgctgatgcg cctgcaaggg ccgatgcagt catggggcac caccagccgt 60 tttgacgagc gcgacactca gctggaaccg tcgaagtcgg gagtgcttgg cctggtctgc 120 gccgccctgg gacgtgatcg cagcgagccg ctggaggatc tggccagcct gcggatgggg 180 gtgcgcgtcg accgagaggg cattccgttg cgcgactacc agacggccac cggtgtgctg 240 gtcgccagtg gcaaggccga tccgcggcgg acagtggtca gcccgcggca ttacctggcc 300 gacgcggtct ttctggtcgg gctcgaaggg cgcgaccagg ccctgctgga gcgaatccag 360 caagccttgc gtgcaccgtt ctggccgctg tgcctgggcc gcaagagttt cgttcctggg 420 agcccggtgt ggttgcccga gggcctttct tccctggcac tggaacaggc gttgcaggcc 480 tggccacgcc tggccgaggc gcaaccgggc gaccgcggca agcccttgcg ttgcctgatc 540 gaggatgagc gcagcggggt ggtacgcctc gatcagccca tcgccccctt tgccgaacgc 600 cgtttcggcc cacgcttcgt acgctcggga gtcgcggatg tacctgacca gactgaccct 660 tga 663 <210> 170 <211> 612 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(612) <223> Cas6 <400> 170 atgtacctga ccagactgac ccttgatcct cgcagcgctc aggcgcgccg cgacctaggc 60 gacgcctatg agatgcaccg tactttgtcg cgggttttcg ccgacgagca ggctccggca 120 tcgcgcttcc tctggcgtct ggaggcctcg gggaatgcct ggtccactcc gaccttgctg 180 gtccaggcgg ccagcgaggg taactggtcg gtgctgcagg cgctccctgg ctacctgctg 240 ggggagccgc agagcaaatc tctggctttg cgacagtggc tggaaagcga tatctcctac 300 cgtttcagat tgttcgccaa tccgacggtg acacgccagg gcaagcgcta tgggctggtg 360 ggcgaggagc agcaactggc ttggctggca cgccagggcg agcggcacgg tttcgtggtc 420 gaggcggccc tcgtaacctt cagcgaagtg cttggcagcc gcaagaggca gacacgcatc 480 agcgtcttgc gcgccgcgtt cgaggggcgt ttgcggatca gtcgcccgga tgcctttggt 540 caggctctgg tcgctgggat aggccctgcc aaggctttcg gctgtggcct gctgagcctg 600 gcgcgtagct ga 612 <210> 171 <211> 1569 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(1569) <223> Cas8 <400> 171 atgaccgagc actataacct gctggacaca ccatggctgc ctgtgcggct ggcaaatgga 60 gaggtgagag agatgggcct gctggaggtg tacagggagg cagagaggat ctctgccctg 120 gcagagaccg agccacccag cctgatcgcc cagtaccggc tgctgctggc catcacacac 180 agagccctgc tgctggagta tggagcatgg aaggactccg gccggctgag atggtttagg 240 gagggcctgc ctatcgatgt ggtggagcgg tacctggagc ggtggaggga gcggttttgg 300 ctgttccacc cacagtatcc cttcatgcag gtggccgccc tggcaagcgc cgcagagacc 360 tgcgataagc agaagccatg ggcacagatc agcctggcat ccgccaacgg caatacacct 420 gtggtgttcg atcactccta cgacctggcc ccatctgccg tgagcgccga ccgggccctg 480 tgcgcactgc tgggctttct gcagttcacc ccaggaggac tggtgaagac agtgcgcgac 540 agcgataagg caggcgccct ggcaaacacc gcagcagtgg tgccactggc agacagcctg 600 gcaaagacac tgtgcctggc cctgcaccca gcatccggcg aggcagcctt tgatctgcct 660 gcctgggaga gagaggccct gaccatccca cagctggcag ccgaccctat cctggcatcc 720 ggcccaaatg atcgctatac acggcagagc cgggccgtgc tgctgctgcc cgaggaggag 780 ggctgcgtgc ggtggatcag attcgcagca ggacaggccc tggcagacga tgtgcaggcc 840 cctgacccaa tggccagcta caggcctggc gccaacaatt ccatggtgcg cctgtctttt 900 ggcgaaggcc gggtgttctg gagagatctg cctagcctgc tgccagactc cgccgcagca 960 ggctctaaga gggcagccgt gctggactgg gcaagcaacc tgcgctccat cggagcagat 1020 gcacctagct ccatgctgct ggtggcagga ctggcaagcg atcaggccaa gctgctgaga 1080 tggaggtccg agaccgtggt gctgccagcc gccctgctgg actctgaggg atgcgcaaac 1140 gagctgcgga gatgtatccg ggagagcgag gatctgtatg gcgagctgag aaagatcgca 1200 gtggcaatgc tggcagaggc cctgcccgat cctgcatcta aggacacctg ggcaagggca 1260 cggaccagct tcgacaatgg accagcagca gcaacatact tcgcactgct ggagaggtcc 1320 ctgccttctc tgatggccct gatcggcggc gatcgcctgg agatgctgga cgaggcagag 1380 gccttctgga gatctaggct gctggccgcc ctggaggtgg catggcaggg cgtgcgggag 1440 ggactgggcc tgagcgtggc cgccctgaga gcagaggcaa aggtgcgccc aaggtacctg 1500 gccctgctga ggcgctatcg gagcgagaga acctctagca cacccctggc cgaggagcag 1560 tgcgcctaa 1569 <210> 172 <211> 531 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(531) <223> Cse2 <400> 172 atgtccgccg cagagcaccc attcatcgga cacctgcaga ggctgcagaa tgacaggggc 60 gccctggccg tgctgaggcg cagcctggga tttgcacctg gagcatatgt gccagcatac 120 ccatatgtgg agcggttcgt gggagcagag agacacgcac aggatgcctg gaggctggcc 180 ctgtacctga ccgcaggact gtttgcatcc cacccaggac agggaagggc ctctctggca 240 atgaggttcg gagagctgat gaaggccagg aacagcgcct ccatcgagaa gcggttcatc 300 gccctgctgg cagcagacgc agagaatctg cccgtgtatc tgagacaggc cgtgagcctg 360 ctggcagcag ataagctggc cttcgactac ggcgccctgc tggacgatct ggcacactgg 420 ctggacccct atctgccagt ggcaaggggc gacgcaatca ggcagcggtg ggccagagac 480 ttctacgccg ccctggccaa caccacagat acctctctgc acaaggacta a 531 <210> 173 <211> 1143 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(1143) <223> Cas7 <400> 173 atgaacctgt ttatcgagtt ccacctgatc cagaattttg ccccatccaa cctgaatagg 60 gacgataccg gagcaccaaa ggacgcaatc tttggaggac acaggagagc cagagtgagc 120 tcccagtgct tcaagagagc catcaggctg accgcccacg agcaggagct ggtggccccc 180 gagcacaggg gcgtgcggac aaagaagctg aaggccctgc tgctggagag gctggcagga 240 cgcgatcctg cagaggcaga gggcaagatc gagaccgccc tggcagcagc aggcctgaag 300 ctgaaggacg atggcaagac agagtacctg ctgtttctgg gagaggcaga gatcgcagga 360 ttcgccgccc tgatcgagca gcggtgggac gagctgggca gcgccgcacc agccggcgag 420 aagaagggca agaaggaggc caaggccaac gtgcccaccg aagtgatcaa gcaggcaagg 480 gccctgctgg atggaggcaa ggcagtggac gtggccctgt tcggaaggat gctggccgat 540 ctgccagagg tcaatcagga cgcagcatgt caggtggcac acgcaatctc cacccacagg 600 gtggagaggg agtttgacta cttcacagca gtggacgata ggggaggccc cgatgagtct 660 ggcgcaggaa tgatcggcca ggtggagttt aacagcgcca ccctgtacag atatgcagtg 720 gtggacctgc gcaagctgct gggaaacctg cagaatgatg gagagctggt gctgtccgcc 780 ctggaggcct tcacccaggc aatggtgcgc gcaatcccat ctggcaagca gaacacattt 840 gccgcccaca atctgcctgc cttcgtggga atctgcctga ggcacgcagg accactgaac 900 ctggccaatg cctttgagaa gccagtggtg gcaagggcag acgcctccct gtctgagcgg 960 agcgtggcag agctggcaag acacgatcag cagctggcaa gcgtgtacgg cgacagccgg 1020 gatagatggg cctatctgga catctccggc gcatggccaa aggagagagg agagccagca 1080 ggaaacctgc agcagctggc cgattggctg aggtctcagg tgtctagccg cctgggagga 1140 taa 1143 <210> 174 <211> 663 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(663) <223> Cas5 <400> 174 atggccaccc tgctgatgag gctgcaggga ccaatgcagt cctggggaac cacatctcgg 60 ttcgacgaga gagatacaca gctggagcct tctaagagcg gcgtgctggg actggtgtgc 120 gccgccctgg gaagggatag aagcgagcca ctggaggacc tggcctccct gcggatgggc 180 gtgcgcgtgg atagggaggg catccccctg agagactatc agaccgcaac aggcgtgctg 240 gtggcatccg gcaaggccga tcccaggaga accgtggtgt ctcctcggca ctacctggcc 300 gacgccgtgt ttctggtggg cctggagggc agagatcagg ccctgctgga gagaatccag 360 caggccctga gagcaccatt ttggcctctg tgcctgggaa ggaagagctt cgtgccaggc 420 tcccccgtgt ggctgcctga gggactgtcc tctctggccc tggagcaggc cctgcaggcc 480 tggccaagac tggcagaggc acagcctggc gacaggggca agccactgag atgtctgatc 540 gaggacgaga ggagcggcgt ggtgcgcctg gatcagccta tcgcaccatt cgccgagagg 600 cgctttggac caagattcgt gaggtccggc gtggcagacg tgcccgatca gaccgaccct 660 taa 663 <210> 175 <211> 612 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(612) <223> Cas6 <400> 175 atgtatctga ccaggctgac cctggacccc cgcagcgccc aggcacggag agatctgggc 60 gacgcctacg agatgcacag gaccctgagc cgcgtgtttg cagacgagca ggcaccagca 120 tcccggttcc tgtggagact ggaggcctct ggcaacgcct ggagcacccc tacactgctg 180 gtgcaggcag catccgaggg aaattggtct gtgctgcagg ccctgccagg atacctgctg 240 ggagagccac agtccaagtc tctggccctg aggcagtggc tggagtctga catcagctac 300 aggtttcgcc tgttcgccaa tcccaccgtg acaaggcagg gcaagcggta cggactggtg 360 ggagaggagc agcagctggc atggctggca aggcagggcg agagacacgg ctttgtggtg 420 gaggccgccc tggtgacctt cagcgaggtg ctgggctccc ggaagagaca gacacggatc 480 tccgtgctga gagccgcctt tgagggcagg ctgcgcatct ctcgcccaga tgccttcggc 540 caggccctgg tggcaggaat cggacccgcc aaggccttcg gctgcggcct gctgtccctg 600 gcaaggagct aa 612 <210> 176 <211> 522 <212> PRT <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(522) <223> Cas8 <400> 176 Met Thr Glu His Tyr Asn Leu Leu Asp Thr Pro Trp Leu Pro Val Arg 1 5 10 15 Leu Ala Asn Gly Glu Val Arg Glu Met Gly Leu Leu Glu Val Tyr Arg 20 25 30 Glu Ala Glu Arg Ile Ser Ala Leu Ala Glu Thr Glu Pro Pro Ser Leu 35 40 45 Ile Ala Gln Tyr Arg Leu Leu Leu Ala Ile Thr His Arg Ala Leu Leu 50 55 60 Leu Glu Tyr Gly Ala Trp Lys Asp Ser Gly Arg Leu Arg Trp Phe Arg 65 70 75 80 Glu Gly Leu Pro Ile Asp Val Val Glu Arg Tyr Leu Glu Arg Trp Arg 85 90 95 Glu Arg Phe Trp Leu Phe His Pro Gln Tyr Pro Phe Met Gln Val Ala 100 105 110 Ala Leu Ala Ser Ala Ala Glu Thr Cys Asp Lys Gln Lys Pro Trp Ala 115 120 125 Gln Ile Ser Leu Ala Ser Ala Asn Gly Asn Thr Pro Val Val Phe Asp 130 135 140 His Ser Tyr Asp Leu Ala Pro Ser Ala Val Ser Ala Asp Arg Ala Leu 145 150 155 160 Cys Ala Leu Leu Gly Phe Leu Gln Phe Thr Pro Gly Gly Leu Val Lys 165 170 175 Thr Val Arg Asp Ser Asp Lys Ala Gly Ala Leu Ala Asn Thr Ala Ala 180 185 190 Val Val Pro Leu Ala Asp Ser Leu Ala Lys Thr Leu Cys Leu Ala Leu 195 200 205 His Pro Ala Ser Gly Glu Ala Ala Phe Asp Leu Pro Ala Trp Glu Arg 210 215 220 Glu Ala Leu Thr Ile Pro Gln Leu Ala Ala Asp Pro Ile Leu Ala Ser 225 230 235 240 Gly Pro Asn Asp Arg Tyr Thr Arg Gln Ser Arg Ala Val Leu Leu Leu 245 250 255 Pro Glu Glu Glu Gly Cys Val Arg Trp Ile Arg Phe Ala Ala Gly Gln 260 265 270 Ala Leu Ala Asp Asp Val Gln Ala Pro Asp Pro Met Ala Ser Tyr Arg 275 280 285 Pro Gly Ala Asn Asn Ser Met Val Arg Leu Ser Phe Gly Glu Gly Arg 290 295 300 Val Phe Trp Arg Asp Leu Pro Ser Leu Leu Pro Asp Ser Ala Ala Ala 305 310 315 320 Gly Ser Lys Arg Ala Ala Val Leu Asp Trp Ala Ser Asn Leu Arg Ser 325 330 335 Ile Gly Ala Asp Ala Pro Ser Ser Met Leu Leu Val Ala Gly Leu Ala 340 345 350 Ser Asp Gln Ala Lys Leu Leu Arg Trp Arg Ser Glu Thr Val Val Leu 355 360 365 Pro Ala Ala Leu Leu Asp Ser Glu Gly Cys Ala Asn Glu Leu Arg Arg 370 375 380 Cys Ile Arg Glu Ser Glu Asp Leu Tyr Gly Glu Leu Arg Lys Ile Ala 385 390 395 400 Val Ala Met Leu Ala Glu Ala Leu Pro Asp Pro Ala Ser Lys Asp Thr 405 410 415 Trp Ala Arg Ala Arg Thr Ser Phe Asp Asn Gly Pro Ala Ala Ala Thr 420 425 430 Tyr Phe Ala Leu Leu Glu Arg Ser Leu Pro Ser Leu Met Ala Leu Ile 435 440 445 Gly Gly Asp Arg Leu Glu Met Leu Asp Glu Ala Glu Ala Phe Trp Arg 450 455 460 Ser Arg Leu Leu Ala Ala Leu Glu Val Ala Trp Gln Gly Val Arg Glu 465 470 475 480 Gly Leu Gly Leu Ser Val Ala Ala Leu Arg Ala Glu Ala Lys Val Arg 485 490 495 Pro Arg Tyr Leu Ala Leu Leu Arg Arg Tyr Arg Ser Glu Arg Thr Ser 500 505 510 Ser Thr Pro Leu Ala Glu Glu Gln Cys Ala 515 520 <210> 177 <211> 176 <212> PRT <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(176) <223> Cse2 <400> 177 Met Ser Ala Ala Glu His Pro Phe Ile Gly His Leu Gln Arg Leu Gln 1 5 10 15 Asn Asp Arg Gly Ala Leu Ala Val Leu Arg Arg Ser Leu Gly Phe Ala 20 25 30 Pro Gly Ala Tyr Val Pro Ala Tyr Pro Tyr Val Glu Arg Phe Val Gly 35 40 45 Ala Glu Arg His Ala Gln Asp Ala Trp Arg Leu Ala Leu Tyr Leu Thr 50 55 60 Ala Gly Leu Phe Ala Ser His Pro Gly Gln Gly Arg Ala Ser Leu Ala 65 70 75 80 Met Arg Phe Gly Glu Leu Met Lys Ala Arg Asn Ser Ala Ser Ile Glu 85 90 95 Lys Arg Phe Ile Ala Leu Leu Ala Ala Asp Ala Glu Asn Leu Pro Val 100 105 110 Tyr Leu Arg Gln Ala Val Ser Leu Leu Ala Ala Asp Lys Leu Ala Phe 115 120 125 Asp Tyr Gly Ala Leu Leu Asp Asp Leu Ala His Trp Leu Asp Pro Tyr 130 135 140 Leu Pro Val Ala Arg Gly Asp Ala Ile Arg Gln Arg Trp Ala Arg Asp 145 150 155 160 Phe Tyr Ala Ala Leu Ala Asn Thr Thr Asp Thr Ser Leu His Lys Asp 165 170 175 <210> 178 <211> 380 <212> PRT <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(380) <223> Cas7 <400> 178 Met Asn Leu Phe Ile Glu Phe His Leu Ile Gln Asn Phe Ala Pro Ser 1 5 10 15 Asn Leu Asn Arg Asp Asp Thr Gly Ala Pro Lys Asp Ala Ile Phe Gly 20 25 30 Gly His Arg Arg Ala Arg Val Ser Ser Gln Cys Phe Lys Arg Ala Ile 35 40 45 Arg Leu Thr Ala His Glu Gln Glu Leu Val Ala Pro Glu His Arg Gly 50 55 60 Val Arg Thr Lys Lys Leu Lys Ala Leu Leu Leu Glu Arg Leu Ala Gly 65 70 75 80 Arg Asp Pro Ala Glu Ala Glu Gly Lys Ile Glu Thr Ala Leu Ala Ala 85 90 95 Ala Gly Leu Lys Leu Lys Asp Asp Gly Lys Thr Glu Tyr Leu Leu Phe 100 105 110 Leu Gly Glu Ala Glu Ile Ala Gly Phe Ala Ala Leu Ile Glu Gln Arg 115 120 125 Trp Asp Glu Leu Gly Ser Ala Ala Pro Ala Gly Glu Lys Lys Gly Lys 130 135 140 Lys Glu Ala Lys Ala Asn Val Pro Thr Glu Val Ile Lys Gln Ala Arg 145 150 155 160 Ala Leu Leu Asp Gly Gly Lys Ala Val Asp Val Ala Leu Phe Gly Arg 165 170 175 Met Leu Ala Asp Leu Pro Glu Val Asn Gln Asp Ala Ala Cys Gln Val 180 185 190 Ala His Ala Ile Ser Thr His Arg Val Glu Arg Glu Phe Asp Tyr Phe 195 200 205 Thr Ala Val Asp Asp Arg Gly Gly Pro Asp Glu Ser Gly Ala Gly Met 210 215 220 Ile Gly Gln Val Glu Phe Asn Ser Ala Thr Leu Tyr Arg Tyr Ala Val 225 230 235 240 Val Asp Leu Arg Lys Leu Leu Gly Asn Leu Gln Asn Asp Gly Glu Leu 245 250 255 Val Leu Ser Ala Leu Glu Ala Phe Thr Gln Ala Met Val Arg Ala Ile 260 265 270 Pro Ser Gly Lys Gln Asn Thr Phe Ala Ala His Asn Leu Pro Ala Phe 275 280 285 Val Gly Ile Cys Leu Arg His Ala Gly Pro Leu Asn Leu Ala Asn Ala 290 295 300 Phe Glu Lys Pro Val Val Ala Arg Ala Asp Ala Ser Leu Ser Glu Arg 305 310 315 320 Ser Val Ala Glu Leu Ala Arg His Asp Gln Gln Leu Ala Ser Val Tyr 325 330 335 Gly Asp Ser Arg Asp Arg Trp Ala Tyr Leu Asp Ile Ser Gly Ala Trp 340 345 350 Pro Lys Glu Arg Gly Glu Pro Ala Gly Asn Leu Gln Gln Leu Ala Asp 355 360 365 Trp Leu Arg Ser Gln Val Ser Ser Arg Leu Gly Gly 370 375 380 <210> 179 <211> 220 <212> PRT <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(220) <223> Cas5 <400> 179 Met Ala Thr Leu Leu Met Arg Leu Gln Gly Pro Met Gln Ser Trp Gly 1 5 10 15 Thr Thr Ser Arg Phe Asp Glu Arg Asp Thr Gln Leu Glu Pro Ser Lys 20 25 30 Ser Gly Val Leu Gly Leu Val Cys Ala Ala Leu Gly Arg Asp Arg Ser 35 40 45 Glu Pro Leu Glu Asp Leu Ala Ser Leu Arg Met Gly Val Arg Val Asp 50 55 60 Arg Glu Gly Ile Pro Leu Arg Asp Tyr Gln Thr Ala Thr Gly Val Leu 65 70 75 80 Val Ala Ser Gly Lys Ala Asp Pro Arg Arg Thr Val Val Ser Pro Arg 85 90 95 His Tyr Leu Ala Asp Ala Val Phe Leu Val Gly Leu Glu Gly Arg Asp 100 105 110 Gln Ala Leu Leu Glu Arg Ile Gln Gln Ala Leu Arg Ala Pro Phe Trp 115 120 125 Pro Leu Cys Leu Gly Arg Lys Ser Phe Val Pro Gly Ser Pro Val Trp 130 135 140 Leu Pro Glu Gly Leu Ser Ser Leu Ala Leu Glu Gln Ala Leu Gln Ala 145 150 155 160 Trp Pro Arg Leu Ala Glu Ala Gln Pro Gly Asp Arg Gly Lys Pro Leu 165 170 175 Arg Cys Leu Ile Glu Asp Glu Arg Ser Gly Val Val Arg Leu Asp Gln 180 185 190 Pro Ile Ala Pro Phe Ala Glu Arg Arg Phe Gly Pro Arg Phe Val Arg 195 200 205 Ser Gly Val Ala Asp Val Pro Asp Gln Thr Asp Pro 210 215 220 <210> 180 <211> 203 <212> PRT <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(203) <223> Cas6 <400> 180 Met Tyr Leu Thr Arg Leu Thr Leu Asp Pro Arg Ser Ala Gln Ala Arg 1 5 10 15 Arg Asp Leu Gly Asp Ala Tyr Glu Met His Arg Thr Leu Ser Arg Val 20 25 30 Phe Ala Asp Glu Gln Ala Pro Ala Ser Arg Phe Leu Trp Arg Leu Glu 35 40 45 Ala Ser Gly Asn Ala Trp Ser Thr Pro Thr Leu Leu Val Gln Ala Ala 50 55 60 Ser Glu Gly Asn Trp Ser Val Leu Gln Ala Leu Pro Gly Tyr Leu Leu 65 70 75 80 Gly Glu Pro Gln Ser Lys Ser Leu Ala Leu Arg Gln Trp Leu Glu Ser 85 90 95 Asp Ile Ser Tyr Arg Phe Arg Leu Phe Ala Asn Pro Thr Val Thr Arg 100 105 110 Gln Gly Lys Arg Tyr Gly Leu Val Gly Glu Glu Gln Gln Leu Ala Trp 115 120 125 Leu Ala Arg Gln Gly Glu Arg His Gly Phe Val Val Glu Ala Ala Leu 130 135 140 Val Thr Phe Ser Glu Val Leu Gly Ser Arg Lys Arg Gln Thr Arg Ile 145 150 155 160 Ser Val Leu Arg Ala Ala Phe Glu Gly Arg Leu Arg Ile Ser Arg Pro 165 170 175 Asp Ala Phe Gly Gln Ala Leu Val Ala Gly Ile Gly Pro Ala Lys Ala 180 185 190 Phe Gly Cys Gly Leu Leu Ser Leu Ala Arg Ser 195 200 <210> 181 <211> 91 <212> DNA <213> Pseudomonas aeruginosa DHS01 <220> <221> misc_feature <222> (1)..(91) <223> CRISPR <400> 181 gtgttcccca catgcgtggg gatgaaccgg gcaccatcgg cgccattgac cgcgcgctga 60 aggtgttccc cacatgcgtg gggatgaacc g 91 <210> 182 <211> 1668 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(1668) <223> Cas8 <400> 182 atgagtcggt ttaatttact tgatgaaccc tggatttctg ttatttatga cgagaaagga 60 tccacaaaag atgtttcttt acaggattta tttacaaatg ctcatcagta taaagaatta 120 gcaggagata cgaaaacaca agattttgcg gtattacgag tattgttggc tgttttgcat 180 acagtttttt cccgatttga tatagatgga aatgcttatg agtatcttac tattgatgaa 240 ggatggaatc agcttgaacc agtggatgag atggatattg agaattatga agaagctctt 300 tatgaaacat gggaaaaact ttggactaat aaaagatttc caaatattgt taatcaatac 360 ttagaaaaat ggcgagatcg cttttactta tttgaccaaa agtatccatt ttttcaggta 420 acgaaagaag atattgctgg agataaaatt agcaaagcca aaggaactag tattttgggt 480 aaaaatataa atagaattat atctgagagt ggaaataaga tagctttatt ttccccaaaa 540 gatgaagaaa ataaaaatac tctaactgcc gcagaattag ctagatggct aattacattt 600 caagggtatt caggagtatc cgataaggtc atttttggaa atgaaaaata tacaccttcg 660 aaaggatggc tatttgatat tggtgctatt tatattaaag gtaacacttt attcgaaacg 720 ttgttactaa attatatttc accgtataat gaatgtggta atgtagaaaa tattcagcga 780 ccttgctggg aacgtaaaag ttctgatatc attaaaagtt accttgatga aaaagatatt 840 accaatatag ctagtttata tactgtttgg agtaaaggaa tctatattga cccagacttt 900 aatttaaata aacctttctc ttttgatatt gtgaaattac ctgatatcaa tcatagggat 960 aattttttgg agccaatgac actttggaag tataatgttt cgggtaaaaa tagggatagc 1020 tatacaccaa agaaacatct tttgaatcag tctttatggc gatcttttgg cttgttatct 1080 ataaaagata ctgatcttca acatagaaaa cctggcgtta tcgaatggct tacatatatt 1140 gatgatataa taggaaatcg actatcaaac attgttgcaa ttagtatgca ggacgatgga 1200 aaccctcaat cacggcttcc aacggatgag gttattgact caatttttat caatgatttg 1260 gttttaacgg atttagacga gggtggttgg gttcctcgta tcaatgaagt agtagaagaa 1320 acaaaaaaaa ttatttctag aacatataaa acgtatatta atgatataaa ggaaatcaga 1380 aatatctcta atggtagtta tactcagcag atagttgaaa gtctatattt caaaatcgat 1440 caacctttcc gacaatggtt agctagcatt caaccagaag atgataaaga ttctaagata 1500 caagaatgga gagttttact gaagaaaata gttaaagctg aagcagaagt tattttacat 1560 caaggggggg cgagggatta tcttggtatc caaaaagatg ggcgaattaa gaatattgca 1620 actgcctata attcgttcga tttttggctt cgtcaacagt taaaatag 1668 <210> 183 <211> 594 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(594) <223> Cse2 <400> 183 atgtcacaac atactaaaca aacagtttgg actgttacaa agaagattat tttcaaattg 60 agtaaccaaa aagaggaaac atatgataaa gctacactag caaaagttag aaaaacattg 120 gggaaaccct tgagtgaagc aacagaaata tggccaattc tgttcgaaaa tttaccagag 180 gaatttttaa gttcgtatca gcaaccaagc tatgaggaat tagctattta tacagcgctt 240 caattgtatg cattgcatca gcaaggtgtt tcaacaagtg tgatgctaga tgattctaag 300 ccctatgaaa atataggttc tgcacttggt aagcttagga aagaagatga taccacttca 360 attgatagac gattcaatac catgattacc tcatcaacgt ttgaagaact tacttatcat 420 ttaaggcatt tgatttcgct acttaaagtg gagtcaccgg tgattcaggt tgattactct 480 ggcctagcaa atgatttata ttggttttta aataatagtc aagaaaatgt ccgcctaaat 540 tgggcaagag catattataa acaaattaaa ggagaaaaaa acaatgacaa ctga 594 <210> 184 <211> 1068 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(1068) <223> Cas7 <400> 184 atgacaactg aacaacgatt atttttagat attcatgcta ttcaaagctt accaccttca 60 aatatgaata gagatgatac aggtagcccg aaaacagctc agtatggagg agttagaaga 120 tctcgcgtaa gttctcaagc atggaagaaa gcgatgagag agtattttaa tactcatggt 180 gatcattcaa atgttggtat tagaacaaaa gaaattgtga gatatgttgc agataaaata 240 gtagaactag atagttctat cagtattgaa gatgctttgg aaaaagccga taaagtcttg 300 atagctgctg gaatcaagaa aaaaggtgaa gttaaagcac tttattttat gggtgatagt 360 caagctaaga agttagctca agcagcctat gacaatataa cacataaaaa agagcttcaa 420 aagttggcta atgaagatcc agctattgat attgccctgt ttggtcgaat ggtagccgaa 480 gatccaactc ttaacgagga ttcttcttct caggttgcac atgccatttc cacacatcca 540 gtacaaactg aatttgattt ctttacggct gttgatgatt tagctccaga ggataatgca 600 ggggcgggta tgcttggaac tgttgagttt aattcttcta cactatatcg ctatgcaaat 660 gttgcgattc atgaattgtc aaaacaatta ggaaacaagg aatcgttgga gaatagttta 720 tctttgttca ttgaggcttt tgcaaagtca cttccaacag ggaaagtaaa tacatttgct 780 aatcaaacgc taccacagac tttaattgta acggttcgaa gtgatcgtcc ggttaatctt 840 gtcagtgcat ttgaagaacc agttaaatca atagaaggct atgttactaa atctatcgat 900 aaactcgcca aagagtttat taaggttgag aaatttgtag acaaaccact tatgaccttc 960 tatgttactt tgcatgagag cgacagtcta aaacaaattg gggaggaaaa agattcagtt 1020 tcaaaattat tggaagattt ttcagaaatg atagcccaat atatttaa 1068 <210> 185 <211> 726 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(726) <223> Cas5 <400> 185 atgaagacga tattgttgaa atttgctggc cccttacaat catggggaac gagttcacat 60 tttgaaacta ggcatacaga tttttatcct tccaaaagtg cggtaattgg actacttgct 120 gctagtttag gttataggag agacgaagat gaaaaaattc aaaaattaaa tgaacttgat 180 tttgctgttc gtgtcgatca gcaaggaaat ctgttaagag acttccatgt tgcacagaag 240 tatacagaaa agggtaaatt tgatagaaat tatgttacga atcggtatta tctagaagac 300 gctgtatttg ttgtagccct ctcccataca gatgatagct ttatagatat cattaaaggt 360 gctctaaaaa atccctattt ccaacctttt atggggagaa gggcactccc aataactgca 420 gactttatct taggtgagac agatgttaat ccattagaga gcctaaaatc gctgaaatgg 480 caagcttctc tatggtttat gaaaaaatct catgataagg atgctatttc tttggaagtt 540 tatctagata gtcaattagt caacaaggat gtttatcagc tgaggcaaga ttatgttagg 600 tcattttcac aaaaagggag aagatttggt tttaggtatg aagtacgtga attaatcagt 660 gttcaaaatc ctcactattt aaataagaat acagagcata acattttcga gagtatagga 720 gattga 726 <210> 186 <211> 639 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(639) <223> Cas6 <400> 186 atgtacattt ctagggtaga aattgatcga tataatagac gaaaggttag agatttaacg 60 catgtaggag cttatcatgc ttgggtggaa gagagttttc catcggaatt agagcaatca 120 atccgtacaa gaaaattatg gcgaatcgat cgtattcaag gtaaggatta tcttattatt 180 gtaagtaaag aaaaacctaa tttacaaaaa cttgaaaaat atggtgttgt aggaagcgct 240 caaactaagg actatcaaca ttttttagat agcatcaaaa ctggttttcg aatgaatttt 300 agaatagtgc taaatccggt tatttcaatt acttcacccg ataaatcaaa acgaggagtt 360 gtaaaaccgc atgtgacgat taaacatcag atggactttc tagtgaaaca atctgagaaa 420 aatggcttct cattagtagg agaaagtttc tcaattgttg aacgtggtta tgaagttttt 480 cagaaaccag aaaaacccat acgactatca aaagttgttt acgaaggaac cttaactgtt 540 agtgatgata cgcttttcaa aaaaatgctg accgagggag ttggaaagaa aaaagcatat 600 ggttttggct tgatgacagt ggtaccactt gaggaatga 639 <210> 187 <211> 1668 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(1668) <223> Cas8 <400> 187 atgtccaggt tcaacctgct ggatgagcca tggatctccg tgatctatga cgagaagggc 60 agcaccaagg acgtgtccct gcaggatctg tttacaaatg cccaccagta caaggagctg 120 gccggcgaca ccaagacaca ggatttcgcc gtgctgcggg tgctgctggc cgtgctgcac 180 accgtgttta gcagattcga catcgatggc aacgcctacg agtatctgac aatcgacgag 240 ggctggaatc agctggagcc tgtggacgag atggatatcg agaactacga ggaggccctg 300 tatgagacct gggagaagct gtggacaaat aagcggttcc caaacatcgt gaatcagtac 360 ctggagaagt ggcgggaccg gttctacctg ttcgatcaga agtatccctt ctttcaggtg 420 accaaggagg acatcgccgg cgataagatc agcaaggcca agggcacatc catcctgggc 480 aagaacatca atagaatcat ctctgagagc ggcaacaaga tcgccctgtt ctccccaaag 540 gacgaggaga acaagaatac cctgacagca gcagagctgg caaggtggct gatcaccttt 600 cagggctact ctggcgtgag cgacaaagtg atcttcggca acgagaagta tacacccagc 660 aagggctggc tgtttgatat cggcgccatc tacatcaagg gcaataccct gttcgagaca 720 ctgctgctga actacatctc cccatataat gagtgcggca acgtggagaa tatccagcgg 780 ccctgttggg agagaaagag ctccgatatc atcaagtctt acctggacga gaaggatatc 840 accaatatcg cctctctgta cacagtgtgg agcaagggca tctatatcga ccccgacttc 900 aacctgaata agcccttttc cttcgacatc gtgaagctgc cagacatcaa ccacagggat 960 aatttcctgg agcccatgac cctgtggaag tacaacgtgt ccggcaagaa tcgcgattct 1020 tatacaccca agaagcacct gctgaaccag tctctgtgga ggagctttgg cctgctgagc 1080 atcaaggaca ccgatctgca gcaccgcaag cctggcgtga tcgagtggct gacatacatc 1140 gacgatatca tcggcaaccg gctgagcaat atcgtggcca tctccatgca ggacgatggc 1200 aatccacaga gcagactgcc caccgacgaa gtgatcgatt ccatcttcat caacgacctg 1260 gtgctgacag acctggatga gggcggctgg gtgcccagaa tcaatgaggt ggtggaggag 1320 accaagaaga tcatctcccg gacatacaag acctatatca acgatatcaa ggagatcaga 1380 aacatctcca atggctctta cacccagcag atcgtggaga gcctgtactt caagatcgac 1440 cagcccttca gacagtggct ggcctccatc cagcctgagg acgataagga ttctaagatc 1500 caggagtgga gggtgctgct gaagaagatc gtgaaggccg aggcagaagt gatcctgcac 1560 cagggaggag ccagggatta tctgggcatc cagaaggacg gccgcatcaa gaacatcgcc 1620 accgcctaca atagctttga cttctggctg aggcagcagc tgaagtaa 1668 <210> 188 <211> 594 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(594) <223> Cse2 <400> 188 atgtctcagc acaccaagca gacagtgtgg accgtgacaa agaagatcat cttcaagctg 60 tccaatcaga aggaggagac ctacgataag gccacactgg ccaaggtgcg caagaccctg 120 ggcaagcctc tgtctgaggc cacagagatc tggcctatcc tgtttgagaa cctgccagag 180 gagttcctga gctcctacca gcagccatcc tatgaggagc tggccatcta caccgccctg 240 cagctgtatg ccctgcacca gcagggcgtg tctacaagcg tgatgctgga cgattctaag 300 ccttatgaga acatcggcag cgccctgggc aagctgcgca aggaggacga taccacaagc 360 atcgacaggc gctttaatac catgatcaca tctagcacct tcgaggagct gacctaccac 420 ctgcggcacc tgatctccct gctgaaggtg gagtctccag tgatccaggt ggactactcc 480 ggcctggcca acgatctgta ttggttcctg aacaattctc aggagaacgt gaggctgaat 540 tgggcccgcg cctactataa gcagatcaag ggcgagaaga acaatgacaa ctaa 594 <210> 189 <211> 1068 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(1068) <223> Cas7 <400> 189 atgaccacag agcagagact gtttctggac atccacgcca tccagagcct gcccccttcc 60 aacatgaatc gggacgatac cggctcccct aagacagccc agtatggcgg cgtgcggaga 120 tctagggtga gctcccaggc ctggaagaag gccatgcgcg agtacttcaa cacccacggc 180 gatcacagca atgtgggcat caggacaaag gagatcgtgc gctatgtggc cgacaagatc 240 gtggagctgg attctagcat ctccatcgag gacgccctgg agaaggccga taaggtgctg 300 atcgccgccg gcatcaagaa gaagggcgag gtgaaggccc tgtacttcat gggcgattcc 360 caggccaaga agctggcaca ggcagcatac gacaacatca cccacaagaa ggagctgcag 420 aagctggcca atgaggaccc cgccatcgat atcgccctgt tcggaaggat ggtggcagag 480 gaccctaccc tgaacgagga ttcctctagc caggtggcac acgcaatcag cacccaccca 540 gtgcagacag agtttgattt ctttaccgca gtggacgatc tggcccccga ggacaatgca 600 ggagcaggaa tgctgggaac cgtggagttc aactcctcta cactgtaccg gtatgccaat 660 gtggccatcc acgagctgtc taagcagctg ggcaacaagg agagcctgga gaattctctg 720 agcctgttta tcgaggcctt cgccaagtcc ctgcctaccg gcaaggtgaa cacatttgcc 780 aatcagacac tgccacagac cctgatcgtg acagtgaggt ccgaccgccc agtgaacctg 840 gtgtctgcct tcgaggagcc cgtgaagagc atcgagggct atgtgaccaa gtccatcgat 900 aagctggcca aggagtttat caaggtggag aagttcgtgg acaagcccct gatgaccttt 960 tacgtgacac tgcacgagtc cgattctctg aagcagatcg gcgaggagaa ggatagcgtg 1020 tccaagctgc tggaggactt cagcgagatg atcgcacagt acatctaa 1068 <210> 190 <211> 726 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(726) <223> Cas5 <400> 190 atgaagacca tcctgctgaa gtttgcagga cctctgcagt cctggggcac atcctctcac 60 tttgagacaa gacacaccga cttctatcca tccaagtctg ccgtgatcgg actgctggca 120 gccagcctgg gataccggag agacgaggat gagaagatcc agaagctgaa tgagctggac 180 ttcgccgtgc gggtggatca gcagggcaac ctgctgagag actttcacgt ggcccagaag 240 tacaccgaga agggcaagtt cgatcggaac tatgtgacaa atagatacta tctggaggac 300 gccgtgtttg tggtggccct gtcccacacc gacgattctt tcatcgatat catcaagggc 360 gccctgaaga acccctactt tcagcctttc atgggcaggc gcgccctgcc tatcaccgca 420 gactttatcc tgggcgagac agatgtgaat ccactggaga gcctgaagtc cctgaagtgg 480 caggcctctc tgtggttcat gaagaagagc cacgacaagg atgccatctc cctggaggtg 540 tacctggact ctcagctggt gaacaaggac gtgtaccagc tgcggcagga ctacgtgcgg 600 agcttcagcc agaagggccg gagattcggc tttaggtacg aggtgcgcga gctgatctcc 660 gtgcagaacc ctcactatct gaacaagaat accgagcaca atatcttcga gagcatcggc 720 gactaa 726 <210> 191 <211> 639 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(639) <223> Cas6 <400> 191 atgtacatca gcagggtgga gatcgatcgc tataatagga ggaaggtgcg cgacctgacc 60 cacgtgggag catatcacgc ctgggtggag gagtcttttc caagcgagct ggagcagtct 120 atcaggacac gcaagctgtg gcggatcgac agaatccagg gcaaggatta cctgatcatc 180 gtgagcaagg agaagcccaa tctgcagaag ctggagaagt acggagtggt gggcagcgcc 240 cagactaagg actatcagca cttcctggat tccatcaaga caggctttcg gatgaacttc 300 agaatcgtgc tgaatcccgt gatctccatc acctctcctg acaagagcaa gcggggcgtg 360 gtgaagcccc acgtgacaat caagcaccag atggattttc tggtgaagca gtctgagaag 420 aacggcttta gcctggtggg cgagtctttc agcatcgtgg agaggggcta tgaggtgttc 480 cagaagcctg agaagccaat ccgcctgtct aaggtggtgt acgagggcac cctgacagtg 540 agcgacgata ccctgtttaa gaagatgctg acagagggcg tgggcaagaa gaaggcctac 600 ggcttcggcc tgatgaccgt ggtgcccctg gaggagtaa 639 <210> 192 <211> 555 <212> PRT <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(555) <223> Cas8 <400> 192 Met Ser Arg Phe Asn Leu Leu Asp Glu Pro Trp Ile Ser Val Ile Tyr 1 5 10 15 Asp Glu Lys Gly Ser Thr Lys Asp Val Ser Leu Gln Asp Leu Phe Thr 20 25 30 Asn Ala His Gln Tyr Lys Glu Leu Ala Gly Asp Thr Lys Thr Gln Asp 35 40 45 Phe Ala Val Leu Arg Val Leu Leu Ala Val Leu His Thr Val Phe Ser 50 55 60 Arg Phe Asp Ile Asp Gly Asn Ala Tyr Glu Tyr Leu Thr Ile Asp Glu 65 70 75 80 Gly Trp Asn Gln Leu Glu Pro Val Asp Glu Met Asp Ile Glu Asn Tyr 85 90 95 Glu Glu Ala Leu Tyr Glu Thr Trp Glu Lys Leu Trp Thr Asn Lys Arg 100 105 110 Phe Pro Asn Ile Val Asn Gln Tyr Leu Glu Lys Trp Arg Asp Arg Phe 115 120 125 Tyr Leu Phe Asp Gln Lys Tyr Pro Phe Phe Gln Val Thr Lys Glu Asp 130 135 140 Ile Ala Gly Asp Lys Ile Ser Lys Ala Lys Gly Thr Ser Ile Leu Gly 145 150 155 160 Lys Asn Ile Asn Arg Ile Ile Ser Glu Ser Gly Asn Lys Ile Ala Leu 165 170 175 Phe Ser Pro Lys Asp Glu Glu Asn Lys Asn Thr Leu Thr Ala Ala Glu 180 185 190 Leu Ala Arg Trp Leu Ile Thr Phe Gln Gly Tyr Ser Gly Val Ser Asp 195 200 205 Lys Val Ile Phe Gly Asn Glu Lys Tyr Thr Pro Ser Lys Gly Trp Leu 210 215 220 Phe Asp Ile Gly Ala Ile Tyr Ile Lys Gly Asn Thr Leu Phe Glu Thr 225 230 235 240 Leu Leu Leu Asn Tyr Ile Ser Pro Tyr Asn Glu Cys Gly Asn Val Glu 245 250 255 Asn Ile Gln Arg Pro Cys Trp Glu Arg Lys Ser Ser Asp Ile Ile Lys 260 265 270 Ser Tyr Leu Asp Glu Lys Asp Ile Thr Asn Ile Ala Ser Leu Tyr Thr 275 280 285 Val Trp Ser Lys Gly Ile Tyr Ile Asp Pro Asp Phe Asn Leu Asn Lys 290 295 300 Pro Phe Ser Phe Asp Ile Val Lys Leu Pro Asp Ile Asn His Arg Asp 305 310 315 320 Asn Phe Leu Glu Pro Met Thr Leu Trp Lys Tyr Asn Val Ser Gly Lys 325 330 335 Asn Arg Asp Ser Tyr Thr Pro Lys Lys His Leu Leu Asn Gln Ser Leu 340 345 350 Trp Arg Ser Phe Gly Leu Leu Ser Ile Lys Asp Thr Asp Leu Gln His 355 360 365 Arg Lys Pro Gly Val Ile Glu Trp Leu Thr Tyr Ile Asp Asp Ile Ile 370 375 380 Gly Asn Arg Leu Ser Asn Ile Val Ala Ile Ser Met Gln Asp Asp Gly 385 390 395 400 Asn Pro Gln Ser Arg Leu Pro Thr Asp Glu Val Ile Asp Ser Ile Phe 405 410 415 Ile Asn Asp Leu Val Leu Thr Asp Leu Asp Glu Gly Gly Trp Val Pro 420 425 430 Arg Ile Asn Glu Val Val Glu Glu Thr Lys Lys Ile Ile Ser Arg Thr 435 440 445 Tyr Lys Thr Tyr Ile Asn Asp Ile Lys Glu Ile Arg Asn Ile Ser Asn 450 455 460 Gly Ser Tyr Thr Gln Gln Ile Val Glu Ser Leu Tyr Phe Lys Ile Asp 465 470 475 480 Gln Pro Phe Arg Gln Trp Leu Ala Ser Ile Gln Pro Glu Asp Asp Lys 485 490 495 Asp Ser Lys Ile Gln Glu Trp Arg Val Leu Leu Lys Lys Ile Val Lys 500 505 510 Ala Glu Ala Glu Val Ile Leu His Gln Gly Gly Ala Arg Asp Tyr Leu 515 520 525 Gly Ile Gln Lys Asp Gly Arg Ile Lys Asn Ile Ala Thr Ala Tyr Asn 530 535 540 Ser Phe Asp Phe Trp Leu Arg Gln Gln Leu Lys 545 550 555 <210> 193 <211> 197 <212> PRT <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(197) <223> Cse2 <400> 193 Met Ser Gln His Thr Lys Gln Thr Val Trp Thr Val Thr Lys Lys Ile 1 5 10 15 Ile Phe Lys Leu Ser Asn Gln Lys Glu Glu Thr Tyr Asp Lys Ala Thr 20 25 30 Leu Ala Lys Val Arg Lys Thr Leu Gly Lys Pro Leu Ser Glu Ala Thr 35 40 45 Glu Ile Trp Pro Ile Leu Phe Glu Asn Leu Pro Glu Glu Phe Leu Ser 50 55 60 Ser Tyr Gln Gln Pro Ser Tyr Glu Glu Leu Ala Ile Tyr Thr Ala Leu 65 70 75 80 Gln Leu Tyr Ala Leu His Gln Gln Gly Val Ser Thr Ser Val Met Leu 85 90 95 Asp Asp Ser Lys Pro Tyr Glu Asn Ile Gly Ser Ala Leu Gly Lys Leu 100 105 110 Arg Lys Glu Asp Asp Thr Thr Ser Ile Asp Arg Arg Phe Asn Thr Met 115 120 125 Ile Thr Ser Ser Thr Phe Glu Glu Leu Thr Tyr His Leu Arg His Leu 130 135 140 Ile Ser Leu Leu Lys Val Glu Ser Pro Val Ile Gln Val Asp Tyr Ser 145 150 155 160 Gly Leu Ala Asn Asp Leu Tyr Trp Phe Leu Asn Asn Ser Gln Glu Asn 165 170 175 Val Arg Leu Asn Trp Ala Arg Ala Tyr Tyr Lys Gln Ile Lys Gly Glu 180 185 190 Lys Asn Asn Asp Asn 195 <210> 194 <211> 355 <212> PRT <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(355) <223> Cas7 <400> 194 Met Thr Thr Glu Gln Arg Leu Phe Leu Asp Ile His Ala Ile Gln Ser 1 5 10 15 Leu Pro Pro Ser Asn Met Asn Arg Asp Asp Thr Gly Ser Pro Lys Thr 20 25 30 Ala Gln Tyr Gly Gly Val Arg Arg Ser Arg Val Ser Ser Gln Ala Trp 35 40 45 Lys Lys Ala Met Arg Glu Tyr Phe Asn Thr His Gly Asp His Ser Asn 50 55 60 Val Gly Ile Arg Thr Lys Glu Ile Val Arg Tyr Val Ala Asp Lys Ile 65 70 75 80 Val Glu Leu Asp Ser Ser Ile Ser Ile Glu Asp Ala Leu Glu Lys Ala 85 90 95 Asp Lys Val Leu Ile Ala Ala Gly Ile Lys Lys Lys Gly Glu Val Lys 100 105 110 Ala Leu Tyr Phe Met Gly Asp Ser Gln Ala Lys Lys Leu Ala Gln Ala 115 120 125 Ala Tyr Asp Asn Ile Thr His Lys Lys Glu Leu Gln Lys Leu Ala Asn 130 135 140 Glu Asp Pro Ala Ile Asp Ile Ala Leu Phe Gly Arg Met Val Ala Glu 145 150 155 160 Asp Pro Thr Leu Asn Glu Asp Ser Ser Ser Gln Val Ala His Ala Ile 165 170 175 Ser Thr His Pro Val Gln Thr Glu Phe Asp Phe Phe Thr Ala Val Asp 180 185 190 Asp Leu Ala Pro Glu Asp Asn Ala Gly Ala Gly Met Leu Gly Thr Val 195 200 205 Glu Phe Asn Ser Ser Thr Leu Tyr Arg Tyr Ala Asn Val Ala Ile His 210 215 220 Glu Leu Ser Lys Gln Leu Gly Asn Lys Glu Ser Leu Glu Asn Ser Leu 225 230 235 240 Ser Leu Phe Ile Glu Ala Phe Ala Lys Ser Leu Pro Thr Gly Lys Val 245 250 255 Asn Thr Phe Ala Asn Gln Thr Leu Pro Gln Thr Leu Ile Val Thr Val 260 265 270 Arg Ser Asp Arg Pro Val Asn Leu Val Ser Ala Phe Glu Glu Pro Val 275 280 285 Lys Ser Ile Glu Gly Tyr Val Thr Lys Ser Ile Asp Lys Leu Ala Lys 290 295 300 Glu Phe Ile Lys Val Glu Lys Phe Val Asp Lys Pro Leu Met Thr Phe 305 310 315 320 Tyr Val Thr Leu His Glu Ser Asp Ser Leu Lys Gln Ile Gly Glu Glu 325 330 335 Lys Asp Ser Val Ser Lys Leu Leu Glu Asp Phe Ser Glu Met Ile Ala 340 345 350 Gln Tyr Ile 355 <210> 195 <211> 241 <212> PRT <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(241) <223> Cas5 <400> 195 Met Lys Thr Ile Leu Leu Lys Phe Ala Gly Pro Leu Gln Ser Trp Gly 1 5 10 15 Thr Ser Ser His Phe Glu Thr Arg His Thr Asp Phe Tyr Pro Ser Lys 20 25 30 Ser Ala Val Ile Gly Leu Leu Ala Ala Ser Leu Gly Tyr Arg Arg Asp 35 40 45 Glu Asp Glu Lys Ile Gln Lys Leu Asn Glu Leu Asp Phe Ala Val Arg 50 55 60 Val Asp Gln Gln Gly Asn Leu Leu Arg Asp Phe His Val Ala Gln Lys 65 70 75 80 Tyr Thr Glu Lys Gly Lys Phe Asp Arg Asn Tyr Val Thr Asn Arg Tyr 85 90 95 Tyr Leu Glu Asp Ala Val Phe Val Val Ala Leu Ser His Thr Asp Asp 100 105 110 Ser Phe Ile Asp Ile Ile Lys Gly Ala Leu Lys Asn Pro Tyr Phe Gln 115 120 125 Pro Phe Met Gly Arg Arg Ala Leu Pro Ile Thr Ala Asp Phe Ile Leu 130 135 140 Gly Glu Thr Asp Val Asn Pro Leu Glu Ser Leu Lys Ser Leu Lys Trp 145 150 155 160 Gln Ala Ser Leu Trp Phe Met Lys Lys Ser His Asp Lys Asp Ala Ile 165 170 175 Ser Leu Glu Val Tyr Leu Asp Ser Gln Leu Val Asn Lys Asp Val Tyr 180 185 190 Gln Leu Arg Gln Asp Tyr Val Arg Ser Phe Ser Gln Lys Gly Arg Arg 195 200 205 Phe Gly Phe Arg Tyr Glu Val Arg Glu Leu Ile Ser Val Gln Asn Pro 210 215 220 His Tyr Leu Asn Lys Asn Thr Glu His Asn Ile Phe Glu Ser Ile Gly 225 230 235 240 Asp <210> 196 <211> 212 <212> PRT <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(212) <223> Cas6 <400> 196 Met Tyr Ile Ser Arg Val Glu Ile Asp Arg Tyr Asn Arg Arg Lys Val 1 5 10 15 Arg Asp Leu Thr His Val Gly Ala Tyr His Ala Trp Val Glu Glu Ser 20 25 30 Phe Pro Ser Glu Leu Glu Gln Ser Ile Arg Thr Arg Lys Leu Trp Arg 35 40 45 Ile Asp Arg Ile Gln Gly Lys Asp Tyr Leu Ile Ile Val Ser Lys Glu 50 55 60 Lys Pro Asn Leu Gln Lys Leu Glu Lys Tyr Gly Val Val Gly Ser Ala 65 70 75 80 Gln Thr Lys Asp Tyr Gln His Phe Leu Asp Ser Ile Lys Thr Gly Phe 85 90 95 Arg Met Asn Phe Arg Ile Val Leu Asn Pro Val Ile Ser Ile Thr Ser 100 105 110 Pro Asp Lys Ser Lys Arg Gly Val Val Lys Pro His Val Thr Ile Lys 115 120 125 His Gln Met Asp Phe Leu Val Lys Gln Ser Glu Lys Asn Gly Phe Ser 130 135 140 Leu Val Gly Glu Ser Phe Ser Ile Val Glu Arg Gly Tyr Glu Val Phe 145 150 155 160 Gln Lys Pro Glu Lys Pro Ile Arg Leu Ser Lys Val Val Tyr Glu Gly 165 170 175 Thr Leu Thr Val Ser Asp Asp Thr Leu Phe Lys Lys Met Leu Thr Glu 180 185 190 Gly Val Gly Lys Lys Lys Ala Tyr Gly Phe Gly Leu Met Thr Val Val 195 200 205 Pro Leu Glu Glu 210 <210> 197 <211> 89 <212> DNA <213> Streptococcus thermophilus strain ND07 <220> <221> misc_feature <222> (1)..(89) <223> CRISPR <400> 197 gtttttcccg cacacgcggg ggtgatccta tacctatatc aatggcctcc cacgcataag 60 cgtttttccc gcacacgcgg gggtgatcc 89 <210> 198 <211> 1743 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(1743) <223> Cas8 <400> 198 ttgcccggga agggtggggc gtcggtgaat ctgttatctg atgggtggct ttcagctgtt 60 tccgcaggtg ggggctctgg tttcgggggt ggtcctgggg cggggccggc ggagttcggt 120 gtgcgggagc ttctgctgaa tgcggagaag ttcgctgaca tcgtggtgga cctgcccacg 180 cagcgtccgg cggtgttccg gcaggtcctg ctgccgttgg tggtggacgc gttggggtgt 240 ccgaaggacg ccgaggcgtg gatggacatg ttccgggcgg gggctttcag ccctgagcag 300 cggcaggtgc tggctgatta cctggacaag caccagcatt tgttcggtct tctggatccg 360 gtggagccgt tcggtcaggt ggctgacctg cggacggcga agggggagac caaggggtcg 420 gcgttgctgg tggcgacggc ggccaccggg aacaacgtgc cgttgttctc gtcccggacg 480 gagggcgacg tactggagct gacgcccgct gaggcggcca ggtggctgct gcacacccac 540 tgctgggaca cggctgccat caagaccggc gcggtcggtg acccgatggt gaagtccggg 600 aagacgaccg gcaatccgac gggcccgctg ggtcagctcg gcgtgaccat gccggtgggg 660 tcgacgcttt tcgagacgtt gttgctcaac atcccgtacg gccaggctgg gctgtccgac 720 gacgtgccgc agtggcgacg gcgtagtacg cagggcgacg tcaaggacac tctctcgtgt 780 gcgacgcctg tgtggcagag cagaccggcg cgggggctgc tggaggcgtg gacgtggcag 840 gctcgccgga tccgtctcat ctctcaggac accgaccggg ggccgcgcat cacccgggtg 900 ctggtcgcgg ccggcgaccg tcttgaggtc agcccggaca cggaaccgca cacggcctgg 960 gtggtggaca gccccgccgg ccggcggggt aagagtcccg cgcggtctgg ggtgaagagt 1020 gcgcgtccgc gccgtcacac ggcaggccgc gccgggtggc gtggtcttga cgcgctgctg 1080 gccgtgaacg ctgtcgacca ggaccagcag gcgaccgcca cccgcagcgg ggcggtgagc 1140 agccagctgg tgcggcagct cagcgccatc agccgccgct tgcccagccg gtatccgctg 1200 cgggtcgagc tgaccgggat cgcctacggc aaccagtcgg ccgtcatcga ggacatgtac 1260 ttcgacgaga tcccgctgcc cgtggccgct ctcgacccgg aggggatcgt ctacggggcg 1320 ctgctggagg tggtcgacca ggcggaggac ctggccaagg cggtcaatca cctgtcgggg 1380 gaccttcgcc gggccgcggg cagtgaaccg atcccgtggg acaagggcca gcgtcccgga 1440 gacaccctgt tgcacgctct cgacccgatc gtgcggcgtc tgttggccgg cctgcgccag 1500 gccggcgacg acttcgaccg gtgtgagcag ggactggagg cgtgggagca caaggccggg 1560 caggccacgc tccgcgtcgc ggagggcctg ttcaattcgg cgcccgccgc cctgttcacc 1620 ggccgccgcg tcaagaagga cggcaaggag caggtctacc gtctcagcac tgccgaagcg 1680 tccttccgcc ggcggctcgc cgtgatcctc caccgccgcg ccgctgcacg tactgccggc 1740 tga 1743 <210> 199 <211> 615 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(615) <223> Cse2 <400> 199 gtgtccacct cacccttgtc cgctcccgtc cccggccaga gagtttcctc cctgcccagg 60 ccctactgga gcggccgtgc ggacgagcaa ggccagtggc ggacacgcgc cggggaatcc 120 ctgcgaccgc ccggggagga cctcagcgcg ctgagagccg gcctgggaaa gaaggcgttc 180 accgaacccc gcctgtggca gtactacacg acacccaccg acggccgcgt caccctcgag 240 ctggaggccg agcacgccgc gctcgccctg tacgggctgc atcagcaaag ccaggagcag 300 ccgatgcacc ggcagggtgt ccgcaccggc agggccctgc gcgccctgca ccagcggtac 360 agcgaagagg cgaccgaccg gcgggtggcg caggccgtcg gtgcgacctc ggctgcggcc 420 ttcgcctacc ggctccgcgc actggtgacg cagttgcgtt ccatcgggca gcccctggac 480 tacgaccagc tgatgcagga cctcctgcgc tggcacttcc ccgacggacg ctcccgggtc 540 cgccgcgggt ggggtcttgg ctaccacggc cgcgatcgcc agcccgacga agccccgccc 600 cccgaaggct cgtag 615 <210> 200 <211> 1167 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(1167) <223> Cas7 <400> 200 atgtctcagc ccgccgcccg cccgccgcgc acgtacgtcg acttccacat cctgcagacg 60 gtccccccgg ccaacctcaa cagggacgac cagggcaacc ccaaggaggc ctactacggc 120 ggtgtccgcc gctctcgtgt ttcctcccag gcgtggaagc gtgccacccg cacccacttc 180 gccgagcggg tccccgagca ggacctcgcc acccgcaccc gcaggatcat cggcgccctc 240 gccgatgaca tccagaagcg cgccggcctg gaccgcccgg cagcgctgcg cctggccgac 300 gcgctgctgg cgccgttgga gctgagcggc ggcaagaaga aggacgagtc ggcctacctc 360 ctcttctacg gccggcgcca gctcgatgcc gtagccgccc tcgtcgccga ccaggcaacc 420 gaactgtccg cgctgagcga cgccgacctc gcttcccggg tgaaggagct cccggttcgt 480 gagcagttca gcacgggcca cccgatcgat gtcgcccttt tcgggcgcat ggtcgcggac 540 atccccgctc tcaaggtcga cgccgcggcg caggtcgccc atgccctgtc cacccacgcg 600 gtggagctcg agttcgacta cttcacggcc gtcgacgatg agcagaccga cgaggagacc 660 ggtgccggca tgatcggcac catcggcttc aactccgcca ccctctaccg ctacgcctcc 720 gtcggcctcc accagctcct ggacaatctc accgacgagg aagcggccct caccgccatc 780 agcgagttcg ccacgtcctt cgcgcgctcc atgcccaccg gctaccagaa ctcctttgcc 840 caccgcaccc tgcccagcct cgtcgccgtc gtcgtccgcg aagaccagcc cgtcaacctc 900 gtctccgcgt tcgaacaacc ggtggccacc ccctcgggca tcgccgccgc ctccgccgcg 960 cggctcgccg aggaacacac acgcgccacc gtcacatggg gcgacgctcc ggccttcgca 1020 gccgccaccc acgtgttcac cgaccaccag aagaccaccg ccgccctcaa cagcgcgttc 1080 ggcccctcca tccccttctc cgctctcctc gaaggcctgc acacccacct ggccggagcc 1140 ctcaagccca agcaggccgc gcagtga 1167 <210> 201 <211> 882 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(882) <223> Cas5 <400> 201 gtgaccaccg cccccacccc cgagcccgcc ggcaacacgc acccggccca cggcagcgac 60 gaaccgaccg tgctgctgct tcgcctcgcc ggccctctgc agtcctgggg cgtacgcagt 120 tccttcaacc gccgcgacac cggcgcggaa cccaccaagt ccggcgtcat cggcctgctg 180 gcggcagcgg caggacaccc ccgtgaacaa cccctgggag agctcgcgga cctgaccctc 240 ggtattcgcg tcgaccaacc aggcaccctg ctgcgcgact accacaccgt cagcgactac 300 cgaggccgcc ccctgccgca ggcaggtgtc tccgcgaaag gcatccagaa gcccacctca 360 ccggccaaac acacccacgt caccacccgc ttctacctcc aggacgcggt attcgtcgcc 420 gccctcgaag gcccccccgg cctcctcacc accctggaca gggcggtacg caaccccgcc 480 ttcccgctcg cactgggacg ccgctcctgc ccaccgaccc aacccctcag cctcggcttg 540 cgcaccaccg acatggaaac cgccctgcgc agcgagccct ggcaggcctc cgcccacacc 600 cgcgagcagt acgcccgccg cctgggccga gaacgcggcc tccaccagcc tcttcaccca 660 ggcaccatcg atcgcgcagc caccatcgaa gacccccgcg gcgacgaccg cctgcaggac 720 gcacccgtct ccttcgaccc ccaccagcgc gccttcacca gccgccaagt ccgccacacc 780 tggctggcca tccccaccgg cttcgaccac atcgacgacg accagcccca cggccaggcc 840 gacgaccccg accacgaccc tttcgccctg ctgggctggt ga 882 <210> 202 <211> 813 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(813) <223> Cas6 <400> 202 atgacctacc tctcccgcat ccgcatcaat cccctccgca aggacagcag gaaactgctc 60 tccaaccccc gtgccgtaca cggcgccgtc atgggcggcc tgcccaacca caagcccgac 120 gaccgcgtcc tgtggcggat ggaccccgac aacccccacc ggccccacct cttcgtcctc 180 agcccgacac gccctgactg gacgcacatc atccaggact gcggatggcc ggacgcggac 240 ggtgaccatg ccgccgtccg cgactacacc cccctcctca gtcagctggc cgtcggccgc 300 gaattcgcct tccgcctcac cgccagcccc gtccagaaca ccgccacccc cacgaaggcg 360 acacccgccc aggccgcccg cctgaccacc cacgccgaaa acggcaaacg catccgcggc 420 ttccgcatgg gccaccgcac agcagccgcc caactcgact ggttcctcac ccggaccgac 480 cgctggggct tcgacatccc cgccacccgc tccgatcccg ccgcccccgg catccacgcc 540 cccacacccc ccaccgcccc tcgccccacc tcgccacccc gcccagaccc caaccctccc 600 tacgaagtcc gcatcaccgc ccgccaccgc cattccttcc agaagaacgg acacggagcg 660 cacgtcgtct tccgcagcgc aaccttcgaa ggccgcctgc gcatcaccga caccgaccgc 720 ttcaccacca gcctcctcac cggcctcggc ccctcccgcg cctacggctg cggcctgctc 780 accctcgccc cgctgcccgg acagcagacc tga 813 <210> 203 <211> 1743 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(1743) <223> Cas8 <400> 203 atgcctggca agggaggagc aagcgtgaac ctgctgtccg atggctggct gagcgccgtg 60 tccgccggcg gcggcagcgg ctttggagga ggacctggag caggaccagc agagttcggc 120 gtgcgcgagc tgctgctgaa tgccgagaag tttgccgaca tcgtggtgga tctgccaacc 180 cagaggcctg ccgtgttccg gcaggtgctg ctgcctctgg tggtggacgc cctgggatgt 240 ccaaaggacg cagaggcctg gatggatatg tttagggcag gagccttctc ccccgagcag 300 aggcaggtgc tggccgacta cctggataag caccagcacc tgtttggact gctggacccc 360 gtggagccat tcggccaggt ggccgacctg agaacagcaa agggagagac caagggcagc 420 gccctgctgg tggcaacagc agccaccggc aacaatgtgc ccctgtttag ctcccggaca 480 gagggcgacg tgctggagct gacccctgca gaggcagcaa gatggctgct gcacacacac 540 tgctgggata ccgcagccat caagacagga gcagtgggcg accctatggt gaagagcggc 600 aagaccaccg gaaacccaac aggacctctg ggacagctgg gagtgaccat gccagtgggc 660 tccacactgt tcgagaccct gctgctgaat atcccatacg gacaggcagg actgtctgat 720 gacgtgccac agtggaggcg ccggagcacc cagggcgacg tgaaggatac cctgtcctgt 780 gcaacacccg tgtggcagag ccggccagca aggggactgc tggaggcctg gacatggcag 840 gccagaagga tcagactgat ctcccaggac acagatcgcg gcccaaggat caccagagtg 900 ctggtggcag caggcgacag gctggaggtg tctccagata cagagcccca caccgcatgg 960 gtggtggata gcccagcagg ccggagaggc aagtctcctg cacggagcgg cgtgaagtcc 1020 gccagaccaa gaaggcacac cgcaggaagg gcaggatgga ggggcctgga cgccctgctg 1080 gccgtgaacg ccgtggacca ggatcagcag gcaacagcaa cccggagcgg cgccgtgtct 1140 agccagctgg tgagacagct gtctgccatc agccgccggc tgcctagccg gtacccactg 1200 agagtggagc tgaccggcat cgcctatggc aaccagtccg ccgtgatcga ggacatgtac 1260 ttcgatgaga tcccactgcc tgtggccgcc ctggaccccg agggcatcgt gtacggcgcc 1320 ctgctggagg tggtggacca ggccgaggat ctggccaagg ccgtgaatca cctgtccggc 1380 gacctgagaa gggcagcagg ctctgagcca atcccatggg acaagggaca gaggcctggc 1440 gataccctgc tgcacgccct ggacccaatc gtgcgccggc tgctggcagg actgaggcag 1500 gccggcgatg actttgatag gtgtgagcag ggcctggagg cctgggagca caaggcagga 1560 caggccacac tgcgggtggc agagggcctg tttaatagcg ccccagccgc cctgttcacc 1620 ggcagaaggg tgaagaagga cggcaaggag caggtgtatc gcctgtctac agcagaggcc 1680 agcttccgcc ggagactggc cgtgatcctg cacaggcgcg ccgccgcccg gaccgccggc 1740 taa 1743 <210> 204 <211> 615 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(615) <223> Cse2 <400> 204 atgtccacat ctccactgtc tgcccccgtg cctggccaga gagtgtctag cctgccaagg 60 ccatactggt ccggcagggc agatgagcag ggacagtggc ggaccagagc aggagagagc 120 ctgaggccac ctggagagga cctgtccgcc ctgagagcag gactgggcaa gaaggccttc 180 acagagccaa ggctgtggca gtactatacc acacccacag atggccgcgt gaccctggag 240 ctggaggcag agcacgccgc cctggccctg tacggactgc accagcagag ccaggagcag 300 ccaatgcaca ggcagggcgt gcggaccgga agagccctga gggccctgca ccagcggtac 360 tctgaggagg caacagacag gcgcgtggca caggcagtgg gagccaccag cgccgcagcc 420 tttgcctata ggctgcgcgc cctggtgacc cagctgaggt ctatcggcca gccactggat 480 tacgaccagc tgatgcagga tctgctgagg tggcacttcc ccgacggccg gagcagagtg 540 cggagaggat ggggactggg ataccacgga agggacaggc agcccgatga ggccccaccc 600 cctgagggca gctaa 615 <210> 205 <211> 1167 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(1167) <223> Cas7 <400> 205 atgtcccagc cagcagcaag gccacctaga acatacgtgg actttcacat cctgcagacc 60 gtgccacccg ccaacctgaa tcgggacgat cagggcaacc caaaggaggc ctactatggc 120 ggcgtgcgga gatccagagt gagctcccag gcctggaaga gggcaacccg cacacacttc 180 gcagagcggg tgcccgagca ggatctggca accagaacaa ggaggatcat cggcgccctg 240 gcagacgata tccagaagag ggccggcctg gataggcctg ccgccctgag gctggcagac 300 gccctgctgg ccccactgga gctgtccggc ggcaagaaga aggacgagtc tgcctacctg 360 ctgttttatg gccggagaca gctggatgca gtggccgccc tggtggcaga ccaggcaacc 420 gagctgtctg ccctgagcga tgcagacctg gcatcccggg tgaaggagct gcccgtgaga 480 gagcagtttt ctacaggcca ccctatcgac gtggccctgt tcggcaggat ggtggccgac 540 atccctgccc tgaaggtgga tgcagcagca caggtggcac acgccctgag cacacacgcc 600 gtggagctgg agtttgatta cttcaccgcc gtggacgatg agcagacaga cgaggagacc 660 ggagcaggaa tgatcggaac catcggcttc aacagcgcca cactgtaccg ctatgcctcc 720 gtgggactgc accagctgct ggacaatctg accgatgagg aggccgccct gacagccatc 780 tccgagtttg ccacctcctt cgcccggtct atgcccacag gctatcagaa ctcttttgcc 840 cacaggaccc tgcccagcct ggtggcagtg gtggtgcgcg aggaccagcc tgtgaatctg 900 gtgagcgcct tcgagcagcc agtggccaca ccatccggca tcgcagcagc atctgccgca 960 aggctggccg aggagcacac ccgcgcaacc gtgacatggg gcgatgcacc agcctttgcc 1020 gcagcaacac acgtgttcac cgaccaccag aagaccacag ccgccctgaa cagcgccttt 1080 ggccctagca tcccattctc cgccctgctg gagggactgc acacccacct ggcaggcgcc 1140 ctgaagccta agcaggcagc acagtaa 1167 <210> 206 <211> 882 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(882) <223> Cas5 <400> 206 atgaccacag cacctacacc agagccagca ggaaataccc acccagcaca cggctccgat 60 gagcctaccg tgctgctgct gaggctggca ggaccactgc agtcttgggg cgtgagatcc 120 tcttttaaca ggagggacac aggagcagag ccaaccaagt ccggcgtgat cggactgctg 180 gcagcagcag caggacaccc tagagagcag ccactgggag agctggcaga tctgaccctg 240 ggcatcaggg tggaccagcc aggcacactg ctgagggact accacaccgt gagcgattat 300 aggggcagac ctctgccaca ggcaggcgtg tctgccaagg gcatccagaa gcccaccagc 360 cctgccaagc acacacacgt gaccacaagg ttttacctgc aggatgccgt gttcgtggcc 420 gccctggagg gacctccagg actgctgacc acactggaca gggccgtgcg gaatccagca 480 ttcccactgg ccctgggccg gagaagctgt ccacctaccc agccactgtc cctgggactg 540 cggaccacag atatggagac agccctgaga tctgagcctt ggcaggccag cgcccacacc 600 agagagcagt atgcaaggcg cctgggaagg gagaggggac tgcaccagcc tctgcaccca 660 ggaaccatcg acagggcagc aacaatcgag gaccccaggg gcgacgatag gctgcaggac 720 gcacccgtga gctttgatcc tcaccagagg gccttcacct ccagacaggt gaggcacacc 780 tggctggcca tccccacagg ctttgaccac atcgacgatg accagcctca cggacaggca 840 gatgaccccg atcacgaccc tttcgccctg ctgggatggt aa 882 <210> 207 <211> 813 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(813) <223> Cas6 <400> 207 atgacatacc tgtcccggat cagaatcaac ccactgcgga aggacagccg gaagctgctg 60 agcaatccaa gggcagtgca cggagccgtg atgggaggcc tgccaaacca caagcccgat 120 gacagggtgc tgtggcgcat ggaccccgac aatcctcaca ggccacacct gtttgtgctg 180 agccccacac gccctgactg gacccacatc atccaggatt gtggctggcc agatgcagac 240 ggcgatcacg cagccgtgag agactatacc ccactgctga gccagctggc agtgggaaga 300 gagttcgcct ttaggctgac agcctccccc gtgcagaaca ccgccacacc aaccaaggca 360 accccagcac aggcagcaag gctgaccaca cacgccgaga atggcaagcg gatcagaggc 420 ttcagaatgg gacacagaac cgcagcagca cagctggatt ggtttctgac acgcaccgac 480 cggtggggct tcgatatccc tgcaacaaga tctgacccag cagcaccagg catccacgca 540 ccaacacctc caaccgcacc aaggcctaca agcccaccta gaccagatcc caacccacca 600 tacgaggtgc gcatcaccgc aaggcacaga cactcctttc agaagaatgg ccacggcgcc 660 cacgtggtgt ttcggtctgc caccttcgag ggcaggctgc gcatcacaga caccgatcgg 720 ttcaccacat ctctgctgac aggcctgggc cctagcagag cctatggatg cggactgctg 780 acactggcac ctctgccagg acagcagacc taa 813 <210> 208 <211> 580 <212> PRT <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(580) <223> Cas8 <400> 208 Met Pro Gly Lys Gly Gly Ala Ser Val Asn Leu Leu Ser Asp Gly Trp 1 5 10 15 Leu Ser Ala Val Ser Ala Gly Gly Gly Ser Gly Phe Gly Gly Gly Pro 20 25 30 Gly Ala Gly Pro Ala Glu Phe Gly Val Arg Glu Leu Leu Leu Asn Ala 35 40 45 Glu Lys Phe Ala Asp Ile Val Val Asp Leu Pro Thr Gln Arg Pro Ala 50 55 60 Val Phe Arg Gln Val Leu Leu Pro Leu Val Val Asp Ala Leu Gly Cys 65 70 75 80 Pro Lys Asp Ala Glu Ala Trp Met Asp Met Phe Arg Ala Gly Ala Phe 85 90 95 Ser Pro Glu Gln Arg Gln Val Leu Ala Asp Tyr Leu Asp Lys His Gln 100 105 110 His Leu Phe Gly Leu Leu Asp Pro Val Glu Pro Phe Gly Gln Val Ala 115 120 125 Asp Leu Arg Thr Ala Lys Gly Glu Thr Lys Gly Ser Ala Leu Leu Val 130 135 140 Ala Thr Ala Ala Thr Gly Asn Asn Val Pro Leu Phe Ser Ser Arg Thr 145 150 155 160 Glu Gly Asp Val Leu Glu Leu Thr Pro Ala Glu Ala Ala Arg Trp Leu 165 170 175 Leu His Thr His Cys Trp Asp Thr Ala Ala Ile Lys Thr Gly Ala Val 180 185 190 Gly Asp Pro Met Val Lys Ser Gly Lys Thr Thr Gly Asn Pro Thr Gly 195 200 205 Pro Leu Gly Gln Leu Gly Val Thr Met Pro Val Gly Ser Thr Leu Phe 210 215 220 Glu Thr Leu Leu Leu Asn Ile Pro Tyr Gly Gln Ala Gly Leu Ser Asp 225 230 235 240 Asp Val Pro Gln Trp Arg Arg Arg Ser Thr Gln Gly Asp Val Lys Asp 245 250 255 Thr Leu Ser Cys Ala Thr Pro Val Trp Gln Ser Arg Pro Ala Arg Gly 260 265 270 Leu Leu Glu Ala Trp Thr Trp Gln Ala Arg Arg Ile Arg Leu Ile Ser 275 280 285 Gln Asp Thr Asp Arg Gly Pro Arg Ile Thr Arg Val Leu Val Ala Ala 290 295 300 Gly Asp Arg Leu Glu Val Ser Pro Asp Thr Glu Pro His Thr Ala Trp 305 310 315 320 Val Val Asp Ser Pro Ala Gly Arg Arg Gly Lys Ser Pro Ala Arg Ser 325 330 335 Gly Val Lys Ser Ala Arg Pro Arg Arg His Thr Ala Gly Arg Ala Gly 340 345 350 Trp Arg Gly Leu Asp Ala Leu Leu Ala Val Asn Ala Val Asp Gln Asp 355 360 365 Gln Gln Ala Thr Ala Thr Arg Ser Gly Ala Val Ser Ser Gln Leu Val 370 375 380 Arg Gln Leu Ser Ala Ile Ser Arg Arg Leu Pro Ser Arg Tyr Pro Leu 385 390 395 400 Arg Val Glu Leu Thr Gly Ile Ala Tyr Gly Asn Gln Ser Ala Val Ile 405 410 415 Glu Asp Met Tyr Phe Asp Glu Ile Pro Leu Pro Val Ala Ala Leu Asp 420 425 430 Pro Glu Gly Ile Val Tyr Gly Ala Leu Leu Glu Val Val Asp Gln Ala 435 440 445 Glu Asp Leu Ala Lys Ala Val Asn His Leu Ser Gly Asp Leu Arg Arg 450 455 460 Ala Ala Gly Ser Glu Pro Ile Pro Trp Asp Lys Gly Gln Arg Pro Gly 465 470 475 480 Asp Thr Leu Leu His Ala Leu Asp Pro Ile Val Arg Arg Leu Leu Ala 485 490 495 Gly Leu Arg Gln Ala Gly Asp Asp Phe Asp Arg Cys Glu Gln Gly Leu 500 505 510 Glu Ala Trp Glu His Lys Ala Gly Gln Ala Thr Leu Arg Val Ala Glu 515 520 525 Gly Leu Phe Asn Ser Ala Pro Ala Ala Leu Phe Thr Gly Arg Arg Val 530 535 540 Lys Lys Asp Gly Lys Glu Gln Val Tyr Arg Leu Ser Thr Ala Glu Ala 545 550 555 560 Ser Phe Arg Arg Arg Leu Ala Val Ile Leu His Arg Arg Ala Ala Ala 565 570 575 Arg Thr Ala Gly 580 <210> 209 <211> 204 <212> PRT <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(204) <223> Cse2 <400> 209 Met Ser Thr Ser Pro Leu Ser Ala Pro Val Pro Gly Gln Arg Val Ser 1 5 10 15 Ser Leu Pro Arg Pro Tyr Trp Ser Gly Arg Ala Asp Glu Gln Gly Gln 20 25 30 Trp Arg Thr Arg Ala Gly Glu Ser Leu Arg Pro Pro Gly Glu Asp Leu 35 40 45 Ser Ala Leu Arg Ala Gly Leu Gly Lys Lys Ala Phe Thr Glu Pro Arg 50 55 60 Leu Trp Gln Tyr Tyr Thr Thr Pro Thr Asp Gly Arg Val Thr Leu Glu 65 70 75 80 Leu Glu Ala Glu His Ala Ala Leu Ala Leu Tyr Gly Leu His Gln Gln 85 90 95 Ser Gln Glu Gln Pro Met His Arg Gln Gly Val Arg Thr Gly Arg Ala 100 105 110 Leu Arg Ala Leu His Gln Arg Tyr Ser Glu Glu Ala Thr Asp Arg Arg 115 120 125 Val Ala Gln Ala Val Gly Ala Thr Ser Ala Ala Ala Phe Ala Tyr Arg 130 135 140 Leu Arg Ala Leu Val Thr Gln Leu Arg Ser Ile Gly Gln Pro Leu Asp 145 150 155 160 Tyr Asp Gln Leu Met Gln Asp Leu Leu Arg Trp His Phe Pro Asp Gly 165 170 175 Arg Ser Arg Val Arg Arg Gly Trp Gly Leu Gly Tyr His Gly Arg Asp 180 185 190 Arg Gln Pro Asp Glu Ala Pro Pro Pro Glu Gly Ser 195 200 <210> 210 <211> 388 <212> PRT <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(388) <223> Cas7 <400> 210 Met Ser Gln Pro Ala Ala Arg Pro Pro Arg Thr Tyr Val Asp Phe His 1 5 10 15 Ile Leu Gln Thr Val Pro Pro Ala Asn Leu Asn Arg Asp Asp Gln Gly 20 25 30 Asn Pro Lys Glu Ala Tyr Tyr Gly Gly Val Arg Arg Ser Arg Val Ser 35 40 45 Ser Gln Ala Trp Lys Arg Ala Thr Arg Thr His Phe Ala Glu Arg Val 50 55 60 Pro Glu Gln Asp Leu Ala Thr Arg Thr Arg Arg Ile Ile Gly Ala Leu 65 70 75 80 Ala Asp Asp Ile Gln Lys Arg Ala Gly Leu Asp Arg Pro Ala Ala Leu 85 90 95 Arg Leu Ala Asp Ala Leu Leu Ala Pro Leu Glu Leu Ser Gly Gly Lys 100 105 110 Lys Lys Asp Glu Ser Ala Tyr Leu Leu Phe Tyr Gly Arg Arg Gln Leu 115 120 125 Asp Ala Val Ala Ala Leu Val Ala Asp Gln Ala Thr Glu Leu Ser Ala 130 135 140 Leu Ser Asp Ala Asp Leu Ala Ser Arg Val Lys Glu Leu Pro Val Arg 145 150 155 160 Glu Gln Phe Ser Thr Gly His Pro Ile Asp Val Ala Leu Phe Gly Arg 165 170 175 Met Val Ala Asp Ile Pro Ala Leu Lys Val Asp Ala Ala Ala Gln Val 180 185 190 Ala His Ala Leu Ser Thr His Ala Val Glu Leu Glu Phe Asp Tyr Phe 195 200 205 Thr Ala Val Asp Asp Glu Gln Thr Asp Glu Glu Thr Gly Ala Gly Met 210 215 220 Ile Gly Thr Ile Gly Phe Asn Ser Ala Thr Leu Tyr Arg Tyr Ala Ser 225 230 235 240 Val Gly Leu His Gln Leu Leu Asp Asn Leu Thr Asp Glu Glu Ala Ala 245 250 255 Leu Thr Ala Ile Ser Glu Phe Ala Thr Ser Phe Ala Arg Ser Met Pro 260 265 270 Thr Gly Tyr Gln Asn Ser Phe Ala His Arg Thr Leu Pro Ser Leu Val 275 280 285 Ala Val Val Val Arg Glu Asp Gln Pro Val Asn Leu Val Ser Ala Phe 290 295 300 Glu Gln Pro Val Ala Thr Pro Ser Gly Ile Ala Ala Ala Ser Ala Ala 305 310 315 320 Arg Leu Ala Glu Glu His Thr Arg Ala Thr Val Thr Trp Gly Asp Ala 325 330 335 Pro Ala Phe Ala Ala Ala Thr His Val Phe Thr Asp His Gln Lys Thr 340 345 350 Thr Ala Ala Leu Asn Ser Ala Phe Gly Pro Ser Ile Pro Phe Ser Ala 355 360 365 Leu Leu Glu Gly Leu His Thr His Leu Ala Gly Ala Leu Lys Pro Lys 370 375 380 Gln Ala Ala Gln 385 <210> 211 <211> 293 <212> PRT <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(293) <223> Cas5 <400> 211 Met Thr Thr Ala Pro Thr Pro Glu Pro Ala Gly Asn Thr His Pro Ala 1 5 10 15 His Gly Ser Asp Glu Pro Thr Val Leu Leu Leu Arg Leu Ala Gly Pro 20 25 30 Leu Gln Ser Trp Gly Val Arg Ser Ser Phe Asn Arg Arg Asp Thr Gly 35 40 45 Ala Glu Pro Thr Lys Ser Gly Val Ile Gly Leu Leu Ala Ala Ala Ala 50 55 60 Gly His Pro Arg Glu Gln Pro Leu Gly Glu Leu Ala Asp Leu Thr Leu 65 70 75 80 Gly Ile Arg Val Asp Gln Pro Gly Thr Leu Leu Arg Asp Tyr His Thr 85 90 95 Val Ser Asp Tyr Arg Gly Arg Pro Leu Pro Gln Ala Gly Val Ser Ala 100 105 110 Lys Gly Ile Gln Lys Pro Thr Ser Pro Ala Lys His Thr His Val Thr 115 120 125 Thr Arg Phe Tyr Leu Gln Asp Ala Val Phe Val Ala Ala Leu Glu Gly 130 135 140 Pro Pro Gly Leu Leu Thr Thr Leu Asp Arg Ala Val Arg Asn Pro Ala 145 150 155 160 Phe Pro Leu Ala Leu Gly Arg Arg Ser Cys Pro Pro Thr Gln Pro Leu 165 170 175 Ser Leu Gly Leu Arg Thr Thr Asp Met Glu Thr Ala Leu Arg Ser Glu 180 185 190 Pro Trp Gln Ala Ser Ala His Thr Arg Glu Gln Tyr Ala Arg Arg Leu 195 200 205 Gly Arg Glu Arg Gly Leu His Gln Pro Leu His Pro Gly Thr Ile Asp 210 215 220 Arg Ala Ala Thr Ile Glu Asp Pro Arg Gly Asp Asp Arg Leu Gln Asp 225 230 235 240 Ala Pro Val Ser Phe Asp Pro His Gln Arg Ala Phe Thr Ser Arg Gln 245 250 255 Val Arg His Thr Trp Leu Ala Ile Pro Thr Gly Phe Asp His Ile Asp 260 265 270 Asp Asp Gln Pro His Gly Gln Ala Asp Asp Pro Asp His Asp Pro Phe 275 280 285 Ala Leu Leu Gly Trp 290 <210> 212 <211> 270 <212> PRT <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(270) <223> Cas6 <400> 212 Met Thr Tyr Leu Ser Arg Ile Arg Ile Asn Pro Leu Arg Lys Asp Ser 1 5 10 15 Arg Lys Leu Leu Ser Asn Pro Arg Ala Val His Gly Ala Val Met Gly 20 25 30 Gly Leu Pro Asn His Lys Pro Asp Asp Arg Val Leu Trp Arg Met Asp 35 40 45 Pro Asp Asn Pro His Arg Pro His Leu Phe Val Leu Ser Pro Thr Arg 50 55 60 Pro Asp Trp Thr His Ile Ile Gln Asp Cys Gly Trp Pro Asp Ala Asp 65 70 75 80 Gly Asp His Ala Ala Val Arg Asp Tyr Thr Pro Leu Leu Ser Gln Leu 85 90 95 Ala Val Gly Arg Glu Phe Ala Phe Arg Leu Thr Ala Ser Pro Val Gln 100 105 110 Asn Thr Ala Thr Pro Thr Lys Ala Thr Pro Ala Gln Ala Ala Arg Leu 115 120 125 Thr Thr His Ala Glu Asn Gly Lys Arg Ile Arg Gly Phe Arg Met Gly 130 135 140 His Arg Thr Ala Ala Ala Gln Leu Asp Trp Phe Leu Thr Arg Thr Asp 145 150 155 160 Arg Trp Gly Phe Asp Ile Pro Ala Thr Arg Ser Asp Pro Ala Ala Pro 165 170 175 Gly Ile His Ala Pro Thr Pro Pro Thr Ala Pro Arg Pro Thr Ser Pro 180 185 190 Pro Arg Pro Asp Pro Asn Pro Pro Tyr Glu Val Arg Ile Thr Ala Arg 195 200 205 His Arg His Ser Phe Gln Lys Asn Gly His Gly Ala His Val Val Phe 210 215 220 Arg Ser Ala Thr Phe Glu Gly Arg Leu Arg Ile Thr Asp Thr Asp Arg 225 230 235 240 Phe Thr Thr Ser Leu Leu Thr Gly Leu Gly Pro Ser Arg Ala Tyr Gly 245 250 255 Cys Gly Leu Leu Thr Leu Ala Pro Leu Pro Gly Gln Gln Thr 260 265 270 <210> 213 <211> 90 <212> DNA <213> Streptomyces sp. S4 <220> <221> misc_feature <222> (1)..(90) <223> CRISPR <400> 213 gtcggccccg cacccgcggg gatgctccaa tggccgagga cgacggcgat ctggccacgg 60 acgtcggccc cgcacccgcg gggatgctcc 90 <210> 214 <211> 744 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(744) <223> Cas6 <400> 214 atggaagttt acgaaatgaa attaaaagta aaacttaaaa aagatatttt tttaaaagat 60 gtttccacat atatcacaag atttatggat atgaatctat cagctaatcc aacaatgtac 120 aattatcata cttctaaaat ctacaaagga tatacatttg acggactatt cccgatagaa 180 gaagataaaa tatataaaaa agataaaact tattctttta gagtaagaac aataaatcaa 240 aaaatagcta actatttttt agatactctt atgttctttg aaaataaaga tattcaaggt 300 ttgacattaa atataagggt gatagagaaa aaattaattg aaaagttata tacaataact 360 cctattttaa tgaaaacaga tgagggatat tggagatatt ctatgacttt tgaagaattt 420 gaaaaaagat taaaaataaa ctgtttaaag aagtatttat actttacaga gaataatgat 480 gatataacta ttgatactga acttttaaaa aaattaggag aagataaatc tgatgatata 540 gatttattta ctaatattaa gtttattaat agaatgcctg tcccaattat ttataaggga 600 agaaaattag ttggagataa ggttgaacta caagttgcca ataatgagaa agcacaagat 660 attgcatata tgcttttagg aacagggctt ttagaaaatt gtgcaagggg ttgcggcttc 720 ttgaatttca aaaattatga gtag 744 <210> 215 <211> 1728 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(1728) <223> Cas8 <400> 215 ttgattgatg aagcattaga agtatttaaa aaaatttatg ataaggaggg ggaaaaactt 60 gttgtaaaca aacatattcc aaaagatgga acatatattt tagtaaatat aaaatcagga 120 aaaataatag aaaaattaaa tattttctat gataaaaaaa gtaaaaaaat agatggtgaa 180 cttaatcaat actatggcta ttttagagct tttgattatt attctaattt agtagatatg 240 aataaaccaa tggatccaaa aaagacaata cattcaaatc agatttattc attttttata 300 aaaaaagata gcataagaga aaataaatta actaaatcaa ttattgaagg atataaaaaa 360 aatcttttaa acccagaaga aaaatacaat agtaaggaag ggaaagagct atataaaaat 420 atagcagaaa agcttcctaa aattgaaaaa gatattgtag aggatatttt tttatggata 480 gaagataatg taaatgaaaa tttattagaa aatgacaata aaaaagatta cttaaaaata 540 ttttttgtag aagaggattt agataaaagt ttagaactat ttaaaaatga acataaaaga 600 tatattattc ctaatatttt taattctaat gattataata aaaaaattgg agagactatt 660 tatggattgt ctaataataa tatgggatta aatgcaaaaa aagcattttt ggaaaataag 720 acaagaagag tatcaacccc atatttagtt aatactgatg aaatactttt acaatatgct 780 ttctataatt atttattacc agaagtaaaa caaggaaatt attttattta tttttcagaa 840 aatgaaatta ttcctaggac atataaagaa ggctgtccta atggagcaaa atatttatta 900 aatgctagtt attcaaaaga tgttgatata aaaaatttta atgtaatctc aaaaaatagt 960 agcgaagaaa taaatattaa ttttaaagaa attttacatc aaaagaaaaa agatacagat 1020 gagattgaat atggaaatct taatagagaa aagatgatga ataatataaa taaaattctt 1080 ttctataatt ctttattagg aaatttttta ctcagtgatg gagatttgga tataaaggat 1140 attgagataa aaaaactgtt aatgaaatat agaaatgctt tttataagtg gttttattta 1200 aatgatgaag cagaagtcaa aaaaaatatt agaaaaatat atctggatgc tgtaatggtg 1260 gcaataggaa atggatattt ctttaaagca agtcaacaac ttgattttgg cttttgtttg 1320 gaaaagtatt tttatggaaa aagtgagtta atggaggaaa ttatgaatgt aaaagaagta 1380 tttttaaatc atactttatc agaagaagat tgggagtttt taaatgatga agagtatttt 1440 ttcgcagttg ggcaaatatt agcgtacata aattatatga gaaatagtaa agctaaaagt 1500 ttgaatttta taaaacaact aacttttgtt aaaaatattg atgttctaaa agaaaagata 1560 aagaaaatag taatttcata ttcacatatt tttgaaacta aaaataaaaa aattaataga 1620 acagtatcaa atattagttt gtaccaacca aaagaaataa gaatagatat attattagca 1680 ggatttacag cagatataat tttctttaaa aagagggagg aaaaataa 1728 <210> 216 <211> 948 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(948) <223> Cas7 <400> 216 atgaaaatgg aaaaaagagt ttatggaatt ttaggaatat catctattat gtctaattgg 60 aatgcagatt tcagtggaga gcctaagtca atttctaatg gaagaatatt tgggagtgat 120 aaggcattta agtatcctat gaaaaaaatg tgggaaaatc aaggagaaaa agttctttat 180 ataaaatctt taaaagttga taaaggagct ttaattccta agactttaaa ggaaagatat 240 gagcaattat ttccagaaaa aaaacttgat aaaaatacag aaacaataga agttattaag 300 aacttattta aagccataga tgtaaaaaat tttggagcaa catttgcaga agaaggaaat 360 aatatttcta tcacaggggc agttcaaata ggacaaggtt ttaatttcta tgatgaaagt 420 aacacagaag ttcaagatat tctatctcca tttagagatc caaaaggaaa aattaataaa 480 gaaacaaaag aaaatgaaga tgcaaagaac tctactttgg gaactaaaat agttagtgat 540 gaggcacact atttttatcc ttttaatata aatcctttgg catataaaga atttatagaa 600 ttagaaataa ctgatggata tacagaagaa gattatttga agtttaaaga agcagcttta 660 tcatcagcaa ctttttttgc aacaaattca aaagttggct gtgataatga atttggacta 720 ttcattgaaa cagaagaaga tttttattta ccaattttaa ctcaatatat aaaatttgaa 780 aagggagaag aaaaaaataa aataactctt aatttaagta ctatattaaa aggagtagaa 840 aatcatatca aaaatataga aatatactat aatccagtaa ctactgaaat tgtaactgat 900 atttctaact ataagttgat aaatatttta actaagaaag aggtataa 948 <210> 217 <211> 771 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(771) <223> Cas5 <400> 217 atggaagcac tgaaatttac tttaagtggt aatagtgcct tttttaaaga taatgtaatc 60 aacactgttt atttaacata tggaaatata catagagtag ctttattagg aatgtttgga 120 gcaattttag gctatggtgg atatagtaaa caaaatgata tgttgaagaa aaaaaataaa 180 aagatgcctg attatccaga attttatgag aaactaaaag atattaaaat atcaatagtt 240 tccaacggaa aaaatggtta ttttaataaa aagttacaaa catttaataa tagtgttggt 300 tatgcgtcaa aagaagaagg tggaaattta atagtaaaac aattctggtt agaaaatcct 360 tcttgggata tttatatatt gttagattgt gatgaagcaa agaaaatagc agactatata 420 cagaatagga aagctattta tcttccatat cttggaagca atgaccattt agcaaatata 480 atggatgtag agataataga tattgaagaa aagatgagtt cagaagatga aactattgaa 540 attctttcta tggtaaaaga tagtgatata tcagaaaaaa agaaaaatgt atttagtata 600 gataaaaatt caataagaga tgatatatat aaatattctg aatatttacc agttacctta 660 tcaaaagaat taaatcaata tgaaaaagaa aaaatgacaa ttactaatat gtctgttata 720 ttaaaaaaat cttattataa agtggaagat aaaaacattg ttttctatta a 771 <210> 218 <211> 744 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(744) <223> Cas6 <400> 218 atggaggtgt acgagatgaa gctgaaggtg aagctgaaga aggatatctt tctgaaggac 60 gtgagcacct atatcacaag attcatggat atgaacctgt ccgccaatcc aaccatgtac 120 aactatcaca catctaagat ctacaagggc tatacctttg acggcctgtt ccccatcgag 180 gaggataaga tctacaagaa ggacaagacc tatagctttc gggtgagaac aatcaaccag 240 aagatcgcca attacttcct ggataccctg atgttctttg agaataagga catccagggc 300 ctgacactga acatcagagt gatcgagaag aagctgatcg agaagctgta caccatcaca 360 cctatcctga tgaagaccga tgagggctac tggcggtatt ctatgacatt tgaggagttc 420 gagaagagac tgaagatcaa ctgcctgaag aagtacctgt atttcaccga gaacaatgac 480 gatatcacca tcgacacaga gctgctgaag aagctgggcg aggataagag cgacgatatc 540 gacctgttta caaacatcaa gttcatcaat aggatgcccg tgcctatcat ctacaagggc 600 cgcaagctgg tgggcgataa ggtggagctg caggtggcca acaatgagaa ggcccaggac 660 atcgcctata tgctgctggg aaccggactg ctggagaatt gcgcacgggg ctgtggcttt 720 ctgaacttca agaattacga gtaa 744 <210> 219 <211> 1728 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(1728) <223> Cas8 <400> 219 atgatcgatg aggccctgga ggtgtttaag aagatctacg acaaggaggg cgagaagctg 60 gtggtgaata agcacatccc caaggacggc acatatatcc tggtgaatat caagtctggc 120 aagatcatcg agaagctgaa catcttctac gataagaaga gcaagaagat cgacggcgag 180 ctgaaccagt actatggcta ttttcgcgcc ttcgattact atagcaacct ggtggatatg 240 aataagccta tggacccaaa gaagaccatc cacagcaatc agatctattc cttctttatc 300 aagaaggact ctatccggga gaacaagctg acaaagagca tcatcgaggg ctacaagaag 360 aacctgctga atcctgagga gaagtacaat tccaaggagg gcaaggagct gtataagaac 420 atcgccgaga agctgccaaa gatcgagaag gatatcgtgg aggacatctt cctgtggatc 480 gaggacaatg tgaacgagaa tctgctggag aacgataata agaaggacta tctgaagatc 540 ttctttgtgg aggaggacct ggataagagc ctggagctgt ttaagaacga gcacaagagg 600 tacatcatcc ctaacatctt caactccaac gattacaata agaagatcgg cgagaccatc 660 tatggcctgt ctaacaataa catgggcctg aacgccaaga aggcctttct ggagaataag 720 accaggcgcg tgagcacacc ctacctggtg aatacagacg agatcctgct gcagtatgcc 780 ttctacaact atctgctgcc tgaggtgaag cagggcaact actttatcta tttctccgag 840 aatgagatca tcccaagaac ctacaaggag ggctgcccca acggcgccaa gtacctgctg 900 aatgcctctt atagcaagga cgtggatatc aagaacttta atgtgatctc caagaatagc 960 tccgaggaga tcaacatcaa tttcaaggag atcctgcacc agaagaagaa ggacacagat 1020 gagatcgagt acggcaacct gaatagggag aagatgatga acaacatcaa caagatcctg 1080 ttttataact ccctgctggg caatttcctg ctgtctgacg gcgatctgga catcaaggat 1140 atcgagatca agaagctgct gatgaagtac cgcaatgcct tttacaagtg gttctatctg 1200 aacgatgagg ccgaggtgaa gaagaatatc agaaagatct acctggacgc cgtgatggtg 1260 gccatcggca acggctattt ctttaaggcc agccagcagc tggactttgg cttctgtctg 1320 gagaagtact tctatggcaa gtccgagctg atggaggaga tcatgaacgt gaaagaggtg 1380 tttctgaatc acaccctgag cgaggaggat tgggagttcc tgaacgacga ggagtacttc 1440 tttgccgtgg gccagatcct ggcctacatc aactatatgc gcaattccaa ggccaagagc 1500 ctgaacttca tcaagcagct gacattcgtg aagaacatcg acgtgctgaa ggagaagatc 1560 aagaagatcg tgatctccta ttctcacatc tttgagacca agaacaagaa gatcaatagg 1620 acagtgtcta acatcagcct gtaccagcca aaggagatcc gcatcgatat cctgctggcc 1680 ggcttcaccg ccgacatcat cttctttaag aagcgggagg agaagtaa 1728 <210> 220 <211> 942 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(942) <223> Cas7 <400> 220 atggagaaga gagtgtacgg catcctgggc atcagctcca tcatgtccaa ttggaacgcc 60 gatttctctg gcgagcctaa gtctatcagc aatggcagaa tctttggctc cgacaaggcc 120 ttcaagtacc caatgaagaa gatgtgggag aaccagggcg agaaggtgct gtatatcaag 180 tctctgaagg tggataaggg cgccctgatc cccaagaccc tgaaggagag gtacgagcag 240 ctgtttcctg agaagaagct ggataagaac accgagacaa tcgaagtgat caagaatctg 300 ttcaaggcca tcgacgtgaa gaactttggc gccaccttcg ccgaggaggg caacaatatc 360 agcatcacag gcgccgtgca gatcggccag ggcttcaact tttacgacga gagcaatacc 420 gaggtgcagg atatcctgtc ccccttcaga gaccctaagg gcaagatcaa caaggagaca 480 aaggagaacg aggatgccaa gaatagcacc ctgggcacaa agatcgtgtc cgacgaggcc 540 cactactttt atccattcaa tatcaacccc ctggcctaca aggagtttat cgagctggag 600 atcaccgatg gctacacaga ggaggactat ctgaagttca aggaggccgc cctgtctagc 660 gccaccttct ttgccacaaa ctccaaagtg ggctgcgata atgagtttgg cctgttcatc 720 gagaccgagg aggactttta cctgccaatc ctgacacagt atatcaagtt cgagaagggc 780 gaggagaaga acaagatcac cctgaatctg tctacaatcc tgaagggcgt ggagaaccac 840 atcaagaata tcgagatcta ctataatccc gtgaccacag agatcgtgac cgatatcagc 900 aactacaagc tgatcaatat cctgacaaag aaggaagtgt aa 942 <210> 221 <211> 771 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(771) <223> Cas5 <400> 221 atggaggccc tgaagtttac actgagcggc aattccgcct tctttaagga caacgtgatc 60 aataccgtgt acctgacata tggcaacatc cacagggtgg ccctgctggg catgtttggc 120 gccatcctgg gctacggcgg ctattctaag cagaacgaca tgctgaagaa gaagaacaag 180 aagatgccag attaccccga gttctatgag aagctgaagg acatcaagat ctctatcgtg 240 agcaacggca agaatggcta ctttaataag aagctgcaga ccttcaacaa tagcgtgggc 300 tatgcctcca aggaggaggg cggcaatctg atcgtgaagc agttctggct ggagaacccc 360 tcctgggata tctacatcct gctggactgc gatgaggcca agaagatcgc cgactatatc 420 cagaaccgca aggccatcta cctgccttat ctgggctcca acgatcacct ggccaatatc 480 atggatgtgg agatcatcga catcgaggag aagatgtcct ctgaggacga gaccatcgag 540 atcctgtcta tggtgaagga ctccgatatc tctgagaaga agaagaacgt gttcagcatc 600 gacaaaaata gcatccggga cgatatctac aagtattctg agtacctgcc tgtgacactg 660 agcaaggagc tgaatcagta tgagaaggag aagatgacca tcacaaacat gagcgtgatc 720 ctgaagaagt cctactataa ggtggaggat aagaatatcg tgttctacta a 771 <210> 222 <211> 247 <212> PRT <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(247) <223> Cas6 <400> 222 Met Glu Val Tyr Glu Met Lys Leu Lys Val Lys Leu Lys Lys Asp Ile 1 5 10 15 Phe Leu Lys Asp Val Ser Thr Tyr Ile Thr Arg Phe Met Asp Met Asn 20 25 30 Leu Ser Ala Asn Pro Thr Met Tyr Asn Tyr His Thr Ser Lys Ile Tyr 35 40 45 Lys Gly Tyr Thr Phe Asp Gly Leu Phe Pro Ile Glu Glu Asp Lys Ile 50 55 60 Tyr Lys Lys Asp Lys Thr Tyr Ser Phe Arg Val Arg Thr Ile Asn Gln 65 70 75 80 Lys Ile Ala Asn Tyr Phe Leu Asp Thr Leu Met Phe Phe Glu Asn Lys 85 90 95 Asp Ile Gln Gly Leu Thr Leu Asn Ile Arg Val Ile Glu Lys Lys Leu 100 105 110 Ile Glu Lys Leu Tyr Thr Ile Thr Pro Ile Leu Met Lys Thr Asp Glu 115 120 125 Gly Tyr Trp Arg Tyr Ser Met Thr Phe Glu Glu Phe Glu Lys Arg Leu 130 135 140 Lys Ile Asn Cys Leu Lys Lys Tyr Leu Tyr Phe Thr Glu Asn Asn Asp 145 150 155 160 Asp Ile Thr Ile Asp Thr Glu Leu Leu Lys Lys Leu Gly Glu Asp Lys 165 170 175 Ser Asp Asp Ile Asp Leu Phe Thr Asn Ile Lys Phe Ile Asn Arg Met 180 185 190 Pro Val Pro Ile Ile Tyr Lys Gly Arg Lys Leu Val Gly Asp Lys Val 195 200 205 Glu Leu Gln Val Ala Asn Asn Glu Lys Ala Gln Asp Ile Ala Tyr Met 210 215 220 Leu Leu Gly Thr Gly Leu Leu Glu Asn Cys Ala Arg Gly Cys Gly Phe 225 230 235 240 Leu Asn Phe Lys Asn Tyr Glu 245 <210> 223 <211> 575 <212> PRT <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(575) <223> Cas8 <400> 223 Met Ile Asp Glu Ala Leu Glu Val Phe Lys Lys Ile Tyr Asp Lys Glu 1 5 10 15 Gly Glu Lys Leu Val Val Asn Lys His Ile Pro Lys Asp Gly Thr Tyr 20 25 30 Ile Leu Val Asn Ile Lys Ser Gly Lys Ile Ile Glu Lys Leu Asn Ile 35 40 45 Phe Tyr Asp Lys Lys Ser Lys Lys Ile Asp Gly Glu Leu Asn Gln Tyr 50 55 60 Tyr Gly Tyr Phe Arg Ala Phe Asp Tyr Tyr Ser Asn Leu Val Asp Met 65 70 75 80 Asn Lys Pro Met Asp Pro Lys Lys Thr Ile His Ser Asn Gln Ile Tyr 85 90 95 Ser Phe Phe Ile Lys Lys Asp Ser Ile Arg Glu Asn Lys Leu Thr Lys 100 105 110 Ser Ile Ile Glu Gly Tyr Lys Lys Asn Leu Leu Asn Pro Glu Glu Lys 115 120 125 Tyr Asn Ser Lys Glu Gly Lys Glu Leu Tyr Lys Asn Ile Ala Glu Lys 130 135 140 Leu Pro Lys Ile Glu Lys Asp Ile Val Glu Asp Ile Phe Leu Trp Ile 145 150 155 160 Glu Asp Asn Val Asn Glu Asn Leu Leu Glu Asn Asp Asn Lys Lys Asp 165 170 175 Tyr Leu Lys Ile Phe Phe Val Glu Glu Asp Leu Asp Lys Ser Leu Glu 180 185 190 Leu Phe Lys Asn Glu His Lys Arg Tyr Ile Ile Pro Asn Ile Phe Asn 195 200 205 Ser Asn Asp Tyr Asn Lys Lys Ile Gly Glu Thr Ile Tyr Gly Leu Ser 210 215 220 Asn Asn Asn Met Gly Leu Asn Ala Lys Lys Ala Phe Leu Glu Asn Lys 225 230 235 240 Thr Arg Arg Val Ser Thr Pro Tyr Leu Val Asn Thr Asp Glu Ile Leu 245 250 255 Leu Gln Tyr Ala Phe Tyr Asn Tyr Leu Leu Pro Glu Val Lys Gln Gly 260 265 270 Asn Tyr Phe Ile Tyr Phe Ser Glu Asn Glu Ile Ile Pro Arg Thr Tyr 275 280 285 Lys Glu Gly Cys Pro Asn Gly Ala Lys Tyr Leu Leu Asn Ala Ser Tyr 290 295 300 Ser Lys Asp Val Asp Ile Lys Asn Phe Asn Val Ile Ser Lys Asn Ser 305 310 315 320 Ser Glu Glu Ile Asn Ile Asn Phe Lys Glu Ile Leu His Gln Lys Lys 325 330 335 Lys Asp Thr Asp Glu Ile Glu Tyr Gly Asn Leu Asn Arg Glu Lys Met 340 345 350 Met Asn Asn Ile Asn Lys Ile Leu Phe Tyr Asn Ser Leu Leu Gly Asn 355 360 365 Phe Leu Leu Ser Asp Gly Asp Leu Asp Ile Lys Asp Ile Glu Ile Lys 370 375 380 Lys Leu Leu Met Lys Tyr Arg Asn Ala Phe Tyr Lys Trp Phe Tyr Leu 385 390 395 400 Asn Asp Glu Ala Glu Val Lys Lys Asn Ile Arg Lys Ile Tyr Leu Asp 405 410 415 Ala Val Met Val Ala Ile Gly Asn Gly Tyr Phe Phe Lys Ala Ser Gln 420 425 430 Gln Leu Asp Phe Gly Phe Cys Leu Glu Lys Tyr Phe Tyr Gly Lys Ser 435 440 445 Glu Leu Met Glu Glu Ile Met Asn Val Lys Glu Val Phe Leu Asn His 450 455 460 Thr Leu Ser Glu Glu Asp Trp Glu Phe Leu Asn Asp Glu Glu Tyr Phe 465 470 475 480 Phe Ala Val Gly Gln Ile Leu Ala Tyr Ile Asn Tyr Met Arg Asn Ser 485 490 495 Lys Ala Lys Ser Leu Asn Phe Ile Lys Gln Leu Thr Phe Val Lys Asn 500 505 510 Ile Asp Val Leu Lys Glu Lys Ile Lys Lys Ile Val Ile Ser Tyr Ser 515 520 525 His Ile Phe Glu Thr Lys Asn Lys Lys Ile Asn Arg Thr Val Ser Asn 530 535 540 Ile Ser Leu Tyr Gln Pro Lys Glu Ile Arg Ile Asp Ile Leu Leu Ala 545 550 555 560 Gly Phe Thr Ala Asp Ile Ile Phe Phe Lys Lys Arg Glu Glu Lys 565 570 575 <210> 224 <211> 313 <212> PRT <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(313) <223> Cas7 <400> 224 Met Glu Lys Arg Val Tyr Gly Ile Leu Gly Ile Ser Ser Ile Met Ser 1 5 10 15 Asn Trp Asn Ala Asp Phe Ser Gly Glu Pro Lys Ser Ile Ser Asn Gly 20 25 30 Arg Ile Phe Gly Ser Asp Lys Ala Phe Lys Tyr Pro Met Lys Lys Met 35 40 45 Trp Glu Asn Gln Gly Glu Lys Val Leu Tyr Ile Lys Ser Leu Lys Val 50 55 60 Asp Lys Gly Ala Leu Ile Pro Lys Thr Leu Lys Glu Arg Tyr Glu Gln 65 70 75 80 Leu Phe Pro Glu Lys Lys Leu Asp Lys Asn Thr Glu Thr Ile Glu Val 85 90 95 Ile Lys Asn Leu Phe Lys Ala Ile Asp Val Lys Asn Phe Gly Ala Thr 100 105 110 Phe Ala Glu Glu Gly Asn Asn Ile Ser Ile Thr Gly Ala Val Gln Ile 115 120 125 Gly Gln Gly Phe Asn Phe Tyr Asp Glu Ser Asn Thr Glu Val Gln Asp 130 135 140 Ile Leu Ser Pro Phe Arg Asp Pro Lys Gly Lys Ile Asn Lys Glu Thr 145 150 155 160 Lys Glu Asn Glu Asp Ala Lys Asn Ser Thr Leu Gly Thr Lys Ile Val 165 170 175 Ser Asp Glu Ala His Tyr Phe Tyr Pro Phe Asn Ile Asn Pro Leu Ala 180 185 190 Tyr Lys Glu Phe Ile Glu Leu Glu Ile Thr Asp Gly Tyr Thr Glu Glu 195 200 205 Asp Tyr Leu Lys Phe Lys Glu Ala Ala Leu Ser Ser Ala Thr Phe Phe 210 215 220 Ala Thr Asn Ser Lys Val Gly Cys Asp Asn Glu Phe Gly Leu Phe Ile 225 230 235 240 Glu Thr Glu Glu Asp Phe Tyr Leu Pro Ile Leu Thr Gln Tyr Ile Lys 245 250 255 Phe Glu Lys Gly Glu Glu Lys Asn Lys Ile Thr Leu Asn Leu Ser Thr 260 265 270 Ile Leu Lys Gly Val Glu Asn His Ile Lys Asn Ile Glu Ile Tyr Tyr 275 280 285 Asn Pro Val Thr Thr Glu Ile Val Thr Asp Ile Ser Asn Tyr Lys Leu 290 295 300 Ile Asn Ile Leu Thr Lys Lys Glu Val 305 310 <210> 225 <211> 256 <212> PRT <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(256) <223> Cas5 <400> 225 Met Glu Ala Leu Lys Phe Thr Leu Ser Gly Asn Ser Ala Phe Phe Lys 1 5 10 15 Asp Asn Val Ile Asn Thr Val Tyr Leu Thr Tyr Gly Asn Ile His Arg 20 25 30 Val Ala Leu Leu Gly Met Phe Gly Ala Ile Leu Gly Tyr Gly Gly Tyr 35 40 45 Ser Lys Gln Asn Asp Met Leu Lys Lys Lys Asn Lys Lys Met Pro Asp 50 55 60 Tyr Pro Glu Phe Tyr Glu Lys Leu Lys Asp Ile Lys Ile Ser Ile Val 65 70 75 80 Ser Asn Gly Lys Asn Gly Tyr Phe Asn Lys Lys Leu Gln Thr Phe Asn 85 90 95 Asn Ser Val Gly Tyr Ala Ser Lys Glu Glu Gly Gly Asn Leu Ile Val 100 105 110 Lys Gln Phe Trp Leu Glu Asn Pro Ser Trp Asp Ile Tyr Ile Leu Leu 115 120 125 Asp Cys Asp Glu Ala Lys Lys Ile Ala Asp Tyr Ile Gln Asn Arg Lys 130 135 140 Ala Ile Tyr Leu Pro Tyr Leu Gly Ser Asn Asp His Leu Ala Asn Ile 145 150 155 160 Met Asp Val Glu Ile Ile Asp Ile Glu Glu Lys Met Ser Ser Glu Asp 165 170 175 Glu Thr Ile Glu Ile Leu Ser Met Val Lys Asp Ser Asp Ile Ser Glu 180 185 190 Lys Lys Lys Asn Val Phe Ser Ile Asp Lys Asn Ser Ile Arg Asp Asp 195 200 205 Ile Tyr Lys Tyr Ser Glu Tyr Leu Pro Val Thr Leu Ser Lys Glu Leu 210 215 220 Asn Gln Tyr Glu Lys Glu Lys Met Thr Ile Thr Asn Met Ser Val Ile 225 230 235 240 Leu Lys Lys Ser Tyr Tyr Lys Val Glu Asp Lys Asn Ile Val Phe Tyr 245 250 255 <210> 226 <211> 96 <212> DNA <213> Fusobacterium nucleatum subsp. animalis 3_1_33 <220> <221> misc_feature <222> (1)..(96) <223> CRISPR <400> 226 atgaactgta aacttgaaaa gttttgaaat gttgacaaat attcagataa tttttcaaaa 60 tcttttatga actgtaaact tgaaaagttt tgaaat 96 <210> 227 <211> 723 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(723) <223> Cas6 <400> 227 atggatgtga aaatatatca gctgaaagta tttttaaagt taaatcaaaa tgtagatttt 60 ataaatagcc ctgagttttt aagcacaaat ttacataaag ctatgttggg ggatgaagct 120 ctacgatcta ttcatatgca aagatattta aagccttata gcatcggttt tttatacagt 180 atgaaaggca aaaaagatac ttttgtgagt ggtgaagata tgtattttta cgtaagaagt 240 attgatgaga gttttatatc taagttaaga atttgtttag aaaattctaa aaatcttggg 300 tttaatgtat atttatctaa atttgaaaat ttggatataa agcaagtcga tcgtttatat 360 actatgagtc cggcaactat cgtgcttaaa gaaggcgata aaactatacc ttggagacgt 420 gaaaatagcg atataacagt gcttaaagaa gctttgattt caaatttaaa aaacaaatac 480 gaatattttt tagacaaaaa aattgagata aaagatgata tcatcgaact tatagagata 540 aaaacaaata gagcgtttgc atttagatat aaaaacggta aaatttatgc ttatagatat 600 caaattcact tttcccaaaa cagattggct caagagtttg caaatatcgc catgatactt 660 ggtgttggag ttaaaaatac attgggattt ggcttttgta tgaggagtaa taatgctgtt 720 tga 723 <210> 228 <211> 1692 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(1692) <223> Cas8 <400> 228 atgctgtttg aattgcttga tgagtttaaa aaacagcttg aaaaaaataa gcacatagtc 60 acacaaaatc acattttaaa agacggagtt tatgcgagaa tttccgatga aaaatgtgag 120 attttttacg taaaaactat cacagaaaaa ataggtaaaa ctgcgcagaa aagaacgatt 180 ttatacaaac aaaacggaga tatcgcgtta aatgatgata tgcagtggtt tgagcaagct 240 gattatttaa gtttcttatg ggatatgaat aaagctgttt tgcctaataa aaaatttcac 300 agcattaact ttttgtctct attttttaag cttgaagagt ctgagtatgt taaggaaaat 360 ttggaagagt attttgatat ttttagagat tatagtgcat ttaataaagc aaaagataag 420 gaaattttat cattttatat ggattatata aaagatgaaa atagacaaaa cttgatcaca 480 aattcagtag ttttatctaa aaaatatttt aatgatataa atgattttgc tgtacaaaat 540 aactttaaaa agtgttatat taagtttttt attgacaaag attttgagat ttatgaaaaa 600 gagtcgcaaa tttatattga tttgaaaatt tacaattcaa atgaacacaa tataaaatat 660 aataatgaaa ttttcggtct ttcaaatttc aatatgggta tgaattcaaa aaaacctttt 720 ttagagcata aaaatagatt atttaaaata ccttacgcca taagtcaaaa agacgctctt 780 gctagtaaaa tgctttttga ttggcttggt tcgcaaaata aaagaattat tcgtgatttt 840 aactcaatct ttatatctaa attcaataaa caatcaaaag ccgtggtaag tgacttcgag 900 tatgttcctg tagataaaaa taagtttaaa tttgataaat ttaaacttaa aaattttatg 960 aatattgaaa atggtgaaaa agagatactt agttttgatg attttaagca agttattgat 1020 gagcagcttt atcataaatg tctttttggt aatttgtata atgatgagat aagagttagt 1080 aaaagaatca gcgaagatat gcaaaattta ctttatcaaa ctagatgttc tatggtggag 1140 tattttgata aatttaataa caatgaattt tactatgtta tacaaaaata ttctaatgat 1200 tttattaaaa ttgctatgca agatagtgaa tttggtagat taaacggtaa aaaatctata 1260 aatttgctac ttagtataaa agaaattaaa ggagaaaaag tggatataga cgggataaaa 1320 aatagagtta tatcagcact tactgatgat aatgtaacta aattaagcgg aaatgaatac 1380 tactttttag taggtaattt agcaatgtat ctagttagta aaagcaagac ttggaaaaag 1440 acgtttgcac taactgaccc atacactaaa gctagaaata caaaaaagct aaaaatggct 1500 ctgtttattg attttgatag atacaactat gatatttttt tagaaaatgg aatattaaaa 1560 aaagcatttt cattggctca aaattgtgaa gatatagtta tgtcaaataa cgaccaacag 1620 atggttttaa tcggtatgat gacaaaaaat ataattaaga aaccaggaga aaaagatgaa 1680 attagcgaat ag 1692 <210> 229 <211> 942 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(942) <223> Cas7 <400> 229 atgaaattag cgaatagaat ttatggaata atcggtataa aatcaactat ggccaactgg 60 aatgcagatt ttagcggcag accaaaaagc acaggaaacg gagatatctt tgctagtgat 120 aaagctttaa aatatcctat gaaaaagatg tgggaaagct atggaaaaaa tattcttttt 180 gtaaaatctc taaaacaagg caagagtaag gatggcaatg acaagctcgt gccaaatact 240 ctaggagaaa gatatggttt gctttttggc gatatcaaaa aagcaaaatc cacaaaagag 300 gttttgagta acctttttaa ctgcattgat gttaaaaatt tcggtgctac attccctgaa 360 gatggttata acttatcaat aactggtgca gttcagatag gacaaggatt taataaattt 420 ggagatataa atatagaagt tcaaaatatc ttatctccat ttgccgattc aagagctaaa 480 gagaaaaacg aaaatggaga agatgcgagc caaagcactc tgggtacaaa aatagttaca 540 gatgaggctc attattttta cggattttgc ataaatccgt tagcttataa tgattataaa 600 gagattttgg gtgatgattt tggttacaat gaagatgatt acgctgagtt caaaaaggct 660 gctagatttt gcgctacgta ttttaattcc aactcaaaat tcggctgcga aaatgagttt 720 gctatgttca ttgaaacagc cgtagatgca tatctgcctg atcttagttc atatatggat 780 tttatttgca aagataaaaa tagattggta aatttagaaa aaatagaaaa aatgatagaa 840 agttcagatg taaaaaaagt agaaatttat tacaatcctt tatctttgga cgtagaaact 900 aaatttgata aattcgatat ttacagtgga aataaaatat ga 942 <210> 230 <211> 762 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(762) <223> Cas5 <400> 230 atgaaagcca taagttttaa gcttagcgga aagtttgcac atttcaaaaa accagatgta 60 aatgaatatg tgtattttac ttataataat atcccaaaac caactctatt agggcttttg 120 ggggccatta tagggcttaa aggatacgcg caaaaaactt ataataataa aaaagataaa 180 aaatcacttt taaacaatga aaacagaagt aacgagccgg aattttatga gcgtttaaaa 240 catcttaaaa tttgtattat tcctcttgtt aaatatggta aattttctaa aaaaattcaa 300 gttttcaata attcagtagg atacgcaagc accgaagaag gtggaaattt aatagttaga 360 gagcaatggc ttgaaaatcc ttcttggcag atacttatag aagatgacgg aagtgcggag 420 tttgagacta tttcacaata tctatttgat aaaaaagcta agtttatacc atatcttggt 480 aaaaatgacc attttgcaga tataagcgaa gtggagaaaa tagatcttgc agagtctaaa 540 aaagataaaa ttgtgataaa atcgctgttt ttggataatt tagcaaagca ggttgatgac 600 cctgatgatg agatatcata tctttttaat gaattttatc ctattggttt taatgaactt 660 atgttttata agcttgaaaa aactactttt acaaatcaaa tttgtcaagc aatggacggg 720 aaatggtatg agtttaaaga cggaactata tgcttctttt aa 762 <210> 231 <211> 723 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(723) <223> Cas6 <400> 231 atggatgtga agatctacca gctgaaggtg ttcctgaagc tgaatcagaa cgtggacttc 60 atcaacagcc cagagtttct gtccaccaat ctgcacaagg ccatgctggg cgatgaggcc 120 ctgaggtcca tccacatgca gcggtacctg aagccctact ctatcggctt tctgtacagc 180 atgaagggca agaaggacac atttgtgagc ggcgaggata tgtacttcta tgtgcggtcc 240 atcgacgagt ctttcatcag caagctgaga atctgcctgg agaattctaa gaacctgggc 300 tttaacgtgt atctgagcaa gttcgagaat ctggacatca agcaggtgga taggctgtac 360 accatgagcc ctgccacaat cgtgctgaag gagggcgata agaccatccc atggcggaga 420 gagaactccg acatcacagt gctgaaggag gccctgatct ctaatctgaa gaacaagtac 480 gagtatttcc tggacaagaa gatcgagatc aaggacgata tcatcgagct gatcgagatc 540 aagaccaatc gggccttcgc ctttagatat aagaacggca agatctacgc ctataggtac 600 cagatccact ttagccagaa ccgcctggcc caggagttcg ccaatatcgc catgatcctg 660 ggcgtgggcg tgaagaatac cctgggcttc ggcttttgca tgaggtccaa caatgcagtg 720 taa 723 <210> 232 <211> 1692 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(1692) <223> Cas8 <400> 232 atgctgttcg agctgctgga tgagtttaag aagcagctgg agaagaacaa gcacatcgtg 60 acacagaatc acatcctgaa ggatggcgtg tatgcccgca tctccgacga gaagtgtgag 120 atcttctacg tgaagaccat cacagagaag atcggcaaga ccgcccagaa gcggacaatc 180 ctgtataagc agaacggcga catcgccctg aatgacgata tgcagtggtt tgagcaggcc 240 gactacctga gcttcctgtg ggatatgaac aaggccgtgc tgcccaataa gaagttccac 300 agcatcaact ttctgtccct gttctttaag ctggaggagt ccgagtacgt gaaggagaat 360 ctggaggagt attttgacat cttcagagat tactccgcct ttaacaaggc caaggataag 420 gagatcctgt ctttctatat ggactacatc aaggatgaga ataggcagaa cctgatcacc 480 aattctgtgg tgctgagcaa gaagtacttc aatgacatca acgattttgc cgtgcagaac 540 aatttcaaga agtgctacat caagttcttt atcgacaagg atttcgagat ctacgagaag 600 gagagccaga tctatatcga cctgaagatc tacaattcca acgagcacaa catcaagtat 660 aacaatgaga tcttcggcct gtctaacttc aacatgggca tgaatagcaa gaagccattt 720 ctggagcaca agaaccgcct gttcaagatc ccctacgcca tctcccagaa ggatgccctg 780 gcctctaaga tgctgtttga ctggctgggc agccagaaca agcggatcat cagagacttt 840 aattccatct tcatctctaa gtttaacaag cagtctaagg ccgtggtgag cgacttcgag 900 tacgtgcccg tggataagaa caagtttaag ttcgacaagt tcaagctgaa gaacttcatg 960 aacatcgaga atggcgagaa ggagatcctg agctttgacg atttcaagca ggtcatcgat 1020 gagcagctgt atcacaagtg cctgtttggc aacctgtaca atgatgagat cagggtgagc 1080 aagcgcatct ccgaggacat gcagaatctg ctgtatcaga cccggtgttc catggtggag 1140 tactttgaca agttcaacaa taacgagttc tactatgtga tccagaagta ctctaacgac 1200 ttcatcaaga tcgccatgca ggacagcgag ttcggccgcc tgaacggcaa gaagagcatc 1260 aatctgctgc tgtccatcaa ggagatcaag ggcgagaagg tggacatcga tggcatcaag 1320 aatagagtga tctccgccct gaccgacgat aacgtgacaa agctgtctgg caatgagtac 1380 tattttctgg tgggcaacct ggccatgtac ctggtgagca agtccaagac ctggaagaag 1440 acattcgccc tgaccgatcc atatacaaag gcccggaaca ccaagaagct gaagatggcc 1500 ctgtttatcg acttcgatag atataactac gacatctttc tggagaatgg catcctgaag 1560 aaggccttca gcctggccca gaattgtgag gatatcgtga tgtccaataa cgaccagcag 1620 atggtgctga tcggcatgat gacaaagaac atcatcaaga agcccggcga gaaggacgag 1680 atcagcgagt aa 1692 <210> 233 <211> 942 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(942) <223> Cas7 <400> 233 atgaagctgg ccaaccgcat ctacggcatc atcggcatca agagcaccat ggccaattgg 60 aacgccgact tttctggccg ccccaagagc acaggcaatg gcgacatctt cgccagcgat 120 aaggccctga agtatcctat gaagaagatg tgggagtcct acggcaagaa catcctgttc 180 gtgaagtccc tgaagcaggg caagtctaag gacggcaacg ataagctggt gccaaatacc 240 ctgggcgagc ggtatggcct gctgtttggc gatatcaaga aggccaagag cacaaaggag 300 gtgctgtcca atctgttcaa ctgcatcgat gtgaagaatt ttggcgccac cttcccagag 360 gacggctaca acctgagcat cacaggcgcc gtgcagatcg gccagggctt taacaagttc 420 ggcgacatca acatcgaggt gcagaatatc ctgtccccct tcgccgatag ccgggccaag 480 gagaagaatg agaacggaga ggacgcctcc cagtctaccc tgggcacaaa gatcgtgacc 540 gatgaggccc actactttta tggcttctgt atcaaccccc tggcctataa tgactacaag 600 gagatcctgg gcgacgattt tggctataat gaggacgatt acgccgagtt caagaaggcc 660 gccagattct gcgccaccta ctttaatagc aactccaagt ttggctgtga gaacgagttt 720 gccatgttca tcgagacagc cgtggacgcc tatctgcctg atctgagctc ctacatggac 780 ttcatctgca aggataagaa caggctggtg aatctggaga agatcgagaa gatgatcgag 840 tctagcgatg tgaagaaggt ggagatctac tataatcctc tgtccctgga cgtggagacc 900 aagtttgaca agttcgatat ctattctggc aacaagatct aa 942 <210> 234 <211> 762 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(762) <223> Cas5 <400> 234 atgaaggcca tcagctttaa gctgtccggc aagtttgccc acttcaagaa gccagacgtg 60 aacgagtacg tgtacttcac ctacaacaat atccccaagc ctacactgct gggactgctg 120 ggagcaatca tcggcctgaa gggctatgcc cagaagacct acaacaataa gaaggacaag 180 aagagcctgc tgaacaatga gaatcggtcc aacgagcctg agttctatga gagactgaag 240 cacctgaaga tctgcatcat cccactggtg aagtacggca agttttctaa gaagatccag 300 gtgttcaaca attctgtggg atatgccagc accgaggagg gaggaaatct gatcgtgagg 360 gagcagtggc tggagaaccc cagctggcag atcctgatcg aggacgatgg ctctgccgag 420 tttgagacaa tcagccagta tctgttcgat aagaaggcca agtttatccc ttacctgggc 480 aagaatgacc acttcgccga tatctccgag gtggagaaga tcgacctggc cgagtccaag 540 aaggataaga tcgtgatcaa gtctctgttc ctggacaacc tggccaagca ggtggacgat 600 cccgacgatg agatctctta tctgtttaac gagttctacc ctatcggctt caatgagctg 660 atgttttaca agctggagaa gaccaccttc accaatcaga tctgtcaggc catggatggc 720 aagtggtatg agttcaagga cggcaccatc tgcttctttt aa 762 <210> 235 <211> 240 <212> PRT <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(240) <223> Cas6 <400> 235 Met Asp Val Lys Ile Tyr Gln Leu Lys Val Phe Leu Lys Leu Asn Gln 1 5 10 15 Asn Val Asp Phe Ile Asn Ser Pro Glu Phe Leu Ser Thr Asn Leu His 20 25 30 Lys Ala Met Leu Gly Asp Glu Ala Leu Arg Ser Ile His Met Gln Arg 35 40 45 Tyr Leu Lys Pro Tyr Ser Ile Gly Phe Leu Tyr Ser Met Lys Gly Lys 50 55 60 Lys Asp Thr Phe Val Ser Gly Glu Asp Met Tyr Phe Tyr Val Arg Ser 65 70 75 80 Ile Asp Glu Ser Phe Ile Ser Lys Leu Arg Ile Cys Leu Glu Asn Ser 85 90 95 Lys Asn Leu Gly Phe Asn Val Tyr Leu Ser Lys Phe Glu Asn Leu Asp 100 105 110 Ile Lys Gln Val Asp Arg Leu Tyr Thr Met Ser Pro Ala Thr Ile Val 115 120 125 Leu Lys Glu Gly Asp Lys Thr Ile Pro Trp Arg Arg Glu Asn Ser Asp 130 135 140 Ile Thr Val Leu Lys Glu Ala Leu Ile Ser Asn Leu Lys Asn Lys Tyr 145 150 155 160 Glu Tyr Phe Leu Asp Lys Lys Ile Glu Ile Lys Asp Asp Ile Ile Glu 165 170 175 Leu Ile Glu Ile Lys Thr Asn Arg Ala Phe Ala Phe Arg Tyr Lys Asn 180 185 190 Gly Lys Ile Tyr Ala Tyr Arg Tyr Gln Ile His Phe Ser Gln Asn Arg 195 200 205 Leu Ala Gln Glu Phe Ala Asn Ile Ala Met Ile Leu Gly Val Gly Val 210 215 220 Lys Asn Thr Leu Gly Phe Gly Phe Cys Met Arg Ser Asn Asn Ala Val 225 230 235 240 <210> 236 <211> 563 <212> PRT <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(563) <223> Cas8 <400> 236 Met Leu Phe Glu Leu Leu Asp Glu Phe Lys Lys Gln Leu Glu Lys Asn 1 5 10 15 Lys His Ile Val Thr Gln Asn His Ile Leu Lys Asp Gly Val Tyr Ala 20 25 30 Arg Ile Ser Asp Glu Lys Cys Glu Ile Phe Tyr Val Lys Thr Ile Thr 35 40 45 Glu Lys Ile Gly Lys Thr Ala Gln Lys Arg Thr Ile Leu Tyr Lys Gln 50 55 60 Asn Gly Asp Ile Ala Leu Asn Asp Asp Met Gln Trp Phe Glu Gln Ala 65 70 75 80 Asp Tyr Leu Ser Phe Leu Trp Asp Met Asn Lys Ala Val Leu Pro Asn 85 90 95 Lys Lys Phe His Ser Ile Asn Phe Leu Ser Leu Phe Phe Lys Leu Glu 100 105 110 Glu Ser Glu Tyr Val Lys Glu Asn Leu Glu Glu Tyr Phe Asp Ile Phe 115 120 125 Arg Asp Tyr Ser Ala Phe Asn Lys Ala Lys Asp Lys Glu Ile Leu Ser 130 135 140 Phe Tyr Met Asp Tyr Ile Lys Asp Glu Asn Arg Gln Asn Leu Ile Thr 145 150 155 160 Asn Ser Val Val Leu Ser Lys Lys Tyr Phe Asn Asp Ile Asn Asp Phe 165 170 175 Ala Val Gln Asn Asn Phe Lys Lys Cys Tyr Ile Lys Phe Phe Ile Asp 180 185 190 Lys Asp Phe Glu Ile Tyr Glu Lys Glu Ser Gln Ile Tyr Ile Asp Leu 195 200 205 Lys Ile Tyr Asn Ser Asn Glu His Asn Ile Lys Tyr Asn Asn Glu Ile 210 215 220 Phe Gly Leu Ser Asn Phe Asn Met Gly Met Asn Ser Lys Lys Pro Phe 225 230 235 240 Leu Glu His Lys Asn Arg Leu Phe Lys Ile Pro Tyr Ala Ile Ser Gln 245 250 255 Lys Asp Ala Leu Ala Ser Lys Met Leu Phe Asp Trp Leu Gly Ser Gln 260 265 270 Asn Lys Arg Ile Ile Arg Asp Phe Asn Ser Ile Phe Ile Ser Lys Phe 275 280 285 Asn Lys Gln Ser Lys Ala Val Val Ser Asp Phe Glu Tyr Val Pro Val 290 295 300 Asp Lys Asn Lys Phe Lys Phe Asp Lys Phe Lys Leu Lys Asn Phe Met 305 310 315 320 Asn Ile Glu Asn Gly Glu Lys Glu Ile Leu Ser Phe Asp Asp Phe Lys 325 330 335 Gln Val Ile Asp Glu Gln Leu Tyr His Lys Cys Leu Phe Gly Asn Leu 340 345 350 Tyr Asn Asp Glu Ile Arg Val Ser Lys Arg Ile Ser Glu Asp Met Gln 355 360 365 Asn Leu Leu Tyr Gln Thr Arg Cys Ser Met Val Glu Tyr Phe Asp Lys 370 375 380 Phe Asn Asn Asn Glu Phe Tyr Tyr Val Ile Gln Lys Tyr Ser Asn Asp 385 390 395 400 Phe Ile Lys Ile Ala Met Gln Asp Ser Glu Phe Gly Arg Leu Asn Gly 405 410 415 Lys Lys Ser Ile Asn Leu Leu Leu Ser Ile Lys Glu Ile Lys Gly Glu 420 425 430 Lys Val Asp Ile Asp Gly Ile Lys Asn Arg Val Ile Ser Ala Leu Thr 435 440 445 Asp Asp Asn Val Thr Lys Leu Ser Gly Asn Glu Tyr Tyr Phe Leu Val 450 455 460 Gly Asn Leu Ala Met Tyr Leu Val Ser Lys Ser Lys Thr Trp Lys Lys 465 470 475 480 Thr Phe Ala Leu Thr Asp Pro Tyr Thr Lys Ala Arg Asn Thr Lys Lys 485 490 495 Leu Lys Met Ala Leu Phe Ile Asp Phe Asp Arg Tyr Asn Tyr Asp Ile 500 505 510 Phe Leu Glu Asn Gly Ile Leu Lys Lys Ala Phe Ser Leu Ala Gln Asn 515 520 525 Cys Glu Asp Ile Val Met Ser Asn Asn Asp Gln Gln Met Val Leu Ile 530 535 540 Gly Met Met Thr Lys Asn Ile Ile Lys Lys Pro Gly Glu Lys Asp Glu 545 550 555 560 Ile Ser Glu <210> 237 <211> 313 <212> PRT <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(313) <223> Cas7 <400> 237 Met Lys Leu Ala Asn Arg Ile Tyr Gly Ile Ile Gly Ile Lys Ser Thr 1 5 10 15 Met Ala Asn Trp Asn Ala Asp Phe Ser Gly Arg Pro Lys Ser Thr Gly 20 25 30 Asn Gly Asp Ile Phe Ala Ser Asp Lys Ala Leu Lys Tyr Pro Met Lys 35 40 45 Lys Met Trp Glu Ser Tyr Gly Lys Asn Ile Leu Phe Val Lys Ser Leu 50 55 60 Lys Gln Gly Lys Ser Lys Asp Gly Asn Asp Lys Leu Val Pro Asn Thr 65 70 75 80 Leu Gly Glu Arg Tyr Gly Leu Leu Phe Gly Asp Ile Lys Lys Ala Lys 85 90 95 Ser Thr Lys Glu Val Leu Ser Asn Leu Phe Asn Cys Ile Asp Val Lys 100 105 110 Asn Phe Gly Ala Thr Phe Pro Glu Asp Gly Tyr Asn Leu Ser Ile Thr 115 120 125 Gly Ala Val Gln Ile Gly Gln Gly Phe Asn Lys Phe Gly Asp Ile Asn 130 135 140 Ile Glu Val Gln Asn Ile Leu Ser Pro Phe Ala Asp Ser Arg Ala Lys 145 150 155 160 Glu Lys Asn Glu Asn Gly Glu Asp Ala Ser Gln Ser Thr Leu Gly Thr 165 170 175 Lys Ile Val Thr Asp Glu Ala His Tyr Phe Tyr Gly Phe Cys Ile Asn 180 185 190 Pro Leu Ala Tyr Asn Asp Tyr Lys Glu Ile Leu Gly Asp Asp Phe Gly 195 200 205 Tyr Asn Glu Asp Asp Tyr Ala Glu Phe Lys Lys Ala Ala Arg Phe Cys 210 215 220 Ala Thr Tyr Phe Asn Ser Asn Ser Lys Phe Gly Cys Glu Asn Glu Phe 225 230 235 240 Ala Met Phe Ile Glu Thr Ala Val Asp Ala Tyr Leu Pro Asp Leu Ser 245 250 255 Ser Tyr Met Asp Phe Ile Cys Lys Asp Lys Asn Arg Leu Val Asn Leu 260 265 270 Glu Lys Ile Glu Lys Met Ile Glu Ser Ser Asp Val Lys Lys Val Glu 275 280 285 Ile Tyr Tyr Asn Pro Leu Ser Leu Asp Val Glu Thr Lys Phe Asp Lys 290 295 300 Phe Asp Ile Tyr Ser Gly Asn Lys Ile 305 310 <210> 238 <211> 253 <212> PRT <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(253) <223> Cas5 <400> 238 Met Lys Ala Ile Ser Phe Lys Leu Ser Gly Lys Phe Ala His Phe Lys 1 5 10 15 Lys Pro Asp Val Asn Glu Tyr Val Tyr Phe Thr Tyr Asn Asn Ile Pro 20 25 30 Lys Pro Thr Leu Leu Gly Leu Leu Gly Ala Ile Ile Gly Leu Lys Gly 35 40 45 Tyr Ala Gln Lys Thr Tyr Asn Asn Lys Lys Asp Lys Lys Ser Leu Leu 50 55 60 Asn Asn Glu Asn Arg Ser Asn Glu Pro Glu Phe Tyr Glu Arg Leu Lys 65 70 75 80 His Leu Lys Ile Cys Ile Ile Pro Leu Val Lys Tyr Gly Lys Phe Ser 85 90 95 Lys Lys Ile Gln Val Phe Asn Asn Ser Val Gly Tyr Ala Ser Thr Glu 100 105 110 Glu Gly Gly Asn Leu Ile Val Arg Glu Gln Trp Leu Glu Asn Pro Ser 115 120 125 Trp Gln Ile Leu Ile Glu Asp Asp Gly Ser Ala Glu Phe Glu Thr Ile 130 135 140 Ser Gln Tyr Leu Phe Asp Lys Lys Ala Lys Phe Ile Pro Tyr Leu Gly 145 150 155 160 Lys Asn Asp His Phe Ala Asp Ile Ser Glu Val Glu Lys Ile Asp Leu 165 170 175 Ala Glu Ser Lys Lys Asp Lys Ile Val Ile Lys Ser Leu Phe Leu Asp 180 185 190 Asn Leu Ala Lys Gln Val Asp Asp Pro Asp Asp Glu Ile Ser Tyr Leu 195 200 205 Phe Asn Glu Phe Tyr Pro Ile Gly Phe Asn Glu Leu Met Phe Tyr Lys 210 215 220 Leu Glu Lys Thr Thr Phe Thr Asn Gln Ile Cys Gln Ala Met Asp Gly 225 230 235 240 Lys Trp Tyr Glu Phe Lys Asp Gly Thr Ile Cys Phe Phe 245 250 <210> 239 <211> 95 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <220> <221> misc_feature <222> (1)..(95) <223> CRISPR <400> 239 gtttgctaat gacaatattt gtgttaaaac aagcgtagca ccaaaagaag cgtatgaaag 60 cataggtttg ctaatgacaa tatttgtgtt aaaac 95 <210> 240 <211> 771 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(771) <223> Cas6 <400> 240 atgcgtttga aattggtact taaaattgtg gaaggaaccg ttttaccttg taattatatg 60 tatgaattgt caagttgttt gtacaaggta ttgaatgaag gtaatccggt ttttactgcc 120 tggctacatg ataaaggata ttgtaaggaa aagaaagcat ttaaattatt taccttttcg 180 aatttctatt ttccgtgttt cagaatcgag ggggatcgga tttttgtttt ggcggatacg 240 gcccagttga ttgtgtcgtt ctatccgata gaagcaattg atgcttttgt aatgggtctg 300 tttaagaaca ggcaattgga ggttggtgac cggaaatcga gggtccgctt tgaagtcttt 360 aacttagagc ggcaggctga gccggaattc acttcccgga tgttttttaa aactctatcg 420 cctatgttta ttgaagagca attaccggaa acccggaaag cgatacatct ttcaccgggg 480 aatccgaagt ttgcagaatt gttgcatttg aatctgctgg ataaatacag ggtgttttat 540 ggacaggaac ccgatccgtc ctggcctctg acccgcttgc atttgttgtc tgagcccaag 600 cctaaaacaa ttgtgctgaa ggtaggtact ccggaggaaa ccagaatgaa aggatatact 660 ttccgctttg agctggaagg acagccggaa ttattgcgtc tgggttacga aggtggtttc 720 ggacgattga acagccaggg attcggttgt gtggaagtgt tgaaacagtg a 771 <210> 241 <211> 1845 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(1845) <223> Cas8 <400> 241 atgcttcagg aaattaataa ctttatgaat agtttgcctg ctgagttaaa gcaggcgggg 60 ctgaagccta aagaaggact gcatgttttg ctgaaaatcc aggaaaagga gggaactcat 120 tttatggacg aacagtctgt ctgccgggtt tgtctgaccc ggaaagcgac agaattcgat 180 tatccttttt tacagcattg tgctgagctg gctcaggtgg gatggtgtgt gaataccaat 240 aaatgtttcg atcttccggc taaggggctg cattcctgtt ctccttattg cattgccttg 300 aaacgggaat ctctggaagg aggaggaaaa tatgcgaaag ataagactaa aatctacgac 360 cgtatcgata cttattttgc taatgcttta tcctacgtcg aagaggatag cgagaaagaa 420 agaataaggg tttttcagca ttttatcaac tccaaagaga aactgaatgc tttatttgcc 480 tgttttcagt cagaggttga tgaagtcaag gataaggagt acattattct ttatttggag 540 gaggagatgg aaaaatatcg ccgggttcat gaaaaatatt tgtcggacaa attattcaat 600 accaatgaat acaatatttc ggtagaaaat caactctatg ggaccagcga tttcctgaat 660 ggatttccaa ctaaaaagcc ttttttatcc catcagtcgg ctgttttcga tattgccggg 720 cggattaccg gagagatggc tggaaatctc catgattttc aggaaatcat gcgccggaat 780 gttttacccc gtcctttgcc gttgtttgtt taccgggaag agttgcagac cgaaatgctt 840 gcggttttct cccggtattt ggcggatggc aagaggatcg gttatcagga gatcatacgg 900 gagctttata aaaatcatca ggacgatatc ggtgattatt atttattgta ttactatggc 960 gatacggttt gtgatttcga ttttgtttcc cgtttccgct atcgtttgca gagtggggat 1020 aaagaaggtt ggatggtaaa agatcatttt cagatcggtt ttacggagaa aataagccat 1080 gtatttgagt tggaggaaaa agtgttacgc gaaatattta ataactcgtt gattacacga 1140 acgaaagccg gagatacaca acgtaaatat ttcgatgaat tagaaccgaa atactgtaaa 1200 tcggaaaata actatttatt ggtattgaag tatcggcaag ctttttatga ttatatctat 1260 aaatccagat tacaggctgt tacccgtcct atgttcgatc atattttatt gaccggtatt 1320 ttggaggata tccgtttgga tgaattaaaa ggaaaccagc atacccaacg ctgggggatt 1380 ttgtctaaaa tgaacatttg gttcagtttg gctgaacgtt ttgatttaca atttaaaaat 1440 acagatacta tggcaagtaa attggaagaa cagagagtgt ttatggttgc cttatcgcaa 1500 ggtgaggcta tattggaaaa cgacgaacaa tatgcttttg cagccggaca ggtgatttac 1560 tatttattac ataagagtaa gacggcagac aaaagttata aacggctgga gccttttttg 1620 cagcaggtgc acgcctctga attgaataaa gcgattgccc ggcttttcga tacctataag 1680 catgagaatt tttcaggcaa tttccgtcat ccgtttgcat cggttatggc ctatcagacc 1740 caagcgaata tgcgggacta cctgcccatg atgctggccg ggattttttc ggataatctg 1800 ctttttagcg ttaataaatc agaagaaaca aatgaagaaa actaa 1845 <210> 242 <211> 939 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(939) <223> Cas7 <400> 242 atgagtaata catttaaaaa cagagtgttt ggttgtgtgg taatcaaatc tgtcaattcc 60 aattataatg cggacttttc acatcagccc cgtactttgc ccgatgggtc ggtatatgca 120 acagataaag cattgaaata taccgttcgg aattatatag ataaaaatta tccggaagac 180 aaggtatttt attttaaaag cctgaatgga gatatgcagc cccgggattt agaccagaat 240 tatgcccgtt tcttcggcga ttatccgaaa gcggataaga aagaggcggt caaggcgcgt 300 aaagtgattc tgggaaattt gttgagctgt ctggatgtac ggttatttgg cggaactttt 360 gccagtaaaa cggccaattt gtctattcat ggtgttgtac aaccgacgca tggggtgaac 420 cgatatgtgg aagggattat ctattcagag cagattgctt cgcctttccg gaactccaat 480 gataatagta cggattcgat gcaaacgact ttaggaaccc aatttaaatt acaggaaggc 540 cattacgtac atcatttttc agtcaatccc ggtaatttag acgaactgac tgaatttgtc 600 gataatggaa gattaacggg ggaggatatt gccaaattga aagaagcttt acgttgcgga 660 gtgacatatt atgattcctc ttccaaggca ggaacggaga atgaggcctt gttgtgggtg 720 gaattgaaag aagagtcgaa gctggtatta ccctctttcg tggatttgat agaggtaaat 780 gcagaacggg aaattgattt tgcgaaagtg agtaccttat tgtccaaaga aaaaatcaaa 840 aatgagatct caaaaattga attgttttac aataagggaa ttacaaaagt gattcatctg 900 ccggaaggaa cggtcgaact tgaattgaac gggttatga 939 <210> 243 <211> 780 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(780) <223> Cas5 <400> 243 atgaataatc aacgactgat ttcatttgat atacaggctg atttcggttt cttcaaaaag 60 cccgattaca atgatggggt gttgctgacc tataatatgt tacataagcc cgccctgtta 120 ggcatattgg gggctattat cggtttgcgg ggttatcgga aaaaaggaga atggccggaa 180 tattaccagc ggttggctgc cctcccggtg ggaatagaac ctttggaggg gagacatgag 240 aaagggaatt ttcagaaaac gatagtcaag tatacgaata cggtcggata tgctaatcag 300 gatggtaacc tgctggttga agagagtatg ctgattcgtc cggcctatcg ctgctatctt 360 ttgttgtcgg aagagcatcc ggatcaccgg aagttgtacg agtatatccg ggaaggatgg 420 gccgagtata ttccctattt gggtaaaaat gaatatccgg cctggttcgg agattcgttc 480 cgggaatatg cttttaaaac ttttgtaccg gaaactgatt tccgggtttc atccttgttt 540 atcaaagaag gagtattgaa aggacagcag gtaaaggcca gtttttcgtt ttcgctgaaa 600 ggcatagtga atcgaggtag ttttgtgtat ttcgaacgtt tgcctgttgg ttttcatccg 660 gttctgatgc aatatgaatt ggccgacttc gcttttacgg attggacctt acaggctgcc 720 acgcagatgg taaatttgta tcagctggaa gaggaaggaa agattgttca attgttttga 780 <210> 244 <211> 771 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(771) <223> Cas6 <400> 244 atgaggctga agctggtgct gaagatcgtg gagggcacag tgctgccctg caactatatg 60 tacgagctga gctcctgtct gtacaaggtg ctgaacgagg gcaatcccgt gttcaccgcc 120 tggctgcacg ataagggcta ttgcaaggag aagaaggcct ttaagctgtt cacattttcc 180 aatttctact ttccatgttt cagaatcgag ggcgacagga tctttgtgct ggccgatacc 240 gcccagctga tcgtgtcttt ctaccccatc gaggccatcg acgccttcgt gatgggcctg 300 tttaagaacc gccagctgga agtgggcgat cggaagtcca gggtgcgctt tgaggtgttc 360 aatctggaga ggcaggcaga gcctgagttc accagccgga tgttctttaa gacactgtcc 420 ccaatgttta tcgaggagca gctgcccgag acaagaaagg ccatccacct gtctcctggc 480 aacccaaagt tcgccgagct gctgcacctg aatctgctgg acaagtacag agtgttttat 540 ggccaggagc ccgatcctag ctggccactg accaggctgc acctgctgtc cgagccaaag 600 cccaagacaa tcgtgctgaa ggtcggcacc cccgaggaga caagaatgaa gggctatacc 660 ttcaggtttg agctggaggg ccagcctgag ctgctgagac tgggatacga gggaggattc 720 ggcaggctga acagccaggg ctttggctgc gtggaggtgc tgaagcagta a 771 <210> 245 <211> 1845 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(1845) <223> Cas8 <400> 245 atgctgcagg agatcaacaa tttcatgaat tctctgccag cagagctgaa gcaggcaggc 60 ctgaagccaa aggagggact gcacgtgctg ctgaagatcc aggagaagga gggcacccac 120 tttatggacg agcagtccgt gtgccgggtg tgcctgaccc ggaaggcaac agagtttgat 180 taccccttcc tgcagcactg cgcagagctg gcccaagtgg gatggtgcgt gaacacaaat 240 aagtgtttcg acctgcctgc caagggcctg cactcttgca gcccatattg tatcgccctg 300 aagagagaga gcctggaggg aggcggcaag tacgcaaagg acaagaccaa gatctatgac 360 aggatcgata catactttgc caacgccctg agctacgtgg aggaggattc cgagaaggag 420 cggatcagag tgtttcagca cttcatcaac tccaaggaga agctgaatgc cctgtttgcc 480 tgtttccagt ctgaggtgga cgaggtgaag gataaggagt acatcatcct gtatctggag 540 gaggagatgg agaagtatag gcgcgtgcac gagaagtacc tgtccgacaa gctgttcaac 600 accaatgagt ataacatcag cgtggagaat cagctgtacg gcacctccga ttttctgaac 660 ggcttcccaa caaagaagcc cttcctgagc caccagtccg ccgtgtttga catcgcagga 720 aggatcaccg gagagatggc aggcaacctg cacgattttc aggagatcat gcggagaaat 780 gtgctgcctc gcccactgcc cctgttcgtg tatcgggagg agctgcagac agagatgctg 840 gccgtgttta gcagatacct ggccgacggc aagaggatcg gctatcagga gatcatccgc 900 gagctgtaca agaaccacca ggacgatatc ggcgactact atctgctgta ctattacggc 960 gataccgtgt gcgactttga tttcgtgtct aggttccgct acaggctgca gagcggcgac 1020 aaggagggat ggatggtgaa ggatcacttt cagatcggct tcaccgagaa gatcagccac 1080 gtgttcgagc tggaggagaa ggtgctgcgg gagatcttta acaattccct gatcaccaga 1140 acaaaggccg gcgacacaca gaggaagtat ttcgatgagc tggagcccaa gtactgtaag 1200 tctgagaaca attatctgct ggtgctgaag tacagacagg ccttctatga ctacatctat 1260 aagagccgcc tgcaggcagt gacccggcct atgtttgatc acatcctgct gacaggcatc 1320 ctggaggaca tcagactgga tgagctgaag ggcaaccagc acacccagag gtggggcatc 1380 ctgtccaaga tgaatatctg gttctctctg gccgagcggt tcgacctgca gttcaagaac 1440 accgatacaa tggccagcaa gctggaggag cagcgggtgt tcatggtggc cctgtcccag 1500 ggagaggcaa tcctggagaa tgacgagcag tacgcctttg ccgccggcca ggtcatctac 1560 tacctgctgc acaagtctaa gaccgccgat aagagctata agaggctgga gcccttcctg 1620 cagcaggtgc acgcctccga gctgaacaag gccatcgccc gcctgtttga cacctacaag 1680 cacgagaact tttctggcaa tttccggcac ccatttgcca gcgtgatggc ctatcagaca 1740 caggccaata tgcgcgacta cctgcccatg atgctggccg gcatcttcag cgataacctg 1800 ctgttttccg tgaataagtc tgaggagacc aacgaggaga attaa 1845 <210> 246 <211> 939 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(939) <223> Cas7 <400> 246 atgtctaaca ccttcaagaa tcgggtgttt ggctgcgtgg tcatcaagag cgtgaactcc 60 aattataacg ccgacttctc ccaccagcca cgcacactgc ctgacggcag cgtgtacgcc 120 accgataagg ccctgaagta cacagtgcgg aactatatcg acaagaatta ccctgaggat 180 aaggtgttct actttaagtc tctgaacggc gacatgcagc cacgcgacct ggatcagaat 240 tatgcccggt tctttggcga ctaccccaag gccgataaga aggaggccgt gaaggccaga 300 aaagtgatcc tgggcaacct gctgagctgt ctggatgtga ggctgtttgg cggcaccttc 360 gcctctaaga cagccaacct gagcatccac ggagtggtgc agcctaccca cggagtgaat 420 agatatgtgg agggcatcat ctacagcgag cagatcgcct ccccattcag gaattctaac 480 gacaattcta ccgatagcat gcagaccaca ctgggcacac agttcaagct gcaggagggc 540 cactacgtgc accactttag cgtgaaccca ggcaatctgg acgagctgac cgagtttgtg 600 gataacggcc gcctgacagg cgaggacatc gcaaagctga aggaggccct gagatgcgga 660 gtgacctact atgatagctc ctctaaggcc ggcacagaga acgaggccct gctgtgggtg 720 gagctgaagg aggagtccaa gctggtgctg ccctctttcg tggacctgat cgaagtgaat 780 gccgagcggg agatcgattt tgccaaggtg tctaccctgc tgagcaagga gaagatcaag 840 aacgagatct ccaagatcga gctgttctac aataagggca tcaccaaagt gatccacctg 900 cctgagggca cagtggagct ggagctgaac ggactgtaa 939 <210> 247 <211> 780 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(780) <223> Cas5 <400> 247 atgaacaatc agcggctgat ctctttcgac atccaggccg attttggctt ctttaagaag 60 cctgactata acgatggcgt gctgctgacc tacaatatgc tgcacaagcc agccctgctg 120 ggcatcctgg gagccatcat cggcctgaga ggctacagga agaagggcga gtggcccgag 180 tactatcaga gactggccgc cctgcctgtg ggaatcgagc cactggaggg caggcacgag 240 aagggcaact tccagaagac aatcgtgaag tataccaata cagtgggcta cgccaaccag 300 gacggcaatc tgctggtgga ggagtctatg ctgatccgcc ctgcctaccg gtgctatctg 360 ctgctgagcg aggagcaccc agatcaccgc aagctgtatg agtacatccg ggagggctgg 420 gccgagtaca tcccttatct gggcaagaac gagtatccag cctggtttgg cgactccttc 480 cgcgagtacg cctttaagac cttcgtgcct gagacagatt tccgggtgtc tagcctgttt 540 atcaaggagg gcgtgctgaa gggccagcag gtgaaggcct ccttctcttt tagcctgaag 600 ggcatcgtga atagaggcag cttcgtgtac ttcgagaggc tgcccgtggg cttccaccct 660 gtgctgatgc agtacgagct ggccgacttc gcctttaccg attggacact gcaggccgcc 720 acccagatgg tgaacctgta ccagctggag gaggagggca agatcgtgca gctgttttaa 780 <210> 248 <211> 256 <212> PRT <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(256) <223> Cas6 <400> 248 Met Arg Leu Lys Leu Val Leu Lys Ile Val Glu Gly Thr Val Leu Pro 1 5 10 15 Cys Asn Tyr Met Tyr Glu Leu Ser Ser Cys Leu Tyr Lys Val Leu Asn 20 25 30 Glu Gly Asn Pro Val Phe Thr Ala Trp Leu His Asp Lys Gly Tyr Cys 35 40 45 Lys Glu Lys Lys Ala Phe Lys Leu Phe Thr Phe Ser Asn Phe Tyr Phe 50 55 60 Pro Cys Phe Arg Ile Glu Gly Asp Arg Ile Phe Val Leu Ala Asp Thr 65 70 75 80 Ala Gln Leu Ile Val Ser Phe Tyr Pro Ile Glu Ala Ile Asp Ala Phe 85 90 95 Val Met Gly Leu Phe Lys Asn Arg Gln Leu Glu Val Gly Asp Arg Lys 100 105 110 Ser Arg Val Arg Phe Glu Val Phe Asn Leu Glu Arg Gln Ala Glu Pro 115 120 125 Glu Phe Thr Ser Arg Met Phe Phe Lys Thr Leu Ser Pro Met Phe Ile 130 135 140 Glu Glu Gln Leu Pro Glu Thr Arg Lys Ala Ile His Leu Ser Pro Gly 145 150 155 160 Asn Pro Lys Phe Ala Glu Leu Leu His Leu Asn Leu Leu Asp Lys Tyr 165 170 175 Arg Val Phe Tyr Gly Gln Glu Pro Asp Pro Ser Trp Pro Leu Thr Arg 180 185 190 Leu His Leu Leu Ser Glu Pro Lys Pro Lys Thr Ile Val Leu Lys Val 195 200 205 Gly Thr Pro Glu Glu Thr Arg Met Lys Gly Tyr Thr Phe Arg Phe Glu 210 215 220 Leu Glu Gly Gln Pro Glu Leu Leu Arg Leu Gly Tyr Glu Gly Gly Phe 225 230 235 240 Gly Arg Leu Asn Ser Gln Gly Phe Gly Cys Val Glu Val Leu Lys Gln 245 250 255 <210> 249 <211> 614 <212> PRT <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(614) <223> Cas8 <400> 249 Met Leu Gln Glu Ile Asn Asn Phe Met Asn Ser Leu Pro Ala Glu Leu 1 5 10 15 Lys Gln Ala Gly Leu Lys Pro Lys Glu Gly Leu His Val Leu Leu Lys 20 25 30 Ile Gln Glu Lys Glu Gly Thr His Phe Met Asp Glu Gln Ser Val Cys 35 40 45 Arg Val Cys Leu Thr Arg Lys Ala Thr Glu Phe Asp Tyr Pro Phe Leu 50 55 60 Gln His Cys Ala Glu Leu Ala Gln Val Gly Trp Cys Val Asn Thr Asn 65 70 75 80 Lys Cys Phe Asp Leu Pro Ala Lys Gly Leu His Ser Cys Ser Pro Tyr 85 90 95 Cys Ile Ala Leu Lys Arg Glu Ser Leu Glu Gly Gly Gly Lys Tyr Ala 100 105 110 Lys Asp Lys Thr Lys Ile Tyr Asp Arg Ile Asp Thr Tyr Phe Ala Asn 115 120 125 Ala Leu Ser Tyr Val Glu Glu Asp Ser Glu Lys Glu Arg Ile Arg Val 130 135 140 Phe Gln His Phe Ile Asn Ser Lys Glu Lys Leu Asn Ala Leu Phe Ala 145 150 155 160 Cys Phe Gln Ser Glu Val Asp Glu Val Lys Asp Lys Glu Tyr Ile Ile 165 170 175 Leu Tyr Leu Glu Glu Glu Met Glu Lys Tyr Arg Arg Val His Glu Lys 180 185 190 Tyr Leu Ser Asp Lys Leu Phe Asn Thr Asn Glu Tyr Asn Ile Ser Val 195 200 205 Glu Asn Gln Leu Tyr Gly Thr Ser Asp Phe Leu Asn Gly Phe Pro Thr 210 215 220 Lys Lys Pro Phe Leu Ser His Gln Ser Ala Val Phe Asp Ile Ala Gly 225 230 235 240 Arg Ile Thr Gly Glu Met Ala Gly Asn Leu His Asp Phe Gln Glu Ile 245 250 255 Met Arg Arg Asn Val Leu Pro Arg Pro Leu Pro Leu Phe Val Tyr Arg 260 265 270 Glu Glu Leu Gln Thr Glu Met Leu Ala Val Phe Ser Arg Tyr Leu Ala 275 280 285 Asp Gly Lys Arg Ile Gly Tyr Gln Glu Ile Ile Arg Glu Leu Tyr Lys 290 295 300 Asn His Gln Asp Asp Ile Gly Asp Tyr Tyr Leu Leu Tyr Tyr Tyr Gly 305 310 315 320 Asp Thr Val Cys Asp Phe Asp Phe Val Ser Arg Phe Arg Tyr Arg Leu 325 330 335 Gln Ser Gly Asp Lys Glu Gly Trp Met Val Lys Asp His Phe Gln Ile 340 345 350 Gly Phe Thr Glu Lys Ile Ser His Val Phe Glu Leu Glu Glu Lys Val 355 360 365 Leu Arg Glu Ile Phe Asn Asn Ser Leu Ile Thr Arg Thr Lys Ala Gly 370 375 380 Asp Thr Gln Arg Lys Tyr Phe Asp Glu Leu Glu Pro Lys Tyr Cys Lys 385 390 395 400 Ser Glu Asn Asn Tyr Leu Leu Val Leu Lys Tyr Arg Gln Ala Phe Tyr 405 410 415 Asp Tyr Ile Tyr Lys Ser Arg Leu Gln Ala Val Thr Arg Pro Met Phe 420 425 430 Asp His Ile Leu Leu Thr Gly Ile Leu Glu Asp Ile Arg Leu Asp Glu 435 440 445 Leu Lys Gly Asn Gln His Thr Gln Arg Trp Gly Ile Leu Ser Lys Met 450 455 460 Asn Ile Trp Phe Ser Leu Ala Glu Arg Phe Asp Leu Gln Phe Lys Asn 465 470 475 480 Thr Asp Thr Met Ala Ser Lys Leu Glu Glu Gln Arg Val Phe Met Val 485 490 495 Ala Leu Ser Gln Gly Glu Ala Ile Leu Glu Asn Asp Glu Gln Tyr Ala 500 505 510 Phe Ala Ala Gly Gln Val Ile Tyr Tyr Leu Leu His Lys Ser Lys Thr 515 520 525 Ala Asp Lys Ser Tyr Lys Arg Leu Glu Pro Phe Leu Gln Gln Val His 530 535 540 Ala Ser Glu Leu Asn Lys Ala Ile Ala Arg Leu Phe Asp Thr Tyr Lys 545 550 555 560 His Glu Asn Phe Ser Gly Asn Phe Arg His Pro Phe Ala Ser Val Met 565 570 575 Ala Tyr Gln Thr Gln Ala Asn Met Arg Asp Tyr Leu Pro Met Met Leu 580 585 590 Ala Gly Ile Phe Ser Asp Asn Leu Leu Phe Ser Val Asn Lys Ser Glu 595 600 605 Glu Thr Asn Glu Glu Asn 610 <210> 250 <211> 312 <212> PRT <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(312) <223> Cas7 <400> 250 Met Ser Asn Thr Phe Lys Asn Arg Val Phe Gly Cys Val Val Ile Lys 1 5 10 15 Ser Val Asn Ser Asn Tyr Asn Ala Asp Phe Ser His Gln Pro Arg Thr 20 25 30 Leu Pro Asp Gly Ser Val Tyr Ala Thr Asp Lys Ala Leu Lys Tyr Thr 35 40 45 Val Arg Asn Tyr Ile Asp Lys Asn Tyr Pro Glu Asp Lys Val Phe Tyr 50 55 60 Phe Lys Ser Leu Asn Gly Asp Met Gln Pro Arg Asp Leu Asp Gln Asn 65 70 75 80 Tyr Ala Arg Phe Phe Gly Asp Tyr Pro Lys Ala Asp Lys Lys Glu Ala 85 90 95 Val Lys Ala Arg Lys Val Ile Leu Gly Asn Leu Leu Ser Cys Leu Asp 100 105 110 Val Arg Leu Phe Gly Gly Thr Phe Ala Ser Lys Thr Ala Asn Leu Ser 115 120 125 Ile His Gly Val Val Gln Pro Thr His Gly Val Asn Arg Tyr Val Glu 130 135 140 Gly Ile Ile Tyr Ser Glu Gln Ile Ala Ser Pro Phe Arg Asn Ser Asn 145 150 155 160 Asp Asn Ser Thr Asp Ser Met Gln Thr Thr Leu Gly Thr Gln Phe Lys 165 170 175 Leu Gln Glu Gly His Tyr Val His His Phe Ser Val Asn Pro Gly Asn 180 185 190 Leu Asp Glu Leu Thr Glu Phe Val Asp Asn Gly Arg Leu Thr Gly Glu 195 200 205 Asp Ile Ala Lys Leu Lys Glu Ala Leu Arg Cys Gly Val Thr Tyr Tyr 210 215 220 Asp Ser Ser Ser Lys Ala Gly Thr Glu Asn Glu Ala Leu Leu Trp Val 225 230 235 240 Glu Leu Lys Glu Glu Ser Lys Leu Val Leu Pro Ser Phe Val Asp Leu 245 250 255 Ile Glu Val Asn Ala Glu Arg Glu Ile Asp Phe Ala Lys Val Ser Thr 260 265 270 Leu Leu Ser Lys Glu Lys Ile Lys Asn Glu Ile Ser Lys Ile Glu Leu 275 280 285 Phe Tyr Asn Lys Gly Ile Thr Lys Val Ile His Leu Pro Glu Gly Thr 290 295 300 Val Glu Leu Glu Leu Asn Gly Leu 305 310 <210> 251 <211> 259 <212> PRT <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(259) <223> Cas5 <400> 251 Met Asn Asn Gln Arg Leu Ile Ser Phe Asp Ile Gln Ala Asp Phe Gly 1 5 10 15 Phe Phe Lys Lys Pro Asp Tyr Asn Asp Gly Val Leu Leu Thr Tyr Asn 20 25 30 Met Leu His Lys Pro Ala Leu Leu Gly Ile Leu Gly Ala Ile Ile Gly 35 40 45 Leu Arg Gly Tyr Arg Lys Lys Gly Glu Trp Pro Glu Tyr Tyr Gln Arg 50 55 60 Leu Ala Ala Leu Pro Val Gly Ile Glu Pro Leu Glu Gly Arg His Glu 65 70 75 80 Lys Gly Asn Phe Gln Lys Thr Ile Val Lys Tyr Thr Asn Thr Val Gly 85 90 95 Tyr Ala Asn Gln Asp Gly Asn Leu Leu Val Glu Glu Ser Met Leu Ile 100 105 110 Arg Pro Ala Tyr Arg Cys Tyr Leu Leu Leu Ser Glu Glu His Pro Asp 115 120 125 His Arg Lys Leu Tyr Glu Tyr Ile Arg Glu Gly Trp Ala Glu Tyr Ile 130 135 140 Pro Tyr Leu Gly Lys Asn Glu Tyr Pro Ala Trp Phe Gly Asp Ser Phe 145 150 155 160 Arg Glu Tyr Ala Phe Lys Thr Phe Val Pro Glu Thr Asp Phe Arg Val 165 170 175 Ser Ser Leu Phe Ile Lys Glu Gly Val Leu Lys Gly Gln Gln Val Lys 180 185 190 Ala Ser Phe Ser Phe Ser Leu Lys Gly Ile Val Asn Arg Gly Ser Phe 195 200 205 Val Tyr Phe Glu Arg Leu Pro Val Gly Phe His Pro Val Leu Met Gln 210 215 220 Tyr Glu Leu Ala Asp Phe Ala Phe Thr Asp Trp Thr Leu Gln Ala Ala 225 230 235 240 Thr Gln Met Val Asn Leu Tyr Gln Leu Glu Glu Glu Gly Lys Ile Val 245 250 255 Gln Leu Phe <210> 252 <211> 97 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <220> <221> misc_feature <222> (1)..(97) <223> CRISPR <400> 252 cttttaattg aactaaggta gaattgaaac taggaataaa ccgtacccaa ccacgtagcc 60 atatacgctt ttaattgaac taaggtagaa ttgaaac 97 <210> 253 <211> 711 <212> DNA <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(711) <223> Cas5 <400> 253 atgagaaacg aagtccaatt tgagctattt ggagactacg cgctttttac cgatccgctc 60 acgaagattg gtggggagaa gctttcctac agtgtcccta cctatcaagc gttgaaagga 120 attgccgaaa gcatctactg gaagccgacg attgtctttg ttatcgatga gcttcgggtg 180 atgaagccga ttcagatgga gtctaaaggg gtgcgtccga ttgaatatgg cgggggtaat 240 acgcttgccc attatacgta tttaaaagat gtgcattatc aggtaaaggc ccattttgaa 300 ttcaatcttc accgacctga cttggcgttt gaccgcaatg aagggaagca ttacagcatt 360 cttcagcgtt ctttgaaagc tggggggcgg agagatattt ttcttggggc gagagagtgc 420 caaggatatg tagctccgtg tgagtttggg agtggcgacg gtttttatga tggacaaggg 480 aagtatcatt taggaacgat ggttcatgga tttaactatc ctgatgagac gggtcaacat 540 cagcttgatg tgcgtttatg gtctgctgta atggagaatg ggtacatcca atttccaagg 600 cccgaagact gtccgattgt ccgacctgtg aaagagatgg agcccaaaat ctttaatcca 660 gacaatgttc aatctgccga gcaattactc catgacttag gaggtgagtg a 711 <210> 254 <211> 1884 <212> DNA <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(1884) <223> Cas8 <400> 254 atgagttggt tgcttcacct atacgaaacc tatgaagcca atctcgatca ggttgggaaa 60 acggtgaaaa agggagagga tcgagaatac acattgctgc cgatctccca tacgacccaa 120 aatgctcata tcgaagtaac acttgacgaa gatggcgact ttctaagagc aaaagcatta 180 acgaaagaga gcacgttaat cccttgtaca gaagaggctg ccagtcgctc aggttcaaag 240 gttgcaccgt accctcttca cgataagctt agctatgttg ctggtgattt tgtcaaatac 300 ggaggaaaga tcaaaaatca agacgatgct ccttttgaca cctatataaa aaatttaggt 360 gagtgggcca attccccgta tgcgacggag aaggtgaagt gcatttatac gtatttgaaa 420 aaagggcgat tgattgaaga cttggtcgac gcaggtgtcc ttaagctcga tgaaaaccaa 480 caattgatcg aaaaatggga aaagcgatat gaagagctac tgggggaaaa gcccgctatt 540 ttttcaagtg gtgctaccga tcaagcgagt gcttttgtga gattcaatgt ttttcaccct 600 gagtcgatcg acgatgtttg gaaagacaaa gagatgtttg attcatttat ttctttttat 660 aatgacaaat taggcgaaga ggatatttgt ttcgtcacag ggaacaggct tcctagcaca 720 gaacgccatg caaataagat ccgtcatgcg gcggataagg caaaattaat atcagctaat 780 gataactctg gttttacctt ccgtgggcga tttaaaacaa gtcgagaagc cgtgggcatt 840 agctatgagg tttctcaaaa ggcccataat gctttgaaat ggctcattca tcgccaaagt 900 aaaagcattg atgatcgtgt gtttcttgtt tggagtaatg ataacagtct tgtgcctaac 960 ccagatgagg atgcggtaga catcatgaag catgccaacc gtgagttaga aagagatcca 1020 gatacagggc aaatttttgc aggtgaagtt aagaaagcga tcggcggcta tcggagtgac 1080 ttgaactatc aaccagaggt tcatattctc gttcttgatt cagcaacgac tgggagaatg 1140 gccgttcttt attatcgaag tctcaataaa gaactctatt tgaatcgttt agaggcgtgg 1200 catgattcgt gtgcatggga gcaccggtat cgaagggacg aaaaggagtt tatttcgttt 1260 tatggggcac ctgcaacgaa ggatattgca tttgccgctt atggaccgag agcgagtgaa 1320 aaggtcataa aagacttaat ggaacgaatg cttccttgta ttgtcgatgg gcgtcgggtc 1380 ccaaaggata ttgttagaag tgccttccaa cgggcttcaa atccggtctc gatggagcgc 1440 tgggaatggg aaaaaacatt aagtatcaca tgtgccctta ttagaaaaat gcacattgaa 1500 caaaaggagg aatggggcgt gccacttgat aaaagctcaa cggaccgcag ctacttgttt 1560 ggacgcttgc tggctgttgc tgatgtgttg gagcgagggg ctctcggtaa ggacgaaaca 1620 agagctacca atgctattcg ttatatgaac tcatattcaa aaaatccagg acgtacgtgg 1680 aaaacgattc aggaaagctt gcagccgtac caagccaaac tcggaactaa agcgacttat 1740 ttatcaaagc tagtcgacga gatcggcgat caatttgagc caggggactt taacaacaac 1800 cctctgacgg aacaatattt gcttgggttt tatagtcaac gtcgtgagct ttataagaaa 1860 aaagaggagg agaccaacca atga 1884 <210> 255 <211> 852 <212> DNA <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(852) <223> Cas7 <400> 255 atgactatac ttgaccacaa aattgatttt gctgttattc tatctgttac taaagccaat 60 ccgaatggag atccccttaa cggaaaccgc ccacgtcaaa attacgatgg gcatggggag 120 atttctgatg ttgcgatcaa gcgtaaaatt cgcaatcgtt tgctagatat ggaagaacct 180 atttttgttc aatctgatga ccgtaaagca gattctttta aaagtttgcg agatcgtgca 240 gattcgaatc ctgagttagc caaaatgctg aaagcaaaaa atgcgtctgt tgatgaattt 300 gcaaaaattg cttgtcaaga gtggatggat gtgcgtagtt ttggacaagt atttgcgttt 360 aaaggctcca atttatccgt tggtgttcgc ggtcctgtgt cgattcacac agcaacgagc 420 attgatccta ttgatattgt tagcacccag attacaaaaa gtgttaactc ggtcacgggt 480 gataaacgta gctcagacac catgggaatg aagcaccgtg tcgactttgg tgtttatgtg 540 ttcaaaggga gcattaacac gcagcttgca gagaaaacag gctttacgaa tgaagatgcg 600 gaaaaaatca agcgggcact catcaccctg tttgaaaatg acagctcttc cgcccgccct 660 gatgggagca tggaggtcca taaagtgtac tggtgggagc attcttcaaa gcttggacaa 720 tattcttctg ccaaagtgca tcgttcatta aaaattgaat caaagacgga tacacctaag 780 agttttgatg attatgccgt tgaactatat gaattagatg gcttgggtgt tgaagtgatt 840 gatggccagt aa 852 <210> 256 <211> 711 <212> DNA <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(711) <223> Cas5 <400> 256 atgcggaacg aggtgcagtt tgagctgttc ggcgattacg ccctgtttac cgaccccctg 60 acaaagatcg gcggcgagaa gctgtcctac tctgtgccta cctatcaggc cctgaagggc 120 atcgccgagt ccatctattg gaagccaaca atcgtgttcg tgatcgatga gctgagagtg 180 atgaagccca tccagatgga gtctaagggc gtgaggccta tcgagtatgg cggcggcaac 240 accctggccc actacacata tctgaaggac gtgcactacc aggtgaaggc ccacttcgag 300 tttaatctgc acagacccga tctggccttt gacaggaacg agggcaagca ctactctatc 360 ctgcagcgca gcctgaaggc aggaggccgg agagacatct tcctgggagc aagggagtgc 420 cagggatatg tggccccttg tgagtttggc tctggcgatg gcttctacga cggccagggc 480 aagtatcacc tgggcaccat ggtgcacggc ttcaattacc cagatgagac aggccagcac 540 cagctggacg tgaggctgtg gtccgccgtg atggagaacg gctatatcca gtttcctaga 600 ccagaggatt gccccatcgt gaggcctgtg aaggagatgg agccaaagat cttcaatccc 660 gataacgtgc agagcgccga gcagctgctg cacgacctgg gaggagagta a 711 <210> 257 <211> 1884 <212> DNA <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(1884) <223> Cas8 <400> 257 atgagctggc tgctgcacct gtacgagaca tatgaggcca atctggatca agtgggcaag 60 accgtgaaga agggcgagga cagagagtac acactgctgc caatctccca caccacacag 120 aacgcccaca tcgaggtgac cctggacgag gatggcgact tcctgagggc caaggccctg 180 accaaggagt ctacactgat cccatgcaca gaggaggcag cctcccgctc tggcagcaag 240 gtggcaccat accctctgca cgataagctg agctatgtgg ccggcgactt tgtgaagtac 300 ggcggcaaga tcaagaatca ggacgatgcc ccattcgaca cctatatcaa gaatctggga 360 gagtgggcaa acagcccata cgcaaccgag aaggtgaagt gtatctacac atatctgaag 420 aagggccgcc tgatcgagga tctggtggac gccggcgtgc tgaagctgga tgagaaccag 480 cagctgatcg agaagtggga gaagcggtac gaggagctgc tgggcgagaa gcctgccatc 540 tttagctccg gcgcaaccga ccaggccagc gccttcgtgc ggttcaacgt gttccaccca 600 gagtccatcg acgacgtgtg gaaggataag gagatgttcg actcctttat ctctttctat 660 aacgataagc tgggcgagga ggacatctgc ttcgtgaccg gcaatcggct gcccagcaca 720 gagagacacg ccaacaagat caggcacgcc gccgataagg ccaagctgat cagcgccaat 780 gacaactccg gctttacctt ccggggccgg ttcaagacca gccgggaggc agtgggaatc 840 agctacgagg tgtcccagaa ggcccacaat gccctgaagt ggctgatcca ccgccagtcc 900 aagtctatcg acgatcgggt gttcctggtg tggtctaatg ataacagcct ggtgccaaat 960 cccgatgagg acgccgtgga catcatgaag cacgccaaca gggagctgga gcgcgatcca 1020 gacaccggac agatcttcgc aggagaggtg aagaaggcaa tcggaggcta ccgcagcgat 1080 ctgaactatc agcccgaggt gcacatcctg gtgctggact ctgccaccac aggccgcatg 1140 gccgtgctgt actatcggag cctgaataag gagctgtacc tgaaccgcct ggaggcctgg 1200 cacgattctt gtgcctggga gcaccggtat cggagagacg agaaggagtt tatcagcttc 1260 tacggcgccc ccgccaccaa ggatatcgcc tttgccgcat atggacctag ggcctccgag 1320 aaagtgatca aggacctgat ggagcggatg ctgccttgca tcgtggatgg caggcgcgtg 1380 ccaaaggaca tcgtgcggag cgccttccag agagcctcca atcccgtgtc tatggagaga 1440 tgggagtggg agaagaccct gtccatcaca tgtgccctga tcaggaagat gcacatcgag 1500 cagaaggagg agtggggcgt gcctctggat aagtctagca ccgaccgcag ctacctgttt 1560 ggccggctgc tggccgtggc agatgtgctg gagaggggcg ccctgggcaa ggacgagacc 1620 agagccacaa acgccatcag gtacatgaat agctattcca agaaccctgg ccgcacctgg 1680 aagacaatcc aggagtccct gcagccatat caggccaagc tgggcaccaa ggccacatac 1740 ctgtctaagc tggtggatga gatcggcgac cagtttgagc ctggcgactt caacaataac 1800 ccactgaccg agcagtacct gctgggcttc tatagccagc ggagagagct gtacaagaag 1860 aaggaggagg agacaaacca gtaa 1884 <210> 258 <211> 852 <212> DNA <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(852) <223> Cas7 <400> 258 atgaccatcc tggatcacaa gatcgacttc gccgtgatcc tgtccgtgac aaaggccaat 60 cctaacggcg acccactgaa tggcaacagg cctcgccaga attacgatgg ccacggcgag 120 atctctgacg tggccatcaa gagaaagatc agaaacagac tgctggatat ggaggagccc 180 atctttgtgc agagcgacga taggaaggcc gactctttca agagcctgag ggatcgcgcc 240 gactccaatc ctgagctggc caagatgctg aaggccaaga acgcctctgt ggatgagttt 300 gccaagatcg cctgccagga gtggatggac gtgcgctcct tcggccaggt gttcgccttt 360 aagggctcca atctgtctgt gggcgtgcgg ggacccgtga gcatccacac cgccacaagc 420 atcgatccaa tcgacatcgt gtctacccag atcacaaaga gcgtgaactc cgtgaccggc 480 gataagagaa gctccgacac aatgggcatg aagcacaggg tggattttgg cgtgtacgtg 540 ttcaagggct ccatcaatac ccagctggcc gagaagaccg gctttacaaa cgaggacgcc 600 gagaagatca agagagccct gatcacactg ttcgagaacg attctagctc cgccaggcct 660 gacggctcca tggaggtgca caaggtgtat tggtgggagc actctagcaa gctgggccag 720 tactcctctg ccaaggtgca ccggagcctg aagatcgagt ccaagaccga tacaccaaag 780 agcttcgacg attacgccgt ggagctgtat gagctggatg gcctgggcgt ggaagtgatc 840 gacggacagt aa 852 <210> 259 <211> 236 <212> PRT <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(236) <223> Cas5 <400> 259 Met Arg Asn Glu Val Gln Phe Glu Leu Phe Gly Asp Tyr Ala Leu Phe 1 5 10 15 Thr Asp Pro Leu Thr Lys Ile Gly Gly Glu Lys Leu Ser Tyr Ser Val 20 25 30 Pro Thr Tyr Gln Ala Leu Lys Gly Ile Ala Glu Ser Ile Tyr Trp Lys 35 40 45 Pro Thr Ile Val Phe Val Ile Asp Glu Leu Arg Val Met Lys Pro Ile 50 55 60 Gln Met Glu Ser Lys Gly Val Arg Pro Ile Glu Tyr Gly Gly Gly Asn 65 70 75 80 Thr Leu Ala His Tyr Thr Tyr Leu Lys Asp Val His Tyr Gln Val Lys 85 90 95 Ala His Phe Glu Phe Asn Leu His Arg Pro Asp Leu Ala Phe Asp Arg 100 105 110 Asn Glu Gly Lys His Tyr Ser Ile Leu Gln Arg Ser Leu Lys Ala Gly 115 120 125 Gly Arg Arg Asp Ile Phe Leu Gly Ala Arg Glu Cys Gln Gly Tyr Val 130 135 140 Ala Pro Cys Glu Phe Gly Ser Gly Asp Gly Phe Tyr Asp Gly Gln Gly 145 150 155 160 Lys Tyr His Leu Gly Thr Met Val His Gly Phe Asn Tyr Pro Asp Glu 165 170 175 Thr Gly Gln His Gln Leu Asp Val Arg Leu Trp Ser Ala Val Met Glu 180 185 190 Asn Gly Tyr Ile Gln Phe Pro Arg Pro Glu Asp Cys Pro Ile Val Arg 195 200 205 Pro Val Lys Glu Met Glu Pro Lys Ile Phe Asn Pro Asp Asn Val Gln 210 215 220 Ser Ala Glu Gln Leu Leu His Asp Leu Gly Gly Glu 225 230 235 <210> 260 <211> 627 <212> PRT <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(627) <223> Cas8 <400> 260 Met Ser Trp Leu Leu His Leu Tyr Glu Thr Tyr Glu Ala Asn Leu Asp 1 5 10 15 Gln Val Gly Lys Thr Val Lys Lys Gly Glu Asp Arg Glu Tyr Thr Leu 20 25 30 Leu Pro Ile Ser His Thr Thr Gln Asn Ala His Ile Glu Val Thr Leu 35 40 45 Asp Glu Asp Gly Asp Phe Leu Arg Ala Lys Ala Leu Thr Lys Glu Ser 50 55 60 Thr Leu Ile Pro Cys Thr Glu Glu Ala Ala Ser Arg Ser Gly Ser Lys 65 70 75 80 Val Ala Pro Tyr Pro Leu His Asp Lys Leu Ser Tyr Val Ala Gly Asp 85 90 95 Phe Val Lys Tyr Gly Gly Lys Ile Lys Asn Gln Asp Asp Ala Pro Phe 100 105 110 Asp Thr Tyr Ile Lys Asn Leu Gly Glu Trp Ala Asn Ser Pro Tyr Ala 115 120 125 Thr Glu Lys Val Lys Cys Ile Tyr Thr Tyr Leu Lys Lys Gly Arg Leu 130 135 140 Ile Glu Asp Leu Val Asp Ala Gly Val Leu Lys Leu Asp Glu Asn Gln 145 150 155 160 Gln Leu Ile Glu Lys Trp Glu Lys Arg Tyr Glu Glu Leu Leu Gly Glu 165 170 175 Lys Pro Ala Ile Phe Ser Ser Gly Ala Thr Asp Gln Ala Ser Ala Phe 180 185 190 Val Arg Phe Asn Val Phe His Pro Glu Ser Ile Asp Asp Val Trp Lys 195 200 205 Asp Lys Glu Met Phe Asp Ser Phe Ile Ser Phe Tyr Asn Asp Lys Leu 210 215 220 Gly Glu Glu Asp Ile Cys Phe Val Thr Gly Asn Arg Leu Pro Ser Thr 225 230 235 240 Glu Arg His Ala Asn Lys Ile Arg His Ala Ala Asp Lys Ala Lys Leu 245 250 255 Ile Ser Ala Asn Asp Asn Ser Gly Phe Thr Phe Arg Gly Arg Phe Lys 260 265 270 Thr Ser Arg Glu Ala Val Gly Ile Ser Tyr Glu Val Ser Gln Lys Ala 275 280 285 His Asn Ala Leu Lys Trp Leu Ile His Arg Gln Ser Lys Ser Ile Asp 290 295 300 Asp Arg Val Phe Leu Val Trp Ser Asn Asp Asn Ser Leu Val Pro Asn 305 310 315 320 Pro Asp Glu Asp Ala Val Asp Ile Met Lys His Ala Asn Arg Glu Leu 325 330 335 Glu Arg Asp Pro Asp Thr Gly Gln Ile Phe Ala Gly Glu Val Lys Lys 340 345 350 Ala Ile Gly Gly Tyr Arg Ser Asp Leu Asn Tyr Gln Pro Glu Val His 355 360 365 Ile Leu Val Leu Asp Ser Ala Thr Thr Gly Arg Met Ala Val Leu Tyr 370 375 380 Tyr Arg Ser Leu Asn Lys Glu Leu Tyr Leu Asn Arg Leu Glu Ala Trp 385 390 395 400 His Asp Ser Cys Ala Trp Glu His Arg Tyr Arg Arg Asp Glu Lys Glu 405 410 415 Phe Ile Ser Phe Tyr Gly Ala Pro Ala Thr Lys Asp Ile Ala Phe Ala 420 425 430 Ala Tyr Gly Pro Arg Ala Ser Glu Lys Val Ile Lys Asp Leu Met Glu 435 440 445 Arg Met Leu Pro Cys Ile Val Asp Gly Arg Arg Val Pro Lys Asp Ile 450 455 460 Val Arg Ser Ala Phe Gln Arg Ala Ser Asn Pro Val Ser Met Glu Arg 465 470 475 480 Trp Glu Trp Glu Lys Thr Leu Ser Ile Thr Cys Ala Leu Ile Arg Lys 485 490 495 Met His Ile Glu Gln Lys Glu Glu Trp Gly Val Pro Leu Asp Lys Ser 500 505 510 Ser Thr Asp Arg Ser Tyr Leu Phe Gly Arg Leu Leu Ala Val Ala Asp 515 520 525 Val Leu Glu Arg Gly Ala Leu Gly Lys Asp Glu Thr Arg Ala Thr Asn 530 535 540 Ala Ile Arg Tyr Met Asn Ser Tyr Ser Lys Asn Pro Gly Arg Thr Trp 545 550 555 560 Lys Thr Ile Gln Glu Ser Leu Gln Pro Tyr Gln Ala Lys Leu Gly Thr 565 570 575 Lys Ala Thr Tyr Leu Ser Lys Leu Val Asp Glu Ile Gly Asp Gln Phe 580 585 590 Glu Pro Gly Asp Phe Asn Asn Asn Pro Leu Thr Glu Gln Tyr Leu Leu 595 600 605 Gly Phe Tyr Ser Gln Arg Arg Glu Leu Tyr Lys Lys Lys Glu Glu Glu 610 615 620 Thr Asn Gln 625 <210> 261 <211> 283 <212> PRT <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(283) <223> Cas7 <400> 261 Met Thr Ile Leu Asp His Lys Ile Asp Phe Ala Val Ile Leu Ser Val 1 5 10 15 Thr Lys Ala Asn Pro Asn Gly Asp Pro Leu Asn Gly Asn Arg Pro Arg 20 25 30 Gln Asn Tyr Asp Gly His Gly Glu Ile Ser Asp Val Ala Ile Lys Arg 35 40 45 Lys Ile Arg Asn Arg Leu Leu Asp Met Glu Glu Pro Ile Phe Val Gln 50 55 60 Ser Asp Asp Arg Lys Ala Asp Ser Phe Lys Ser Leu Arg Asp Arg Ala 65 70 75 80 Asp Ser Asn Pro Glu Leu Ala Lys Met Leu Lys Ala Lys Asn Ala Ser 85 90 95 Val Asp Glu Phe Ala Lys Ile Ala Cys Gln Glu Trp Met Asp Val Arg 100 105 110 Ser Phe Gly Gln Val Phe Ala Phe Lys Gly Ser Asn Leu Ser Val Gly 115 120 125 Val Arg Gly Pro Val Ser Ile His Thr Ala Thr Ser Ile Asp Pro Ile 130 135 140 Asp Ile Val Ser Thr Gln Ile Thr Lys Ser Val Asn Ser Val Thr Gly 145 150 155 160 Asp Lys Arg Ser Ser Asp Thr Met Gly Met Lys His Arg Val Asp Phe 165 170 175 Gly Val Tyr Val Phe Lys Gly Ser Ile Asn Thr Gln Leu Ala Glu Lys 180 185 190 Thr Gly Phe Thr Asn Glu Asp Ala Glu Lys Ile Lys Arg Ala Leu Ile 195 200 205 Thr Leu Phe Glu Asn Asp Ser Ser Ser Ala Arg Pro Asp Gly Ser Met 210 215 220 Glu Val His Lys Val Tyr Trp Trp Glu His Ser Ser Lys Leu Gly Gln 225 230 235 240 Tyr Ser Ser Ala Lys Val His Arg Ser Leu Lys Ile Glu Ser Lys Thr 245 250 255 Asp Thr Pro Lys Ser Phe Asp Asp Tyr Ala Val Glu Leu Tyr Glu Leu 260 265 270 Asp Gly Leu Gly Val Glu Val Ile Asp Gly Gln 275 280 <210> 262 <211> 99 <212> DNA <213> Bacillus halodurans C-125 <220> <221> misc_feature <222> (1)..(99) <223> Exemplary minimal CRISPR array <400> 262 gtcgcactct tcatgggtgc gtggattgaa atcctttgac ggagagggga acaggaaatt 60 agagaaggtc gcactcttca tgggtgcgtg gattgaaat 99 <210> 263 <211> 684 <212> DNA <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(684) <223> Cas5, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 263 atgacacatg gggctgttaa gacatacggc atcagactgc gggtatgggg cgactacgcc 60 tgcttcacgc ggccggagat gaaggtggaa cgggtgtcat acgatgtcat gcccccttcc 120 gccgcacggg gcatccttga ggccatccac tggaagccgg ccatcaggtg gattgtggac 180 aggattcatg tgctgcggcc catcgtcttc gacaacgtgc ggcgcaacga ggtcagttcg 240 aagataccca agcccaatcc ggcaacggcc atgcgcgaca ggaagccgct ctactttctg 300 gtcgatgacg gcagcaaccg ccagcaacgg gcggcgaccc tgctgcgcaa cgtcgactat 360 gtcatcgaag cccacttcga actgacagac aaggccggag cggaagacaa cgcgggcaag 420 catctggaca tcttcaggcg tcgtgcgcgc gccgggcagt cgttccagca gccatgcctc 480 ggctgccgcg agtttccggc gtcgttcgaa ctgctggagg gggatgtgcc gctctcgtgc 540 tacgcgggcg agaagcgcga ccttggctac atgctgctcg acatcgactt cgaacgcgac 600 atgacgccgc tgttcttcaa ggccgtcatg gaagacggag tgataacgcc cccgtcgcgc 660 acgtcaccgg aggtgagggc atga 684 <210> 264 <211> 1839 <212> DNA <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(1839) <223> Cas8, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 264 atgatcctgc aggcattgca tggctattac cagcgcatga gcgcagaccc cgatgcgggg 60 atgccgccct acgggaccag catggagaac atctcgttcg cgctggtgct ggatgcgaaa 120 gggacgctac ggggcatcga ggacttgcgg gaacaggaag gcaagaagct gcggccccgc 180 aagatgctgg ttcctatcgc ggaaaagaag gggaacggca tcaaaccgaa cttcctgtgg 240 gagaacacca gttatattct gggggtggac gccaagggca agcaggaacg tacagacaag 300 tgccacgccg cgttcattgc ccacatcaag gcctactgtg acactgcaga ccaagacctt 360 gccgccgttc tgcagttcct tgaacacggc gaaaaagacc tctccgcttt tccggtttcg 420 gaagaggtca tcggctccaa tatcgtcttt cgcatcgagg gcgaaccggg cttcgtccat 480 gagcgtccgg ctgcgcggca ggcttgggcc aactgcctga accggcggga gcaagggcta 540 tgtggtcaat gcctcatcac cggggagcgc cagaagccga ttgcccaact ccatccgtcg 600 atcaaaggcg ggcgagacgg cgttcgcggt gcacaggctg ttgcctcgat agtgtccttt 660 aacaacaccg cctttgaatc ttacgggaaa gaacagtcga tcaatgcacc cgtcagtcaa 720 gaagcggcat tctcttatgt cacagccctg aattacctgc tcaacccgtc aaatcgacag 780 aaggtcacca tcgctgacgc caccgtggtc ttctgggccg aacgcagcag cccggcagag 840 gacatctttg caggcatgtt cgacccgcct tccaccacgg cgaaaccgga gtcctcgaac 900 gggacgccgc cggaagacag tgaagaaggc agccagcctg acacagccag agacgacccc 960 catgccgctg ccagaatgca cgacctgctt gtggccatcc gttccggcaa gcgcgccacg 1020 gacatcatgc ccgacatgga cgagtccgtg cgcttccatg tgcttggcct gtcgcccaac 1080 gccgcccgcc tgtccgtccg cttctgggag gtcgataccg tcggtcacat gctggacaag 1140 gtggggcggc actaccgtga actcgagatc attccgcaat tcaacaacga gcaggagttc 1200 ccgtctcttt caaccctgct gcggcagact gccgtcttga acaagaccga gaacatctcg 1260 cctgtacttg caggcgggct attcagggcc atgctcaccg gcgggcccta tccgcaaagc 1320 ctgttgcccg ccgtgcttgg acgcatccgc gccgagcacg ccagaccaga agataaaagc 1380 cgctataggc ttgaagttgt gacgtattat cgagccgcct tgatcaaggc gtatctcata 1440 agaaacagaa agctggaggt gcccgtgtct ctcgaccccg caagaacaga ccgcccgtac 1500 ctgctcggac gactcttcgc cgttctggaa aaagcgcagg aagatgccgt gcccggtgcg 1560 aacgccacca tcaaggaccg ctatctggcc tccgcatcgg ccaatccggg gcaggtattc 1620 cacatgctgc tcaagaatgc gtccaaccac acggccaaac tccgcaagga ccctgaaaga 1680 aaggggtcgg ccatccacta cgaaatcatg atgcaagaga ttatcgacaa catcagcgat 1740 tttccggtga ccatgtcgtc cgacgaacaa ggcctgttca tgatcggcta ctaccaccag 1800 cgcaaggccc ttttcaccaa gaagaacaag gagaactag 1839 <210> 265 <211> 873 <212> DNA <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(873) <223> Cas7, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 265 atgaccgcca ttgccaacag atacgagttc gtgctgcttt tcgatgtgga gaacggcaac 60 cccaacggcg accccgacgc gggcaacatg ccgcgcatcg accccgagac cgggcatggt 120 ctggtcaccg acgtgtgcct gaagcgcaag atacgcaacc atgtggccct gacaaaagaa 180 ggtgccgagc ggttcaatat ctatattcag gaaaaggcca ttctcaacga aacccacgaa 240 cgcgcctaca cggcctgcga cctgaaaccc gaacccaaga aactgcccaa gaaggtcgaa 300 gacgccaaga gggtcaccga ctggatgtgc acgaacttct acgacatccg cacgttcggc 360 gccgtcatga ccacagaggt caactgcggg caggtgcgcg gccccgtgca gatggccttt 420 gccagaagtg tggaacccgt cgtgccgcaa gaggtgagca tcacccgcat ggcagtcacc 480 acgaaggcag aggccgaaaa gcagcaggga gacaaccgca ccatgggtcg caagcacatc 540 gtgccctacg gcctgtatgt ggcgcacggc ttcatctccg caccgctggc agagaagaca 600 ggcttctccg atgaagacct gacgctgttc tgggacgccc tcgtcaacat gttcgagcac 660 gaccgttcgg cggcacgcgg cctcatgagc agccgcaaac tcatcgtctt caagcaccag 720 aacaggctcg gcaacgcccc cgcccacaag ttgttcgacc tcgtgaaggt cagccgtgca 780 gagggttcgt ccggccccgc ccggtcgttt gccgactatg cggtgacagt ggggcaggcc 840 cccgaaggcg tagaggtcaa agagatgctg tag 873 <210> 266 <211> 684 <212> DNA <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(684) <223> Cas5, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 266 atgacccacg gagcagtgaa gacatacggc atcagactga gggtgtgggg cgactatgcc 60 tgttttaccc ggcctgagat gaaggtggag agagtgagct acgatgtgat gccaccatcc 120 gccgcaaggg gcatcctgga ggcaatccac tggaagccag ccatcagatg gatcgtggac 180 agaatccacg tgctgcgccc catcgtgttc gataatgtgc ggagaaacga ggtgtcctct 240 aagatcccta agccaaaccc agcaacagca atgagggata ggaagcccct gtattttctg 300 gtggacgatg gctccaacag gcagcagagg gcagccaccc tgctgcggaa tgtggactac 360 gtgatcgagg cccacttcga gctgacagac aaggccggcg ccgaggataa tgccggcaag 420 cacctggata tcttcaggcg ccgggcaagg gcaggacaga gctttcagca gccttgcctg 480 ggctgtcgcg agtttccagc ctccttcgag ctgctggagg gcgacgtgcc actgtcttgc 540 tacgcaggcg agaagcggga tctgggctat atgctgctgg acatcgattt cgagagagac 600 atgaccccac tgttctttaa ggccgtgatg gaggatggcg tgatcacccc tccatctagg 660 acaagccccg aggtgcgcgc ataa 684 <210> 267 <211> 1839 <212> DNA <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(1839) <223> Cas8, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 267 atgatcctgc aggccctgca cggatactat cagagaatgt ccgccgaccc tgatgcagga 60 atgccaccct acggcaccag catggagaat atctccttcg ccctggtgct ggacgccaag 120 ggcacactga ggggcatcga ggatctgcgc gagcaggagg gcaagaagct gagaccaagg 180 aagatgctgg tgcccatcgc cgagaagaag ggcaatggca tcaagccaaa ctttctgtgg 240 gagaatacca gctatatcct gggcgtggac gccaagggca agcaggagag gaccgataag 300 tgccacgccg ccttcatcgc ccacatcaag gcctactgtg acaccgcaga ccaggatctg 360 gcagccgtgc tgcagttcct ggagcacggc gagaaggatc tgtctgcctt tcccgtgagc 420 gaggaagtga tcggctccaa catcgtgttc agaatcgagg gcgagcccgg ctttgtgcac 480 gagagacctg cagcaaggca ggcctgggcc aattgtctga acaggaggga gcagggactg 540 tgcggacagt gtctgatcac cggcgagagg cagaagccta tcgcccagct gcacccaagc 600 atcaagggag gaagggacgg cgtgcgggga gcacaggccg tggccagcat cgtgtccttt 660 aacaataccg ccttcgagtc ttacggcaag gagcagagca tcaacgcacc cgtgtcccag 720 gaggcagcct tttcttacgt gacagccctg aattatctgc tgaatccttc caacaggcag 780 aaggtgacca tcgccgatgc cacagtggtg ttctgggcag agcgcagctc cccagcagag 840 gacatctttg ccggcatgtt cgatcctcca tctaccacag ccaagcccga gtctagcaac 900 ggaacccccc ctgaggactc tgaggagggc agccagccag atacagcaag ggacgatcca 960 cacgcagcag caaggatgca cgacctgctg gtggccatca gatctggcaa gagggccacc 1020 gatatcatgc ccgacatgga tgagagcgtg agatttcacg tgctgggcct gtctcctaat 1080 gcagcaaggc tgagcgtgcg gttctgggag gtggacacag tgggccacat gctggataaa 1140 gtgggcagac actataggga gctggagatc atccctcagt ttaacaatga gcaggagttc 1200 ccatccctgt ctaccctgct gagacagaca gccgtgctga ataagaccga gaacatctct 1260 ccagtgctgg ccggaggact gttcagggca atgctgacag gaggacctta cccacagagc 1320 ctgctgccag ccgtgctggg acgcatccgg gcagagcacg cacggcctga ggacaagtcc 1380 agatacaggc tggaggtggt gacctactat agagccgccc tgatcaaggc ctatctgatc 1440 cgcaaccgga agctggaggt gcccgtgtcc ctggaccctg caaggaccga taggccatat 1500 ctgctgggcc gcctgtttgc cgtgctggag aaggcacagg aggacgcagt gcctggagcc 1560 aacgccacaa tcaaggatcg gtacctggcc agcgcctccg ccaatccagg acaggtgttc 1620 cacatgctgc tgaagaatgc ctccaaccac accgccaagc tgcggaagga ccctgagaga 1680 aagggctctg ccatccacta cgagatcatg atgcaggaga tcatcgacaa tatcagcgat 1740 ttcccagtga ccatgtcctc tgatgagcag ggcctgttta tgatcggcta ctatcaccag 1800 aggaaggccc tgttcacaaa gaagaataag gagaactaa 1839 <210> 268 <211> 873 <212> DNA <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(873) <223> Cas7, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 268 atgaccgcaa tcgcaaaccg ctatgagttt gtgctgctgt tcgacgtgga gaacggcaat 60 ccaaacggcg accccgatgc cggcaatatg cctaggatcg acccagagac cggacacgga 120 ctggtgacag acgtgtgcct gaagagaaag atcaggaacc acgtggccct gacaaaggag 180 ggcgccgaga ggttcaacat ctacatccag gagaaggcca tcctgaatga gacccacgag 240 cgcgcctata cagcctgtga cctgaagcca gagcccaaga agctgccaaa gaaggtggag 300 gacgccaagc gggtgaccga ttggatgtgc acaaactttt acgatatcag aaccttcggc 360 gccgtgatga ccacagaagt gaattgtgga caggtgcggg gaccagtgca gatggccttt 420 gccagatccg tggagcccgt ggtgcctcag gaggtgtcta tcacccggat ggccgtgacc 480 acaaaggccg aggccgagaa gcagcagggc gacaacagaa caatgggcag gaagcacatc 540 gtgccatacg gcctgtatgt ggcacacggc ttcatcagcg cccccctggc cgagaagacc 600 ggcttttccg acgaggatct gacactgttc tgggacgccc tggtgaatat gtttgagcac 660 gatcgctccg ccgcaagggg actgatgagc tcccggaagc tgatcgtgtt taagcaccag 720 aatagactgg gcaacgcccc tgcccacaag ctgttcgacc tggtgaaggt gtctagggca 780 gagggctcta gcggccctgc acgcagcttc gccgattatg cagtgaccgt gggacaggcc 840 ccagagggag tggaggtgaa ggagatgctg taa 873 <210> 269 <211> 227 <212> PRT <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(227) <223> Cas5, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 269 Met Thr His Gly Ala Val Lys Thr Tyr Gly Ile Arg Leu Arg Val Trp 1 5 10 15 Gly Asp Tyr Ala Cys Phe Thr Arg Pro Glu Met Lys Val Glu Arg Val 20 25 30 Ser Tyr Asp Val Met Pro Pro Ser Ala Ala Arg Gly Ile Leu Glu Ala 35 40 45 Ile His Trp Lys Pro Ala Ile Arg Trp Ile Val Asp Arg Ile His Val 50 55 60 Leu Arg Pro Ile Val Phe Asp Asn Val Arg Arg Asn Glu Val Ser Ser 65 70 75 80 Lys Ile Pro Lys Pro Asn Pro Ala Thr Ala Met Arg Asp Arg Lys Pro 85 90 95 Leu Tyr Phe Leu Val Asp Asp Gly Ser Asn Arg Gln Gln Arg Ala Ala 100 105 110 Thr Leu Leu Arg Asn Val Asp Tyr Val Ile Glu Ala His Phe Glu Leu 115 120 125 Thr Asp Lys Ala Gly Ala Glu Asp Asn Ala Gly Lys His Leu Asp Ile 130 135 140 Phe Arg Arg Arg Ala Arg Ala Gly Gln Ser Phe Gln Gln Pro Cys Leu 145 150 155 160 Gly Cys Arg Glu Phe Pro Ala Ser Phe Glu Leu Leu Glu Gly Asp Val 165 170 175 Pro Leu Ser Cys Tyr Ala Gly Glu Lys Arg Asp Leu Gly Tyr Met Leu 180 185 190 Leu Asp Ile Asp Phe Glu Arg Asp Met Thr Pro Leu Phe Phe Lys Ala 195 200 205 Val Met Glu Asp Gly Val Ile Thr Pro Pro Ser Arg Thr Ser Pro Glu 210 215 220 Val Arg Ala 225 <210> 270 <211> 612 <212> PRT <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(612) <223> Cas8, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 270 Met Ile Leu Gln Ala Leu His Gly Tyr Tyr Gln Arg Met Ser Ala Asp 1 5 10 15 Pro Asp Ala Gly Met Pro Pro Tyr Gly Thr Ser Met Glu Asn Ile Ser 20 25 30 Phe Ala Leu Val Leu Asp Ala Lys Gly Thr Leu Arg Gly Ile Glu Asp 35 40 45 Leu Arg Glu Gln Glu Gly Lys Lys Leu Arg Pro Arg Lys Met Leu Val 50 55 60 Pro Ile Ala Glu Lys Lys Gly Asn Gly Ile Lys Pro Asn Phe Leu Trp 65 70 75 80 Glu Asn Thr Ser Tyr Ile Leu Gly Val Asp Ala Lys Gly Lys Gln Glu 85 90 95 Arg Thr Asp Lys Cys His Ala Ala Phe Ile Ala His Ile Lys Ala Tyr 100 105 110 Cys Asp Thr Ala Asp Gln Asp Leu Ala Ala Val Leu Gln Phe Leu Glu 115 120 125 His Gly Glu Lys Asp Leu Ser Ala Phe Pro Val Ser Glu Glu Val Ile 130 135 140 Gly Ser Asn Ile Val Phe Arg Ile Glu Gly Glu Pro Gly Phe Val His 145 150 155 160 Glu Arg Pro Ala Ala Arg Gln Ala Trp Ala Asn Cys Leu Asn Arg Arg 165 170 175 Glu Gln Gly Leu Cys Gly Gln Cys Leu Ile Thr Gly Glu Arg Gln Lys 180 185 190 Pro Ile Ala Gln Leu His Pro Ser Ile Lys Gly Gly Arg Asp Gly Val 195 200 205 Arg Gly Ala Gln Ala Val Ala Ser Ile Val Ser Phe Asn Asn Thr Ala 210 215 220 Phe Glu Ser Tyr Gly Lys Glu Gln Ser Ile Asn Ala Pro Val Ser Gln 225 230 235 240 Glu Ala Ala Phe Ser Tyr Val Thr Ala Leu Asn Tyr Leu Leu Asn Pro 245 250 255 Ser Asn Arg Gln Lys Val Thr Ile Ala Asp Ala Thr Val Val Phe Trp 260 265 270 Ala Glu Arg Ser Ser Pro Ala Glu Asp Ile Phe Ala Gly Met Phe Asp 275 280 285 Pro Pro Ser Thr Thr Ala Lys Pro Glu Ser Ser Asn Gly Thr Pro Pro 290 295 300 Glu Asp Ser Glu Glu Gly Ser Gln Pro Asp Thr Ala Arg Asp Asp Pro 305 310 315 320 His Ala Ala Ala Arg Met His Asp Leu Leu Val Ala Ile Arg Ser Gly 325 330 335 Lys Arg Ala Thr Asp Ile Met Pro Asp Met Asp Glu Ser Val Arg Phe 340 345 350 His Val Leu Gly Leu Ser Pro Asn Ala Ala Arg Leu Ser Val Arg Phe 355 360 365 Trp Glu Val Asp Thr Val Gly His Met Leu Asp Lys Val Gly Arg His 370 375 380 Tyr Arg Glu Leu Glu Ile Ile Pro Gln Phe Asn Asn Glu Gln Glu Phe 385 390 395 400 Pro Ser Leu Ser Thr Leu Leu Arg Gln Thr Ala Val Leu Asn Lys Thr 405 410 415 Glu Asn Ile Ser Pro Val Leu Ala Gly Gly Leu Phe Arg Ala Met Leu 420 425 430 Thr Gly Gly Pro Tyr Pro Gln Ser Leu Leu Pro Ala Val Leu Gly Arg 435 440 445 Ile Arg Ala Glu His Ala Arg Pro Glu Asp Lys Ser Arg Tyr Arg Leu 450 455 460 Glu Val Val Thr Tyr Tyr Arg Ala Ala Leu Ile Lys Ala Tyr Leu Ile 465 470 475 480 Arg Asn Arg Lys Leu Glu Val Pro Val Ser Leu Asp Pro Ala Arg Thr 485 490 495 Asp Arg Pro Tyr Leu Leu Gly Arg Leu Phe Ala Val Leu Glu Lys Ala 500 505 510 Gln Glu Asp Ala Val Pro Gly Ala Asn Ala Thr Ile Lys Asp Arg Tyr 515 520 525 Leu Ala Ser Ala Ser Ala Asn Pro Gly Gln Val Phe His Met Leu Leu 530 535 540 Lys Asn Ala Ser Asn His Thr Ala Lys Leu Arg Lys Asp Pro Glu Arg 545 550 555 560 Lys Gly Ser Ala Ile His Tyr Glu Ile Met Met Gln Glu Ile Ile Asp 565 570 575 Asn Ile Ser Asp Phe Pro Val Thr Met Ser Ser Asp Glu Gln Gly Leu 580 585 590 Phe Met Ile Gly Tyr Tyr His Gln Arg Lys Ala Leu Phe Thr Lys Lys 595 600 605 Asn Lys Glu Asn 610 <210> 271 <211> 290 <212> PRT <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(290) <223> Cas7, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 271 Met Thr Ala Ile Ala Asn Arg Tyr Glu Phe Val Leu Leu Phe Asp Val 1 5 10 15 Glu Asn Gly Asn Pro Asn Gly Asp Pro Asp Ala Gly Asn Met Pro Arg 20 25 30 Ile Asp Pro Glu Thr Gly His Gly Leu Val Thr Asp Val Cys Leu Lys 35 40 45 Arg Lys Ile Arg Asn His Val Ala Leu Thr Lys Glu Gly Ala Glu Arg 50 55 60 Phe Asn Ile Tyr Ile Gln Glu Lys Ala Ile Leu Asn Glu Thr His Glu 65 70 75 80 Arg Ala Tyr Thr Ala Cys Asp Leu Lys Pro Glu Pro Lys Lys Leu Pro 85 90 95 Lys Lys Val Glu Asp Ala Lys Arg Val Thr Asp Trp Met Cys Thr Asn 100 105 110 Phe Tyr Asp Ile Arg Thr Phe Gly Ala Val Met Thr Thr Glu Val Asn 115 120 125 Cys Gly Gln Val Arg Gly Pro Val Gln Met Ala Phe Ala Arg Ser Val 130 135 140 Glu Pro Val Val Pro Gln Glu Val Ser Ile Thr Arg Met Ala Val Thr 145 150 155 160 Thr Lys Ala Glu Ala Glu Lys Gln Gln Gly Asp Asn Arg Thr Met Gly 165 170 175 Arg Lys His Ile Val Pro Tyr Gly Leu Tyr Val Ala His Gly Phe Ile 180 185 190 Ser Ala Pro Leu Ala Glu Lys Thr Gly Phe Ser Asp Glu Asp Leu Thr 195 200 205 Leu Phe Trp Asp Ala Leu Val Asn Met Phe Glu His Asp Arg Ser Ala 210 215 220 Ala Arg Gly Leu Met Ser Ser Arg Lys Leu Ile Val Phe Lys His Gln 225 230 235 240 Asn Arg Leu Gly Asn Ala Pro Ala His Lys Leu Phe Asp Leu Val Lys 245 250 255 Val Ser Arg Ala Glu Gly Ser Ser Gly Pro Ala Arg Ser Phe Ala Asp 260 265 270 Tyr Ala Val Thr Val Gly Gln Ala Pro Glu Gly Val Glu Val Lys Glu 275 280 285 Met Leu 290 <210> 272 <211> 97 <212> DNA <213> Desulfovibrio vulgaris <220> <221> misc_feature <222> (1)..(97) <223> CRISPR, Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 272 gtcgcccccc acgcgggggc gtggattgaa accagtctcg ttaccctgtc gcggagggcg 60 tcgatgtcgc cccccacgcg ggggcgtgga ttgaaac 97 <210> 273 <211> 711 <212> DNA <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(711) <223> Cas5 <400> 273 atgcagcgtc gagcgaaagt gcaggtgaag gtgtgggggg aatatgcttg ttttacaaga 60 ccagaattta aagtcgagcg catcagttat cctgtgatga cgccgagcgc agcgcggggg 120 gtattggaag cgatcttttg gaagcccgaa tttcgctacg aggttcgaca aatcgggatt 180 ttaagtttag gggggcaaca agcgattttg cgcaacgaac tcacaagcaa gcaaaataaa 240 aacccgatcg tgattgaaag cgccagggct caacgaacga gcttgatttt aaagaacgtg 300 gcgtattgga tagttgccga tatcatttta acaaatcgag cggttgatcc agcggccaaa 360 taccgggatc agtttaaccg acgagttgaa cgaggtcagt gtcatcatac gccatattta 420 ggaacaaggg agtttgccgc ctacttttca tctatagatg aagatgatgt tgtgaagccg 480 gtcgatatgg acattggcac aatgctgttg gattttgctt ttattgaaga cggttcgaga 540 aaagaaatgg agtttctccg ttatgaagaa acggggacgc gaacggcggt tggattcgcg 600 aagccactct tttttgaggc aaaggtagaa aacggttggc tgcatgttcc aaaagaaaca 660 tatcagcagc tgtatgcatt ggagggacaa aatgctttac gagttgattg a 711 <210> 274 <211> 1776 <212> DNA <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(1776) <223> Cas8 <400> 274 atgcattgga gggacaaaat gctttacgag ttgattgagt tggcggctaa gttgcagagg 60 gaaaaaaaac taccaccgat ctcctataaa cctaaatcaa tcaattggat tattgattta 120 ggtggggatc aaccatattt gaaagggccg tttagaaggg gagaataccg tttggtggaa 180 gcgccgtttc ggttgaggca agggaaagtt acggaagaaa acgtaaagcc ttatttgttg 240 gctgatgatg gccgctatgt acttggcatc cctgaaagtc cagaaaaggc ggatgaagcg 300 gagttaatgc ataaagggta tgttcgatta attgaggaag cttatgagaa aacaaagttg 360 aaagaattaa aaaaagtgct ggattttttg tacagtccga tgaagaatgc gttccgtgag 420 caaattggtg ccaaggatat cgtgacgttt caagatgatg aggagtcatt gatttttgaa 480 aagagtgaaa ttcaaacatt ttgggctgaa tacttggcga gtgatttgct gtccgacgat 540 gaatgtgact gttctgtttg cgggaagcga tcggcttatg tacggtattt gcccaaccct 600 gtccagttat ttggacaatc gtgccaactg acgtcgttta ataacccgtc gtttgaatca 660 atgggcaaaa ctcaaacgaa taatgtacct gtctgcttcg ggtgtgctac tttggttgtc 720 gatacattga attatctcat tagggaagat caacatcata ctcccctgta tataagcgac 780 cgaaatattt tgcaatccca aatggccata tattgggttg atgaccaaat tgaggggagg 840 ggatgtatcc aacttgatga aaaattgttt gcatcgccaa tcgaacaatg gctttttgat 900 gaagatacaa atcaacggac tcctccccct gagttgaagc agctcgagga actgctggct 960 cttccgaaaa cagggcgcga gcaggcattg cacttagaca agacgttttt tcatatggct 1020 gtcctttcgg ccaataaagc gagattagtc gttcgtgaat ggattcatac gtcgatttct 1080 caattgctga tgcatttgga gaggtatgcg gccgctgtgc gcatcgttca gccgactggg 1140 gaaaaaggct atttattgcc gctggcagct ttgattcgcg ctgttgatat gtcgccgggg 1200 ctggtgcgcc aatgtttgcg cacgatttat caaggggctt tgccgcctac tgaattgctg 1260 ccgttagcgc ttcaacgttt ccgctctttg aaagtattga gtgatccgaa ggaaacgtgg 1320 agatatcatt catcagccag cttgttaaaa ctcgttctca catatggaaa ggaggaagca 1380 aatacaatgc aatcgttaaa caaccattgc ttgcagccgg cttatatttg tggacgatta 1440 ttggccgtat tggaagaaat tcaacggcgc gctttgggat accgaattgg aagcacaatc 1500 gtggatcgat tttatggcgc ggcttctaca gctccagcat cgacatttgg ttcattgctg 1560 aggctttcaa caacagctca tctgccaaaa gtgtctggtg agcttggccg tttgcttgag 1620 gaagtgatga aacagctgga tgaagctgga ggtttcccga cgattttcaa tttaagagaa 1680 caggcagagt tcgcacttgg tttttatcat caacgcgctg agttccgcag tcgccatcaa 1740 agcaatcaaa caaatggaac gggggaaagc caatga 1776 <210> 275 <211> 1116 <212> DNA <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(1116) <223> Cas7 <400> 275 atgatggagc gctatatcga tccgacaaaa cgtcatgaat ttgtgttgct ttttgatgtc 60 aaagatggga atccaaatgg ggatccagat gcgggcaaca tgccgcgtgt cgatccggaa 120 acgatgcacg gcattgtgac cgacgttgcg atcaagcgga aaattcgcga ttacgccgcg 180 atggtattag gcaaaccgat ttttattcaa agccaaacgg ctttaaacac catcattttt 240 caagcatatc aagacgtcgg agtgaaactg gcgacgattg agctgaatga agaagaaaaa 300 gaaaatgggg aattgatgaa ttggctttca cagcttgagg aacaaggatt ggtgctcgaa 360 gacaatcggg tgatctatac tggtgaggac atcaaggaga aggatattcg tgaaaaatta 420 acggaaggat tagaagaagc tggtcttaaa aaacaactgg aaaagtcatt gcgaaatatg 480 gcgaaacgtc tggcacaggc ggcaaataat atgaaaattg atgaacaaac acgccaaaat 540 gcgcaaaagg ctttatgcca aaagtactat gatgtccgca tgttcggggc tgtgatgtca 600 acaggattga atgctggtca agtgcgtggg ccgatgcagc tgacattttc tcgctcaatt 660 gacccggtat ttccatggga tttgaccatc acacgctccg cgatcaccaa agaatcggat 720 cgccgcagaa aacaaacgga aatgggaaga aaaccgttaa ttccatacgg attgtatcga 780 ttgcatggat tctacaatcc atttttagga gaaaaaacag gggttacggc agaagattta 840 gctgattttt gggatgcgct cgttcattta tttgcatttg accattctgc ggctcgagga 900 gaaatgaatg tcagagcact ctatattttt agccatgaaa atgcgaaagg atcagcgcca 960 gctcacaagc tgtttgactt ggtgaaaatc gagcgccgcc aacaggaagc tccaaggtca 1020 ttccatgact atgttttgct tggaccggca gatgaggggc agaaagacgt ttttcttgaa 1080 gggttttctg gggtcaccgt gacgcgcctc gtataa 1116 <210> 276 <211> 711 <212> DNA <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(711) <223> Cas5 <400> 276 atgcagagaa gggccaaggt gcaggtgaaa gtgtggggcg agtacgcctg ttttacacgc 60 ccagagttca aggtggagcg gatcagctat ccagtgatga ccccatccgc cgcaaggggc 120 gtgctggagg ccatcttttg gaagcccgag ttcagatacg aggtgaggca gatcggcatc 180 ctgagcctgg gaggacagca ggcaatcctg cggaacgagc tgacatccaa gcagaacaag 240 aatcctatcg tgatcgagtc tgccagggca cagcggacca gcctgatcct gaagaacgtg 300 gcctactgga tcgtggccga tatcatcctg acaaataggg cagtggaccc cgcagccaag 360 tatagagacc agttcaatcg ccgggtggag aggggacagt gccaccacac accttacctg 420 ggcacccgcg agtttgccgc ctatttcagc tccatcgacg aggacgatgt ggtgaagcca 480 gtggacatgg atatcggcac catgctgctg gatttcgcct ttatcgagga cggcagcaga 540 aaggagatgg agtttctgag atacgaggag accggaacac gcaccgcagt gggattcgca 600 aagccactgt tctttgaggc caaggtggag aacggctggc tgcacgtgcc caaggagacc 660 taccagcagc tgtatgccct ggagggccag aatgccctga gggtggatta a 711 <210> 277 <211> 1776 <212> DNA <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(1776) <223> Cas8 <400> 277 atgcactgga gagataagat gctgtatgag ctgatcgagc tggccgccaa gctgcagagg 60 gagaagaagc tgcctccaat cagctacaag cccaagtcca tcaactggat catcgatctg 120 ggaggcgacc agccttacct gaagggacca tttcgccggg gagagtatag gctggtggag 180 gcacctttcc gcctgaggca gggcaaggtg accgaggaga atgtgaagcc atacctgctg 240 gccgacgatg gcagatatgt gctgggcatc ccagagtccc ccgagaaggc agacgaggca 300 gagctgatgc acaagggcta cgtgaggctg atcgaggagg cctatgagaa gacaaagctg 360 aaggagctga agaaggtgct ggattttctg tattctccta tgaagaacgc cttccgggag 420 cagatcggcg ccaaggacat cgtgacattc caggacgatg aggagagcct gatctttgag 480 aagtccgaga tccagacctt ctgggccgag tacctggcct ccgatctgct gtctgacgat 540 gagtgcgact gtagcgtgtg cggcaagaga agcgcctacg tgaggtatct gccaaatccc 600 gtgcagctgt ttggccagtc ttgtcagctg accagcttta acaatccctc tttcgagagc 660 atgggcaaga cacagaccaa caatgtgccc gtgtgcttcg gctgtgccac actggtggtg 720 gataccctga actacctgat cagagaggac cagcaccaca cacctctgta tatctccgat 780 aggaatatcc tgcagtctca gatggccatc tactgggtgg acgatcagat cgagggcaga 840 ggctgcatcc agctggacga gaagctgttt gcctctccta tcgagcagtg gctgttcgac 900 gaggatacaa accagcgcac cccccctcca gagctgaagc agctggagga gctgctggcc 960 ctgccaaaga caggaaggga gcaggccctg cacctggaca agaccttctt tcacatggcc 1020 gtgctgtccg ccaataaggc aaggctggtg gtgcgggagt ggattcacac ctccatctct 1080 cagctgctga tgcacctgga gcggtacgca gcagccgtgc ggatcgtgca gcctacaggc 1140 gagaagggct atctgctgcc actggccgcc ctgatcaggg cagtggatat gagcccaggc 1200 ctggtgagac agtgtctgag gacaatctat cagggcgccc tgccacctac cgagctgctg 1260 cccctggccc tgcagcggtt cagaagcctg aaggtgctgt ctgaccctaa ggagacctgg 1320 agataccact ctagcgcctc tctgctgaag ctggtgctga catatggcaa ggaggaggcc 1380 aacaccatgc agagcctgaa caatcactgc ctgcagcccg cctacatctg tggcaggctg 1440 ctggccgtgc tggaggagat ccagagaagg gccctgggct accggatcgg ctctaccatc 1500 gtggatcggt tctacggagc agccagcaca gcacctgcca gcaccttcgg ctccctgctg 1560 aggctgagca ccacagcaca cctgccaaag gtgtccggcg agctgggccg gctgctggag 1620 gaagtgatga agcagctgga cgaggcagga ggatttccaa caatcttcaa tctgagggag 1680 caggcagagt ttgcactggg cttctaccac cagagggcag agttccgctc tcggcaccag 1740 agcaaccaga caaatggcac cggcgagtcc cagtaa 1776 <210> 278 <211> 1116 <212> DNA <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(1116) <223> Cas7 <400> 278 atgatggaga gatatatcga tcccaccaag aggcacgagt ttgtgctgct gttcgacgtg 60 aaggatggca accctaatgg cgacccagat gcaggaaaca tgccccgggt ggaccctgag 120 acaatgcacg gcatcgtgac cgatgtggcc atcaagagaa agatcaggga ctatgccgcc 180 atggtgctgg gcaagcctat ctttatccag tctcagacag ccctgaacac catcatcttc 240 caggcctacc aggatgtggg cgtgaagctg gccaccatcg agctgaatga ggaggagaag 300 gagaacggcg agctgatgaa ttggctgagc cagctggagg agcagggact ggtgctggag 360 gacaatagag tgatctacac aggcgaggat atcaaggaga aggacatcag ggagaagctg 420 accgagggcc tggaggaggc aggcctgaag aagcagctgg agaagagcct gcgcaacatg 480 gcaaagcggc tggcccaggc cgccaacaat atgaagatcg atgagcagac ccgccagaat 540 gcccagaagg ccctgtgcca gaagtactat gacgtgcgga tgttcggcgc cgtgatgtcc 600 acaggcctga acgcaggaca ggtgagggga ccaatgcagc tgaccttttc ccgctctatc 660 gatcccgtgt tcccatggga cctgaccatc acaagaagcg ccatcacaaa ggagtccgat 720 cggagaagga agcagaccga gatgggccgc aagcccctga tcccttacgg cctgtatcgg 780 ctgcacggct tttacaatcc cttcctgggc gagaagacag gagtgaccgc agaggacctg 840 gcagattttt gggacgccct ggtgcacctg ttcgcctttg accacagcgc cgcaagggga 900 gagatgaacg tgcgggccct gtatatcttt tcccacgaga atgccaaggg ctctgcccct 960 gcccacaagc tgttcgatct ggtgaagatc gagcgccggc agcaggaggc accaagatcc 1020 ttccacgact acgtgctgct gggaccagca gatgagggac agaaggacgt gtttctggag 1080 ggcttctctg gcgtgaccgt gacacggctg gtgtaa 1116 <210> 279 <211> 236 <212> PRT <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(236) <223> Cas5 <400> 279 Met Gln Arg Arg Ala Lys Val Gln Val Lys Val Trp Gly Glu Tyr Ala 1 5 10 15 Cys Phe Thr Arg Pro Glu Phe Lys Val Glu Arg Ile Ser Tyr Pro Val 20 25 30 Met Thr Pro Ser Ala Ala Arg Gly Val Leu Glu Ala Ile Phe Trp Lys 35 40 45 Pro Glu Phe Arg Tyr Glu Val Arg Gln Ile Gly Ile Leu Ser Leu Gly 50 55 60 Gly Gln Gln Ala Ile Leu Arg Asn Glu Leu Thr Ser Lys Gln Asn Lys 65 70 75 80 Asn Pro Ile Val Ile Glu Ser Ala Arg Ala Gln Arg Thr Ser Leu Ile 85 90 95 Leu Lys Asn Val Ala Tyr Trp Ile Val Ala Asp Ile Ile Leu Thr Asn 100 105 110 Arg Ala Val Asp Pro Ala Ala Lys Tyr Arg Asp Gln Phe Asn Arg Arg 115 120 125 Val Glu Arg Gly Gln Cys His His Thr Pro Tyr Leu Gly Thr Arg Glu 130 135 140 Phe Ala Ala Tyr Phe Ser Ser Ile Asp Glu Asp Asp Val Val Lys Pro 145 150 155 160 Val Asp Met Asp Ile Gly Thr Met Leu Leu Asp Phe Ala Phe Ile Glu 165 170 175 Asp Gly Ser Arg Lys Glu Met Glu Phe Leu Arg Tyr Glu Glu Thr Gly 180 185 190 Thr Arg Thr Ala Val Gly Phe Ala Lys Pro Leu Phe Phe Glu Ala Lys 195 200 205 Val Glu Asn Gly Trp Leu His Val Pro Lys Glu Thr Tyr Gln Gln Leu 210 215 220 Tyr Ala Leu Glu Gly Gln Asn Ala Leu Arg Val Asp 225 230 235 <210> 280 <211> 591 <212> PRT <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(591) <223> Cas8 <400> 280 Met His Trp Arg Asp Lys Met Leu Tyr Glu Leu Ile Glu Leu Ala Ala 1 5 10 15 Lys Leu Gln Arg Glu Lys Lys Leu Pro Pro Ile Ser Tyr Lys Pro Lys 20 25 30 Ser Ile Asn Trp Ile Ile Asp Leu Gly Gly Asp Gln Pro Tyr Leu Lys 35 40 45 Gly Pro Phe Arg Arg Gly Glu Tyr Arg Leu Val Glu Ala Pro Phe Arg 50 55 60 Leu Arg Gln Gly Lys Val Thr Glu Glu Asn Val Lys Pro Tyr Leu Leu 65 70 75 80 Ala Asp Asp Gly Arg Tyr Val Leu Gly Ile Pro Glu Ser Pro Glu Lys 85 90 95 Ala Asp Glu Ala Glu Leu Met His Lys Gly Tyr Val Arg Leu Ile Glu 100 105 110 Glu Ala Tyr Glu Lys Thr Lys Leu Lys Glu Leu Lys Lys Val Leu Asp 115 120 125 Phe Leu Tyr Ser Pro Met Lys Asn Ala Phe Arg Glu Gln Ile Gly Ala 130 135 140 Lys Asp Ile Val Thr Phe Gln Asp Asp Glu Glu Ser Leu Ile Phe Glu 145 150 155 160 Lys Ser Glu Ile Gln Thr Phe Trp Ala Glu Tyr Leu Ala Ser Asp Leu 165 170 175 Leu Ser Asp Asp Glu Cys Asp Cys Ser Val Cys Gly Lys Arg Ser Ala 180 185 190 Tyr Val Arg Tyr Leu Pro Asn Pro Val Gln Leu Phe Gly Gln Ser Cys 195 200 205 Gln Leu Thr Ser Phe Asn Asn Pro Ser Phe Glu Ser Met Gly Lys Thr 210 215 220 Gln Thr Asn Asn Val Pro Val Cys Phe Gly Cys Ala Thr Leu Val Val 225 230 235 240 Asp Thr Leu Asn Tyr Leu Ile Arg Glu Asp Gln His His Thr Pro Leu 245 250 255 Tyr Ile Ser Asp Arg Asn Ile Leu Gln Ser Gln Met Ala Ile Tyr Trp 260 265 270 Val Asp Asp Gln Ile Glu Gly Arg Gly Cys Ile Gln Leu Asp Glu Lys 275 280 285 Leu Phe Ala Ser Pro Ile Glu Gln Trp Leu Phe Asp Glu Asp Thr Asn 290 295 300 Gln Arg Thr Pro Pro Pro Glu Leu Lys Gln Leu Glu Glu Leu Leu Ala 305 310 315 320 Leu Pro Lys Thr Gly Arg Glu Gln Ala Leu His Leu Asp Lys Thr Phe 325 330 335 Phe His Met Ala Val Leu Ser Ala Asn Lys Ala Arg Leu Val Val Arg 340 345 350 Glu Trp Ile His Thr Ser Ile Ser Gln Leu Leu Met His Leu Glu Arg 355 360 365 Tyr Ala Ala Ala Val Arg Ile Val Gln Pro Thr Gly Glu Lys Gly Tyr 370 375 380 Leu Leu Pro Leu Ala Ala Leu Ile Arg Ala Val Asp Met Ser Pro Gly 385 390 395 400 Leu Val Arg Gln Cys Leu Arg Thr Ile Tyr Gln Gly Ala Leu Pro Pro 405 410 415 Thr Glu Leu Leu Pro Leu Ala Leu Gln Arg Phe Arg Ser Leu Lys Val 420 425 430 Leu Ser Asp Pro Lys Glu Thr Trp Arg Tyr His Ser Ser Ala Ser Leu 435 440 445 Leu Lys Leu Val Leu Thr Tyr Gly Lys Glu Glu Ala Asn Thr Met Gln 450 455 460 Ser Leu Asn Asn His Cys Leu Gln Pro Ala Tyr Ile Cys Gly Arg Leu 465 470 475 480 Leu Ala Val Leu Glu Glu Ile Gln Arg Arg Ala Leu Gly Tyr Arg Ile 485 490 495 Gly Ser Thr Ile Val Asp Arg Phe Tyr Gly Ala Ala Ser Thr Ala Pro 500 505 510 Ala Ser Thr Phe Gly Ser Leu Leu Arg Leu Ser Thr Thr Ala His Leu 515 520 525 Pro Lys Val Ser Gly Glu Leu Gly Arg Leu Leu Glu Glu Val Met Lys 530 535 540 Gln Leu Asp Glu Ala Gly Gly Phe Pro Thr Ile Phe Asn Leu Arg Glu 545 550 555 560 Gln Ala Glu Phe Ala Leu Gly Phe Tyr His Gln Arg Ala Glu Phe Arg 565 570 575 Ser Arg His Gln Ser Asn Gln Thr Asn Gly Thr Gly Glu Ser Gln 580 585 590 <210> 281 <211> 371 <212> PRT <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(371) <223> Cas7 <400> 281 Met Met Glu Arg Tyr Ile Asp Pro Thr Lys Arg His Glu Phe Val Leu 1 5 10 15 Leu Phe Asp Val Lys Asp Gly Asn Pro Asn Gly Asp Pro Asp Ala Gly 20 25 30 Asn Met Pro Arg Val Asp Pro Glu Thr Met His Gly Ile Val Thr Asp 35 40 45 Val Ala Ile Lys Arg Lys Ile Arg Asp Tyr Ala Ala Met Val Leu Gly 50 55 60 Lys Pro Ile Phe Ile Gln Ser Gln Thr Ala Leu Asn Thr Ile Ile Phe 65 70 75 80 Gln Ala Tyr Gln Asp Val Gly Val Lys Leu Ala Thr Ile Glu Leu Asn 85 90 95 Glu Glu Glu Lys Glu Asn Gly Glu Leu Met Asn Trp Leu Ser Gln Leu 100 105 110 Glu Glu Gln Gly Leu Val Leu Glu Asp Asn Arg Val Ile Tyr Thr Gly 115 120 125 Glu Asp Ile Lys Glu Lys Asp Ile Arg Glu Lys Leu Thr Glu Gly Leu 130 135 140 Glu Glu Ala Gly Leu Lys Lys Gln Leu Glu Lys Ser Leu Arg Asn Met 145 150 155 160 Ala Lys Arg Leu Ala Gln Ala Ala Asn Asn Met Lys Ile Asp Glu Gln 165 170 175 Thr Arg Gln Asn Ala Gln Lys Ala Leu Cys Gln Lys Tyr Tyr Asp Val 180 185 190 Arg Met Phe Gly Ala Val Met Ser Thr Gly Leu Asn Ala Gly Gln Val 195 200 205 Arg Gly Pro Met Gln Leu Thr Phe Ser Arg Ser Ile Asp Pro Val Phe 210 215 220 Pro Trp Asp Leu Thr Ile Thr Arg Ser Ala Ile Thr Lys Glu Ser Asp 225 230 235 240 Arg Arg Arg Lys Gln Thr Glu Met Gly Arg Lys Pro Leu Ile Pro Tyr 245 250 255 Gly Leu Tyr Arg Leu His Gly Phe Tyr Asn Pro Phe Leu Gly Glu Lys 260 265 270 Thr Gly Val Thr Ala Glu Asp Leu Ala Asp Phe Trp Asp Ala Leu Val 275 280 285 His Leu Phe Ala Phe Asp His Ser Ala Ala Arg Gly Glu Met Asn Val 290 295 300 Arg Ala Leu Tyr Ile Phe Ser His Glu Asn Ala Lys Gly Ser Ala Pro 305 310 315 320 Ala His Lys Leu Phe Asp Leu Val Lys Ile Glu Arg Arg Gln Gln Glu 325 330 335 Ala Pro Arg Ser Phe His Asp Tyr Val Leu Leu Gly Pro Ala Asp Glu 340 345 350 Gly Gln Lys Asp Val Phe Leu Glu Gly Phe Ser Gly Val Thr Val Thr 355 360 365 Arg Leu Val 370 <210> 282 <211> 111 <212> DNA <213> Geobacillus thermocatenulatus strain KCTC 3921 <220> <221> misc_feature <222> (1)..(111) <223> CRISPR <400> 282 gttgcacccg gctattaagc cgggtgagga ttgaaactat atcacacagc ttcttagtat 60 catcgacaac acgtgttgca cccggctatt aagccgggtg aggattgaaa c 111 <210> 283 <211> 1263 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(1263) <223> Cas8 <400> 283 gtgatagatc cagtaatagc cgcctttttt gcggaacgta aagaagcatg gctaaagaag 60 aatatcagtg cagcgatgtc tgatgcagaa gtcttggaaa aacaacagga gtgtgagcaa 120 aactttctat tagacaattg gttgcctgat gcggccaaaa gggcggggca aatttcagtg 180 gcttcacatc cttgtacctt tagtcatccg agtgcgcgga aaaacaaaaa tggctacgta 240 tcgtccatta ttgccaagaa caaaccaaga atagatggtt ttcttcgctc tggtaatgtg 300 agtgttgagc cagatgcact tggtaacgca gcagcattag atgtatacaa gtttctcagc 360 ttagagatga gcgaccaacg ttctttattg gtgcatattg aacaagaaag cgagttagca 420 aggcaattgc ttgatatacc aagttgtgaa tatcaggcgc tacgcgatgg ctttttaaaa 480 atggtcgata gcgatcaggc gtctgtttcc agctcgaaga ttaagcaagt ttatttcccg 540 atagccgatg gggaatatca tttattgtcg ttattaaccc attccggcca tctttttgaa 600 ttgcgtaaac gtctagatgc acttcgattt ggtgatgcgg taaaagaggc aagagagtgc 660 aaaaaaacga atcactttca ccccgcgggt taccaagaga tctttggtct caccacgatt 720 gggtttggcg gcacaaaacc gcaaaatatc agcgtgctca ataaccaaaa cgcaggtaaa 780 gcacatttac tagcctctat tccacctgag ttaacacctc gcgatattcg tctgccgaaa 840 acggattttt tcaaagagag ttttaacgct tggcaagcca aagaagtact tgaatcgttg 900 catcgactct ttcaaaccga ctgcaacaac atcaatctcc gtgatggccg tgactaccgc 960 attcagcaat acgtagattt ggtgattgaa aaaatgtggc aagtacgcct gtttcttgaa 1020 gcgtattccg gtgaactatc gagtgcgttg ccgttggagc aaaaaatctg gctctatcca 1080 gagtttgctg agcagcgtca gcaagaggat gagtggctcg ataaaatcat tcgccacatt 1140 gcgcgaggct taatcaacca ttacagccgc agcaaagtga tcactaatcc cgtcacattg 1200 gcagaccaag agctgctggc gatagaagag gtggttgcca gcaataagga gaacttgcga 1260 tga 1263 <210> 284 <211> 888 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(888) <223> Cas5 <400> 284 atgaacgtat tgatcttacc gcatcttaaa attcacaacg ccaatgcact ttcaagcccc 60 tttactgttg gctttcctgc catgacggca tggctaggct ttgtacatgc cttagagcgc 120 aagctcagcc aagcagggtt atccgatctc atgctgcata gtactgctgt agtgagccac 180 cgttgtgatg tacagactca taaaggcgaa ggtgactttg ttcattcaat tatcggtact 240 gccaatccac tcgataagga tggttcacgc tcggcattta tcgaggaagc acgctgtcat 300 ttagatgtgt cccttgtcat tgagtggagt ggcaatgaag agcaagttca acagccagag 360 tttaccgagc agttgcaagc agtgatcgcg acgatgaaag tcgcaggggg cgacgttctt 420 gccgttggga agccctcagt taaatctgtg atcactgagg atgatactgg cagagttctg 480 cgccagttaa tgcctggtta tgtgctgatc gaacgccgcg atttaatgat tgacgccatg 540 cagcaaggtg atgacgcaat agatgcgctg ctgggttacc tcacagtgca ccaccattgt 600 gagcagcttg aagaccaaag tgttgtttgg catagccagc gcaaaacgag tggctggatt 660 gtgccgattg ccactggttt tcaaggtatt tcaccgttag gtgaggcaaa aaatcagcgc 720 gatccatcag tgccgcatcg ctttgctgaa agtgtggtca cgctgggtga atttgtcatg 780 gtgcacaaaa tcaaacatct cgatgacatc ctttggcaat accacccgga tttagaaaac 840 gatctttacc tttgtcagaa agttaacgct atcaacgaac atcaataa 888 <210> 285 <211> 1032 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(1032) <223> Cas7 <400> 285 atggctaaaa ataacgacat cgcatcagta ctcgcatttg aaaaaaaact agtcccatcg 60 gatggctacc tctttggatg tcagtgggaa accaaagagc aagcaacccc attaaccctg 120 caagagaaat cagtacgtgg cactatctcc aaccgtttaa aagccgcagt acaaaatgat 180 cccgctaagc ttaatgcgga agttgaaaaa gcaaacttgc agcgagtgga tgcctgtgcg 240 ttggggcagg atcacgatac tttgaagcta catttcacac tcaaagtatt agggggactt 300 gcccaacctt cggcgtgtaa caatgcgctg ttcaaacaga gctacagtac tgcggtttcg 360 cagtacatta ccaaatatgg ctgtttcgaa ttggcgaaac gttatgccac caaccttgcc 420 aatgcccgtt ttctatggcg caaccgcgtt ggcgcagaag agattgaagt gcaagtcaaa 480 gcattaaaca aaggggctga gcagacttgg acttttaatg ccaaacaatt cagtactcgc 540 cactttgatc ataacgactc acagctcaat agtctggccg acagaattgc tcaggcactg 600 gccagcgaaa cagatcattt gatgttgcaa attgactgct atgccaaagt cggtaaagcc 660 caagaagttt accccagtga agagttagtg ctcgataagg gcaacagcaa aaccaagaaa 720 agtaaaatcc tgtatgcagt taatgagcat gctgcgatgc attcacaaaa aattggtaac 780 gcactgcgtt ccattgatac ttggtaccca gattacgcat ctgaggagca aagtgcagga 840 gccattgcga ttgaacccta tggcgctgtt accaatttag gaaaggcgtt ccgcacaccg 900 aaagataagc aagattttta cactttcttt gataaatggg cgcgtggtga aagtttgccc 960 cgtgaagaag atgagcatta cgtcatggcg gtattggtgc gtggtggtgt atttggcgaa 1020 agtgacaaat ag 1032 <210> 286 <211> 639 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(639) <223> Cas6 <400> 286 atgaactact accaagagat cacgttattg ccagatgccg acattgcctt gggctttctt 60 tggcaaaacg tctttcaaca agtgcacatt gctttagtgg agcacaaagt ggcgagcaac 120 caatctctgg ttgcggtcgg ttttcctgat tatcgccaag caaagtttcc gctcggcgca 180 aagctgcgtc tctttgcaaa agagcaagta acactggaaa agttggatat ccaccgctgg 240 ctaactcggc tagaagacta tgtgcacatc aaaggggtca aacccgtacc aagcgatgta 300 acttatgtaa gctttgtacg caagcaggtg aaatcgcccg aacgaataga gcgggatatg 360 cagcaaaaag ccgaactatg ggcagcaaaa tctggtaaac cgctggtgga atgtttagtg 420 gatttacaac aaagcaagcc gacagcgttg tgctccttgc cctttattta cttgcatagc 480 cagcaaacca agcaacgttc accagaaaaa aacagcaagt tcccgctgtt tattgagatg 540 cagcagcaaa gcacatctca agatgggggc ttcgattgct atggtttgag tagcaaagcg 600 aatgggcagt caatgttggc tactgtaccg cacttttaa 639 <210> 287 <211> 1263 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(1263) <223> Cas8 <400> 287 atgatcgacc cagtgatcgc cgccttcttt gccgagagga aggaggcctg gctgaagaag 60 aatatcagcg ccgcaatgtc cgatgcagag gtgctggaga agcagcagga gtgcgagcag 120 aacttcctgc tggacaattg gctgcccgat gcagcaaaga gggcaggaca gatctctgtg 180 gccagccacc catgtacatt ttcccacccc tctgcccgca agaacaagaa tggctacgtg 240 tcctctatca tcgccaagaa caagccacgc atcgacggct tcctgcggtc tggcaacgtg 300 agcgtggagc cagacgccct gggaaatgca gccgccctgg acgtgtacaa gtttctgtcc 360 ctggagatgt ctgatcagcg cagcctgctg gtgcacatcg agcaggagag cgagctggcc 420 aggcagctgc tggacatccc ttcctgcgag tatcaggccc tgagagatgg cttcctgaag 480 atggtggact ccgatcaggc ctctgtgagc tcctctaaga tcaagcaggt gtactttcca 540 atcgccgacg gcgagtatca cctgctgtcc ctgctgaccc actctggcca cctgttcgag 600 ctgaggaagc gcctggacgc cctgaggttt ggcgatgccg tgaaggaggc ccgggagtgt 660 aagaagacca accacttcca cccagccggc taccaggaga tcttcggcct gaccacaatc 720 ggctttggcg gcacaaagcc ccagaacatc agcgtgctga acaatcagaa tgcaggcaag 780 gcacacctgc tggcctccat cccccctgag ctgacccctc gggacatcag actgccaaag 840 acagatttct ttaaggagtc cttcaacgcc tggcaggcca aggaggtgct ggagtctctg 900 cacagactgt ttcagaccga ctgcaacaat atcaatctga gggacggccg cgattacaga 960 atccagcagt atgtggacct ggtcatcgag aagatgtggc aggtgaggct gttcctggag 1020 gcctacagcg gcgagctgag ctccgccctg cctctggagc agaagatctg gctgtatcca 1080 gagtttgcag agcagaggca gcaggaggac gagtggctgg ataagatcat ccgccacatc 1140 gcccggggcc tgatcaacca ctacagccgg tccaaagtga tcaccaatcc tgtgacactg 1200 gccgaccagg agctgctggc catcgaggag gtggtggcct ccaacaagga gaatctgaga 1260 taa 1263 <210> 288 <211> 888 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(888) <223> Cas5 <400> 288 atgaatgtgc tgatcctgcc tcacctgaag atccacaacg ccaatgccct gtctagcccc 60 tttaccgtgg gcttccctgc catgacagca tggctgggat tcgtgcacgc cctggagaga 120 aagctgtccc aggccggcct gtctgatctg atgctgcaca gcaccgcagt ggtgtcccac 180 aggtgcgacg tgcagacaca caagggcgag ggcgatttcg tgcacagcat catcggcacc 240 gccaaccccc tggacaagga tggcagccgc tccgccttta tcgaggaggc ccggtgtcac 300 ctggacgtga gcctggtcat cgagtggtcc ggcaatgagg agcaggtgca gcagcctgag 360 tttaccgagc agctgcaggc cgtgatcgcc acaatgaagg tggcaggagg cgatgtgctg 420 gccgtgggca agccttccgt gaagtctgtg atcaccgagg acgatacagg cagggtgctg 480 aggcagctga tgccaggata cgtgctgatc gagcggagag acctgatgat cgatgccatg 540 cagcagggcg acgatgcaat cgacgccctg ctgggctatc tgaccgtgca ccaccactgc 600 gagcagctgg aggatcagtc tgtggtgtgg cacagccagc ggaagacctc cggctggatc 660 gtgcccatcg ccacaggctt ccagggcatc tcccctctgg gcgaggccaa gaaccagaga 720 gaccctagcg tgccacacag gttcgcagag tccgtggtga ccctgggaga gtttgtgatg 780 gtgcacaaga tcaagcacct ggacgatatc ctgtggcagt accacccaga cctggagaac 840 gatctgtatc tgtgccagaa ggtgaacgcc atcaatgagc accagtaa 888 <210> 289 <211> 1032 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(1032) <223> Cas7 <400> 289 atggccaaga acaatgacat cgcctctgtg ctggccttcg agaagaagct ggtgcctagc 60 gatggctacc tgtttggctg ccagtgggag accaaggagc aggccacccc actgacactg 120 caggagaaga gcgtgagagg cacaatctcc aacaggctga aggccgccgt gcagaacgac 180 cctgccaagc tgaatgccga ggtggagaag gccaatctgc agcgggtgga tgcctgtgca 240 ctgggacagg accacgatac cctgaagctg cacttcacac tgaaggtgct gggaggcctg 300 gcccagccat ctgcctgcaa caatgccctg tttaagcagt cttacagcac cgccgtgagc 360 cagtacatca caaagtatgg ctgtttcgag ctggccaaga gatatgccac caacctggcc 420 aatgccaggt ttctgtggcg gaacagagtg ggcgccgagg agatcgaggt gcaggtgaag 480 gccctgaaca agggcgccga gcagacctgg accttcaacg ccaagcagtt ctctaccagg 540 cactttgacc acaacgatag ccagctgaat tccctggccg acaggatcgc acaggccctg 600 gccagcgaga cagaccacct gatgctgcag atcgattgct acgccaaagt gggcaaggcc 660 caggaggtgt atccctccga ggagctggtg ctggataagg gcaacagcaa gaccaagaag 720 tccaagatcc tgtacgccgt gaacgagcac gccgccatgc actctcagaa gatcggcaat 780 gccctgcgca gcatcgacac atggtaccct gattatgcct ctgaggagca gagcgccgga 840 gcaatcgcaa tcgagcccta cggcgccgtg accaatctgg gcaaggcctt cagaacccct 900 aaggacaagc aggacttcta caccttcttt gacaagtggg caaggggaga gagcctgcct 960 agggaggagg atgagcacta cgtgatggcc gtgctggtgc ggggaggcgt gttcggagag 1020 tccgacaagt aa 1032 <210> 290 <211> 639 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(639) <223> Cas6 <400> 290 atgaattact atcaggagat cacactgctg cccgacgcag atatcgccct gggcttcctg 60 tggcagaacg tgtttcagca ggtgcacatc gccctggtgg agcacaaggt ggcctctaat 120 cagagcctgg tggccgtggg cttccctgac tacagacagg ccaagtttcc actgggcgcc 180 aagctgaggc tgttcgccaa ggagcaggtg accctggaga agctggacat ccacagatgg 240 ctgacaaggc tggaggatta cgtgcacatc aagggcgtga agccagtgcc ctctgacgtg 300 acctatgtga gctttgtgag aaagcaggtg aagtcccccg agcggatcga gagagatatg 360 cagcagaagg ccgagctgtg ggccgccaag tctggcaagc ctctggtgga gtgcctggtg 420 gacctgcagc agtccaagcc caccgccctg tgctctctgc ctttcatcta cctgcacagc 480 cagcagacaa agcagaggtc tccagagaag aacagcaagt ttcccctgtt catcgagatg 540 cagcagcagt ccacatctca ggacggcggc ttcgattgct atggcctgag ctccaaggcc 600 aatggccaga gcatgctggc caccgtgcca cacttttaa 639 <210> 291 <211> 420 <212> PRT <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(420) <223> Cas8 <400> 291 Met Ile Asp Pro Val Ile Ala Ala Phe Phe Ala Glu Arg Lys Glu Ala 1 5 10 15 Trp Leu Lys Lys Asn Ile Ser Ala Ala Met Ser Asp Ala Glu Val Leu 20 25 30 Glu Lys Gln Gln Glu Cys Glu Gln Asn Phe Leu Leu Asp Asn Trp Leu 35 40 45 Pro Asp Ala Ala Lys Arg Ala Gly Gln Ile Ser Val Ala Ser His Pro 50 55 60 Cys Thr Phe Ser His Pro Ser Ala Arg Lys Asn Lys Asn Gly Tyr Val 65 70 75 80 Ser Ser Ile Ile Ala Lys Asn Lys Pro Arg Ile Asp Gly Phe Leu Arg 85 90 95 Ser Gly Asn Val Ser Val Glu Pro Asp Ala Leu Gly Asn Ala Ala Ala 100 105 110 Leu Asp Val Tyr Lys Phe Leu Ser Leu Glu Met Ser Asp Gln Arg Ser 115 120 125 Leu Leu Val His Ile Glu Gln Glu Ser Glu Leu Ala Arg Gln Leu Leu 130 135 140 Asp Ile Pro Ser Cys Glu Tyr Gln Ala Leu Arg Asp Gly Phe Leu Lys 145 150 155 160 Met Val Asp Ser Asp Gln Ala Ser Val Ser Ser Ser Lys Ile Lys Gln 165 170 175 Val Tyr Phe Pro Ile Ala Asp Gly Glu Tyr His Leu Leu Ser Leu Leu 180 185 190 Thr His Ser Gly His Leu Phe Glu Leu Arg Lys Arg Leu Asp Ala Leu 195 200 205 Arg Phe Gly Asp Ala Val Lys Glu Ala Arg Glu Cys Lys Lys Thr Asn 210 215 220 His Phe His Pro Ala Gly Tyr Gln Glu Ile Phe Gly Leu Thr Thr Ile 225 230 235 240 Gly Phe Gly Gly Thr Lys Pro Gln Asn Ile Ser Val Leu Asn Asn Gln 245 250 255 Asn Ala Gly Lys Ala His Leu Leu Ala Ser Ile Pro Pro Glu Leu Thr 260 265 270 Pro Arg Asp Ile Arg Leu Pro Lys Thr Asp Phe Phe Lys Glu Ser Phe 275 280 285 Asn Ala Trp Gln Ala Lys Glu Val Leu Glu Ser Leu His Arg Leu Phe 290 295 300 Gln Thr Asp Cys Asn Asn Ile Asn Leu Arg Asp Gly Arg Asp Tyr Arg 305 310 315 320 Ile Gln Gln Tyr Val Asp Leu Val Ile Glu Lys Met Trp Gln Val Arg 325 330 335 Leu Phe Leu Glu Ala Tyr Ser Gly Glu Leu Ser Ser Ala Leu Pro Leu 340 345 350 Glu Gln Lys Ile Trp Leu Tyr Pro Glu Phe Ala Glu Gln Arg Gln Gln 355 360 365 Glu Asp Glu Trp Leu Asp Lys Ile Ile Arg His Ile Ala Arg Gly Leu 370 375 380 Ile Asn His Tyr Ser Arg Ser Lys Val Ile Thr Asn Pro Val Thr Leu 385 390 395 400 Ala Asp Gln Glu Leu Leu Ala Ile Glu Glu Val Val Ala Ser Asn Lys 405 410 415 Glu Asn Leu Arg 420 <210> 292 <211> 295 <212> PRT <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(295) <223> Cas5 <400> 292 Met Asn Val Leu Ile Leu Pro His Leu Lys Ile His Asn Ala Asn Ala 1 5 10 15 Leu Ser Ser Pro Phe Thr Val Gly Phe Pro Ala Met Thr Ala Trp Leu 20 25 30 Gly Phe Val His Ala Leu Glu Arg Lys Leu Ser Gln Ala Gly Leu Ser 35 40 45 Asp Leu Met Leu His Ser Thr Ala Val Val Ser His Arg Cys Asp Val 50 55 60 Gln Thr His Lys Gly Glu Gly Asp Phe Val His Ser Ile Ile Gly Thr 65 70 75 80 Ala Asn Pro Leu Asp Lys Asp Gly Ser Arg Ser Ala Phe Ile Glu Glu 85 90 95 Ala Arg Cys His Leu Asp Val Ser Leu Val Ile Glu Trp Ser Gly Asn 100 105 110 Glu Glu Gln Val Gln Gln Pro Glu Phe Thr Glu Gln Leu Gln Ala Val 115 120 125 Ile Ala Thr Met Lys Val Ala Gly Gly Asp Val Leu Ala Val Gly Lys 130 135 140 Pro Ser Val Lys Ser Val Ile Thr Glu Asp Asp Thr Gly Arg Val Leu 145 150 155 160 Arg Gln Leu Met Pro Gly Tyr Val Leu Ile Glu Arg Arg Asp Leu Met 165 170 175 Ile Asp Ala Met Gln Gln Gly Asp Asp Ala Ile Asp Ala Leu Leu Gly 180 185 190 Tyr Leu Thr Val His His His Cys Glu Gln Leu Glu Asp Gln Ser Val 195 200 205 Val Trp His Ser Gln Arg Lys Thr Ser Gly Trp Ile Val Pro Ile Ala 210 215 220 Thr Gly Phe Gln Gly Ile Ser Pro Leu Gly Glu Ala Lys Asn Gln Arg 225 230 235 240 Asp Pro Ser Val Pro His Arg Phe Ala Glu Ser Val Val Thr Leu Gly 245 250 255 Glu Phe Val Met Val His Lys Ile Lys His Leu Asp Asp Ile Leu Trp 260 265 270 Gln Tyr His Pro Asp Leu Glu Asn Asp Leu Tyr Leu Cys Gln Lys Val 275 280 285 Asn Ala Ile Asn Glu His Gln 290 295 <210> 293 <211> 343 <212> PRT <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(343) <223> Cas7 <400> 293 Met Ala Lys Asn Asn Asp Ile Ala Ser Val Leu Ala Phe Glu Lys Lys 1 5 10 15 Leu Val Pro Ser Asp Gly Tyr Leu Phe Gly Cys Gln Trp Glu Thr Lys 20 25 30 Glu Gln Ala Thr Pro Leu Thr Leu Gln Glu Lys Ser Val Arg Gly Thr 35 40 45 Ile Ser Asn Arg Leu Lys Ala Ala Val Gln Asn Asp Pro Ala Lys Leu 50 55 60 Asn Ala Glu Val Glu Lys Ala Asn Leu Gln Arg Val Asp Ala Cys Ala 65 70 75 80 Leu Gly Gln Asp His Asp Thr Leu Lys Leu His Phe Thr Leu Lys Val 85 90 95 Leu Gly Gly Leu Ala Gln Pro Ser Ala Cys Asn Asn Ala Leu Phe Lys 100 105 110 Gln Ser Tyr Ser Thr Ala Val Ser Gln Tyr Ile Thr Lys Tyr Gly Cys 115 120 125 Phe Glu Leu Ala Lys Arg Tyr Ala Thr Asn Leu Ala Asn Ala Arg Phe 130 135 140 Leu Trp Arg Asn Arg Val Gly Ala Glu Glu Ile Glu Val Gln Val Lys 145 150 155 160 Ala Leu Asn Lys Gly Ala Glu Gln Thr Trp Thr Phe Asn Ala Lys Gln 165 170 175 Phe Ser Thr Arg His Phe Asp His Asn Asp Ser Gln Leu Asn Ser Leu 180 185 190 Ala Asp Arg Ile Ala Gln Ala Leu Ala Ser Glu Thr Asp His Leu Met 195 200 205 Leu Gln Ile Asp Cys Tyr Ala Lys Val Gly Lys Ala Gln Glu Val Tyr 210 215 220 Pro Ser Glu Glu Leu Val Leu Asp Lys Gly Asn Ser Lys Thr Lys Lys 225 230 235 240 Ser Lys Ile Leu Tyr Ala Val Asn Glu His Ala Ala Met His Ser Gln 245 250 255 Lys Ile Gly Asn Ala Leu Arg Ser Ile Asp Thr Trp Tyr Pro Asp Tyr 260 265 270 Ala Ser Glu Glu Gln Ser Ala Gly Ala Ile Ala Ile Glu Pro Tyr Gly 275 280 285 Ala Val Thr Asn Leu Gly Lys Ala Phe Arg Thr Pro Lys Asp Lys Gln 290 295 300 Asp Phe Tyr Thr Phe Phe Asp Lys Trp Ala Arg Gly Glu Ser Leu Pro 305 310 315 320 Arg Glu Glu Asp Glu His Tyr Val Met Ala Val Leu Val Arg Gly Gly 325 330 335 Val Phe Gly Glu Ser Asp Lys 340 <210> 294 <211> 212 <212> PRT <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(212) <223> Cas6 <400> 294 Met Asn Tyr Tyr Gln Glu Ile Thr Leu Leu Pro Asp Ala Asp Ile Ala 1 5 10 15 Leu Gly Phe Leu Trp Gln Asn Val Phe Gln Gln Val His Ile Ala Leu 20 25 30 Val Glu His Lys Val Ala Ser Asn Gln Ser Leu Val Ala Val Gly Phe 35 40 45 Pro Asp Tyr Arg Gln Ala Lys Phe Pro Leu Gly Ala Lys Leu Arg Leu 50 55 60 Phe Ala Lys Glu Gln Val Thr Leu Glu Lys Leu Asp Ile His Arg Trp 65 70 75 80 Leu Thr Arg Leu Glu Asp Tyr Val His Ile Lys Gly Val Lys Pro Val 85 90 95 Pro Ser Asp Val Thr Tyr Val Ser Phe Val Arg Lys Gln Val Lys Ser 100 105 110 Pro Glu Arg Ile Glu Arg Asp Met Gln Gln Lys Ala Glu Leu Trp Ala 115 120 125 Ala Lys Ser Gly Lys Pro Leu Val Glu Cys Leu Val Asp Leu Gln Gln 130 135 140 Ser Lys Pro Thr Ala Leu Cys Ser Leu Pro Phe Ile Tyr Leu His Ser 145 150 155 160 Gln Gln Thr Lys Gln Arg Ser Pro Glu Lys Asn Ser Lys Phe Pro Leu 165 170 175 Phe Ile Glu Met Gln Gln Gln Ser Thr Ser Gln Asp Gly Gly Phe Asp 180 185 190 Cys Tyr Gly Leu Ser Ser Lys Ala Asn Gly Gln Ser Met Leu Ala Thr 195 200 205 Val Pro His Phe 210 <210> 295 <211> 88 <212> DNA <213> Vibrio cholerae strain L15 <220> <221> misc_feature <222> (1)..(88) <223> CRISPR <400> 295 gttcactgcc gtacaggcag cttagaaaaa tatgcagggg tttgaaacgc tcgatgttat 60 gttcactgcc gtacaggcag cttagaaa 88 <210> 296 <211> 1314 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(1314) <223> Cas8 <400> 296 atgacaaccg aagcactgac tcacttcatc atcgactaca tcgcttcacg aaagcagccc 60 aaattagacg cctttgaaaa agaggcggcg aaacggttgg ctcaaggcga ggatgctggc 120 gctatcgcgc aggagcgtca ggagcttgaa gtgaagtatc agccgcgcaa ctggctgacg 180 gatgcggcaa gacgtgctgg gcaaatcagc cttgtcactc atgcggcgaa gtttacccac 240 ggtgactcaa aaagcagcag catttaccgc gaaacggtgg gcgatgaggg ctatttaagt 300 acagctgtgc tggctaacgt ggcggcggat gcggtgggca acgcggctgc tctggacgtg 360 gcaaaactgc tgcaaaccga agtgggcggc gattcgctgc tggcctgcct gaaacgcggc 420 gatcgtagtc cgctgatggg ctttgctgaa aacgacgccc agctggcact gtggatggaa 480 ggattctctc aggcgttaac gcctgctcaa cccacctcgc ataagcttgc caaacagatt 540 tactttccag tcgatggcgg ctatcacctg ctatctccgc tatttgcctc ctcgctggcg 600 caggcgatgc atgaaaaaat ggtggcagca cgatttggcg aacaagcaaa agccgcgcgt 660 gaagctcgcc gggcgggtaa atggcatgcg cagcccgatg tgcgctatcc gaatgttgcc 720 gaaatgcatt ttggcggcac taaaccgcag aatatttcgg cgttaaacag ctcgcgcggt 780 gggcgggtct ggctgctgcc gtcgcagccg ccaaaatgga caatgctcga taaggcgccg 840 caaaatctga ctagtctctt tgcactacgc ggcgatttta accgagcggc aaccgacact 900 gtttcccgga tggtttctct acttaaagag aagactgata acaataatcg ccatatccgc 960 aacgctcggg cgggttatgt tgatgaactg attgatttgt tatttcttca tgcagcgacg 1020 taccagcagg aagcgtggca gggatggacg cttaacagcc cggatttacc tctccaccag 1080 cagctttggc tcgatccctg gcgtagcaaa acagacgaga cattccgctc tgagcgtgaa 1140 aaaggcgact ggcaacgaag cgtcgcggat gacttcgcgc gctggctgaa ctatcgcctg 1200 aataaagcgc gtctcgatgt ggggatcgcc gagcgccgtg agtggcaaac tcagcgtctg 1260 tttagtcaac ggatgcggga aatggaagct attgtgcagg aggcgctgaa atga 1314 <210> 297 <211> 936 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(936) <223> Cas5 <400> 297 atgagctatc tgcttttatt gccccatatt cgcatcgaaa acgcaaatgc ggtggcagga 60 ttaacctggg gattccccgc tattacccac tttttagggt atgttcatgc gctttcccgc 120 agggtgagcg aatttggcgt ctctttcacc ggctgcgcgg tgattaatca tgaacaccat 180 attcaggcct attcctccgg gcgcgactat caatttgcgc tgactcgtaa tccgctgacc 240 aaagaaggta aaaccgctgc ctttaacgaa gaggggcgaa tgcatcttac cgtctctttg 300 cttgttgaat gccagggcga aatcatcaat ggcgaatatg gcaaagcggc gctctgttcg 360 tctctgctta cgctctgcca gagccacaaa ctggcgggcg gaagtatcgt gatgatgcgt 420 gagccacaga tatttaatgc gcctgatgat gaaagaacgc tgcgtaagat cctctggcgt 480 ctgatgccgg gttttgcact ctgcgatcgc agcgagtggt tgatggagca ctatcgccag 540 ctgcagcagc ggaggccgga aagcagctta ctggatgcgt ggcttgactt cgcggcgatc 600 aaatatcagc ccgttcagca ggaaccggag gatagcatga gctgggagta tcagccgaaa 660 ccgaagccgg ggtatctggt gccgctgatg tgcggatatc aacgtatttc ccgactatac 720 cagccgggag aagtggccaa cgttcgcgat accacaacgc cgttcgcctt taccgaggcc 780 gtttatggcg ttggagaatg gcgtgggtta catcgtatag ctgaccttga gccgcttatc 840 tggcgctacc gcacgagcga tacaggctac tactgttctg caatgcctgt tgctgatgat 900 gattttatat ttaacgaaga tgacgattta gaataa 936 <210> 298 <211> 1002 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(1002) <223> Cas7 <400> 298 atggcaaagg ctcctgtatc tgtaaaaacg gcttccgtac tggcatttga acgcaagctc 60 gccacctccg atgcgatgat gtatgcgggg aactggctgg gcgatagctg gcaaccgatc 120 gaaattaagg aaaaagcggt acgtggaact atctcgaacc ggcttaaaaa tgccatcgcc 180 agcgatgcaa caaagctgga tgccgagatc caaaaagcga atctgcaacg agtggatacg 240 gcggcgttgc ccgctgatgc cgacacctta aaagtcgtat tcaccctgcg ggtgctgggg 300 aacttagcga cgccatcggt ctgtaatgat atggcctatc agaatgcgat tcagcagacg 360 atcgaaggtt atatcagcga gcacggtttt gccgaactgg ctcgtcgcta tgcggctaac 420 ctcgcaaatg ggcgttttct atggcgcaac cgcattggcg ctgagcagat tcaggttagc 480 gtgagcgcgc aggggcaggc gtgggtattc aatggccacg attattcatt acgtgaattc 540 tctcaggacg atgaggaaat agcctccctt gcggcgctga tcgaacaggg gctaagtggc 600 caggcgtggg tgatgctaac ggttgaggcg caggtacgtt tgggcgccgg gcaggaggtc 660 tttccgtcac aggagctggt actggatagc aacagtagta aaagtcgcgt gctgtatcag 720 gtcgcgggca tcgccgggat ccactcgcag aagatcggca atgcgctgcg cactatcgat 780 acctggcatc caaaagttga tgagctgggg gcgattgcgg tagagccgta cggctcggta 840 accagccgcg gtatggcctg tcgtcagccg aaggacaaga tggattttta taccctgctg 900 gatagctggg tgacgaaagg cattaagcca gacgtcgaac agcagcatta tgtcatggcg 960 gttcttatcc ggggtggtgt attcggtgag aaaagcgaat aa 1002 <210> 299 <211> 555 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(555) <223> Cas6 <400> 299 atggactatt tcctggatat tcgcgttctg cctgacccgg aatttagcga agagatgctt 60 atggccgcac tgtttgccaa actgcaccgc gctttaggag ccagaggcaa gggggatatt 120 ggcgtcagtt ttcctgagtt ttccgtcaag ccggggccat tattacgttt acatggtgat 180 gaatctgcac tgtgcgcgct ggaagaaacg ctctggcgta aagggctgaa tgattattgt 240 cagagtgggc agataatgcc ggtagaggaa ataaaaggat ggcgttgcgt cagtcgggta 300 caggtaaaaa gcagccccga gcggctgatg cgccgctcgg tgagaaaagg ctggctgaca 360 caggatgaag caaatgagcg attgcttagc atgcggggag agtcgacagc gctcccctgg 420 ttgaatatga aaagcctctc aaatgggcag aagtttccgc tatttatttg tcacggtgag 480 ctgctggcgc agcgcgtcgc gggaacattc aatagctatg ggctgagcca tatcgcgact 540 atcccctggt tttag 555 <210> 300 <211> 1314 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(1314) <223> Cas8 <400> 300 atgacaaccg aggccctgac acactttatc atcgactaca tcgcctcccg gaagcagcca 60 aagctggatg ccttcgagaa ggaggccgcc aagagactgg cccagggaga ggacgcagga 120 gcaatcgccc aggagaggca ggagctggag gtgaagtatc agccaaggaa ctggctgacc 180 gatgcagcaa ggagggcagg acagatcagc ctggtgaccc acgccgccaa gttcacacac 240 ggcgactcca agtcctctag catctacaga gagaccgtgg gcgatgaggg ctatctgtcc 300 acagccgtgc tggccaatgt ggcagcagac gcagtgggaa acgcagccgc cctggatgtg 360 gcaaagctgc tgcagacaga agtgggaggc gacagcctgc tggcctgtct gaagaggggc 420 gatcgctccc cactgatggg ctttgccgag aatgacgcac agctggccct gtggatggag 480 ggcttctccc aggccctgac cccagcccag cctacatctc acaagctggc caagcagatc 540 tactttcctg tggatggcgg ctatcacctg ctgagcccac tgttcgcctc ctctctggcc 600 caggccatgc acgagaagat ggtggcagca aggtttggag agcaggcaaa ggcagcaaga 660 gaggcaagga gagccggcaa gtggcacgca cagccagacg tgcgctaccc taacgtggcc 720 gagatgcact tcggcggcac caagccccag aatatctccg ccctgaacag ctcccgggga 780 ggcagagtgt ggctgctgcc ctctcagccc cctaagtgga ccatgctgga caaggcccct 840 cagaatctga caagcctgtt tgccctgaga ggcgacttca acagggccgc cacagatacc 900 gtgagccgga tggtgtccct gctgaaggag aagacagata acaataacag gcacatccgc 960 aatgcaaggg caggatacgt ggacgagctg atcgatctgc tgtttctgca cgccgccacc 1020 tatcagcagg aggcctggca gggctggaca ctgaactccc cagacctgcc actgcaccag 1080 cagctgtggc tggacccctg gaggtccaag acagatgaga cctttagatc tgagagggag 1140 aagggcgact ggcagcgcag cgtggcagac gatttcgcaa ggtggctgaa ttaccggctg 1200 aacaaggcca gactggatgt gggaatcgca gagaggaggg agtggcagac ccagcggctg 1260 ttcagccagc ggatgagaga gatggaggcc atcgtgcagg aggccctgaa gtaa 1314 <210> 301 <211> 936 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(936) <223> Cas5 <400> 301 atgtcttacc tgctgctgct gccccacatc cgcatcgaga atgcaaacgc agtggcagga 60 ctgacctggg gatttcctgc catcacacac ttcctgggct atgtgcacgc cctgtcccgg 120 agagtgtctg agtttggcgt gtccttcacc ggctgcgccg tgatcaatca cgagcaccac 180 atccaggcct actcctctgg ccgggactat cagtttgccc tgacaagaaa tcctctgacc 240 aaggagggca agacagccgc cttcaacgag gagggcagaa tgcacctgac cgtgagcctg 300 ctggtggagt gtcagggcga gatcatcaat ggagagtacg gcaaggccgc cctgtgcagc 360 tccctgctga ccctgtgcca gagccacaag ctggccggag gctccatcgt gatgatgagg 420 gagccacaga tctttaacgc ccccgacgat gagaggaccc tgcgcaagat cctgtggagg 480 ctgatgccag gattcgcact gtgcgatagg tccgagtggc tgatggagca ctacaggcag 540 ctgcagcaga ggcgccctga gtctagcctg ctggacgcct ggctggattt cgccgccatc 600 aagtatcagc ctgtgcagca ggagccagag gacagcatgt cctgggagta ccagcccaag 660 cctaagccag gctatctggt gcccctgatg tgcggctacc agcggatcag cagactgtat 720 cagccaggcg aggtggccaa cgtgagggat accacaaccc ccttcgcctt taccgaggcc 780 gtgtacggag tgggagagtg gagaggactg cacaggatcg ccgacctgga gccactgatc 840 tggaggtatc gcacatctga taccggctac tattgcagcg ccatgcccgt ggccgacgat 900 gacttcatct ttaatgagga tgacgatctg gagtaa 936 <210> 302 <211> 1002 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(1002) <223> Cas7 <400> 302 atggcaaagg cacccgtgtc tgtgaagacc gccagcgtgc tggcctttga gaggaagctg 60 gccacatccg acgccatgat gtacgccggc aactggctgg gcgattcttg gcagcctatc 120 gagatcaagg agaaggccgt gaggggcacc atcagcaatc gcctgaagaa cgccatcgcc 180 tccgacgcca caaagctgga tgccgagatc cagaaggcaa atctgcagcg ggtggacacc 240 gccgccctgc cagccgacgc cgataccctg aaggtggtgt tcacactgag agtgctggga 300 aacctggcaa ccccaagcgt gtgcaatgat atggcctacc agaacgccat ccagcagaca 360 atcgagggct atatcagcga gcacggattt gcagagctgg cccggagata cgccgccaat 420 ctggccaacg gcagattcct gtggcggaat agaatcggcg ccgagcagat ccaggtgtct 480 gtgagcgccc agggacaggc ctgggtgttt aacggccacg actattccct gagggagttc 540 tctcaggacg atgaggagat cgcctctctg gccgccctga tcgagcaggg actgagcggc 600 caggcctggg tcatgctgac cgtggaggca caggtgcggc tgggagcagg ccaggaggtg 660 tttccatctc aggagctggt gctggatagc aatagctcca agtcccgcgt gctgtaccag 720 gtggcaggaa tcgcaggcat ccacagccag aagatcggca acgccctgcg gacaatcgac 780 acctggcacc ccaaggtgga tgagctggga gcaatcgcag tggagcctta cggcagcgtg 840 acctcccgcg gaatggcatg caggcagccc aaggacaaga tggacttcta caccctgctg 900 gactcctggg tgacaaaggg catcaagcct gatgtggagc agcagcacta cgtgatggcc 960 gtgctgatca ggggaggcgt gttcggcgag aagtctgagt aa 1002 <210> 303 <211> 555 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(555) <223> Cas6 <400> 303 atggactact tcctggatat cagagtgctg ccagaccccg agttttccga ggagatgctg 60 atggccgccc tgttcgccaa gctgcacaga gccctgggag caaggggcaa gggcgatatc 120 ggcgtgtctt ttccagagtt cagcgtgaag cctggaccac tgctgaggct gcacggcgac 180 gagtccgccc tgtgcgccct ggaggagacc ctgtggagaa agggcctgaa tgattattgt 240 cagtctggcc agatcatgcc tgtggaggag atcaagggat ggagatgcgt gagccgggtg 300 caggtgaagt ctagcccaga gaggctgatg aggcgcagcg tgcgcaaggg atggctgacc 360 caggacgagg caaacgagcg cctgctgtcc atgaggggag agtctacagc cctgccttgg 420 ctgaatatga agtccctgtc taacggccag aagtttccac tgttcatctg ccacggagag 480 ctgctggccc agcgcgtggc aggcaccttt aattcttacg gcctgagcca catcgccaca 540 atcccttggt tctaa 555 <210> 304 <211> 437 <212> PRT <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(437) <223> Cas8 <400> 304 Met Thr Thr Glu Ala Leu Thr His Phe Ile Ile Asp Tyr Ile Ala Ser 1 5 10 15 Arg Lys Gln Pro Lys Leu Asp Ala Phe Glu Lys Glu Ala Ala Lys Arg 20 25 30 Leu Ala Gln Gly Glu Asp Ala Gly Ala Ile Ala Gln Glu Arg Gln Glu 35 40 45 Leu Glu Val Lys Tyr Gln Pro Arg Asn Trp Leu Thr Asp Ala Ala Arg 50 55 60 Arg Ala Gly Gln Ile Ser Leu Val Thr His Ala Ala Lys Phe Thr His 65 70 75 80 Gly Asp Ser Lys Ser Ser Ser Ile Tyr Arg Glu Thr Val Gly Asp Glu 85 90 95 Gly Tyr Leu Ser Thr Ala Val Leu Ala Asn Val Ala Ala Asp Ala Val 100 105 110 Gly Asn Ala Ala Ala Leu Asp Val Ala Lys Leu Leu Gln Thr Glu Val 115 120 125 Gly Gly Asp Ser Leu Leu Ala Cys Leu Lys Arg Gly Asp Arg Ser Pro 130 135 140 Leu Met Gly Phe Ala Glu Asn Asp Ala Gln Leu Ala Leu Trp Met Glu 145 150 155 160 Gly Phe Ser Gln Ala Leu Thr Pro Ala Gln Pro Thr Ser His Lys Leu 165 170 175 Ala Lys Gln Ile Tyr Phe Pro Val Asp Gly Gly Tyr His Leu Leu Ser 180 185 190 Pro Leu Phe Ala Ser Ser Leu Ala Gln Ala Met His Glu Lys Met Val 195 200 205 Ala Ala Arg Phe Gly Glu Gln Ala Lys Ala Ala Arg Glu Ala Arg Arg 210 215 220 Ala Gly Lys Trp His Ala Gln Pro Asp Val Arg Tyr Pro Asn Val Ala 225 230 235 240 Glu Met His Phe Gly Gly Thr Lys Pro Gln Asn Ile Ser Ala Leu Asn 245 250 255 Ser Ser Arg Gly Gly Arg Val Trp Leu Leu Pro Ser Gln Pro Pro Lys 260 265 270 Trp Thr Met Leu Asp Lys Ala Pro Gln Asn Leu Thr Ser Leu Phe Ala 275 280 285 Leu Arg Gly Asp Phe Asn Arg Ala Ala Thr Asp Thr Val Ser Arg Met 290 295 300 Val Ser Leu Leu Lys Glu Lys Thr Asp Asn Asn Asn Arg His Ile Arg 305 310 315 320 Asn Ala Arg Ala Gly Tyr Val Asp Glu Leu Ile Asp Leu Leu Phe Leu 325 330 335 His Ala Ala Thr Tyr Gln Gln Glu Ala Trp Gln Gly Trp Thr Leu Asn 340 345 350 Ser Pro Asp Leu Pro Leu His Gln Gln Leu Trp Leu Asp Pro Trp Arg 355 360 365 Ser Lys Thr Asp Glu Thr Phe Arg Ser Glu Arg Glu Lys Gly Asp Trp 370 375 380 Gln Arg Ser Val Ala Asp Asp Phe Ala Arg Trp Leu Asn Tyr Arg Leu 385 390 395 400 Asn Lys Ala Arg Leu Asp Val Gly Ile Ala Glu Arg Arg Glu Trp Gln 405 410 415 Thr Gln Arg Leu Phe Ser Gln Arg Met Arg Glu Met Glu Ala Ile Val 420 425 430 Gln Glu Ala Leu Lys 435 <210> 305 <211> 311 <212> PRT <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(311) <223> Cas5 <400> 305 Met Ser Tyr Leu Leu Leu Leu Pro His Ile Arg Ile Glu Asn Ala Asn 1 5 10 15 Ala Val Ala Gly Leu Thr Trp Gly Phe Pro Ala Ile Thr His Phe Leu 20 25 30 Gly Tyr Val His Ala Leu Ser Arg Arg Val Ser Glu Phe Gly Val Ser 35 40 45 Phe Thr Gly Cys Ala Val Ile Asn His Glu His His Ile Gln Ala Tyr 50 55 60 Ser Ser Gly Arg Asp Tyr Gln Phe Ala Leu Thr Arg Asn Pro Leu Thr 65 70 75 80 Lys Glu Gly Lys Thr Ala Ala Phe Asn Glu Glu Gly Arg Met His Leu 85 90 95 Thr Val Ser Leu Leu Val Glu Cys Gln Gly Glu Ile Ile Asn Gly Glu 100 105 110 Tyr Gly Lys Ala Ala Leu Cys Ser Ser Leu Leu Thr Leu Cys Gln Ser 115 120 125 His Lys Leu Ala Gly Gly Ser Ile Val Met Met Arg Glu Pro Gln Ile 130 135 140 Phe Asn Ala Pro Asp Asp Glu Arg Thr Leu Arg Lys Ile Leu Trp Arg 145 150 155 160 Leu Met Pro Gly Phe Ala Leu Cys Asp Arg Ser Glu Trp Leu Met Glu 165 170 175 His Tyr Arg Gln Leu Gln Gln Arg Arg Pro Glu Ser Ser Leu Leu Asp 180 185 190 Ala Trp Leu Asp Phe Ala Ala Ile Lys Tyr Gln Pro Val Gln Gln Glu 195 200 205 Pro Glu Asp Ser Met Ser Trp Glu Tyr Gln Pro Lys Pro Lys Pro Gly 210 215 220 Tyr Leu Val Pro Leu Met Cys Gly Tyr Gln Arg Ile Ser Arg Leu Tyr 225 230 235 240 Gln Pro Gly Glu Val Ala Asn Val Arg Asp Thr Thr Thr Pro Phe Ala 245 250 255 Phe Thr Glu Ala Val Tyr Gly Val Gly Glu Trp Arg Gly Leu His Arg 260 265 270 Ile Ala Asp Leu Glu Pro Leu Ile Trp Arg Tyr Arg Thr Ser Asp Thr 275 280 285 Gly Tyr Tyr Cys Ser Ala Met Pro Val Ala Asp Asp Asp Phe Ile Phe 290 295 300 Asn Glu Asp Asp Asp Leu Glu 305 310 <210> 306 <211> 333 <212> PRT <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(333) <223> Cas7 <400> 306 Met Ala Lys Ala Pro Val Ser Val Lys Thr Ala Ser Val Leu Ala Phe 1 5 10 15 Glu Arg Lys Leu Ala Thr Ser Asp Ala Met Met Tyr Ala Gly Asn Trp 20 25 30 Leu Gly Asp Ser Trp Gln Pro Ile Glu Ile Lys Glu Lys Ala Val Arg 35 40 45 Gly Thr Ile Ser Asn Arg Leu Lys Asn Ala Ile Ala Ser Asp Ala Thr 50 55 60 Lys Leu Asp Ala Glu Ile Gln Lys Ala Asn Leu Gln Arg Val Asp Thr 65 70 75 80 Ala Ala Leu Pro Ala Asp Ala Asp Thr Leu Lys Val Val Phe Thr Leu 85 90 95 Arg Val Leu Gly Asn Leu Ala Thr Pro Ser Val Cys Asn Asp Met Ala 100 105 110 Tyr Gln Asn Ala Ile Gln Gln Thr Ile Glu Gly Tyr Ile Ser Glu His 115 120 125 Gly Phe Ala Glu Leu Ala Arg Arg Tyr Ala Ala Asn Leu Ala Asn Gly 130 135 140 Arg Phe Leu Trp Arg Asn Arg Ile Gly Ala Glu Gln Ile Gln Val Ser 145 150 155 160 Val Ser Ala Gln Gly Gln Ala Trp Val Phe Asn Gly His Asp Tyr Ser 165 170 175 Leu Arg Glu Phe Ser Gln Asp Asp Glu Glu Ile Ala Ser Leu Ala Ala 180 185 190 Leu Ile Glu Gln Gly Leu Ser Gly Gln Ala Trp Val Met Leu Thr Val 195 200 205 Glu Ala Gln Val Arg Leu Gly Ala Gly Gln Glu Val Phe Pro Ser Gln 210 215 220 Glu Leu Val Leu Asp Ser Asn Ser Ser Lys Ser Arg Val Leu Tyr Gln 225 230 235 240 Val Ala Gly Ile Ala Gly Ile His Ser Gln Lys Ile Gly Asn Ala Leu 245 250 255 Arg Thr Ile Asp Thr Trp His Pro Lys Val Asp Glu Leu Gly Ala Ile 260 265 270 Ala Val Glu Pro Tyr Gly Ser Val Thr Ser Arg Gly Met Ala Cys Arg 275 280 285 Gln Pro Lys Asp Lys Met Asp Phe Tyr Thr Leu Leu Asp Ser Trp Val 290 295 300 Thr Lys Gly Ile Lys Pro Asp Val Glu Gln Gln His Tyr Val Met Ala 305 310 315 320 Val Leu Ile Arg Gly Gly Val Phe Gly Glu Lys Ser Glu 325 330 <210> 307 <211> 184 <212> PRT <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(184) <223> Cas6 <400> 307 Met Asp Tyr Phe Leu Asp Ile Arg Val Leu Pro Asp Pro Glu Phe Ser 1 5 10 15 Glu Glu Met Leu Met Ala Ala Leu Phe Ala Lys Leu His Arg Ala Leu 20 25 30 Gly Ala Arg Gly Lys Gly Asp Ile Gly Val Ser Phe Pro Glu Phe Ser 35 40 45 Val Lys Pro Gly Pro Leu Leu Arg Leu His Gly Asp Glu Ser Ala Leu 50 55 60 Cys Ala Leu Glu Glu Thr Leu Trp Arg Lys Gly Leu Asn Asp Tyr Cys 65 70 75 80 Gln Ser Gly Gln Ile Met Pro Val Glu Glu Ile Lys Gly Trp Arg Cys 85 90 95 Val Ser Arg Val Gln Val Lys Ser Ser Pro Glu Arg Leu Met Arg Arg 100 105 110 Ser Val Arg Lys Gly Trp Leu Thr Gln Asp Glu Ala Asn Glu Arg Leu 115 120 125 Leu Ser Met Arg Gly Glu Ser Thr Ala Leu Pro Trp Leu Asn Met Lys 130 135 140 Ser Leu Ser Asn Gly Gln Lys Phe Pro Leu Phe Ile Cys His Gly Glu 145 150 155 160 Leu Leu Ala Gln Arg Val Ala Gly Thr Phe Asn Ser Tyr Gly Leu Ser 165 170 175 His Ile Ala Thr Ile Pro Trp Phe 180 <210> 308 <211> 88 <212> DNA <213> Klebsiella oxytoca strain ICU1-2b <220> <221> misc_feature <222> (1)..(88) <223> CRISPR <400> 308 gttcactgcc gtacaggcag cttagaaaaa aaactgagcg gccgcagaat gaagttgtaa 60 gttcactgcc gtacaggcag cttagaaa 88 <210> 309 <211> 1305 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(1305) <223> Cas8 <400> 309 atgacctctc ccctcccaac gcctacgtgg caggagcttc gccagttcat cgaatccttc 60 atccaggagc gcctccaggg caagctggac aaactccaac ccgacgaaga cgacaagcgc 120 cagacattgc tggccaccca ccggcgggag gcctggctgg ccgatgccgc ccggcgggtt 180 ggccagttgc agttggtgac ccacacgctc aagccgatcc atcccgacgc ccgcggcagc 240 aacctgcaca gcctgccgca agcacccggc caaccgggcc tcgccggttc ccatgagcta 300 ggtgacaggc tggtcagcga tgtggtgggc aatgccgcgg cgctggacgt attcaagttt 360 ctcagtctcc agtatcaggg taaaaatctt ctgaactggc tgacagaaga cagtgccgag 420 gcattacagg cgctgtccga taacgccgaa caggctcgcg aatggcggca agcgttcatc 480 ggcatcacga ccgtcaaagg cgctcccgcg tcccacagcc tggccaagca gttgtacttt 540 cccctgcccg gttccggcta ccacctgcta gcaccgctgt ttcccaccag tctggtgcat 600 cacgtccacg ctctgctccg cgaagcgcgc ttcggcgacg cggccaaggc ggcacgcgaa 660 gcgcgcagcc gccaggagtc atggccccac ggattcagcg agtaccccaa cctggcgatc 720 cagaagttcg gcggtaccaa gccgcagaac atcagtcagt tgaacaacga gcgccgtggc 780 gagaactggt tgctgccatc gcttccgccg aactggcaaa ggcagaatgt aaacgcgccg 840 atgcggcact cttcggtctt cgagcatgac ttcggaagaa ctcctgaagt atcccgccta 900 acccgtaccc tgcagcgttt tcttgccaag acagtccata acaacctcgc catccgccag 960 cggcgtgccc aattggtggc gcaaatctgc gacgaagccc tgcaatacgc cgcccgtctg 1020 cgcgaactgg agcccggctg gagcgcaacc cccgggtgcc aactgcatga cgcggagcag 1080 ctctggctcg atccgttgcg cgcacagacc gatgagacgt tcttgcagcg ccgactacga 1140 ggtgactggc ctgccgaggt cggaaatcgc ttcgccaact ggctgaaccg ggcggtcagc 1200 agcgacagtc agatactggg tagcccggaa gccgcccaat ggagccagga gctgagcaag 1260 gaactgacga tgttcaagga gatactcgaa gatgagcgtg actga 1305 <210> 310 <211> 984 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(984) <223> Cas5 <400> 310 atgagcgtga ctgatcccga ggcgctgctg ttgctgccac gcctgtccat ccagaacgcc 60 aacgccattt ccagcccctt gacctggggt ttcccttcgc ccggcgcttt caccggattc 120 gtccatgcct tgcagcgtcg agtcggaatc tccctcgata tcgaactgga cggtgtcggc 180 atcgtctgtc accgcttcga agcgcagata tcgcaaccgg ccggcaagcg caccaaggtc 240 ttcaacctga cccgcaatcc gctgaaccgc gacggctcca ccgcagccat cgtcgaagaa 300 ggtcgcgccc atctggaggt cagtctgctg ctcggagtgc atggcgatgg tctggacgat 360 caccccgcac aggaaatcgc caggcaggta caggagcagg ctggcgccat gcgcctcgcc 420 ggtggcagca tcctgccctg gtgcaatgag cgcttcccgg ctccgaacgc cgaactgctg 480 atgctgggtg gcagcgacga acagcggcgc aagaaccagc gccggcttac ccgccgcctg 540 ctccccggct tcgccctggt gagtcgcgag gcgttgttgc aacaacatct ggaaaccttg 600 cgcaccacgc tccccgaagc caccacgctc gatgcactgc tcgatctttg tcgaatcaac 660 ttcgagcctc ctgcaacctc gtccgaagaa gaagcatcgc cgcccgatgc agcctggcaa 720 gtgcgcgaca agcccggctg gctggtgccg atcccggctg gctacaacgc cctgtcaccc 780 ctgtacctcc ccggcgaagt gcgaaatgcc cgtgatagag aaacaccgct gcgcttcgtc 840 gaaaacctct tcggtctggg cgaatggctc agcccccatc gcgtcgccgc gttatcggac 900 ctgctttggt atcaccacgc cgagcctgac aaagggctct accgctggag cacaccccgt 960 ttcgtcgaac acgccatcgc ataa 984 <210> 311 <211> 1029 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(1029) <223> Cas7 <400> 311 atgtccaagc caatactgag caccgcttcc gtcctcgcct tcgaacgtaa gctcgaccct 60 tccgacgccc ttatgagcgc tggcgcctgg gcgcaacgcg acgcctcgca ggaatggccg 120 gccgtgaccg tgcgcgagaa gtccgtacgc ggcaccatct ccaaccgcct caagaccaag 180 gaccgtgacc cggccaagct ggacgcctcg atccagtcgc ccaacctgca gacggtggac 240 gtggccaacc tgccgagcga cgccgacacc ctcaaggtcc gcttcaccct ccgtgtgctc 300 ggcggcgccg gaacaccgtc tgcctgcaac gacgcggcct accgtgacaa gctgctgcaa 360 acggtcgcca cctacgtgaa cgatcagggc ttcgccgagc tggctcgtcg ttatgcgcac 420 aacctggcca acgcccgctt cctgtggcgc aaccgggtgg gcgcggaagc ggtggaagtc 480 cgtatcaacc atatccgcca gggcgaggtg gctcgcgcct ggcgcttcga cgccctggcc 540 atcggcttgc gcgacttcaa ggccgacgcc gaactggacg cgctcgccga actgatcgcc 600 agcggtctct caggcagtgg gcatgtcctg ctcgaagtgg tcgccttcgc ccgtatcggc 660 gacggccagg aagtcttccc ctcccaggaa ctgatcctcg acaaaggcga caagaaaggc 720 cagaagagca agaccctgta cagcgtacgc gatgccgcgg ccatccactc gcagaagatc 780 ggcaatgccc tgcgcaccat cgatacgtgg tatcccgacg aagatggcct cggccccatc 840 gccgtggagc cctacggctc cgtcacatcc cagggcaaag cctatcgcca gcccaagcag 900 aagctggact tctatacgct gctcgacaac tgggtactgc gcgacgaggc gcccgccgtg 960 gagcaacagc attatgtgat cgccaacctg atccgtggcg gcgtgttcgg tgaagccgaa 1020 gagaagtaa 1029 <210> 312 <211> 564 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(564) <223> Cas6 <400> 312 atggaccact acctcgacat tcgcttgcga ccggacccgg aatttccccc ggcgcaactc 60 atgagcgtgc tcttcggcaa gctccaccag gccctggtgg cacagggcgg ggacaggatc 120 ggcgtgagct tccccgacct cgacgaaagc cgctcccggc tgggcgagcg cctgcgcatt 180 catgcctcgg cggacgacct tcgtgccctg ctcgcccggc cctggctgga agggttgcgg 240 gaccatctgc aattcggaga accggcagtc gtgcctcacc ccacaccgta ccgtcaggtc 300 agtcgggttc aggcgaaaag caatccggaa cgcctgcggc ggcggctcat gcgccggcac 360 gatctgagtg aggaggaggc tcggaaacgc attcccgata cggtcgcgag agccttggac 420 ctgcccttcg tcacgctacg cagccagagc accggacagc acttccgtct cttcatccgc 480 cacgggccgt tgcaggtgac ggcagaggaa ggaggattca cctgttacgg gttgagcaaa 540 ggaggtttcg ttccctggtt ctga 564 <210> 313 <211> 1305 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(1305) <223> Cas8 <400> 313 atgacatctc ctctgccaac ccccacatgg caggagctga gacagtttat cgagagcttc 60 atccaggaga ggctgcaggg caagctggat aagctgcagc ctgacgagga cgataagcgg 120 cagaccctgc tggccacaca cagaagggag gcctggctgg ccgatgcagc acgccgggtg 180 ggacagctgc agctggtgac ccacacactg aagccaatcc accctgacgc aaggggctct 240 aatctgcaca gcctgccaca ggcaccagga cagcctggcc tggccggctc tcacgagctg 300 ggcgataggc tggtgagcga cgtggtggga aacgcagccg ccctggacgt gtttaagttc 360 ctgtccctgc agtaccaggg caagaacctg ctgaattggc tgaccgagga tagcgccgag 420 gccctgcagg ccctgtccga caatgcagag caggcaagag agtggaggca ggcctttatc 480 ggaatcacca cagtgaaggg agcaccagcc agccactccc tggccaagca gctgtacttt 540 cctctgccag gcagcggcta tcacctgctg gccccactgt tccccacctc cctggtgcac 600 cacgtgcacg ccctgctgag ggaggcaagg ttcggcgacg cagccaaggc cgccagagag 660 gcacgctccc ggcaggagtc ttggccacac ggctttagcg agtaccctaa tctggccatc 720 cagaagttcg gcggcaccaa gccccagaac atctcccagc tgaacaatga gagaaggggc 780 gagaactggc tgctgccttc tctgccccct aattggcaga gacagaacgt gaatgcccca 840 atgaggcact ccagcgtgtt cgagcacgat ttcggccgca cccctgaggt gagcagactg 900 accaggacac tgcagcggtt cctggccaag acagtgcaca acaatctggc catcagacag 960 aggagggcac agctggtggc acagatctgc gacgaggccc tgcagtacgc agcaagactg 1020 agggagctgg agccaggatg gtccgccacc ccaggctgtc agctgcacga cgcagagcag 1080 ctgtggctgg accccctgag ggcacagacc gacgagacat ttctgcagag aaggctgagg 1140 ggcgattggc cagcagaagt gggaaacagg ttcgcaaact ggctgaatcg ggccgtgagc 1200 tccgactctc agatcctggg cagccccgag gcagcacagt ggagccagga gctgtccaag 1260 gagctgacca tgttcaagga gatcctggag gacgagaggg attaa 1305 <210> 314 <211> 984 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(984) <223> Cas5 <400> 314 atgtctgtga cagaccctga ggccctgctg ctgctgccaa gactgagcat ccagaacgcc 60 aatgccatca gctccccact gacctgggga ttcccttccc caggcgcctt tacaggattc 120 gtgcacgccc tgcagcgccg ggtgggcatc tccctggata tcgagctgga cggagtggga 180 atcgtgtgcc accgctttga ggcccagatc tctcagccag ccggcaagcg gaccaaggtg 240 ttcaacctga cacgcaaccc cctgaatcgg gatggctcta ccgcagcaat cgtggaggag 300 ggaagagcac acctggaggt gagcctgctg ctgggagtgc acggcgacgg cctggacgat 360 cacccagccc aggagatcgc aagacaggtg caggagcagg caggagcaat gaggctggcc 420 ggaggctcta tcctgccatg gtgcaacgag aggtttcccg cccctaatgc agagctgctg 480 atgctgggag gcagcgacga gcagagaagg aagaatcagc gccggctgac cagaaggctg 540 ctgccaggat tcgcactggt gagcagagag gccctgctgc agcagcacct ggagacactg 600 aggaccacac tgcctgaggc aaccaccctg gacgccctgc tggacctgtg cagaatcaac 660 tttgagccac ctgccacctc tagcgaggag gaggccagcc cacccgacgc agcctggcag 720 gtgagggata agcctggatg gctggtgcca atcccagcag gatacaacgc cctgtcccct 780 ctgtatctgc caggcgaggt gcgcaatgcc agagataggg agacacccct gcggtttgtg 840 gagaacctgt tcggcctggg cgagtggctg tctcctcaca gggtggccgc cctgagcgat 900 ctgctgtggt atcaccacgc cgagcctgac aagggcctgt acagatggag caccccaagg 960 ttcgtggagc acgcaatcgc ataa 984 <210> 315 <211> 1029 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(1029) <223> Cas7 <400> 315 atgagcaagc ccatcctgtc caccgcctct gtgctggcct ttgagcggaa gctggaccct 60 tctgatgccc tgatgagcgc cggagcatgg gcacagagag atgccagcca ggagtggcca 120 gccgtgacag tgagagagaa gtccgtgagg ggcaccatct ctaaccgcct gaagacaaag 180 gaccgggacc ccgcaaagct ggatgccagc atccagtccc ctaacctgca gaccgtggac 240 gtggccaatc tgccaagcga cgccgatacc ctgaaggtgc gcttcacact gcgggtgctg 300 ggaggagcag gaacaccatc cgcctgcaat gatgccgcct atagagacaa gctgctgcag 360 accgtggcca catacgtgaa cgaccaggga tttgcagagc tggcccggag atacgcccac 420 aacctggcca atgccaggtt cctgtggagg aacagggtgg gagcagaggc agtggaggtg 480 cgcatcaatc acatcaggca gggagaggtg gcaagggcat ggcggtttga tgccctggcc 540 atcggcctga gagacttcaa ggcagatgca gagctggacg ccctggccga gctgatcgcc 600 agcggcctgt ctggcagcgg ccacgtgctg ctggaggtgg tggcctttgc caggatcggc 660 gacggccagg aggtgttccc ttcccaggag ctgatcctgg acaagggcga taagaagggc 720 cagaagtcca agaccctgta ctctgtgcgg gatgcagcag caatccacag ccagaagatc 780 ggcaatgccc tgagaaccat cgacacatgg tatccagacg aggatggact gggaccaatc 840 gcagtggagc cttacggctc tgtgaccagc cagggcaagg cctataggca gcccaagcag 900 aagctggact tctacacact gctggacaat tgggtgctga gggatgaggc acctgcagtg 960 gagcagcagc actacgtgat cgccaacctg atcaggggag gcgtgttcgg agaggcagag 1020 gagaagtaa 1029 <210> 316 <211> 564 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(564) <223> Cas6 <400> 316 atggatcact atctggacat cagactgagg ccagatcccg agtttccacc cgcccagctg 60 atgtctgtgc tgttcggcaa gctgcaccag gccctggtgg cacagggagg cgaccggatc 120 ggcgtgtctt ttccagacct ggatgagtcc cgctctcggc tgggagagcg gctgagaatc 180 cacgccagcg ccgacgatct gagagccctg ctggccaggc catggctgga gggactgcgc 240 gatcacctgc agttcggaga gcctgcagtg gtgcctcacc caacccccta cagacaggtg 300 tctagggtgc aggccaagag caacccagag cggctgaggc gccggctgat gagaaggcac 360 gacctgagcg aggaggaggc aaggaagaga atccccgaca cagtggcacg cgccctggat 420 ctgccctttg tgaccctgcg gagccagtcc acaggccagc actttcgcct gttcatcagg 480 cacggaccac tgcaggtgac cgcagaggag ggaggcttca catgctatgg cctgtccaag 540 ggcggctttg tgccttggtt ctaa 564 <210> 317 <211> 434 <212> PRT <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(434) <223> Cas8 <400> 317 Met Thr Ser Pro Leu Pro Thr Pro Thr Trp Gln Glu Leu Arg Gln Phe 1 5 10 15 Ile Glu Ser Phe Ile Gln Glu Arg Leu Gln Gly Lys Leu Asp Lys Leu 20 25 30 Gln Pro Asp Glu Asp Asp Lys Arg Gln Thr Leu Leu Ala Thr His Arg 35 40 45 Arg Glu Ala Trp Leu Ala Asp Ala Ala Arg Arg Val Gly Gln Leu Gln 50 55 60 Leu Val Thr His Thr Leu Lys Pro Ile His Pro Asp Ala Arg Gly Ser 65 70 75 80 Asn Leu His Ser Leu Pro Gln Ala Pro Gly Gln Pro Gly Leu Ala Gly 85 90 95 Ser His Glu Leu Gly Asp Arg Leu Val Ser Asp Val Val Gly Asn Ala 100 105 110 Ala Ala Leu Asp Val Phe Lys Phe Leu Ser Leu Gln Tyr Gln Gly Lys 115 120 125 Asn Leu Leu Asn Trp Leu Thr Glu Asp Ser Ala Glu Ala Leu Gln Ala 130 135 140 Leu Ser Asp Asn Ala Glu Gln Ala Arg Glu Trp Arg Gln Ala Phe Ile 145 150 155 160 Gly Ile Thr Thr Val Lys Gly Ala Pro Ala Ser His Ser Leu Ala Lys 165 170 175 Gln Leu Tyr Phe Pro Leu Pro Gly Ser Gly Tyr His Leu Leu Ala Pro 180 185 190 Leu Phe Pro Thr Ser Leu Val His His Val His Ala Leu Leu Arg Glu 195 200 205 Ala Arg Phe Gly Asp Ala Ala Lys Ala Ala Arg Glu Ala Arg Ser Arg 210 215 220 Gln Glu Ser Trp Pro His Gly Phe Ser Glu Tyr Pro Asn Leu Ala Ile 225 230 235 240 Gln Lys Phe Gly Gly Thr Lys Pro Gln Asn Ile Ser Gln Leu Asn Asn 245 250 255 Glu Arg Arg Gly Glu Asn Trp Leu Leu Pro Ser Leu Pro Pro Asn Trp 260 265 270 Gln Arg Gln Asn Val Asn Ala Pro Met Arg His Ser Ser Val Phe Glu 275 280 285 His Asp Phe Gly Arg Thr Pro Glu Val Ser Arg Leu Thr Arg Thr Leu 290 295 300 Gln Arg Phe Leu Ala Lys Thr Val His Asn Asn Leu Ala Ile Arg Gln 305 310 315 320 Arg Arg Ala Gln Leu Val Ala Gln Ile Cys Asp Glu Ala Leu Gln Tyr 325 330 335 Ala Ala Arg Leu Arg Glu Leu Glu Pro Gly Trp Ser Ala Thr Pro Gly 340 345 350 Cys Gln Leu His Asp Ala Glu Gln Leu Trp Leu Asp Pro Leu Arg Ala 355 360 365 Gln Thr Asp Glu Thr Phe Leu Gln Arg Arg Leu Arg Gly Asp Trp Pro 370 375 380 Ala Glu Val Gly Asn Arg Phe Ala Asn Trp Leu Asn Arg Ala Val Ser 385 390 395 400 Ser Asp Ser Gln Ile Leu Gly Ser Pro Glu Ala Ala Gln Trp Ser Gln 405 410 415 Glu Leu Ser Lys Glu Leu Thr Met Phe Lys Glu Ile Leu Glu Asp Glu 420 425 430 Arg Asp <210> 318 <211> 327 <212> PRT <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(327) <223> Cas5 <400> 318 Met Ser Val Thr Asp Pro Glu Ala Leu Leu Leu Leu Pro Arg Leu Ser 1 5 10 15 Ile Gln Asn Ala Asn Ala Ile Ser Ser Pro Leu Thr Trp Gly Phe Pro 20 25 30 Ser Pro Gly Ala Phe Thr Gly Phe Val His Ala Leu Gln Arg Arg Val 35 40 45 Gly Ile Ser Leu Asp Ile Glu Leu Asp Gly Val Gly Ile Val Cys His 50 55 60 Arg Phe Glu Ala Gln Ile Ser Gln Pro Ala Gly Lys Arg Thr Lys Val 65 70 75 80 Phe Asn Leu Thr Arg Asn Pro Leu Asn Arg Asp Gly Ser Thr Ala Ala 85 90 95 Ile Val Glu Glu Gly Arg Ala His Leu Glu Val Ser Leu Leu Leu Gly 100 105 110 Val His Gly Asp Gly Leu Asp Asp His Pro Ala Gln Glu Ile Ala Arg 115 120 125 Gln Val Gln Glu Gln Ala Gly Ala Met Arg Leu Ala Gly Gly Ser Ile 130 135 140 Leu Pro Trp Cys Asn Glu Arg Phe Pro Ala Pro Asn Ala Glu Leu Leu 145 150 155 160 Met Leu Gly Gly Ser Asp Glu Gln Arg Arg Lys Asn Gln Arg Arg Leu 165 170 175 Thr Arg Arg Leu Leu Pro Gly Phe Ala Leu Val Ser Arg Glu Ala Leu 180 185 190 Leu Gln Gln His Leu Glu Thr Leu Arg Thr Thr Leu Pro Glu Ala Thr 195 200 205 Thr Leu Asp Ala Leu Leu Asp Leu Cys Arg Ile Asn Phe Glu Pro Pro 210 215 220 Ala Thr Ser Ser Glu Glu Glu Ala Ser Pro Pro Asp Ala Ala Trp Gln 225 230 235 240 Val Arg Asp Lys Pro Gly Trp Leu Val Pro Ile Pro Ala Gly Tyr Asn 245 250 255 Ala Leu Ser Pro Leu Tyr Leu Pro Gly Glu Val Arg Asn Ala Arg Asp 260 265 270 Arg Glu Thr Pro Leu Arg Phe Val Glu Asn Leu Phe Gly Leu Gly Glu 275 280 285 Trp Leu Ser Pro His Arg Val Ala Ala Leu Ser Asp Leu Leu Trp Tyr 290 295 300 His His Ala Glu Pro Asp Lys Gly Leu Tyr Arg Trp Ser Thr Pro Arg 305 310 315 320 Phe Val Glu His Ala Ile Ala 325 <210> 319 <211> 342 <212> PRT <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(342) <223> Cas7 <400> 319 Met Ser Lys Pro Ile Leu Ser Thr Ala Ser Val Leu Ala Phe Glu Arg 1 5 10 15 Lys Leu Asp Pro Ser Asp Ala Leu Met Ser Ala Gly Ala Trp Ala Gln 20 25 30 Arg Asp Ala Ser Gln Glu Trp Pro Ala Val Thr Val Arg Glu Lys Ser 35 40 45 Val Arg Gly Thr Ile Ser Asn Arg Leu Lys Thr Lys Asp Arg Asp Pro 50 55 60 Ala Lys Leu Asp Ala Ser Ile Gln Ser Pro Asn Leu Gln Thr Val Asp 65 70 75 80 Val Ala Asn Leu Pro Ser Asp Ala Asp Thr Leu Lys Val Arg Phe Thr 85 90 95 Leu Arg Val Leu Gly Gly Ala Gly Thr Pro Ser Ala Cys Asn Asp Ala 100 105 110 Ala Tyr Arg Asp Lys Leu Leu Gln Thr Val Ala Thr Tyr Val Asn Asp 115 120 125 Gln Gly Phe Ala Glu Leu Ala Arg Arg Tyr Ala His Asn Leu Ala Asn 130 135 140 Ala Arg Phe Leu Trp Arg Asn Arg Val Gly Ala Glu Ala Val Glu Val 145 150 155 160 Arg Ile Asn His Ile Arg Gln Gly Glu Val Ala Arg Ala Trp Arg Phe 165 170 175 Asp Ala Leu Ala Ile Gly Leu Arg Asp Phe Lys Ala Asp Ala Glu Leu 180 185 190 Asp Ala Leu Ala Glu Leu Ile Ala Ser Gly Leu Ser Gly Ser Gly His 195 200 205 Val Leu Leu Glu Val Val Ala Phe Ala Arg Ile Gly Asp Gly Gln Glu 210 215 220 Val Phe Pro Ser Gln Glu Leu Ile Leu Asp Lys Gly Asp Lys Lys Gly 225 230 235 240 Gln Lys Ser Lys Thr Leu Tyr Ser Val Arg Asp Ala Ala Ala Ile His 245 250 255 Ser Gln Lys Ile Gly Asn Ala Leu Arg Thr Ile Asp Thr Trp Tyr Pro 260 265 270 Asp Glu Asp Gly Leu Gly Pro Ile Ala Val Glu Pro Tyr Gly Ser Val 275 280 285 Thr Ser Gln Gly Lys Ala Tyr Arg Gln Pro Lys Gln Lys Leu Asp Phe 290 295 300 Tyr Thr Leu Leu Asp Asn Trp Val Leu Arg Asp Glu Ala Pro Ala Val 305 310 315 320 Glu Gln Gln His Tyr Val Ile Ala Asn Leu Ile Arg Gly Gly Val Phe 325 330 335 Gly Glu Ala Glu Glu Lys 340 <210> 320 <211> 187 <212> PRT <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(187) <223> Cas6 <400> 320 Met Asp His Tyr Leu Asp Ile Arg Leu Arg Pro Asp Pro Glu Phe Pro 1 5 10 15 Pro Ala Gln Leu Met Ser Val Leu Phe Gly Lys Leu His Gln Ala Leu 20 25 30 Val Ala Gln Gly Gly Asp Arg Ile Gly Val Ser Phe Pro Asp Leu Asp 35 40 45 Glu Ser Arg Ser Arg Leu Gly Glu Arg Leu Arg Ile His Ala Ser Ala 50 55 60 Asp Asp Leu Arg Ala Leu Leu Ala Arg Pro Trp Leu Glu Gly Leu Arg 65 70 75 80 Asp His Leu Gln Phe Gly Glu Pro Ala Val Val Pro His Pro Thr Pro 85 90 95 Tyr Arg Gln Val Ser Arg Val Gln Ala Lys Ser Asn Pro Glu Arg Leu 100 105 110 Arg Arg Arg Leu Met Arg Arg His Asp Leu Ser Glu Glu Glu Ala Arg 115 120 125 Lys Arg Ile Pro Asp Thr Val Ala Arg Ala Leu Asp Leu Pro Phe Val 130 135 140 Thr Leu Arg Ser Gln Ser Thr Gly Gln His Phe Arg Leu Phe Ile Arg 145 150 155 160 His Gly Pro Leu Gln Val Thr Ala Glu Glu Gly Gly Phe Thr Cys Tyr 165 170 175 Gly Leu Ser Lys Gly Gly Phe Val Pro Trp Phe 180 185 <210> 321 <211> 88 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <220> <221> misc_feature <222> (1)..(88) <223> CRISPR <400> 321 gttcactgcc gtgtaggcag ctaagaaaac cacccgctac caccggcagc cgcaccggcc 60 gttcactgcc gtgtaggcag ctaagaaa 88 <210> 322 <211> 948 <212> DNA <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(948) <223> Cas7 <400> 322 atgcaaaaag taacgggaat taaaagtgtt gattttaaaa ttaaagcatt aggtcatggc 60 gtagtgaatt ggaatgggcc tacaacctta accggtgatg acggtaaaac ggttgataat 120 cataccttgc caaaattgcg tggctacaca aacttgaccg gtaaagtgaa agatgaaacg 180 ggctataaat ataaaaaaca agcaactgac attaatttca aagaaacgcc actgtatata 240 agtcaaaatt gcattcgcca tcatttattt cgtgaacaag cattcgattt acattatgcc 300 agtgacaaaa acctcaaaaa tgtcctggct tcaattacag ggttgatccg tggttacgta 360 gtgccctcaa gtcaatgcaa acgcaccagt ccgctattgt tggaagattt tgttgatcaa 420 ttgggtaacg gcaattttga acaatatggg caggcaggag caagagatag tacatcattt 480 ttttcaaaga ccacttttgg ggatacagaa tacatctcct atggctctat tagtattgaa 540 cagttgcagt ttatatcgtt ggataagaag tttgatcgtg ctgcaatggt tatcaaagaa 600 ggagagggcg aggttattgc cgctgaacta cagaattata ttcagtcact taaccccagc 660 ttaaatccac aagccatttt tcattcaaac tacgtcagaa gaggcactat attcgaagag 720 ggagaatgcg gcattttact taatgatgat gcagtaaaag ccttggttgc tgaaacatta 780 gaacgcttag ctaatttgtc tattcgccaa gctaaaggtt atatgtacgt ggatgacatc 840 acggtggatt acaacgacag ccataaaatg atgcgtatca agcgtgatga gtcagaaatc 900 atcaatgagc agcatgcgcc atttgcacag tatttttatg caaaatag 948 <210> 323 <211> 1011 <212> DNA <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(1011) <223> Cas5 <400> 323 atgaaaataa tcatagaata tgactcttgc tggcgtaatg cctttttagg tggttcaaat 60 aatgaacctg taccgaaaaa aggccgcgaa tttttaggct caatgacgag cttaaaaaaa 120 gaaggcaatt ttaaggtgtg tgaaaatacc ttagataccg taatgggagt actaaatcgt 180 ttaattggcg accaacgaaa gctttatcag gcgcgcagta aaatgtacga atccgcttat 240 tacttcgaag cactggaaga taaagtcagc tttatagata agccgcagtt gaccaatgaa 300 atatcattta ttcgtaatat gaatggcagt acggatcaga atgcatttac tggaatgatc 360 aaagtgtctg atcctgtttt tacctctgaa tattcacagc aattttgggg cgtgttggct 420 ctcgatttca cgcagctctg tgattttatt attaagcaat cacaagttgt aggatctatt 480 gagttaaacc cgttaagtat tatcaatcgc ttggagagcc ttaatcagga aaaagcacta 540 gaaaatagtg atgatttagc ccaagtatta aaggtactaa atgaatactt tcctgatatt 600 gaatatttaa ataataaagg tttgatcaca cctatcagca tttattgctc ggcgctttac 660 cttcagcttg cccgcttaga aactagcttt aatatgacca cagctaaaac gaaagcaggg 720 gggattagtg gaatttccaa acgaggtttc actaaaaaag acttcatgga ccgatataca 780 acgggaccca aaaaaacaat ctggggtaat ccttttatca aaaaagaaaa gataaaaggg 840 caaggtgaag tgacctccat gatgaccaaa gcaagtggtc aattggaaat tagtatcgat 900 gtggatcgag acaaagccca agaaatcaaa attttgattg aaaatgctgg ggtatcaagc 960 ttttaccttg gaaaaaaagg gctggcctat gtatcaaaca ttaagcttta g 1011 <210> 324 <211> 552 <212> DNA <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(552) <223> Cas6 <400> 324 atgaactcat atattgatat acggctgaag cctgatgccg aaatgcggga ggctgagctc 60 agtagtaaag tatttactaa atttcacaaa gcgttagtga cgctcaatag ccataaaatt 120 ggcattagct ttccgcaaat gaaattaagc ttagggcagt tatttcgcat tcatggtgat 180 gcgagtttat tgcatgattt acaaggcctg gattggttag gccctttggc aggatattgt 240 caggttactg ctgtttctgc cgtgcctgat cacgtgcaat atcgtattgt ttccgttaaa 300 cgcagtaatt taagtaaagc aaaattgaag cgtttaattg ccagaggcag catagataaa 360 gacggagaga aacggtacaa ggtaaaaatg ctcggccaag gatttgataa tccatatctt 420 gatctgttta gtagttccac agggcaggta tatcgtaaat tctttgagtt tagcgacatt 480 caagctcacc cccttgatgg tgagtttgat agttatggtc ttagcaaaac cgctacagta 540 ccttggtttt aa 552 <210> 325 <211> 948 <212> DNA <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(948) <223> Cas7 <400> 325 atgcagaagg tgaccggcat caagtccgtg gacttcaaga tcaaggccct gggccacggc 60 gtggtgaact ggaatggccc caccacactg acaggcgacg atggcaagac cgtggacaat 120 cacacactgc ctaagctgag aggctacacc aacctgacag gcaaggtgaa ggatgagacc 180 ggctacaagt ataagaagca ggccaccgac atcaatttca aggagacacc tctgtacatc 240 agccagaact gcatccggca ccacctgttt agagagcagg ccttcgatct gcactatgcc 300 tctgacaaga acctgaagaa tgtgctggcc agcatcaccg gactgatcag gggatacgtg 360 gtgccaagct cccagtgtaa gcggacatcc cccctgctgc tggaggattt tgtggaccag 420 ctgggcaacg gcaatttcga gcagtacgga caggcaggag caagggatag cacctccttc 480 tttagcaaga ccacattcgg cgacacagag tacatctcct atggctctat cagcatcgag 540 cagctgcagt ttatcagcct ggataagaag ttcgaccgcg ccgccatggt catcaaggag 600 ggagagggag aagtgatcgc agcagagctg cagaattaca tccagagcct gaacccctcc 660 ctgaatcctc aggccatctt tcactctaac tatgtgcgga gaggcaccat cttcgaggag 720 ggcgagtgcg gcatcctgct gaatgacgat gcagtgaagg ccctggtggc agagaccctg 780 gagagactgg ccaacctgtc catcaggcag gccaagggct acatgtatgt ggacgatatc 840 acagtggatt acaatgactc tcacaagatg atgcggatca agagagatga gagcgagatc 900 atcaacgagc agcacgcccc ttttgcccag tacttctatg caaagtaa 948 <210> 326 <211> 1011 <212> DNA <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(1011) <223> Cas5 <400> 326 atgaagatca tcatcgagta cgactcctgc tggagaaacg ccttcctggg cggctctaac 60 aatgagcctg tgccaaagaa gggcagggag tttctgggca gcatgacatc cctgaagaag 120 gagggcaact tcaaggtgtg cgagaatacc ctggatacag tgatgggcgt gctgaacagg 180 ctgatcggcg accagaggaa gctgtaccag gcacggtcca agatgtatga gtctgcctac 240 tattttgagg ccctggagga taaggtgagc ttcatcgaca agccccagct gaccaatgag 300 atctccttta tcagaaacat gaatggctct accgatcaga acgccttcac aggcatgatc 360 aaggtgagcg accccgtgtt cacctctgag tacagccagc agttctgggg cgtgctggcc 420 ctggacttca cccagctgtg cgacttcatc atcaagcaga gccaggtggt gggctccatc 480 gagctgaacc ccctgtctat catcaatagg ctggagagcc tgaaccagga gaaggccctg 540 gagaatagcg acgatctggc ccaggtgctg aaggtgctga acgagtactt tccagacatc 600 gagtatctga acaataaggg cctgatcacc cccatcagca tctactgttc cgccctgtat 660 ctgcagctgg cccgcctgga gacctccttc aatatgacca cagccaagac aaaggccggc 720 ggcatctccg gcatctctaa gagaggcttt accaagaagg atttcatgga caggtacacc 780 acaggcccca agaagacaat ctggggcaac ccttttatca agaaggagaa gatcaagggc 840 cagggcgagg tgacctctat gatgacaaag gccagcggcc agctggagat ctccatcgac 900 gtggatcggg acaaggccca ggagatcaag atcctgatcg agaatgccgg cgtgtcctct 960 ttctacctgg gcaagaaggg cctggcctat gtgagcaaca tcaagctgta a 1011 <210> 327 <211> 552 <212> DNA <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(552) <223> Cas6 <400> 327 atgaacagct atatcgatat ccgcctgaag ccagacgcag agatgaggga ggcagagctg 60 tctagcaagg tgtttaccaa gttccacaag gccctggtga cactgaactc ccacaagatc 120 ggcatctctt ttccacagat gaagctgtcc ctgggccagc tgttcagaat ccacggcgat 180 gcctctctgc tgcacgatct gcagggcctg gactggctgg gacctctggc cggatactgc 240 caggtgaccg ccgtgagcgc cgtgccagac cacgtgcagt ataggatcgt gtccgtgaag 300 cggagcaatc tgagcaaggc caagctgaag aggctgatcg cccgcggcag catcgacaag 360 gatggcgaga agcggtacaa ggtgaagatg ctgggccagg gctttgataa cccatacctg 420 gacctgttct cctctagcac cggccaggtg tatagaaagt tctttgagtt ttccgatatc 480 caggcccacc cactggatgg cgagttcgac tcctatggcc tgtctaagac cgcaacagtg 540 ccatggttct aa 552 <210> 328 <211> 315 <212> PRT <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(315) <223> Cas7 <400> 328 Met Gln Lys Val Thr Gly Ile Lys Ser Val Asp Phe Lys Ile Lys Ala 1 5 10 15 Leu Gly His Gly Val Val Asn Trp Asn Gly Pro Thr Thr Leu Thr Gly 20 25 30 Asp Asp Gly Lys Thr Val Asp Asn His Thr Leu Pro Lys Leu Arg Gly 35 40 45 Tyr Thr Asn Leu Thr Gly Lys Val Lys Asp Glu Thr Gly Tyr Lys Tyr 50 55 60 Lys Lys Gln Ala Thr Asp Ile Asn Phe Lys Glu Thr Pro Leu Tyr Ile 65 70 75 80 Ser Gln Asn Cys Ile Arg His His Leu Phe Arg Glu Gln Ala Phe Asp 85 90 95 Leu His Tyr Ala Ser Asp Lys Asn Leu Lys Asn Val Leu Ala Ser Ile 100 105 110 Thr Gly Leu Ile Arg Gly Tyr Val Val Pro Ser Ser Gln Cys Lys Arg 115 120 125 Thr Ser Pro Leu Leu Leu Glu Asp Phe Val Asp Gln Leu Gly Asn Gly 130 135 140 Asn Phe Glu Gln Tyr Gly Gln Ala Gly Ala Arg Asp Ser Thr Ser Phe 145 150 155 160 Phe Ser Lys Thr Thr Phe Gly Asp Thr Glu Tyr Ile Ser Tyr Gly Ser 165 170 175 Ile Ser Ile Glu Gln Leu Gln Phe Ile Ser Leu Asp Lys Lys Phe Asp 180 185 190 Arg Ala Ala Met Val Ile Lys Glu Gly Glu Gly Glu Val Ile Ala Ala 195 200 205 Glu Leu Gln Asn Tyr Ile Gln Ser Leu Asn Pro Ser Leu Asn Pro Gln 210 215 220 Ala Ile Phe His Ser Asn Tyr Val Arg Arg Gly Thr Ile Phe Glu Glu 225 230 235 240 Gly Glu Cys Gly Ile Leu Leu Asn Asp Asp Ala Val Lys Ala Leu Val 245 250 255 Ala Glu Thr Leu Glu Arg Leu Ala Asn Leu Ser Ile Arg Gln Ala Lys 260 265 270 Gly Tyr Met Tyr Val Asp Asp Ile Thr Val Asp Tyr Asn Asp Ser His 275 280 285 Lys Met Met Arg Ile Lys Arg Asp Glu Ser Glu Ile Ile Asn Glu Gln 290 295 300 His Ala Pro Phe Ala Gln Tyr Phe Tyr Ala Lys 305 310 315 <210> 329 <211> 336 <212> PRT <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(336) <223> Cas5 <400> 329 Met Lys Ile Ile Ile Glu Tyr Asp Ser Cys Trp Arg Asn Ala Phe Leu 1 5 10 15 Gly Gly Ser Asn Asn Glu Pro Val Pro Lys Lys Gly Arg Glu Phe Leu 20 25 30 Gly Ser Met Thr Ser Leu Lys Lys Glu Gly Asn Phe Lys Val Cys Glu 35 40 45 Asn Thr Leu Asp Thr Val Met Gly Val Leu Asn Arg Leu Ile Gly Asp 50 55 60 Gln Arg Lys Leu Tyr Gln Ala Arg Ser Lys Met Tyr Glu Ser Ala Tyr 65 70 75 80 Tyr Phe Glu Ala Leu Glu Asp Lys Val Ser Phe Ile Asp Lys Pro Gln 85 90 95 Leu Thr Asn Glu Ile Ser Phe Ile Arg Asn Met Asn Gly Ser Thr Asp 100 105 110 Gln Asn Ala Phe Thr Gly Met Ile Lys Val Ser Asp Pro Val Phe Thr 115 120 125 Ser Glu Tyr Ser Gln Gln Phe Trp Gly Val Leu Ala Leu Asp Phe Thr 130 135 140 Gln Leu Cys Asp Phe Ile Ile Lys Gln Ser Gln Val Val Gly Ser Ile 145 150 155 160 Glu Leu Asn Pro Leu Ser Ile Ile Asn Arg Leu Glu Ser Leu Asn Gln 165 170 175 Glu Lys Ala Leu Glu Asn Ser Asp Asp Leu Ala Gln Val Leu Lys Val 180 185 190 Leu Asn Glu Tyr Phe Pro Asp Ile Glu Tyr Leu Asn Asn Lys Gly Leu 195 200 205 Ile Thr Pro Ile Ser Ile Tyr Cys Ser Ala Leu Tyr Leu Gln Leu Ala 210 215 220 Arg Leu Glu Thr Ser Phe Asn Met Thr Thr Ala Lys Thr Lys Ala Gly 225 230 235 240 Gly Ile Ser Gly Ile Ser Lys Arg Gly Phe Thr Lys Lys Asp Phe Met 245 250 255 Asp Arg Tyr Thr Thr Gly Pro Lys Lys Thr Ile Trp Gly Asn Pro Phe 260 265 270 Ile Lys Lys Glu Lys Ile Lys Gly Gln Gly Glu Val Thr Ser Met Met 275 280 285 Thr Lys Ala Ser Gly Gln Leu Glu Ile Ser Ile Asp Val Asp Arg Asp 290 295 300 Lys Ala Gln Glu Ile Lys Ile Leu Ile Glu Asn Ala Gly Val Ser Ser 305 310 315 320 Phe Tyr Leu Gly Lys Lys Gly Leu Ala Tyr Val Ser Asn Ile Lys Leu 325 330 335 <210> 330 <211> 183 <212> PRT <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(183) <223> Cas6 <400> 330 Met Asn Ser Tyr Ile Asp Ile Arg Leu Lys Pro Asp Ala Glu Met Arg 1 5 10 15 Glu Ala Glu Leu Ser Ser Lys Val Phe Thr Lys Phe His Lys Ala Leu 20 25 30 Val Thr Leu Asn Ser His Lys Ile Gly Ile Ser Phe Pro Gln Met Lys 35 40 45 Leu Ser Leu Gly Gln Leu Phe Arg Ile His Gly Asp Ala Ser Leu Leu 50 55 60 His Asp Leu Gln Gly Leu Asp Trp Leu Gly Pro Leu Ala Gly Tyr Cys 65 70 75 80 Gln Val Thr Ala Val Ser Ala Val Pro Asp His Val Gln Tyr Arg Ile 85 90 95 Val Ser Val Lys Arg Ser Asn Leu Ser Lys Ala Lys Leu Lys Arg Leu 100 105 110 Ile Ala Arg Gly Ser Ile Asp Lys Asp Gly Glu Lys Arg Tyr Lys Val 115 120 125 Lys Met Leu Gly Gln Gly Phe Asp Asn Pro Tyr Leu Asp Leu Phe Ser 130 135 140 Ser Ser Thr Gly Gln Val Tyr Arg Lys Phe Phe Glu Phe Ser Asp Ile 145 150 155 160 Gln Ala His Pro Leu Asp Gly Glu Phe Asp Ser Tyr Gly Leu Ser Lys 165 170 175 Thr Ala Thr Val Pro Trp Phe 180 <210> 331 <211> 88 <212> DNA <213> Shewanella putrefaciens CN-32 <220> <221> misc_feature <222> (1)..(88) <223> CRISPR <400> 331 gttcaccgcc gcacaggcgg cttagaaatc aaccaaatca taaattgcgc gaccacattg 60 gttcaccgcc gcacaggcgg cttagaaa 88 <210> 332 <211> 990 <212> DNA <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(990) <223> Cas7 <400> 332 atggctaaag taacaggcgt aaaaagcgta gattttaaaa ttacagcata tggttatggg 60 gtggtgaatt ggaatggtcc aacgtcactg acaggtaatg atggtaagac agtggataac 120 cacacattac ctaaacttcg tggtttcagt aatttatcag gtagagtcaa agaagaaaca 180 ggctacaaat accgtaaaga agcatcagac attgatttta acgaaacgcc tttatatatc 240 agccaaaatt gtattcgcca tcacttattc cgtgaccaat cttttgattt acattatgca 300 aaagataaga atttgattga tgttctagca tctattacgg gattaatccg tggttatgtt 360 gtgccatcga gtcaatgtaa acgtacaagt ccacttttga ttactgattt tattgatcag 420 ttgggtaatg gcaactttga acagctttcg aatgcaagtt caagtgaaga aattacgcaa 480 gatgatggct caaaaacata taaacgtggt gaaaactcaa tcttctctaa aacgaccttt 540 ggtgataccg aatatatcgc ttatggctcg attagtattg aacaattgca gttcatttca 600 ctcgataaaa aatttgaccg tgcttcgatg attattaaag aaggagaagg tgaaaagatt 660 gcagagcgag tacaggaatt tattaagagc cttgatccat cgaaagaacc aaaagcaatt 720 ttccataaaa attatgtccg taagggaaca atctttaatg aaggtgaagt gggtatttta 780 ctcgacaaca ctgcaattga tattttagtc aaagaaacgc tttcaatgct tgaagaactc 840 gttattaagc aagccaaagg ttatatgtgc gcagatacgg tagaagtgga ttataacgac 900 agtcataaaa tgatgcgtat taaacgcaat ccagaccaag ccaatcctga gctacaacaa 960 gattatgcag tttattttga agcccaataa 990 <210> 333 <211> 1014 <212> DNA <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(1014) <223> Cas5 <400> 333 atgcaaatca ttattgaata tgaatcctct tggcgaaatt catttttaga tggctctaat 60 aatgaaccct tgcctaaagg cggacgtaat tttattgctt caatgacaac attaaagcaa 120 gaaggcaatt acaaaaagcg tagtatttca aaagataccg tcatgggcat tctaaatcgt 180 ttgattggtg atcaacgtaa actttatcag gcacgacagg atgaaaatta ttattttact 240 gaagttgaaa aagtacttca ggagaatgat attgtcgatc acgctttaaa tagtaacgag 300 atggtttata tccgtaatgt ttcagggagt acagatcaaa attcatttac aggtgaaatt 360 aaagcaaatg atccatcctt tagctcgagt ttttcagctg aactttgggg tgttttatgg 420 cttaatttat ctgaagtttc caaatttatt ttggatgagt catattctgt gacctactct 480 gaagttttag atccaattac ggtgtgtaat cgtattgaag ttttgagtgc agaaaaacca 540 atggatctga cggaggatat tcaagctgta ctagactatt tattgaatca tttccccgat 600 acaaagtatt tgactgcaaa aaagcaatta cctttgatca gtatttatgc ctctgcttta 660 tatcttcaaa ttacaagatt atctcaaaga tatgatctct caactgtctt aacaaaaagt 720 ggcggactga gtggaatctc aaagcgtgga tttaccaaaa aagattttat ggatcgttat 780 acgacaggaa gtaaaaagct catttggggc aatccctatt tattgaaaga aaagaaaaaa 840 ggtgagggtg aaatcgtatc tgttttaacc aaagctagtg gaaagctcat tataaatttg 900 aatatttcta aagaacaagc aagagattta gaagaaaaaa ttgaaaatgc aggggtttca 960 tctttttact taggtaaaaa gggcttggct tatgtcacgg atattagacc ttaa 1014 <210> 334 <211> 603 <212> DNA <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(603) <223> Cas6 <400> 334 atgaactatt acattgaagt aacattaatg gaaaatgatc aattttctcc ttatgaatta 60 tggtcacaac tttatcctca attgcatctt gcattggttg aagccaaaaa tgctgacaat 120 aaagtgaata ttggattttc gttccctcaa taccgctttc atcaagataa aggtgttgga 180 tttataggta caaaattacg tttatttgct gagtctgaag ctgatttgaa gaaactggac 240 attcgacgtt ggcttgagcg tttagaagat tatgtacatg tcacttctat tcgtgaagta 300 cctaatgata ttaagaacta tgccatttat aagcgtaagc aagtgaaaac caatgcacaa 360 cgtttggcgc gtcaccgtgt aaaacgtggg gatattggct ttgatgaggc attagccaga 420 tacagcaatg tagttacgac aaccaacatg ccttatattg aaatgaaaag cctgagcact 480 tcagatcagc aaagtgaaaa acgttttaaa ttgtttatcg aaaagcaatc tgctgaaaaa 540 tctgaaactc aggtttttag cacttatgga ttaagttcgg tgtcatctgt accagaattt 600 taa 603 <210> 335 <211> 990 <212> DNA <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(990) <223> Cas7 <400> 335 atggccaagg tgacaggcgt gaagtccgtg gacttcaaga tcaccgccta cggctatggc 60 gtggtgaact ggaatggccc aacaagcctg accggcaatg acggcaagac agtggataac 120 cacaccctgc ccaagctgag aggcttctcc aatctgtctg gcagggtgaa ggaggagaca 180 ggctacaagt ataggaagga ggcctctgac atcgacttca acgagacccc tctgtacatc 240 agccagaact gcatcaggca ccacctgttt cgcgaccagt ccttcgatct gcactatgcc 300 aaggacaaga acctgatcga tgtgctggcc tctatcaccg gactgatcag gggatacgtg 360 gtgccaagct cccagtgtaa gcggacaagc cccctgctga tcaccgactt catcgatcag 420 ctgggcaacg gcaattttga gcagctgagc aatgcctcta gctccgagga gatcacacag 480 gacgatggct ccaagaccta caagcgcggc gagaacagca tcttttccaa gaccacattc 540 ggcgacaccg agtacatcgc ctatggctcc atctctatcg agcagctgca gtttatctcc 600 ctggacaaga agttcgatag agcctctatg atcatcaagg agggcgaggg cgagaagatc 660 gccgagaggg tgcaggagtt catcaagagc ctggacccca gcaaggagcc taaggccatc 720 ttccacaaga attacgtgcg gaagggcaca atctttaacg agggcgaagt gggcatcctg 780 ctggacaata cagccatcga tatcctggtg aaggagaccc tgagcatgct ggaggagctg 840 gtcatcaagc aggccaaggg ctacatgtgc gccgacaccg tggaggtgga ctataacgat 900 tcccacaaga tgatgaggat caagcgcaat ccagaccagg ccaaccccga gctgcagcag 960 gattacgccg tgtatttcga ggcacagtaa 990 <210> 336 <211> 1014 <212> DNA <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(1014) <223> Cas5 <400> 336 atgcagatca tcatcgagta cgagagctcc tggcgcaact ccttcctgga cggctctaac 60 aatgagcctc tgccaaaggg cggccggaac ttcatcgcct ccatgacaac cctgaagcag 120 gagggcaact acaagaagcg gagcatctct aaggatacag tgatgggcat cctgaacagg 180 ctgatcggcg accagcgcaa gctgtatcag gcccggcagg atgagaatta ctatttcacc 240 gaggtggaga aggtgctgca ggagaacgac atcgtggatc acgccctgaa cagcaatgag 300 atggtgtaca tcagaaacgt gagcggcagc acagaccaga actccttcac cggagagatc 360 aaggccaatg atcccagctt ttctagctcc ttctccgccg agctgtgggg cgtgctgtgg 420 ctgaacctgt ccgaggtgtc taagtttatc ctggacgagt cttacagcgt gacatattct 480 gaggtgctgg accccatcac cgtgtgcaat cggatcgagg tgctgagcgc cgagaagcct 540 atggacctga ccgaggatat ccaggccgtg ctggactacc tgctgaacca ctttccagat 600 acaaagtatc tgaccgccaa gaagcagctg cccctgatca gcatctacgc ctccgccctg 660 tatctgcaga tcacacggct gtctcagaga tacgacctga gcacagtgct gaccaagtcc 720 ggcggactga gcggcatctc caagagaggc tttaccaaga aggacttcat ggataggtac 780 acaaccggca gcaagaagct gatctggggc aatccttatc tgctgaagga gaagaagaag 840 ggcgagggcg agatcgtgtc tgtgctgaca aaggccagcg gcaagctgat catcaacctg 900 aatatctcca aggagcaggc cagagacctg gaggagaaga tcgagaacgc cggcgtgtct 960 agcttctacc tgggcaagaa gggcctggcc tatgtgaccg atatcaggcc ataa 1014 <210> 337 <211> 603 <212> DNA <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(603) <223> Cas6 <400> 337 atgaattact atatcgaggt gaccctgatg gagaacgatc agttttctcc ttacgagctg 60 tggagccagc tgtatccaca gctgcacctg gccctggtgg aggcaaagaa cgccgacaat 120 aaggtgaaca tcggcttctc ctttccccag taccgctttc accaggataa gggcgtgggc 180 ttcatcggca ccaagctgcg gctgtttgcc gagtccgagg ccgacctgaa gaagctggat 240 atccggcggt ggctggagag actggaggac tatgtgcacg tgacatctat cagggaggtg 300 cccaatgata tcaagaacta cgccatctat aagaggaagc aggtgaagac caacgcacag 360 cgcctggcca ggcacagagt gaagcggggc gacatcggct tcgatgaggc cctggcccgc 420 tacagcaatg tggtgaccac aaccaacatg ccttatatcg agatgaagag cctgtccaca 480 tctgaccagc agtctgagaa gcggtttaag ctgttcatcg agaagcagtc cgccgagaag 540 tctgagacac aggtgttcag cacctacggc ctgtctagcg tgtcctctgt gcctgagttt 600 taa 603 <210> 338 <211> 329 <212> PRT <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(329) <223> Cas7 <400> 338 Met Ala Lys Val Thr Gly Val Lys Ser Val Asp Phe Lys Ile Thr Ala 1 5 10 15 Tyr Gly Tyr Gly Val Val Asn Trp Asn Gly Pro Thr Ser Leu Thr Gly 20 25 30 Asn Asp Gly Lys Thr Val Asp Asn His Thr Leu Pro Lys Leu Arg Gly 35 40 45 Phe Ser Asn Leu Ser Gly Arg Val Lys Glu Glu Thr Gly Tyr Lys Tyr 50 55 60 Arg Lys Glu Ala Ser Asp Ile Asp Phe Asn Glu Thr Pro Leu Tyr Ile 65 70 75 80 Ser Gln Asn Cys Ile Arg His His Leu Phe Arg Asp Gln Ser Phe Asp 85 90 95 Leu His Tyr Ala Lys Asp Lys Asn Leu Ile Asp Val Leu Ala Ser Ile 100 105 110 Thr Gly Leu Ile Arg Gly Tyr Val Val Pro Ser Ser Gln Cys Lys Arg 115 120 125 Thr Ser Pro Leu Leu Ile Thr Asp Phe Ile Asp Gln Leu Gly Asn Gly 130 135 140 Asn Phe Glu Gln Leu Ser Asn Ala Ser Ser Ser Glu Glu Ile Thr Gln 145 150 155 160 Asp Asp Gly Ser Lys Thr Tyr Lys Arg Gly Glu Asn Ser Ile Phe Ser 165 170 175 Lys Thr Thr Phe Gly Asp Thr Glu Tyr Ile Ala Tyr Gly Ser Ile Ser 180 185 190 Ile Glu Gln Leu Gln Phe Ile Ser Leu Asp Lys Lys Phe Asp Arg Ala 195 200 205 Ser Met Ile Ile Lys Glu Gly Glu Gly Glu Lys Ile Ala Glu Arg Val 210 215 220 Gln Glu Phe Ile Lys Ser Leu Asp Pro Ser Lys Glu Pro Lys Ala Ile 225 230 235 240 Phe His Lys Asn Tyr Val Arg Lys Gly Thr Ile Phe Asn Glu Gly Glu 245 250 255 Val Gly Ile Leu Leu Asp Asn Thr Ala Ile Asp Ile Leu Val Lys Glu 260 265 270 Thr Leu Ser Met Leu Glu Glu Leu Val Ile Lys Gln Ala Lys Gly Tyr 275 280 285 Met Cys Ala Asp Thr Val Glu Val Asp Tyr Asn Asp Ser His Lys Met 290 295 300 Met Arg Ile Lys Arg Asn Pro Asp Gln Ala Asn Pro Glu Leu Gln Gln 305 310 315 320 Asp Tyr Ala Val Tyr Phe Glu Ala Gln 325 <210> 339 <211> 337 <212> PRT <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(337) <223> Cas5 <400> 339 Met Gln Ile Ile Ile Glu Tyr Glu Ser Ser Trp Arg Asn Ser Phe Leu 1 5 10 15 Asp Gly Ser Asn Asn Glu Pro Leu Pro Lys Gly Gly Arg Asn Phe Ile 20 25 30 Ala Ser Met Thr Thr Leu Lys Gln Glu Gly Asn Tyr Lys Lys Arg Ser 35 40 45 Ile Ser Lys Asp Thr Val Met Gly Ile Leu Asn Arg Leu Ile Gly Asp 50 55 60 Gln Arg Lys Leu Tyr Gln Ala Arg Gln Asp Glu Asn Tyr Tyr Phe Thr 65 70 75 80 Glu Val Glu Lys Val Leu Gln Glu Asn Asp Ile Val Asp His Ala Leu 85 90 95 Asn Ser Asn Glu Met Val Tyr Ile Arg Asn Val Ser Gly Ser Thr Asp 100 105 110 Gln Asn Ser Phe Thr Gly Glu Ile Lys Ala Asn Asp Pro Ser Phe Ser 115 120 125 Ser Ser Phe Ser Ala Glu Leu Trp Gly Val Leu Trp Leu Asn Leu Ser 130 135 140 Glu Val Ser Lys Phe Ile Leu Asp Glu Ser Tyr Ser Val Thr Tyr Ser 145 150 155 160 Glu Val Leu Asp Pro Ile Thr Val Cys Asn Arg Ile Glu Val Leu Ser 165 170 175 Ala Glu Lys Pro Met Asp Leu Thr Glu Asp Ile Gln Ala Val Leu Asp 180 185 190 Tyr Leu Leu Asn His Phe Pro Asp Thr Lys Tyr Leu Thr Ala Lys Lys 195 200 205 Gln Leu Pro Leu Ile Ser Ile Tyr Ala Ser Ala Leu Tyr Leu Gln Ile 210 215 220 Thr Arg Leu Ser Gln Arg Tyr Asp Leu Ser Thr Val Leu Thr Lys Ser 225 230 235 240 Gly Gly Leu Ser Gly Ile Ser Lys Arg Gly Phe Thr Lys Lys Asp Phe 245 250 255 Met Asp Arg Tyr Thr Thr Gly Ser Lys Lys Leu Ile Trp Gly Asn Pro 260 265 270 Tyr Leu Leu Lys Glu Lys Lys Lys Gly Glu Gly Glu Ile Val Ser Val 275 280 285 Leu Thr Lys Ala Ser Gly Lys Leu Ile Ile Asn Leu Asn Ile Ser Lys 290 295 300 Glu Gln Ala Arg Asp Leu Glu Glu Lys Ile Glu Asn Ala Gly Val Ser 305 310 315 320 Ser Phe Tyr Leu Gly Lys Lys Gly Leu Ala Tyr Val Thr Asp Ile Arg 325 330 335 Pro <210> 340 <211> 200 <212> PRT <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(200) <223> Cas6 <400> 340 Met Asn Tyr Tyr Ile Glu Val Thr Leu Met Glu Asn Asp Gln Phe Ser 1 5 10 15 Pro Tyr Glu Leu Trp Ser Gln Leu Tyr Pro Gln Leu His Leu Ala Leu 20 25 30 Val Glu Ala Lys Asn Ala Asp Asn Lys Val Asn Ile Gly Phe Ser Phe 35 40 45 Pro Gln Tyr Arg Phe His Gln Asp Lys Gly Val Gly Phe Ile Gly Thr 50 55 60 Lys Leu Arg Leu Phe Ala Glu Ser Glu Ala Asp Leu Lys Lys Leu Asp 65 70 75 80 Ile Arg Arg Trp Leu Glu Arg Leu Glu Asp Tyr Val His Val Thr Ser 85 90 95 Ile Arg Glu Val Pro Asn Asp Ile Lys Asn Tyr Ala Ile Tyr Lys Arg 100 105 110 Lys Gln Val Lys Thr Asn Ala Gln Arg Leu Ala Arg His Arg Val Lys 115 120 125 Arg Gly Asp Ile Gly Phe Asp Glu Ala Leu Ala Arg Tyr Ser Asn Val 130 135 140 Val Thr Thr Thr Asn Met Pro Tyr Ile Glu Met Lys Ser Leu Ser Thr 145 150 155 160 Ser Asp Gln Gln Ser Glu Lys Arg Phe Lys Leu Phe Ile Glu Lys Gln 165 170 175 Ser Ala Glu Lys Ser Glu Thr Gln Val Phe Ser Thr Tyr Gly Leu Ser 180 185 190 Ser Val Ser Ser Val Pro Glu Phe 195 200 <210> 341 <211> 88 <212> DNA <213> Acinetobacter sp. 869535 <220> <221> misc_feature <222> (1)..(88) <223> CRISPR <400> 341 gttcactgcc atataggcag cttagaaaat cgttttttca tacgagattc gaaacggaca 60 gttcactgcc atataggcag cttagaaa 88 <210> 342 <211> 948 <212> DNA <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(948) <223> Cas7 <400> 342 atgcaaaaag taacaggaat taaaagtgta gattttaaaa ttaaagcatt aggtcatggt 60 gtagtgaatt ggaatgggcc tacaacctta actggagatg atggtaaaac agtcgataat 120 cataccttgc caaaattgcg cggctatacc aacttaaccg gtaaagtgaa agatgaaact 180 ggctataaat ataaaaaaca agcaactgac attaatttca aagaaacacc actgtatata 240 agtcaaaatt gtattcgaca tcatttgttt cgtgagcaag cttttgattt acattttgct 300 agtgacaaaa acctaaaaaa cgttctggct tcaattacgg ggttgatccg aggttatgta 360 gttcctgcaa gtcaatgtaa gcgcaccagt ccactattgt tagaagattt tgttgatcaa 420 ttggggaatg gcaactttga acaatatgga caggcaggtg ctagagatag cacatcattt 480 ttttcaaaga ctacttttgg tgatactgaa tatatctctt atggttccat cagtattgaa 540 caactgcaat ttatatcgtt ggataagaag tttgatcgtg ccgcaatggt tatcaaagag 600 ggcgagggtg aggttattgc cgctgaacta caaagctata ttaagtcact taatcctagc 660 ttaaacccac aggcgatttt tcacaaaaac tacgtcagaa gaggcacaat atttgaagag 720 ggagagtgtg gcattttact taatgatgac gcagtgaaag ctttagttga cgaaacacta 780 gatcgtttag ctaatttgtc tattcgtcaa gcgaaaggtt atatgtatgt tgacgaaatt 840 acagttgatt ataacgatag tcataaaatg atgcgcatta agcgtgatga atcagaaatt 900 tcagagcaac ctaatagcaa ttttgcaatt tacttttatg caaagtag 948 <210> 343 <211> 1056 <212> DNA <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(1056) <223> Cas5 <400> 343 atgaaaatct taattgatta tgaagcatct tggcgtaatt catttttgga tggtaataat 60 gatgaaccat tacccgcgaa aggtagaaca tttatagctg caagctccag tttaaatgat 120 cgtgaaaagc cggataattt taaattagtt gacgtaacga agcagactgt atttggaatc 180 ctgtgtcgat tgatcggtga tcaaaggaaa ttataccaat caaagcaaag tgatacatat 240 ttcctgaaag ggttggaaga ctttataacg ttcaaagata tacctgtgtt gaccaatgaa 300 attgtatata ttcggaatat gactggcagc tttgacagag agtcatatac tggagtgata 360 aatacaaatc attggttgtt taaatctgtt ttttctaatc aactttggag tcttgctttt 420 actgatctaa atgcactggt cagttttata gttgaagaga ttgaagttgc taatgatcaa 480 gagttcgatc ctagggatgt tattgatcga tttaataaat ttaaaagtat tggtatcagt 540 aaaattgatg aattaggctt gtcagaaaat cgtttatata aggctgttga cattctttat 600 gatgctaacc ttaatgcaaa tgtaaggtct ttgtttccca gtatgaaaaa gagcttttct 660 gatattgatt atattaaatc agataaagtt gatgtcagag cattatattg ctctgcacta 720 tatttaaaat tagtcaggct taatctcggt ggtataccta taccgagtaa tattaaaggg 780 ttttctgtgg ctggtttgac accaaaagac tttatgggca gtttcacaca aggtaaaaag 840 aaggtttacg gtaatcctta tctaaaaaag gaaatgataa aagggcaagg agaagtgaca 900 tctatgctga ccaaagccag tgggcagttg gaaattacta ttgacgtgga tcgagacaaa 960 gcacaagaaa tcaaaacgtt gattgaaaat gctggggtat caagctttta ccttggaaaa 1020 aaagggctgg cttacgtttc aagcattcga ctttag 1056 <210> 344 <211> 552 <212> DNA <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(552) <223> Cas6 <400> 344 atggacgcat acattgatat acggctgatg cctgatgctg aaatgcgcga ggcagaatta 60 agtagtaaag tctttattaa attccacaaa gcactggtga agttacagag caataaaatt 120 ggtattagct ttccagaagc aaatattaag ctagggcgat tatttcgttt acacggtgaa 180 gtgagcgcat tgcatgattt gcaggggtta aattggttag gacctttggc aggatattgc 240 aagattacta cggttactca tgtgccagac caagtggaat atcgcatcat ttcagttaaa 300 cgcagcaatt taagcaaagc aaaattagcg cgtttaattg ctagaggtag catagataaa 360 gatggtgaga aacgttacaa agtaaaaatg cttcgccaag ggtttgataa tccatacctt 420 gatctgtcta gcagttcaac agggcaggtg taccgaaaat tctttgagtt tagtgatatt 480 caagctgagc cagttgatgg tgagtttgat agttatggtc taagcaaaac agcaactgta 540 ccttggtttt aa 552 <210> 345 <211> 948 <212> DNA <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(948) <223> Cas7 <400> 345 atgcagaagg tgaccggcat caagtccgtg gacttcaaga tcaaggccct gggccacggc 60 gtggtgaact ggaatggccc taccacactg acaggcgacg atggcaagac cgtggataat 120 cacacactgc caaagctgag gggctatacc aacctgacag gcaaggtgaa ggacgagacc 180 ggctacaagt ataagaagca ggccaccgat atcaacttca aggagacacc tctgtacatc 240 agccagaact gcatcaggca ccacctgttc cgcgagcagg cctttgacct gcacttcgcc 300 tctgataaga atctgaagaa cgtgctggcc agcatcaccg gactgatcag gggctatgtg 360 gtgccagcca gccagtgtaa gagaacatcc cccctgctgc tggaggattt tgtggaccag 420 ctgggcaacg gcaatttcga gcagtacgga caggcaggag caagggactc cacctctttc 480 ttttccaaga ccacattcgg cgatacagag tacatctctt atggcagcat ctccatcgag 540 cagctgcagt ttatcagcct ggacaagaag ttcgatcggg ccgccatggt catcaaggag 600 ggagagggag aagtgatcgc agcagagctg cagagctaca tcaagtccct gaatccatct 660 ctgaaccccc aggccatctt tcacaagaac tatgtgcgga gaggcaccat cttcgaggag 720 ggcgagtgcg gcatcctgct gaatgacgat gccgtgaagg ccctggtgga cgagaccctg 780 gatcggctgg ccaacctgtc catcagacag gccaagggct acatgtatgt ggacgagatc 840 acagtggatt acaatgacag ccacaagatg atgcggatca agagagatga gtctgagatc 900 agcgagcagc caaactccaa ttttgccatc tacttctatg caaagtaa 948 <210> 346 <211> 1056 <212> DNA <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(1056) <223> Cas5 <400> 346 atgaagatcc tgatcgacta cgaggcctct tggagaaaca gctttctgga cggcaacaat 60 gatgagcctc tgccagccaa gggcaggaca ttcatcgccg ccagctcctc tctgaatgac 120 cgcgagaagc cagataactt taagctggtg gatgtgacca agcagacagt gttcggcatc 180 ctgtgcaggc tgatcggcga ccagcgcaag ctgtaccagt ctaagcagag cgatacctat 240 tttctgaagg gcctggagga ctttatcacc ttcaaggata tccccgtgct gacaaatgag 300 atcgtgtaca tcaggaacat gacaggctcc ttcgaccgcg agtcttatac cggcgtgatc 360 aacacaaatc actggctgtt taagtccgtg ttctctaatc agctgtggag cctggccttt 420 accgacctga acgccctggt gtccttcatc gtggaggaga tcgaggtggc caatgatcag 480 gagttcgatc cccgggacgt gatcgatcgg ttcaacaagt tcaagtccat cggcatctct 540 aagatcgacg agctgggcct gagcgagaac aggctgtaca aggccgtgga catcctgtat 600 gatgccaacc tgaatgccaa cgtgcgcagc ctgtttcctt ccatgaagaa gagcttctcc 660 gacatcgatt acatcaagtc tgacaaggtg gatgtgcggg ccctgtactg cagcgccctg 720 tatctgaagc tggtgagact gaatctgggc ggcatcccca tcccttctaa catcaagggc 780 tttagcgtgg ccggcctgac cccaaaggac tttatgggct ccttcacaca gggcaagaag 840 aaggtgtacg gcaatcccta tctgaagaag gagatgatca agggccaggg cgaggtgacc 900 tccatgctga caaaggcctc tggccagctg gagatcacca tcgacgtgga tagagacaag 960 gcccaggaga tcaagacact gatcgagaac gccggcgtga gctccttcta cctgggcaag 1020 aagggcctgg cctacgtgag cagcatcagg ctgtaa 1056 <210> 347 <211> 552 <212> DNA <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(552) <223> Cas6 <400> 347 atggacgcct acatcgatat ccggctgatg ccagatgccg agatgagaga ggccgagctg 60 agctccaagg tgtttatcaa gttccacaag gccctggtga agctgcagtc caataagatc 120 ggcatctctt ttcctgaggc caacatcaag ctgggcaggc tgttccgcct gcacggagag 180 gtgtccgccc tgcacgacct gcagggcctg aattggctgg gaccactggc cggctactgc 240 aagatcacca cagtgaccca cgtgcccgat caggtggagt ataggatcat ctctgtgaag 300 cggagcaacc tgtctaaggc aaagctggcc aggctgatcg caagaggctc catcgacaag 360 gatggcgaga agaggtataa ggtgaagatg ctgcgccagg gctttgacaa tccttacctg 420 gatctgtcta gctcctctac cggccaggtg tatcggaagt tctttgagtt tagcgacatc 480 caggcagagc cagtggacgg agagttcgat agctacggcc tgtccaagac cgcaacagtg 540 ccttggttct aa 552 <210> 348 <211> 315 <212> PRT <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(315) <223> Cas7 <400> 348 Met Gln Lys Val Thr Gly Ile Lys Ser Val Asp Phe Lys Ile Lys Ala 1 5 10 15 Leu Gly His Gly Val Val Asn Trp Asn Gly Pro Thr Thr Leu Thr Gly 20 25 30 Asp Asp Gly Lys Thr Val Asp Asn His Thr Leu Pro Lys Leu Arg Gly 35 40 45 Tyr Thr Asn Leu Thr Gly Lys Val Lys Asp Glu Thr Gly Tyr Lys Tyr 50 55 60 Lys Lys Gln Ala Thr Asp Ile Asn Phe Lys Glu Thr Pro Leu Tyr Ile 65 70 75 80 Ser Gln Asn Cys Ile Arg His His Leu Phe Arg Glu Gln Ala Phe Asp 85 90 95 Leu His Phe Ala Ser Asp Lys Asn Leu Lys Asn Val Leu Ala Ser Ile 100 105 110 Thr Gly Leu Ile Arg Gly Tyr Val Val Pro Ala Ser Gln Cys Lys Arg 115 120 125 Thr Ser Pro Leu Leu Leu Glu Asp Phe Val Asp Gln Leu Gly Asn Gly 130 135 140 Asn Phe Glu Gln Tyr Gly Gln Ala Gly Ala Arg Asp Ser Thr Ser Phe 145 150 155 160 Phe Ser Lys Thr Thr Phe Gly Asp Thr Glu Tyr Ile Ser Tyr Gly Ser 165 170 175 Ile Ser Ile Glu Gln Leu Gln Phe Ile Ser Leu Asp Lys Lys Phe Asp 180 185 190 Arg Ala Ala Met Val Ile Lys Glu Gly Glu Gly Glu Val Ile Ala Ala 195 200 205 Glu Leu Gln Ser Tyr Ile Lys Ser Leu Asn Pro Ser Leu Asn Pro Gln 210 215 220 Ala Ile Phe His Lys Asn Tyr Val Arg Arg Gly Thr Ile Phe Glu Glu 225 230 235 240 Gly Glu Cys Gly Ile Leu Leu Asn Asp Asp Ala Val Lys Ala Leu Val 245 250 255 Asp Glu Thr Leu Asp Arg Leu Ala Asn Leu Ser Ile Arg Gln Ala Lys 260 265 270 Gly Tyr Met Tyr Val Asp Glu Ile Thr Val Asp Tyr Asn Asp Ser His 275 280 285 Lys Met Met Arg Ile Lys Arg Asp Glu Ser Glu Ile Ser Glu Gln Pro 290 295 300 Asn Ser Asn Phe Ala Ile Tyr Phe Tyr Ala Lys 305 310 315 <210> 349 <211> 351 <212> PRT <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(351) <223> Cas5 <400> 349 Met Lys Ile Leu Ile Asp Tyr Glu Ala Ser Trp Arg Asn Ser Phe Leu 1 5 10 15 Asp Gly Asn Asn Asp Glu Pro Leu Pro Ala Lys Gly Arg Thr Phe Ile 20 25 30 Ala Ala Ser Ser Ser Leu Asn Asp Arg Glu Lys Pro Asp Asn Phe Lys 35 40 45 Leu Val Asp Val Thr Lys Gln Thr Val Phe Gly Ile Leu Cys Arg Leu 50 55 60 Ile Gly Asp Gln Arg Lys Leu Tyr Gln Ser Lys Gln Ser Asp Thr Tyr 65 70 75 80 Phe Leu Lys Gly Leu Glu Asp Phe Ile Thr Phe Lys Asp Ile Pro Val 85 90 95 Leu Thr Asn Glu Ile Val Tyr Ile Arg Asn Met Thr Gly Ser Phe Asp 100 105 110 Arg Glu Ser Tyr Thr Gly Val Ile Asn Thr Asn His Trp Leu Phe Lys 115 120 125 Ser Val Phe Ser Asn Gln Leu Trp Ser Leu Ala Phe Thr Asp Leu Asn 130 135 140 Ala Leu Val Ser Phe Ile Val Glu Glu Ile Glu Val Ala Asn Asp Gln 145 150 155 160 Glu Phe Asp Pro Arg Asp Val Ile Asp Arg Phe Asn Lys Phe Lys Ser 165 170 175 Ile Gly Ile Ser Lys Ile Asp Glu Leu Gly Leu Ser Glu Asn Arg Leu 180 185 190 Tyr Lys Ala Val Asp Ile Leu Tyr Asp Ala Asn Leu Asn Ala Asn Val 195 200 205 Arg Ser Leu Phe Pro Ser Met Lys Lys Ser Phe Ser Asp Ile Asp Tyr 210 215 220 Ile Lys Ser Asp Lys Val Asp Val Arg Ala Leu Tyr Cys Ser Ala Leu 225 230 235 240 Tyr Leu Lys Leu Val Arg Leu Asn Leu Gly Gly Ile Pro Ile Pro Ser 245 250 255 Asn Ile Lys Gly Phe Ser Val Ala Gly Leu Thr Pro Lys Asp Phe Met 260 265 270 Gly Ser Phe Thr Gln Gly Lys Lys Lys Val Tyr Gly Asn Pro Tyr Leu 275 280 285 Lys Lys Glu Met Ile Lys Gly Gln Gly Glu Val Thr Ser Met Leu Thr 290 295 300 Lys Ala Ser Gly Gln Leu Glu Ile Thr Ile Asp Val Asp Arg Asp Lys 305 310 315 320 Ala Gln Glu Ile Lys Thr Leu Ile Glu Asn Ala Gly Val Ser Ser Phe 325 330 335 Tyr Leu Gly Lys Lys Gly Leu Ala Tyr Val Ser Ser Ile Arg Leu 340 345 350 <210> 350 <211> 183 <212> PRT <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(183) <223> Cas6 <400> 350 Met Asp Ala Tyr Ile Asp Ile Arg Leu Met Pro Asp Ala Glu Met Arg 1 5 10 15 Glu Ala Glu Leu Ser Ser Lys Val Phe Ile Lys Phe His Lys Ala Leu 20 25 30 Val Lys Leu Gln Ser Asn Lys Ile Gly Ile Ser Phe Pro Glu Ala Asn 35 40 45 Ile Lys Leu Gly Arg Leu Phe Arg Leu His Gly Glu Val Ser Ala Leu 50 55 60 His Asp Leu Gln Gly Leu Asn Trp Leu Gly Pro Leu Ala Gly Tyr Cys 65 70 75 80 Lys Ile Thr Thr Val Thr His Val Pro Asp Gln Val Glu Tyr Arg Ile 85 90 95 Ile Ser Val Lys Arg Ser Asn Leu Ser Lys Ala Lys Leu Ala Arg Leu 100 105 110 Ile Ala Arg Gly Ser Ile Asp Lys Asp Gly Glu Lys Arg Tyr Lys Val 115 120 125 Lys Met Leu Arg Gln Gly Phe Asp Asn Pro Tyr Leu Asp Leu Ser Ser 130 135 140 Ser Ser Thr Gly Gln Val Tyr Arg Lys Phe Phe Glu Phe Ser Asp Ile 145 150 155 160 Gln Ala Glu Pro Val Asp Gly Glu Phe Asp Ser Tyr Gly Leu Ser Lys 165 170 175 Thr Ala Thr Val Pro Trp Phe 180 <210> 351 <211> 88 <212> DNA <213> Vibrio cholerae HE48 <220> <221> misc_feature <222> (1)..(88) <223> CRISPR <400> 351 gttcactgcc gcacaggcag cttagaaata accggaggcg tacactcgat agaggcagcg 60 gttcactgcc gcacaggcag cttagaaa 88 <210> 352 <211> 3736 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR <400> 352 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggctagcgag ttccccgcgc cagcggggat 120 aaaccgccag tgataagtgg aatgccatgt gggctgtcga gttccccgcg ccagcgggga 180 taaaccggag ctcgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt 240 gaggggtttt ttgctgaaac ctcaggcatt tgagaagcac acggtcacac tgcttccggt 300 agtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgac cctgccctga 360 accgacgacc gggtcgaatt tgctttcgaa tttctgccat tcatccgctt attatcactt 420 attcaggcgt agcaaccagg cgtttaaggg caccaataac tgccttaaaa aaattacgcc 480 ccgccctgcc actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag 540 ccatcacaaa cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc 600 gtataatatt tgcccatagt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt 660 aaatcaaaac tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata 720 aaccctttag ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg 780 tgtagaaact gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt 840 tgctcatgga aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct 900 ttcattgcca tacggaactc cggatgagca ttcatcaggc gggcaagaat gtgaataaag 960 gccggataaa acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc 1020 tgaacggtct ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta 1080 cgatgccatt gggatatatc aacggtggta tatccagtga tttttttctc cattttagct 1140 tccttagctc ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca 1200 ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccaaaagttg 1260 gcccagggct tcccggtatc aacagggaca ccaggattta tttattctgc gaagtgatct 1320 tccgtcacag gtatttattc ggcgcaaagt gcgtcgggtg atgctgccaa cttactgatt 1380 tagtgtatga tggtgttttt gaggtgctcc agtggcttct gtttctatca gctgtccctc 1440 ctgttcagct actgacgggg tggtgcgtaa cggcaaaagc accgccggac atcagcgcta 1500 gcggagtgta tactggctta ctatgttggc actgatgagg gtgtcagtga agtgcttcat 1560 gtggcaggag aaaaaaggct gcaccggtgc gtcagcagaa tatgtgatac aggatatatt 1620 ccgcttcctc gctcactgac tcgctacgct cggtcgttcg actgcggcga gcggaaatgg 1680 cttacgaacg gggcggagat ttcctggaag atgccaggaa gatacttaac agggaagtga 1740 gagggccgcg gcaaagccgt ttttccatag gctccgcccc cctgacaagc atcacgaaat 1800 ctgacgctca aatcagtggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1860 cctggcggct ccctcgtgcg ctctcctgtt cctgcctttc ggtttaccgg tgtcattccg 1920 ctgttatggc cgcgtttgtc tcattccacg cctgacactc agttccgggt aggcagttcg 1980 ctccaagctg gactgtatgc acgaaccccc cgttcagtcc gaccgctgcg ccttatccgg 2040 taactatcgt cttgagtcca acccggaaag acatgcaaaa gcaccactgg cagcagccac 2100 tggtaattga tttagaggag ttagtcttga agtcatgcgc cggttaaggc taaactgaaa 2160 ggacaagttt tggtgactgc gctcctccaa gccagttacc tcggttcaaa gagttggtag 2220 ctcagagaac cttcgaaaaa ccgccctgca aggcggtttt ttcgttttca gagcaagaga 2280 ttacgcgcag accaaaacga tctcaagaag atcatcttat taatcagata aaatatttct 2340 agatttcagt gcaatttatc tcttcaaatg tagcacctga agtcagcccc atacgatata 2400 agttgtaatt ctcatgttag tcatgccccg cgcccaccgg aaggagctga ctgggttgaa 2460 ggctctcaag ggcatcggtc gagatcccgg tgcctaatga gtgagctaac ttacattaat 2520 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 2580 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgccagggtg gtttttcttt 2640 tcaccagtga gacgggcaac agctgattgc ccttcaccgc ctggccctga gagagttgca 2700 gcaagcggtc cacgctggtt tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg 2760 gcgggatata acatgagctg tcttcggtat cgtcgtatcc cactaccgag atgtccgcac 2820 caacgcgcag cccggactcg gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg 2880 caaccagcat cgcagtggga acgatgccct cattcagcat ttgcatggtt tgttgaaaac 2940 cggacatggc actccagtcg ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga 3000 gatatttatg ccagccagcc agacgcagac gcgccgagac agaacttaat gggcccgcta 3060 acagcgcgat ttgctggtga cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt 3120 cttcatggga gaaaataata ctgttgatgg gtgtctggtc agagacatca agaaataacg 3180 ccggaacatt agtgcaggca gcttccacag caatggcatc ctggtcatcc agcggatagt 3240 taatgatcag cccactgacg cgttgcgcga gaagattgtg caccgccgct ttacaggctt 3300 cgacgccgct tcgttctacc atcgacacca ccacgctggc acccagttga tcggcgcgag 3360 atttaatcgc cgcgacaatt tgcgacggcg cgtgcagggc cagactggag gtggcaacgc 3420 caatcagcaa cgactgtttg cccgccagtt gttgtgccac gcggttggga atgtaattca 3480 gctccgccat cgccgcttcc actttttccc gcgttttcgc agaaacgtgg ctggcctggt 3540 tcaccacgcg ggaaacggtc tgataagaga caccggcata ctctgcgaca tcgtataacg 3600 ttactggttt cacattcacc accctgaatt gactctcttc cgggcgctat catgccatac 3660 cgcgaaaggt tttgcgccat tcgatggtgt ccgggatctc gacgctctcc cttatgcgac 3720 tcctgcatta ggaaat 3736 <210> 353 <211> 4118 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR <400> 353 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg gattagctga tctttaataa taaggaaatg 120 ttacattaag gttggtgggt tgtttttatg ggaaaaaatg ctttaagaac aaatgtatac 180 ttttagagag ttccccgcgc cagcggggat aaaccgcaaa cacagcatgg acgacagcca 240 ggtacctaga gttccccgcg ccagcgggga taaaccgcaa acacagcatg gacgacagcc 300 aggtacctag agttccccgc gccagcgggg ataaaccgca aacacagcat ggacgacagc 360 caggtaccta gagttccccg cgccagcggg gataaaccga aaacaaaagg ctcagtcgga 420 agactgggcc ttttgtttta accccttggg gcctctaaac gggtcttgag gggttttttg 480 ctcgagtctg gtaaagaaac cgctgctgcg aaatttgaac gccagcacat ggactcgtct 540 actagcgcag cttaattaac ctaggctgct gccaccgctg agcaataact agcataaccc 600 cttggggcct ctaaacgggt cttgaggggt tttttgctga aacctcaggc atttgagaag 660 cacacggtca cactgcttcc ggtagtcaat aaaccggtaa accagcaata gacataagcg 720 gctatttaac gaccctgccc tgaaccgacg accgggtcga atttgctttc gaatttctgc 780 cattcatccg cttattatca cttattcagg cgtagcacca ggcgtttaag ggcaccaata 840 actgccttaa aaaaattacg ccccgccctg ccactcatcg cagtactgtt gtaattcatt 900 aagcattctg ccgacatgga agccatcaca gacggcatga tgaacctgaa tcgccagcgg 960 catcagcacc ttgtcgcctt gcgtataata tttgcccata gtgaaaacgg gggcgaagaa 1020 gttgtccata ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg gattggctga 1080 gacgaaaaac atattctcaa taaacccttt agggaaatag gccaggtttt caccgtaaca 1140 cgccacatct tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt attcactcca 1200 gagcgatgaa aacgtttcag tttgctcatg gaaaacggtg taacaagggt gaacactatc 1260 ccatatcacc agctcaccgt ctttcattgc catacggaac tccggatgag cattcatcag 1320 gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct ttacggtctt 1380 taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag caactgactg 1440 aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg tatatccagt 1500 gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact caaaaaatac 1560 gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac 1620 gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt 1680 tatttattct gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa gtgcgtcggg 1740 tgatgctgcc aacttactga tttagtgtat gatggtgttt ttgaggtgct ccagtggctt 1800 ctgtttctat cagctgtccc tcctgttcag ctactgacgg ggtggtgcgt aacggcaaaa 1860 gcaccgccgg acatcagcgc tagcggagtg tatactggct tactatgttg gcactgatga 1920 gggtgtcagt gaagtgcttc atgtggcagg agaaaaaagg ctgcaccggt gcgtcagcag 1980 aatatgtgat acaggatata ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt 2040 cgactgcggc gagcggaaat ggcttacgaa cggggcggag atttcctgga agatgccagg 2100 aagatactta acagggaagt gagagggccg cggcaaagcc gtttttccat aggctccgcc 2160 cccctgacaa gcatcacgaa atctgacgct caaatcagtg gtggcgaaac ccgacaggac 2220 tataaagata ccaggcgttt cccctggcgg ctccctcgtg cgctctcctg ttcctgcctt 2280 tcggtttacc ggtgtcattc cgctgttatg gccgcgtttg tctcattcca cgcctgacac 2340 tcagttccgg gtaggcagtt cgctccaagc tggactgtat gcacgaaccc cccgttcagt 2400 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggaa agacatgcaa 2460 aagcaccact ggcagcagcc actggtaatt gatttagagg agttagtctt gaagtcatgc 2520 gccggttaag gctaaactga aaggacaagt tttggtgact gcgctcctcc aagccagtta 2580 cctcggttca aagagttggt agctcagaga accttcgaaa aaccgccctg caaggcggtt 2640 ttttcgtttt cagagcaaga gattacgcgc agaccaaaac gatctcaaga agatcatctt 2700 attaatcaga taaaatattt ctagatttca gtgcaattta tctcttcaaa tgtagcacct 2760 gaagtcagcc ccatacgata taagttgtaa ttctcatgtt agtcatgccc cgcgcccacc 2820 ggaaggagct gactgggttg aaggctctca agggcatcgg tcgagatccc ggtgcctaat 2880 gagtgagcta acttacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 2940 tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 3000 ggcgccaggg tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc 3060 gcctggccct gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa 3120 tcctgtttga tggtggttaa cggcgggata taacatgagc tgtcttcggt atcgtcgtat 3180 cccactaccg agatgtccgc accaacgcgc agcccggact cggtaatggc gcgcattgcg 3240 cccagcgcca tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc ctcattcagc 3300 atttgcatgg tttgttgaaa accggacatg gcactccagt cgccttcccg ttccgctatc 3360 ggctgaattt gattgcgagt gagatattta tgccagccag ccagacgcag acgcgccgag 3420 acagaactta atgggcccgc taacagcgcg atttgctggt gacccaatgc gaccagatgc 3480 tccacgccca gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat gggtgtctgg 3540 tcagagacat caagaaataa cgccggaaca ttagtgcagg cagcttccac agcaatggca 3600 tcctggtcat ccagcggata gttaatgatc agcccactga cgcgttgcgc gagaagattg 3660 tgcaccgccg ctttacaggc ttcgacgccg cttcgttcta ccatcgacac caccacgctg 3720 gcacccagtt gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg cgcgtgcagg 3780 gccagactgg aggtggcaac gccaatcagc aacgactgtt tgcccgccag ttgttgtgcc 3840 acgcggttgg gaatgtaatt cagctccgcc atcgccgctt ccactttttc ccgcgttttc 3900 gcagaaacgt ggctggcctg gttcaccacg cgggaaacgg tctgataaga gacaccggca 3960 tactctgcga catcgtataa cgttactggt ttcacattca ccaccctgaa ttgactctct 4020 tccgggcgct atcatgccat accgcgaaag gttttgcgcc attcgatggt gtccgggatc 4080 tcgacgctct cccttatgcg actcctgcat taggaaat 4118 <210> 354 <211> 3797 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(J3/L3) <400> 354 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggctagcgag ttccccgcgc cagcggggat 120 aaaccgccag tgataagtgg aatgccatgt gggctgtcga gttccccgcg ccagcgggga 180 taaaccgagt ggcagatata gcctggtggt tcaggcggcg agttccccgc gccagcgggg 240 ataaaccgga gctcgctgag caataactag cataacccct tggggcctct aaacgggtct 300 tgaggggttt tttgctgaaa cctcaggcat ttgagaagca cacggtcaca ctgcttccgg 360 tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga ccctgccctg 420 aaccgacgac cgggtcgaat ttgctttcga atttctgcca ttcatccgct tattatcact 480 tattcaggcg tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc 540 cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 600 gccatcacaa acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 660 cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 720 taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 780 aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 840 gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 900 ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 960 tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 1020 ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 1080 ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 1140 acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccattttagc 1200 ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc 1260 attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt 1320 ggcccagggc ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc 1380 ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca acttactgat 1440 ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc agctgtccct 1500 cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga catcagcgct 1560 agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg aagtgcttca 1620 tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata caggatatat 1680 tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg 1740 gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa cagggaagtg 1800 agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag catcacgaaa 1860 tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1920 ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 1980 gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 2040 gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 2100 gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg gcagcagcca 2160 ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 2220 aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa agagttggta 2280 gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 2340 attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 2400 tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 2460 aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg actgggttga 2520 aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa cttacattaa 2580 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 2640 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt ggtttttctt 2700 ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg agagagttgc 2760 agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat ggtggttaac 2820 ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga gatgtccgca 2880 ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg 2940 gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt ttgttgaaaa 3000 ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg attgcgagtg 3060 agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa tgggcccgct 3120 aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag tcgcgtaccg 3180 tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc aagaaataac 3240 gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc cagcggatag 3300 ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc tttacaggct 3360 tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg atcggcgcga 3420 gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg 3480 ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg aatgtaattc 3540 agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg gctggcctgg 3600 ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac atcgtataac 3660 gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta tcatgccata 3720 ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc ccttatgcga 3780 ctcctgcatt aggaaat 3797 <210> 355 <211> 3797 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(Hsa07) <400> 355 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggctagcgag ttccccgcgc cagcggggat 120 aaaccggttg atttgcctgc attggtgtta cacagtctga gttccccgcg ccagcgggga 180 taaaccgtaa gttgtgttct tctttgccta ggccttcagg agttccccgc gccagcgggg 240 ataaaccgga gctcgctgag caataactag cataacccct tggggcctct aaacgggtct 300 tgaggggttt tttgctgaaa cctcaggcat ttgagaagca cacggtcaca ctgcttccgg 360 tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga ccctgccctg 420 aaccgacgac cgggtcgaat ttgctttcga atttctgcca ttcatccgct tattatcact 480 tattcaggcg tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc 540 cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 600 gccatcacaa acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 660 cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 720 taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 780 aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 840 gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 900 ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 960 tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 1020 ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 1080 ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 1140 acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccattttagc 1200 ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc 1260 attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt 1320 ggcccagggc ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc 1380 ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca acttactgat 1440 ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc agctgtccct 1500 cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga catcagcgct 1560 agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg aagtgcttca 1620 tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata caggatatat 1680 tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg 1740 gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa cagggaagtg 1800 agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag catcacgaaa 1860 tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1920 ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 1980 gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 2040 gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 2100 gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg gcagcagcca 2160 ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 2220 aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa agagttggta 2280 gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 2340 attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 2400 tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 2460 aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg actgggttga 2520 aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa cttacattaa 2580 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 2640 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt ggtttttctt 2700 ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg agagagttgc 2760 agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat ggtggttaac 2820 ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga gatgtccgca 2880 ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg 2940 gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt ttgttgaaaa 3000 ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg attgcgagtg 3060 agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa tgggcccgct 3120 aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag tcgcgtaccg 3180 tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc aagaaataac 3240 gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc cagcggatag 3300 ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc tttacaggct 3360 tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg atcggcgcga 3420 gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg 3480 ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg aatgtaattc 3540 agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg gctggcctgg 3600 ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac atcgtataac 3660 gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta tcatgccata 3720 ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc ccttatgcga 3780 ctcctgcatt aggaaat 3797 <210> 356 <211> 7967 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-Cas8 <400> 356 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaact agtaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatgt 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaactaa ggaggtccgc tatgcaccat caccatcacc atggaaaaat 5100 cgaagaaggt aaactggtaa tctggattaa cggcgataaa ggctataacg gtctcgctga 5160 agtcggtaag aaattcgaga aagataccgg aattaaagtc accgttgagc atccggataa 5220 actggaagag aaattcccac aggttgcggc aactggcgat ggccctgaca ttatcttctg 5280 ggcacacgac cgctttggtg gctacgctca atctggcctg ttggctgaaa tcaccccgga 5340 caaagcgttc caggacaagc tgtatccgtt tacctgggat gccgtacgtt acaacggcaa 5400 gctgattgct tacccgatcg ctgttgaagc gttatcgctg atttataaca aagatctgct 5460 gccgaacccg ccaaaaacct gggaagagat cccggcgctg gataaagaac tgaaagcgaa 5520 aggtaagagc gcgctgatgt tcaacctgca agaaccgtac ttcacctggc cgctgattgc 5580 tgctgacggg ggttatgcgt tcaagtatga aaacggcaag tacgacatta aagacgtggg 5640 cgtggataac gctggcgcga aagcgggtct gaccttcctg gttgacctga ttaaaaacaa 5700 acacatgaat gcagacaccg attactccat cgcagaagct gcctttaata aaggcgaaac 5760 agcgatgacc atcaacggcc cgtgggcatg gtccaacatc gacaccagca aagtgaatta 5820 tggtgtaacg gtactgccga ccttcaaggg tcaaccatcc aaaccgttcg ttggcgtgct 5880 gagcgcaggt attaacgccg ccagtccgaa caaagagctg gcaaaagagt tcctcgaaaa 5940 ctatctgctg actgatgaag gtctggaagc ggttaataaa gacaaaccgc tgggtgccgt 6000 agcgctgaag tcttacgagg aagagttggc gaaagatcca cgtattgccg ccactatgga 6060 aaacgcccag aaaggtgaaa tcatgccgaa catcccgcag atgtccgctt tctggtatgc 6120 cgtgcgtact gcggtgatca acgccgccag cggtcgtcag actgtcgatg aagccctgaa 6180 agacgcgcag actaatggga tcgaggaaaa cctgtacttc caatccaatg caatgaattt 6240 gcttattgat aactggatcc ctgtacgccc gcgaaacggg gggaaagtcc aaatcataaa 6300 tctgcaatcg ctatactgca gtagagatca gtggcgatta agtttgcccc gtgacgatat 6360 ggaactggcc gctttagcac tgctggtttg cattgggcaa attatcgccc cggcaaaaga 6420 tgacgttgaa tttcgacatc gcataatgaa tccgctcact gaagatgagt ttcaacaact 6480 catcgcgccg tggatagata tgttctacct taatcacgca gaacatccct ttatgcagac 6540 caaaggtgtc aaagcaaatg atgtgactcc aatggaaaaa ctgttggctg gggtaagcgg 6600 cgcgacgaat tgtgcatttg tcaatcaacc ggggcagggt gaagcattat gtggtggatg 6660 cactgcgatt gcgttattca accaggcgaa tcaggcacca ggttttggtg gtggttttaa 6720 aagcggttta cgtggaggaa cacctgtaac aacgttcgta cgtgggatcg atcttcgttc 6780 aacggtgtta ctcaatgtcc tcacattacc tcgtcttcaa aaacaatttc ctaatgaatc 6840 acatacggaa aaccaaccta cctggattaa acctatcaag tccaatgagt ctatacctgc 6900 ttcgtcaatt gggtttgtcc gtggtctatt ctggcaacca gcgcatattg aattatgcga 6960 tcccattggg attggtaaat gttcttgctg tggacaggaa agcaatttgc gttataccgg 7020 ttttcttaag gaaaaattta cctttacagt taatgggcta tggccccatc cgcattcccc 7080 ttgtctggta acagtcaaga aaggggaggt tgaggaaaaa tttcttgctt tcaccacctc 7140 cgcaccatca tggacacaaa tcagccgagt tgtggtagat aagattattc aaaatgaaaa 7200 tggaaatcgc gtggcggcgg ttgtgaatca attcagaaat attgcgccgc aaagtcctct 7260 tgaattgatt atggggggat atcgtaataa tcaagcatct attcttgaac ggcgtcatga 7320 tgtgttgatg tttaatcagg ggtggcaaca atacggcaat gtgataaacg aaatagtgac 7380 tgttggtttg ggatataaaa cagccttacg caaggcgtta tatacctttg cagaagggtt 7440 taaaaataaa gacttcaaag gggccggagt ctctgttcat gagactgcag aaaggcattt 7500 ctatcgacag agtgaattat taattcccga tgtactggcg aatgttaatt tttcccaggc 7560 tgatgaggta atagctgatt tacgagacaa acttcatcaa ttgtgtgaaa tgctatttaa 7620 tcaatctgta gctccctatg cacatcatcc taaattaata agcacattag cgcttgcccg 7680 cgccacgcta tacaaacatt tacgggagtt aaaaccgcaa ggagggccat caaatggctg 7740 ataataacat tggaagtgga taacggatcc gaattcgagc gccgtcgaca agcttgcggc 7800 cgcactcgag caccaccacc accaccactg agatccggct gctaacaaag cccgaaagga 7860 agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa 7920 acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 7967 <210> 357 <211> 6435 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: StrepII-HRV3C-Cse2_Cas7_Cas5_Cas6 <400> 357 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg gcaagctgga gccacccgca gttcgaaaag 120 ggtgcacttg aagtcctctt tcagggaccc gggtaccaga tggctgatga aattgatgca 180 atggctttat atcgagcctg gcaacaactg gataatggat catgtgcgca aattagacgt 240 gtttcagaac ctgatgaatt acgcgatatc cctgcgtttt ataggctggt gcaacctttt 300 ggttgggaaa acccacgtca ccagcaggct cttttgcgca tggtgttttg cctgagcgca 360 ggaaagaatg tcatccgaca tcaggacaaa aaatcggagc aaacaacagg tatctcgttg 420 ggaagagctt tagccaatag tggaagaatt aacgagcgcc gtatctttca attaattcgg 480 gctgacagaa cagccgatat ggtccagtta cgtcgattac ttactcacgc cgaacccgta 540 cttgactggc cattaatggc caggatgttg acctggtggg gaaagcgcga acgccagcaa 600 cttctggaag attttgtatt gaccacaaac aaaaatgcgt aaggaaacct ttctatgtct 660 aactttatca atattcatgt tctgatctct cacagccctt catgtctgaa ccgcgacgat 720 atgaacatgc agaaagacgc tattttcggc ggcaaaagac gagtaagaat ttcaagtcaa 780 agccttaaac gtgcgatgcg taaaagtggt tattacgcac aaaatattgg tgaatccagt 840 ctcagaacca ttcatcttgc acaattacgt gatgttcttc ggcaaaaact tggtgaacgt 900 tttgaccaaa aaatcatcga taagacatta gcgctgctct ccggtaaatc agttgatgaa 960 gccgaaaaga tttctgccga tgcggttact ccctgggttg tgggagaaat agcctggttc 1020 tgtgagcagg ttgcaaaagc agaggctgat aatctggatg ataaaaagct gctcaaagtt 1080 cttaaggaag atattgccgc catacgtgtg aatttacagc agggtgttga tattgcgctt 1140 agtggaagaa tggcaaccag cggcatgatg actgagttgg gaaaagttga tggtgcaatg 1200 tccattgcgc atgcgatcac tactcatcag gttgattctg atattgactg gttcaccgct 1260 gtagatgatt tacaggaaca aggttctgca catctgggaa ctcaggaatt ttcatcgggt 1320 gttttttatc gttatgccaa cattaacctc gctcaacttc aggaaaattt aggtggtgcc 1380 tccagggagc aggctctgga aattgcaacc catgttgttc atatgctggc aacagaggtc 1440 cctggagcaa aacagcgtac ttatgccgct tttaaccctg cggatatggt aatggttaat 1500 ttctccgata tgccactttc tatggcaaat gcttttgaaa aagcggttaa agcgaaagat 1560 ggctttttgc aaccgtctat acaggcgttt aatcaatatt gggatcgcgt tgccaatgga 1620 tatggtctga acggagctgc tgcgcaattc agcttatctg atgtagaccc aattactgct 1680 caagttaaac aaatgcctac tttagaacag ttaaaatcct gggttcgtaa taatggcgag 1740 gcgtgaacat gagatcttat ttgatcttgc ggcttgctgg gccaatgcaa gcctgggggc 1800 agccgacctt tgaaggaacg cgacctaccg gaagatttcc gacccgaagc gggttattag 1860 ggctactcgg ggcttgtctt gggatccaac gtgatgatac ttcttcatta caggcgttat 1920 cagagagtgt gcaatttgca gtgcgctgcg atgaactcat tcttgacgat cgtcgtgtgt 1980 ctgtaacggg gttgcgtgat taccatacag tccttggagc gcgagaagat taccgtggtt 2040 tgaaaagtca tgaaacgatt caaacatggc gcgaatattt atgtgatgcc tcctttaccg 2100 tcgctctctg gttaacaccc catgcaacga tggttatctc agaacttgaa aaagcagtat 2160 taaagcctcg gtatacacct tacctggggc ggagaagttg cccactaaca cacccgcttt 2220 ttttggggac atgtcaggca tcggatcctc agaaggcgct attaaattat gagcccgttg 2280 gcggcgatat atatagtgag gaatcagtta cagggcatca tttaaaattt acggcgcgcg 2340 acgaaccgat gatcaccttg cctcgacaat ttgcttcccg agaatggtat gtgattaaag 2400 gaggtatgga tgtatctcag taaagtcatc attgccaggg cctggagcag ggatctttac 2460 caacttcacc agggattatg gcatttattt ccaaacagac cggatgctgc tcgtgatttt 2520 ctttttcatg ttgagaagcg aaacacacca gaaggctgtc atgttttatt gcagtcagcg 2580 caaatgcctg tttcaactgc cgttgcgaca gtcattaaaa ctaaacaggt tgaatttcaa 2640 cttcaggttg gtgttccact ctattttcgg cttcgggcaa atccgatcaa aactattctc 2700 gacaatcaaa agcgcctgga cagtaaaggg aatattaaac gctgtcgggt tccgttaata 2760 aaagaagcag aacaaatcgc gtggttgcaa cgtaaattgg gcaatgcggc gcgcgttgaa 2820 gatgtgcatc ccatatcgga acggccacag tatttttctg gtgatggtaa aagtggaaag 2880 atccaaacgg tttgctttga aggtgtgctc accatcaacg acgcgccagc gttaatagat 2940 cttgtacagc aaggtattgg gccagctaaa tcgatgggat gtggcttgct atctttggct 3000 ccactgtgac tgcaggcggc cgcactcgag tctggtaaag aaaccgctgc tgcgaaattt 3060 gaacgccagc acatggactc gtctactagc gcagcttaat taacctaggc tgctgccacc 3120 gctgagcaat aactagcata accccttggg gcctctaaac gggtcttgag gggttttttg 3180 ctgaaacctc aggcatttga gaagcacacg gtcacactgc ttccggtagt caataaaccg 3240 gtaaaccagc aatagacata agcggctatt taacgaccct gccctgaacc gacgaccggg 3300 tcatcgtggc cggatcttgc ggcccctcgg cttgaacgaa ttgttagaca ttatttgccg 3360 actaccttgg tgatctcgcc tttcacgtag tggacaaatt cttccaactg atctgcgcgc 3420 gaggccaagc gatcttcttc ttgtccaaga taagcctgtc tagcttcaag tatgacgggc 3480 tgatactggg ccggcaggcg ctccattgcc cagtcggcag cgacatcctt cggcgcgatt 3540 ttgccggtta ctgcgctgta ccaaatgcgg gacaacgtaa gcactacatt tcgctcatcg 3600 ccagcccagt cgggcggcga gttccatagc gttaaggttt catttagcgc ctcaaataga 3660 tcctgttcag gaaccggatc aaagagttcc tccgccgctg gacctaccaa ggcaacgcta 3720 tgttctcttg cttttgtcag caagatagcc agatcaatgt cgatcgtggc tggctcgaag 3780 atacctgcaa gaatgtcatt gcgctgccat tctccaaatt gcagttcgcg cttagctgga 3840 taacgccacg gaatgatgtc gtcgtgcaca acaatggtga cttctacagc gcggagaatc 3900 tcgctctctc caggggaagc cgaagtttcc aaaaggtcgt tgatcaaagc tcgccgcgtt 3960 gtttcatcaa gccttacggt caccgtaacc agcaaatcaa tatcactgtg tggcttcagg 4020 ccgccatcca ctgcggagcc gtacaaatgt acggccagca acgtcggttc gagatggcgc 4080 tcgatgacgc caactacctc tgatagttga gtcgatactt cggcgatcac cgcttccctc 4140 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 4200 tacatatttg aatgtattta gaaaaataaa caaatagcta gctcactcgg tcgctacgct 4260 ccgggcgtga gactgcggcg ggcgctgcgg acacatacaa agttacccac agattccgtg 4320 gataagcagg ggactaacat gtgaggcaaa acagcagggc cgcgccggtg gcgtttttcc 4380 ataggctccg ccctcctgcc agagttcaca taaacagacg cttttccggt gcatctgtgg 4440 gagccgtgag gctcaaccat gaatctgaca gtacgggcga aacccgacag gacttaaaga 4500 tccccaccgt ttccggcggg tcgctccctc ttgcgctctc ctgttccgac cctgccgttt 4560 accggatacc tgttccgcct ttctccctta cgggaagtgt ggcgctttct catagctcac 4620 acactggtat ctcggctcgg tgtaggtcgt tcgctccaag ctgggctgta agcaagaact 4680 ccccgttcag cccgactgct gcgccttatc cggtaactgt tcacttgagt ccaacccgga 4740 aaagcacggt aaaacgccac tggcagcagc cattggtaac tgggagttcg cagaggattt 4800 gtttagctaa acacgcggtt gctcttgaag tgtgcgccaa agtccggcta cactggaagg 4860 acagatttgg ttgctgtgct ctgcgaaagc cagttaccac ggttaagcag ttccccaact 4920 gacttaacct tcgatcaaac cacctcccca ggtggttttt tcgtttacag ggcaaaagat 4980 tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctactg aaccgctcta 5040 gatttcagtg caatttatct cttcaaatgt agcacctgaa gtcagcccca tacgatataa 5100 gttgtaattc tcatgttagt catgccccgc gcccaccgga aggagctgac tgggttgaag 5160 gctctcaagg gcatcggtcg agatcccggt gcctaatgag tgagctaact tacattaatt 5220 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 5280 atcggccaac gcgcggggag aggcggtttg cgtattgggc gccagggtgg tttttctttt 5340 caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag agagttgcag 5400 caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg tggttaacgg 5460 cgggatataa catgagctgt cttcggtatc gtcgtatccc actaccgaga tgtccgcacc 5520 aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct gatcgttggc 5580 aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt gttgaaaacc 5640 ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat tgcgagtgag 5700 atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg ggcccgctaa 5760 cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc gcgtaccgtc 5820 ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa gaaataacgc 5880 cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca gcggatagtt 5940 aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt tacaggcttc 6000 gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat cggcgcgaga 6060 tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg tggcaacgcc 6120 aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa tgtaattcag 6180 ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc tggcctggtt 6240 caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat cgtataacgt 6300 tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc atgccatacc 6360 gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg acgctctccc ttatgcgact 6420 cctgcattag gaaat 6435 <210> 358 <211> 7933 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas8_His6HRV3CCse2_Cas7_Cas5_Cas6 <400> 358 ttttctactg aaccgctcta gatttcagtg caatttatct cttcaaatgt agcacctgaa 60 gtcagcccca tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga 120 aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 180 tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 240 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300 gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 360 tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 420 tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 480 actaccgaga tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 540 agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 600 tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 660 tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 720 gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 780 acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 840 gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 900 tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 960 accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 1020 cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 1080 agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 1140 cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 1200 gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 1260 tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 1320 gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 1380 acgctctccc ttatgcgact cctgcattag gaaattaata cgactcacta taggggaatt 1440 gtgagcggat aacaattccc ctgtagaaat aattttgttt aactttaata aggagatata 1500 ccatggctaa tttgcttatt gataactgga tccctgtacg cccgcgaaac ggggggaaag 1560 tccaaatcat aaatctgcaa tcgctatact gcagtagaga tcagtggcga ttaagtttgc 1620 cccgtgacga tatggaactg gccgctttag cactgctggt ttgcattggg caaattatcg 1680 ccccggcaaa agatgacgtt gaatttcgac atcgcataat gaatccgctc actgaagatg 1740 agtttcaaca actcatcgcg ccgtggatag atatgttcta ccttaatcac gcagaacatc 1800 cctttatgca gaccaaaggt gtcaaagcaa atgatgtgac tccaatggaa aaactgttgg 1860 ctggggtaag cggcgcgacg aattgtgcat ttgtcaatca accggggcag ggtgaagcat 1920 tatgtggtgg atgcactgcg attgcgttat tcaaccaggc gaatcaggca ccaggttttg 1980 gtggtggttt taaaagcggt ttacgtggag gaacacctgt aacaacgttc gtacgtggga 2040 tcgatcttcg ttcaacggtg ttactcaatg tcctcacatt acctcgtctt caaaaacaat 2100 ttcctaatga atcacatacg gaaaaccaac ctacctggat taaacctatc aagtccaatg 2160 agtctatacc tgcttcgtca attgggtttg tccgtggtct attctggcaa ccagcgcata 2220 ttgaattatg cgatcccatt gggattggta aatgttcttg ctgtggacag gaaagcaatt 2280 tgcgttatac cggttttctt aaggaaaaat ttacctttac agttaatggg ctatggcccc 2340 atccgcattc cccttgtctg gtaacagtca agaaagggga ggttgaggaa aaatttcttg 2400 ctttcaccac ctccgcacca tcatggacac aaatcagccg agttgtggta gataagatta 2460 ttcaaaatga aaatggaaat cgcgtggcgg cggttgtgaa tcaattcaga aatattgcgc 2520 cgcaaagtcc tcttgaattg attatggggg gatatcgtaa taatcaagca tctattcttg 2580 aacggcgtca tgatgtgttg atgtttaatc aggggtggca acaatacggc aatgtgataa 2640 acgaaatagt gactgttggt ttgggatata aaacagcctt acgcaaggcg ttatatacct 2700 ttgcagaagg gtttaaaaat aaagacttca aaggggccgg agtctctgtt catgagactg 2760 cagaaaggca tttctatcga cagagtgaat tattaattcc cgatgtactg gcgaatgtta 2820 atttttccca ggctgatgag gtaatagctg atttacgaga caaacttcat caattgtgtg 2880 aaatgctatt taatcaatct gtagctccct atgcacatca tcctaaatta ataagcacat 2940 tagcgcttgc ccgcgccacg ctatacaaac atttacggga gttaaaaccg caaggagggc 3000 catcaaatgg ctgagcatca ccaccatcat cacggtgcac ttgaagtcct ctttcaggga 3060 cccgggtacc agatggctga tgaaattgat gcaatggctt tatatcgagc ctggcaacaa 3120 ctggataatg gatcatgtgc gcaaattaga cgtgtttcag aacctgatga attacgcgat 3180 atccctgcgt tttataggct ggtgcaacct tttggttggg aaaacccacg tcaccagcag 3240 gctcttttgc gcatggtgtt ttgcctgagc gcaggaaaga atgtcatccg acatcaggac 3300 aaaaaatcgg agcaaacaac aggtatctcg ttgggaagag ctttagccaa tagtggaaga 3360 attaacgagc gccgtatctt tcaattaatt cgggctgaca gaacagccga tatggtccag 3420 ttacgtcgat tacttactca cgccgaaccc gtacttgact ggccattaat ggccaggatg 3480 ttgacctggt ggggaaagcg cgaacgccag caacttctgg aagattttgt attgaccaca 3540 aacaaaaatg cgtaaggaaa cctttctatg tctaacttta tcaatattca tgttctgatc 3600 tctcacagcc cttcatgtct gaaccgcgac gatatgaaca tgcagaaaga cgctattttc 3660 ggcggcaaaa gacgagtaag aatttcaagt caaagcctta aacgtgcgat gcgtaaaagt 3720 ggttattacg cacaaaatat tggtgaatcc agtctcagaa ccattcatct tgcacaatta 3780 cgtgatgttc ttcggcaaaa acttggtgaa cgttttgacc aaaaaatcat cgataagaca 3840 ttagcgctgc tctccggtaa atcagttgat gaagccgaaa agatttctgc cgatgcggtt 3900 actccctggg ttgtgggaga aatagcctgg ttctgtgagc aggttgcaaa agcagaggct 3960 gataatctgg atgataaaaa gctgctcaaa gttcttaagg aagatattgc cgccatacgt 4020 gtgaatttac agcagggtgt tgatattgcg cttagtggaa gaatggcaac cagcggcatg 4080 atgactgagt tgggaaaagt tgatggtgca atgtccattg cgcatgcgat cactactcat 4140 caggttgatt ctgatattga ctggttcacc gctgtagatg atttacagga acaaggttct 4200 gcacatctgg gaactcagga attttcatcg ggtgtttttt atcgttatgc caacattaac 4260 ctcgctcaac ttcaggaaaa tttaggtggt gcctccaggg agcaggctct ggaaattgca 4320 acccatgttg ttcatatgct ggcaacagag gtccctggag caaaacagcg tacttatgcc 4380 gcttttaacc ctgcggatat ggtaatggtt aatttctccg atatgccact ttctatggca 4440 aatgcttttg aaaaagcggt taaagcgaaa gatggctttt tgcaaccgtc tatacaggcg 4500 tttaatcaat attgggatcg cgttgccaat ggatatggtc tgaacggagc tgctgcgcaa 4560 ttcagcttat ctgatgtaga cccaattact gctcaagtta aacaaatgcc tactttagaa 4620 cagttaaaat cctgggttcg taataatggc gaggcgtgaa catgagatct tatttgatct 4680 tgcggcttgc tgggccaatg caagcctggg ggcagccgac ctttgaagga acgcgaccta 4740 ccggaagatt tccgacccga agcgggttat tagggctact cggggcttgt cttgggatcc 4800 aacgtgatga tacttcttca ttacaggcgt tatcagagag tgtgcaattt gcagtgcgct 4860 gcgatgaact cattcttgac gatcgtcgtg tgtctgtaac ggggttgcgt gattaccata 4920 cagtccttgg agcgcgagaa gattaccgtg gtttgaaaag tcatgaaacg attcaaacat 4980 ggcgcgaata tttatgtgat gcctccttta ccgtcgctct ctggttaaca ccccatgcaa 5040 cgatggttat ctcagaactt gaaaaagcag tattaaagcc tcggtataca ccttacctgg 5100 ggcggagaag ttgcccacta acacacccgc tttttttggg gacatgtcag gcatcggatc 5160 ctcagaaggc gctattaaat tatgagcccg ttggcggcga tatatatagt gaggaatcag 5220 ttacagggca tcatttaaaa tttacggcgc gcgacgaacc gatgatcacc ttgcctcgac 5280 aatttgcttc ccgagaatgg tatgtgatta aaggaggtat ggatgtatct cagtaaagtc 5340 atcattgcca gggcctggag cagggatctt taccaacttc accagggatt atggcattta 5400 tttccaaaca gaccggatgc tgctcgtgat tttctttttc atgttgagaa gcgaaacaca 5460 ccagaaggct gtcatgtttt attgcagtca gcgcaaatgc ctgtttcaac tgccgttgcg 5520 acagtcatta aaactaaaca ggttgaattt caacttcagg ttggtgttcc actctatttt 5580 cggcttcggg caaatccgat caaaactatt ctcgacaatc aaaagcgcct ggacagtaaa 5640 gggaatatta aacgctgtcg ggttccgtta ataaaagaag cagaacaaat cgcgtggttg 5700 caacgtaaat tgggcaatgc ggcgcgcgtt gaagatgtgc atcccatatc ggaacggcca 5760 cagtattttt ctggtgatgg taaaagtgga aagatccaaa cggtttgctt tgaaggtgtg 5820 ctcaccatca acgacgcgcc agcgttaata gatcttgtac agcaaggtat tgggccagct 5880 aaatcgatgg gatgtggctt gctatctttg gctccactgt gactgcaggc ggccgcactc 5940 gagtctggta aagaaaccgc tgctgcgaaa tttgaacgcc agcacatgga ctcgtctact 6000 agcgcagctt aattaaccta ggctgctgcc accgctgagc aataactagc ataacccctt 6060 ggggcctcta aacgggtctt gaggggtttt ttgctgaaac ctcaggcatt tgagaagcac 6120 acggtcacac tgcttccggt agtcaataaa ccggtaaacc agcaatagac ataagcggct 6180 atttaacgac cctgccctga accgacgacc gggtcatcgt ggccggatct tgcggcccct 6240 cggcttgaac gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg 6300 tagtggacaa attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttcttgtcca 6360 agataagcct gtctagcttc aagtatgacg ggctgatact gggccggcag gcgctccatt 6420 gcccagtcgg cagcgacatc cttcggcgcg attttgccgg ttactgcgct gtaccaaatg 6480 cgggacaacg taagcactac atttcgctca tcgccagccc agtcgggcgg cgagttccat 6540 agcgttaagg tttcatttag cgcctcaaat agatcctgtt caggaaccgg atcaaagagt 6600 tcctccgccg ctggacctac caaggcaacg ctatgttctc ttgcttttgt cagcaagata 6660 gccagatcaa tgtcgatcgt ggctggctcg aagatacctg caagaatgtc attgcgctgc 6720 cattctccaa attgcagttc gcgcttagct ggataacgcc acggaatgat gtcgtcgtgc 6780 acaacaatgg tgacttctac agcgcggaga atctcgctct ctccagggga agccgaagtt 6840 tccaaaaggt cgttgatcaa agctcgccgc gttgtttcat caagccttac ggtcaccgta 6900 accagcaaat caatatcact gtgtggcttc aggccgccat ccactgcgga gccgtacaaa 6960 tgtacggcca gcaacgtcgg ttcgagatgg cgctcgatga cgccaactac ctctgatagt 7020 tgagtcgata cttcggcgat caccgcttcc ctcatactct tcctttttca atattattga 7080 agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 7140 aaacaaatag ctagctcact cggtcgctac gctccgggcg tgagactgcg gcgggcgctg 7200 cggacacata caaagttacc cacagattcc gtggataagc aggggactaa catgtgaggc 7260 aaaacagcag ggccgcgccg gtggcgtttt tccataggct ccgccctcct gccagagttc 7320 acataaacag acgcttttcc ggtgcatctg tgggagccgt gaggctcaac catgaatctg 7380 acagtacggg cgaaacccga caggacttaa agatccccac cgtttccggc gggtcgctcc 7440 ctcttgcgct ctcctgttcc gaccctgccg tttaccggat acctgttccg cctttctccc 7500 ttacgggaag tgtggcgctt tctcatagct cacacactgg tatctcggct cggtgtaggt 7560 cgttcgctcc aagctgggct gtaagcaaga actccccgtt cagcccgact gctgcgcctt 7620 atccggtaac tgttcacttg agtccaaccc ggaaaagcac ggtaaaacgc cactggcagc 7680 agccattggt aactgggagt tcgcagagga tttgtttagc taaacacgcg gttgctcttg 7740 aagtgtgcgc caaagtccgg ctacactgga aggacagatt tggttgctgt gctctgcgaa 7800 agccagttac cacggttaag cagttcccca actgacttaa ccttcgatca aaccacctcc 7860 ccaggtggtt ttttcgttta cagggcaaaa gattacgcgc agaaaaaaag gatctcaaga 7920 agatcctttg atc 7933 <210> 359 <211> 8644 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: FokI30aaCas8_His6HRV3CCse2_Cas7_Cas5_Cas6 <400> 359 ttttctactg aaccgctcta gatttcagtg caatttatct cttcaaatgt agcacctgaa 60 gtcagcccca tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga 120 aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 180 tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 240 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300 gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 360 tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 420 tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 480 actaccgaga tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 540 agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 600 tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 660 tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 720 gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 780 acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 840 gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 900 tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 960 accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 1020 cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 1080 agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 1140 cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 1200 gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 1260 tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 1320 gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 1380 acgctctccc ttatgcgact cctgcattag gaaattaata cgactcacta taggggaatt 1440 gtgagcggat aacaattccc ctgtagaaat aattttgttt aactttaata aggagatata 1500 ccatggctcc gaaaaaaaag cgcaaagtgg gtggctctca actggttaaa agcgaactgg 1560 aagagaaaaa aagtgaactg cgccacaaac tgaaatatgt gccgcatgaa tatatcgagc 1620 tgattgaaat tgcacgtaat ccgacccagg atcgtattct ggaaatgaaa gtgatggaat 1680 tttttatgaa agtgtacggc tatcgcggtg aacatctggg tggtagccgt aaaccggatg 1740 gtgcaattta taccgttggt agcccgattg attatggtgt tattgttgat accaaagcct 1800 atagcggtgg ttataatctg ccgattggtc aggcagatga aatgcagcgt tatgtggaag 1860 aaaatcagac ccgtaacaaa catattaatc cgaatgaatg gtggaaagtt tatccgagca 1920 gcgttaccga gtttaaattc ctgtttgtta gcggtcactt caaaggcaac tataaagcac 1980 agctgacccg tctgaatcat attaccaatt gtaatggtgc agttctgagc gttgaagaac 2040 tgctgattgg tggtgaaatg attaaagcag gcaccctgac cctggaagaa gttcgtcgca 2100 aatttaacaa tggcgaaatc aacttttcag gcagcgaaac gccgggtaca agtgagtcag 2160 caactccaga gagcggcggc agtggtagta gtgggggatc tgggtcatct ggtgggatga 2220 atttgcttat tgataactgg attcctgtac gcccgcgaaa cggggggaaa gtccaaatca 2280 taaatctgca atcgctatac tgcagtagag atcagtggcg attaagtttg ccccgtgacg 2340 atatggaact ggccgcttta gcactgctgg tttgcattgg gcaaattatc gccccggcaa 2400 aagatgacgt tgaatttcga catcgcataa tgaatccgct cactgaagat gagtttcaac 2460 aactcatcgc gccgtggata gatatgttct accttaatca cgcagaacat ccctttatgc 2520 agaccaaagg tgtcaaagca aatgatgtga ctccaatgga aaaactgttg gctggggtaa 2580 gcggcgcgac gaattgtgca tttgtcaatc aaccggggca gggtgaagca ttatgtggtg 2640 gatgcactgc gattgcgtta ttcaaccagg cgaatcaggc accaggtttt ggtggtggtt 2700 ttaaaagcgg tttacgtgga ggaacacctg taacaacgtt cgtacgtggg atcgatcttc 2760 gttcaacggt gttactcaat gtcctcacat tacctcgtct tcaaaaacaa tttcctaatg 2820 aatcacatac ggaaaaccaa cctacctgga ttaaacctat caagtccaat gagtctatac 2880 ctgcttcgtc aattgggttt gtccgtggtc tattctggca accagcgcat attgaattat 2940 gcgatcccat tgggattggt aaatgttctt gctgtggaca ggaaagcaat ttgcgttata 3000 ccggttttct taaggaaaaa tttaccttta cagttaatgg gctatggccc catccgcatt 3060 ccccttgtct ggtaacagtc aagaaagggg aggttgagga aaaatttctt gctttcacca 3120 cctccgcacc atcatggaca caaatcagcc gagttgtggt agataagatt attcaaaatg 3180 aaaatggaaa tcgcgtggcg gcggttgtga atcaattcag aaatattgcg ccgcaaagtc 3240 ctcttgaatt gattatgggg ggatatcgta ataatcaagc atctattctt gaacggcgtc 3300 atgatgtgtt gatgtttaat caggggtggc aacaatacgg caatgtgata aacgaaatag 3360 tgactgttgg tttgggatat aaaacagcct tacgcaaggc gttatatacc tttgcagaag 3420 ggtttaaaaa taaagacttc aaaggggccg gagtctctgt tcatgagact gcagaaaggc 3480 atttctatcg acagagtgaa ttattaattc ccgatgtact ggcgaatgtt aatttttccc 3540 aggctgatga ggtaatagct gatttacgag acaaacttca tcaattgtgt gaaatgctat 3600 ttaatcaatc tgtagctccc tatgcacatc atcctaaatt aataagcaca ttagcgcttg 3660 cccgcgccac gctatacaaa catttacggg agttaaaacc gcaaggaggg ccatcaaatg 3720 gctgagcatc accaccatca tcacggtgca cttgaagtcc tctttcaggg acccgggtac 3780 cagatggctg atgaaattga tgcaatggct ttatatcgag cctggcaaca actggataat 3840 ggatcatgtg cgcaaattag acgtgtttca gaacctgatg aattacgcga tatccctgcg 3900 ttttataggc tggtgcaacc ttttggttgg gaaaacccac gtcaccagca ggctcttttg 3960 cgcatggtgt tttgcctgag cgcaggaaag aatgtcatcc gacatcagga caaaaaatcg 4020 gagcaaacaa caggtatctc gttgggaaga gctttagcca atagtggaag aattaacgag 4080 cgccgtatct ttcaattaat tcgggctgac agaacagccg atatggtcca gttacgtcga 4140 ttacttactc acgccgaacc cgtacttgac tggccattaa tggccaggat gttgacctgg 4200 tggggaaagc gcgaacgcca gcaacttctg gaagattttg tattgaccac aaacaaaaat 4260 gcgtaaggaa acctttctat gtctaacttt atcaatattc atgttctgat ctctcacagc 4320 ccttcatgtc tgaaccgcga cgatatgaac atgcagaaag acgctatttt cggcggcaaa 4380 agacgagtaa gaatttcaag tcaaagcctt aaacgtgcga tgcgtaaaag tggttattac 4440 gcacaaaata ttggtgaatc cagtctcaga accattcatc ttgcacaatt acgtgatgtt 4500 cttcggcaaa aacttggtga acgttttgac caaaaaatca tcgataagac attagcgctg 4560 ctctccggta aatcagttga tgaagccgaa aagatttctg ccgatgcggt tactccctgg 4620 gttgtgggag aaatagcctg gttctgtgag caggttgcaa aagcagaggc tgataatctg 4680 gatgataaaa agctgctcaa agttcttaag gaagatattg ccgccatacg tgtgaattta 4740 cagcagggtg ttgatattgc gcttagtgga agaatggcaa ccagcggcat gatgactgag 4800 ttgggaaaag ttgatggtgc aatgtccatt gcgcatgcga tcactactca tcaggttgat 4860 tctgatattg actggttcac cgctgtagat gatttacagg aacaaggttc tgcacatctg 4920 ggaactcagg aattttcatc gggtgttttt tatcgttatg ccaacattaa cctcgctcaa 4980 cttcaggaaa atttaggtgg tgcctccagg gagcaggctc tggaaattgc aacccatgtt 5040 gttcatatgc tggcaacaga ggtccctgga gcaaaacagc gtacttatgc cgcttttaac 5100 cctgcggata tggtaatggt taatttctcc gatatgccac tttctatggc aaatgctttt 5160 gaaaaagcgg ttaaagcgaa agatggcttt ttgcaaccgt ctatacaggc gtttaatcaa 5220 tattgggatc gcgttgccaa tggatatggt ctgaacggag ctgctgcgca attcagctta 5280 tctgatgtag acccaattac tgctcaagtt aaacaaatgc ctactttaga acagttaaaa 5340 tcctgggttc gtaataatgg cgaggcgtga acatgagatc ttatttgatc ttgcggcttg 5400 ctgggccaat gcaagcctgg gggcagccga cctttgaagg aacgcgacct accggaagat 5460 ttccgacccg aagcgggtta ttagggctac tcggggcttg tcttgggatc caacgtgatg 5520 atacttcttc attacaggcg ttatcagaga gtgtgcaatt tgcagtgcgc tgcgatgaac 5580 tcattcttga cgatcgtcgt gtgtctgtaa cggggttgcg tgattaccat acagtccttg 5640 gagcgcgaga agattaccgt ggtttgaaaa gtcatgaaac gattcaaaca tggcgcgaat 5700 atttatgtga tgcctccttt accgtcgctc tctggttaac accccatgca acgatggtta 5760 tctcagaact tgaaaaagca gtattaaagc ctcggtatac accttacctg gggcggagaa 5820 gttgcccact aacacacccg ctttttttgg ggacatgtca ggcatcggat cctcagaagg 5880 cgctattaaa ttatgagccc gttggcggcg atatatatag tgaggaatca gttacagggc 5940 atcatttaaa atttacggcg cgcgacgaac cgatgatcac cttgcctcga caatttgctt 6000 cccgagaatg gtatgtgatt aaaggaggta tggatgtatc tcagtaaagt catcattgcc 6060 agggcctgga gcagggatct ttaccaactt caccagggat tatggcattt atttccaaac 6120 agaccggatg ctgctcgtga ttttcttttt catgttgaga agcgaaacac accagaaggc 6180 tgtcatgttt tattgcagtc agcgcaaatg cctgtttcaa ctgccgttgc gacagtcatt 6240 aaaactaaac aggttgaatt tcaacttcag gttggtgttc cactctattt tcggcttcgg 6300 gcaaatccga tcaaaactat tctcgacaat caaaagcgcc tggacagtaa agggaatatt 6360 aaacgctgtc gggttccgtt aataaaagaa gcagaacaaa tcgcgtggtt gcaacgtaaa 6420 ttgggcaatg cggcgcgcgt tgaagatgtg catcccatat cggaacggcc acagtatttt 6480 tctggtgatg gtaaaagtgg aaagatccaa acggtttgct ttgaaggtgt gctcaccatc 6540 aacgacgcgc cagcgttaat agatcttgta cagcaaggta ttgggccagc taaatcgatg 6600 ggatgtggct tgctatcttt ggctccactg tgactgcagg cggccgcact cgagtctggt 6660 aaagaaaccg ctgctgcgaa atttgaacgc cagcacatgg actcgtctac tagcgcagct 6720 taattaacct aggctgctgc caccgctgag caataactag cataacccct tggggcctct 6780 aaacgggtct tgaggggttt tttgctgaaa cctcaggcat ttgagaagca cacggtcaca 6840 ctgcttccgg tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga 6900 ccctgccctg aaccgacgac cgggtcatcg tggccggatc ttgcggcccc tcggcttgaa 6960 cgaattgtta gacattattt gccgactacc ttggtgatct cgcctttcac gtagtggaca 7020 aattcttcca actgatctgc gcgcgaggcc aagcgatctt cttcttgtcc aagataagcc 7080 tgtctagctt caagtatgac gggctgatac tgggccggca ggcgctccat tgcccagtcg 7140 gcagcgacat ccttcggcgc gattttgccg gttactgcgc tgtaccaaat gcgggacaac 7200 gtaagcacta catttcgctc atcgccagcc cagtcgggcg gcgagttcca tagcgttaag 7260 gtttcattta gcgcctcaaa tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc 7320 gctggaccta ccaaggcaac gctatgttct cttgcttttg tcagcaagat agccagatca 7380 atgtcgatcg tggctggctc gaagatacct gcaagaatgt cattgcgctg ccattctcca 7440 aattgcagtt cgcgcttagc tggataacgc cacggaatga tgtcgtcgtg cacaacaatg 7500 gtgacttcta cagcgcggag aatctcgctc tctccagggg aagccgaagt ttccaaaagg 7560 tcgttgatca aagctcgccg cgttgtttca tcaagcctta cggtcaccgt aaccagcaaa 7620 tcaatatcac tgtgtggctt caggccgcca tccactgcgg agccgtacaa atgtacggcc 7680 agcaacgtcg gttcgagatg gcgctcgatg acgccaacta cctctgatag ttgagtcgat 7740 acttcggcga tcaccgcttc cctcatactc ttcctttttc aatattattg aagcatttat 7800 cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 7860 gctagctcac tcggtcgcta cgctccgggc gtgagactgc ggcgggcgct gcggacacat 7920 acaaagttac ccacagattc cgtggataag caggggacta acatgtgagg caaaacagca 7980 gggccgcgcc ggtggcgttt ttccataggc tccgccctcc tgccagagtt cacataaaca 8040 gacgcttttc cggtgcatct gtgggagccg tgaggctcaa ccatgaatct gacagtacgg 8100 gcgaaacccg acaggactta aagatcccca ccgtttccgg cgggtcgctc cctcttgcgc 8160 tctcctgttc cgaccctgcc gtttaccgga tacctgttcc gcctttctcc cttacgggaa 8220 gtgtggcgct ttctcatagc tcacacactg gtatctcggc tcggtgtagg tcgttcgctc 8280 caagctgggc tgtaagcaag aactccccgt tcagcccgac tgctgcgcct tatccggtaa 8340 ctgttcactt gagtccaacc cggaaaagca cggtaaaacg ccactggcag cagccattgg 8400 taactgggag ttcgcagagg atttgtttag ctaaacacgc ggttgctctt gaagtgtgcg 8460 ccaaagtccg gctacactgg aaggacagat ttggttgctg tgctctgcga aagccagtta 8520 ccacggttaa gcagttcccc aactgactta accttcgatc aaaccacctc cccaggtggt 8580 tttttcgttt acagggcaaa agattacgcg cagaaaaaaa ggatctcaag aagatccttt 8640 gatc 8644 <210> 360 <211> 8710 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: FokI30aaCas8_His6HRV3CCse2_Cas7_Cas5_NLSCas6 <400> 360 ttttctactg aaccgctcta gatttcagtg caatttatct cttcaaatgt agcacctgaa 60 gtcagcccca tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga 120 aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 180 tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 240 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300 gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 360 tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 420 tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 480 actaccgaga tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 540 agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 600 tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 660 tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 720 gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 780 acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 840 gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 900 tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 960 accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 1020 cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 1080 agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 1140 cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 1200 gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 1260 tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 1320 gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 1380 acgctctccc ttatgcgact cctgcattag gaaattaata cgactcacta taggggaatt 1440 gtgagcggat aacaattccc ctgtagaaat aattttgttt aactttaata aggagatata 1500 ccatggctcc gaaaaaaaag cgcaaagtgg gtggctctca actggttaaa agcgaactgg 1560 aagagaaaaa aagtgaactg cgccacaaac tgaaatatgt gccgcatgaa tatatcgagc 1620 tgattgaaat tgcacgtaat ccgacccagg atcgtattct ggaaatgaaa gtgatggaat 1680 tttttatgaa agtgtacggc tatcgcggtg aacatctggg tggtagccgt aaaccggatg 1740 gtgcaattta taccgttggt agcccgattg attatggtgt tattgttgat accaaagcct 1800 atagcggtgg ttataatctg ccgattggtc aggcagatga aatgcagcgt tatgtggaag 1860 aaaatcagac ccgtaacaaa catattaatc cgaatgaatg gtggaaagtt tatccgagca 1920 gcgttaccga gtttaaattc ctgtttgtta gcggtcactt caaaggcaac tataaagcac 1980 agctgacccg tctgaatcat attaccaatt gtaatggtgc agttctgagc gttgaagaac 2040 tgctgattgg tggtgaaatg attaaagcag gcaccctgac cctggaagaa gttcgtcgca 2100 aatttaacaa tggcgaaatc aacttttcag gcagcgaaac gccgggtaca agtgagtcag 2160 caactccaga gagcggcggc agtggtagta gtgggggatc tgggtcatct ggtgggatga 2220 atttgcttat tgataactgg attcctgtac gcccgcgaaa cggggggaaa gtccaaatca 2280 taaatctgca atcgctatac tgcagtagag atcagtggcg attaagtttg ccccgtgacg 2340 atatggaact ggccgcttta gcactgctgg tttgcattgg gcaaattatc gccccggcaa 2400 aagatgacgt tgaatttcga catcgcataa tgaatccgct cactgaagat gagtttcaac 2460 aactcatcgc gccgtggata gatatgttct accttaatca cgcagaacat ccctttatgc 2520 agaccaaagg tgtcaaagca aatgatgtga ctccaatgga aaaactgttg gctggggtaa 2580 gcggcgcgac gaattgtgca tttgtcaatc aaccggggca gggtgaagca ttatgtggtg 2640 gatgcactgc gattgcgtta ttcaaccagg cgaatcaggc accaggtttt ggtggtggtt 2700 ttaaaagcgg tttacgtgga ggaacacctg taacaacgtt cgtacgtggg atcgatcttc 2760 gttcaacggt gttactcaat gtcctcacat tacctcgtct tcaaaaacaa tttcctaatg 2820 aatcacatac ggaaaaccaa cctacctgga ttaaacctat caagtccaat gagtctatac 2880 ctgcttcgtc aattgggttt gtccgtggtc tattctggca accagcgcat attgaattat 2940 gcgatcccat tgggattggt aaatgttctt gctgtggaca ggaaagcaat ttgcgttata 3000 ccggttttct taaggaaaaa tttaccttta cagttaatgg gctatggccc catccgcatt 3060 ccccttgtct ggtaacagtc aagaaagggg aggttgagga aaaatttctt gctttcacca 3120 cctccgcacc atcatggaca caaatcagcc gagttgtggt agataagatt attcaaaatg 3180 aaaatggaaa tcgcgtggcg gcggttgtga atcaattcag aaatattgcg ccgcaaagtc 3240 ctcttgaatt gattatgggg ggatatcgta ataatcaagc atctattctt gaacggcgtc 3300 atgatgtgtt gatgtttaat caggggtggc aacaatacgg caatgtgata aacgaaatag 3360 tgactgttgg tttgggatat aaaacagcct tacgcaaggc gttatatacc tttgcagaag 3420 ggtttaaaaa taaagacttc aaaggggccg gagtctctgt tcatgagact gcagaaaggc 3480 atttctatcg acagagtgaa ttattaattc ccgatgtact ggcgaatgtt aatttttccc 3540 aggctgatga ggtaatagct gatttacgag acaaacttca tcaattgtgt gaaatgctat 3600 ttaatcaatc tgtagctccc tatgcacatc atcctaaatt aataagcaca ttagcgcttg 3660 cccgcgccac gctatacaaa catttacggg agttaaaacc gcaaggaggg ccatcaaatg 3720 gctgagcatc accaccatca tcacggtgca cttgaagtcc tctttcaggg acccgggtac 3780 cagatggctg atgaaattga tgcaatggct ttatatcgag cctggcaaca actggataat 3840 ggatcatgtg cgcaaattag acgtgtttca gaacctgatg aattacgcga tatccctgcg 3900 ttttataggc tggtgcaacc ttttggttgg gaaaacccac gtcaccagca ggctcttttg 3960 cgcatggtgt tttgcctgag cgcaggaaag aatgtcatcc gacatcagga caaaaaatcg 4020 gagcaaacaa caggtatctc gttgggaaga gctttagcca atagtggaag aattaacgag 4080 cgccgtatct ttcaattaat tcgggctgac agaacagccg atatggtcca gttacgtcga 4140 ttacttactc acgccgaacc cgtacttgac tggccattaa tggccaggat gttgacctgg 4200 tggggaaagc gcgaacgcca gcaacttctg gaagattttg tattgaccac aaacaaaaat 4260 gcgtaaggaa acctttctat gtctaacttt atcaatattc atgttctgat ctctcacagc 4320 ccttcatgtc tgaaccgcga cgatatgaac atgcagaaag acgctatttt cggcggcaaa 4380 agacgagtaa gaatttcaag tcaaagcctt aaacgtgcga tgcgtaaaag tggttattac 4440 gcacaaaata ttggtgaatc cagtctcaga accattcatc ttgcacaatt acgtgatgtt 4500 cttcggcaaa aacttggtga acgttttgac caaaaaatca tcgataagac attagcgctg 4560 ctctccggta aatcagttga tgaagccgaa aagatttctg ccgatgcggt tactccctgg 4620 gttgtgggag aaatagcctg gttctgtgag caggttgcaa aagcagaggc tgataatctg 4680 gatgataaaa agctgctcaa agttcttaag gaagatattg ccgccatacg tgtgaattta 4740 cagcagggtg ttgatattgc gcttagtgga agaatggcaa ccagcggcat gatgactgag 4800 ttgggaaaag ttgatggtgc aatgtccatt gcgcatgcga tcactactca tcaggttgat 4860 tctgatattg actggttcac cgctgtagat gatttacagg aacaaggttc tgcacatctg 4920 ggaactcagg aattttcatc gggtgttttt tatcgttatg ccaacattaa cctcgctcaa 4980 cttcaggaaa atttaggtgg tgcctccagg gagcaggctc tggaaattgc aacccatgtt 5040 gttcatatgc tggcaacaga ggtccctgga gcaaaacagc gtacttatgc cgcttttaac 5100 cctgcggata tggtaatggt taatttctcc gatatgccac tttctatggc aaatgctttt 5160 gaaaaagcgg ttaaagcgaa agatggcttt ttgcaaccgt ctatacaggc gtttaatcaa 5220 tattgggatc gcgttgccaa tggatatggt ctgaacggag ctgctgcgca attcagctta 5280 tctgatgtag acccaattac tgctcaagtt aaacaaatgc ctactttaga acagttaaaa 5340 tcctgggttc gtaataatgg cgaggcgtga acatgagatc ttatttgatc ttgcggcttg 5400 ctgggccaat gcaagcctgg gggcagccga cctttgaagg aacgcgacct accggaagat 5460 ttccgacccg aagcgggtta ttagggctac tcggggcttg tcttgggatc caacgtgatg 5520 atacttcttc attacaggcg ttatcagaga gtgtgcaatt tgcagtgcgc tgcgatgaac 5580 tcattcttga cgatcgtcgt gtgtctgtaa cggggttgcg tgattaccat acagtccttg 5640 gagcgcgaga agattaccgt ggtttgaaaa gtcatgaaac gattcaaaca tggcgcgaat 5700 atttatgtga tgcctccttt accgtcgctc tctggttaac accccatgca acgatggtta 5760 tctcagaact tgaaaaagca gtattaaagc ctcggtatac accttacctg gggcggagaa 5820 gttgcccact aacacacccg ctttttttgg ggacatgtca ggcatcggat cctcagaagg 5880 cgctattaaa ttatgagccc gttggcggcg atatatatag tgaggaatca gttacagggc 5940 atcatttaaa atttacggcg cgcgacgaac cgatgatcac cttgcctcga caatttgctt 6000 cccgagaatg gtatgtgatt aaaggaggta tggatgtatc tcagtaatta ataaaggagg 6060 tatataatgc caaagaaaaa acgtaaggtt ggcggtagca tgtacctcag caaagtcatc 6120 attgccaggg cctggagcag ggatctttac caacttcacc agggattatg gcatttattt 6180 ccaaacagac cggatgctgc tcgtgatttt ctttttcatg ttgagaagcg aaacacacca 6240 gaaggctgtc atgttttatt gcagtcagcg caaatgcctg tttcaactgc cgttgcgaca 6300 gtcattaaaa ctaaacaggt tgaatttcaa cttcaggttg gtgttccact ctattttcgg 6360 cttcgggcaa atccgatcaa aactattctc gacaatcaaa agcgcctgga cagtaaaggg 6420 aatattaaac gctgtcgggt tccgttaata aaagaagcag aacaaatcgc gtggttgcaa 6480 cgtaaattgg gcaatgcggc gcgcgttgaa gatgtgcatc ccatatcgga acggccacag 6540 tatttttctg gtgatggtaa aagtggaaag atccaaacgg tttgctttga aggtgtgctc 6600 accatcaacg acgcgccagc gttaatagat cttgtacagc aaggtattgg gccagctaaa 6660 tcgatgggat gtggcttgct atctttggct ccactgtgac tgcaggcggc cgcactcgag 6720 tctggtaaag aaaccgctgc tgcgaaattt gaacgccagc acatggactc gtctactagc 6780 gcagcttaat taacctaggc tgctgccacc gctgagcaat aactagcata accccttggg 6840 gcctctaaac gggtcttgag gggttttttg ctgaaacctc aggcatttga gaagcacacg 6900 gtcacactgc ttccggtagt caataaaccg gtaaaccagc aatagacata agcggctatt 6960 taacgaccct gccctgaacc gacgaccggg tcatcgtggc cggatcttgc ggcccctcgg 7020 cttgaacgaa ttgttagaca ttatttgccg actaccttgg tgatctcgcc tttcacgtag 7080 tggacaaatt cttccaactg atctgcgcgc gaggccaagc gatcttcttc ttgtccaaga 7140 taagcctgtc tagcttcaag tatgacgggc tgatactggg ccggcaggcg ctccattgcc 7200 cagtcggcag cgacatcctt cggcgcgatt ttgccggtta ctgcgctgta ccaaatgcgg 7260 gacaacgtaa gcactacatt tcgctcatcg ccagcccagt cgggcggcga gttccatagc 7320 gttaaggttt catttagcgc ctcaaataga tcctgttcag gaaccggatc aaagagttcc 7380 tccgccgctg gacctaccaa ggcaacgcta tgttctcttg cttttgtcag caagatagcc 7440 agatcaatgt cgatcgtggc tggctcgaag atacctgcaa gaatgtcatt gcgctgccat 7500 tctccaaatt gcagttcgcg cttagctgga taacgccacg gaatgatgtc gtcgtgcaca 7560 acaatggtga cttctacagc gcggagaatc tcgctctctc caggggaagc cgaagtttcc 7620 aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa gccttacggt caccgtaacc 7680 agcaaatcaa tatcactgtg tggcttcagg ccgccatcca ctgcggagcc gtacaaatgt 7740 acggccagca acgtcggttc gagatggcgc tcgatgacgc caactacctc tgatagttga 7800 gtcgatactt cggcgatcac cgcttccctc atactcttcc tttttcaata ttattgaagc 7860 atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 7920 caaatagcta gctcactcgg tcgctacgct ccgggcgtga gactgcggcg ggcgctgcgg 7980 acacatacaa agttacccac agattccgtg gataagcagg ggactaacat gtgaggcaaa 8040 acagcagggc cgcgccggtg gcgtttttcc ataggctccg ccctcctgcc agagttcaca 8100 taaacagacg cttttccggt gcatctgtgg gagccgtgag gctcaaccat gaatctgaca 8160 gtacgggcga aacccgacag gacttaaaga tccccaccgt ttccggcggg tcgctccctc 8220 ttgcgctctc ctgttccgac cctgccgttt accggatacc tgttccgcct ttctccctta 8280 cgggaagtgt ggcgctttct catagctcac acactggtat ctcggctcgg tgtaggtcgt 8340 tcgctccaag ctgggctgta agcaagaact ccccgttcag cccgactgct gcgccttatc 8400 cggtaactgt tcacttgagt ccaacccgga aaagcacggt aaaacgccac tggcagcagc 8460 cattggtaac tgggagttcg cagaggattt gtttagctaa acacgcggtt gctcttgaag 8520 tgtgcgccaa agtccggcta cactggaagg acagatttgg ttgctgtgct ctgcgaaagc 8580 cagttaccac ggttaagcag ttccccaact gacttaacct tcgatcaaac cacctcccca 8640 ggtggttttt tcgtttacag ggcaaaagat tacgcgcaga aaaaaaggat ctcaagaaga 8700 tcctttgatc 8710 <210> 361 <211> 8687 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: FokI30aaCas8_His6HRV3CCse2_Cas7NLS_Cas5_Cas6 <400> 361 ttttctactg aaccgctcta gatttcagtg caatttatct cttcaaatgt agcacctgaa 60 gtcagcccca tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga 120 aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 180 tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 240 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300 gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 360 tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 420 tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 480 actaccgaga tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 540 agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 600 tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 660 tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 720 gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 780 acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 840 gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 900 tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 960 accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 1020 cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 1080 agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 1140 cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 1200 gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 1260 tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 1320 gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 1380 acgctctccc ttatgcgact cctgcattag gaaattaata cgactcacta taggggaatt 1440 gtgagcggat aacaattccc ctgtagaaat aattttgttt aactttaata aggagatata 1500 ccatggctcc gaaaaaaaag cgcaaagtgg gtggctctca actggttaaa agcgaactgg 1560 aagagaaaaa aagtgaactg cgccacaaac tgaaatatgt gccgcatgaa tatatcgagc 1620 tgattgaaat tgcacgtaat ccgacccagg atcgtattct ggaaatgaaa gtgatggaat 1680 tttttatgaa agtgtacggc tatcgcggtg aacatctggg tggtagccgt aaaccggatg 1740 gtgcaattta taccgttggt agcccgattg attatggtgt tattgttgat accaaagcct 1800 atagcggtgg ttataatctg ccgattggtc aggcagatga aatgcagcgt tatgtggaag 1860 aaaatcagac ccgtaacaaa catattaatc cgaatgaatg gtggaaagtt tatccgagca 1920 gcgttaccga gtttaaattc ctgtttgtta gcggtcactt caaaggcaac tataaagcac 1980 agctgacccg tctgaatcat attaccaatt gtaatggtgc agttctgagc gttgaagaac 2040 tgctgattgg tggtgaaatg attaaagcag gcaccctgac cctggaagaa gttcgtcgca 2100 aatttaacaa tggcgaaatc aacttttcag gcagcgaaac gccgggtaca agtgagtcag 2160 caactccaga gagcggcggc agtggtagta gtgggggatc tgggtcatct ggtgggatga 2220 atttgcttat tgataactgg attcctgtac gcccgcgaaa cggggggaaa gtccaaatca 2280 taaatctgca atcgctatac tgcagtagag atcagtggcg attaagtttg ccccgtgacg 2340 atatggaact ggccgcttta gcactgctgg tttgcattgg gcaaattatc gccccggcaa 2400 aagatgacgt tgaatttcga catcgcataa tgaatccgct cactgaagat gagtttcaac 2460 aactcatcgc gccgtggata gatatgttct accttaatca cgcagaacat ccctttatgc 2520 agaccaaagg tgtcaaagca aatgatgtga ctccaatgga aaaactgttg gctggggtaa 2580 gcggcgcgac gaattgtgca tttgtcaatc aaccggggca gggtgaagca ttatgtggtg 2640 gatgcactgc gattgcgtta ttcaaccagg cgaatcaggc accaggtttt ggtggtggtt 2700 ttaaaagcgg tttacgtgga ggaacacctg taacaacgtt cgtacgtggg atcgatcttc 2760 gttcaacggt gttactcaat gtcctcacat tacctcgtct tcaaaaacaa tttcctaatg 2820 aatcacatac ggaaaaccaa cctacctgga ttaaacctat caagtccaat gagtctatac 2880 ctgcttcgtc aattgggttt gtccgtggtc tattctggca accagcgcat attgaattat 2940 gcgatcccat tgggattggt aaatgttctt gctgtggaca ggaaagcaat ttgcgttata 3000 ccggttttct taaggaaaaa tttaccttta cagttaatgg gctatggccc catccgcatt 3060 ccccttgtct ggtaacagtc aagaaagggg aggttgagga aaaatttctt gctttcacca 3120 cctccgcacc atcatggaca caaatcagcc gagttgtggt agataagatt attcaaaatg 3180 aaaatggaaa tcgcgtggcg gcggttgtga atcaattcag aaatattgcg ccgcaaagtc 3240 ctcttgaatt gattatgggg ggatatcgta ataatcaagc atctattctt gaacggcgtc 3300 atgatgtgtt gatgtttaat caggggtggc aacaatacgg caatgtgata aacgaaatag 3360 tgactgttgg tttgggatat aaaacagcct tacgcaaggc gttatatacc tttgcagaag 3420 ggtttaaaaa taaagacttc aaaggggccg gagtctctgt tcatgagact gcagaaaggc 3480 atttctatcg acagagtgaa ttattaattc ccgatgtact ggcgaatgtt aatttttccc 3540 aggctgatga ggtaatagct gatttacgag acaaacttca tcaattgtgt gaaatgctat 3600 ttaatcaatc tgtagctccc tatgcacatc atcctaaatt aataagcaca ttagcgcttg 3660 cccgcgccac gctatacaaa catttacggg agttaaaacc gcaaggaggg ccatcaaatg 3720 gctgagcatc accaccatca tcacggtgca cttgaagtcc tctttcaggg acccgggtac 3780 cagatggctg atgaaattga tgcaatggct ttatatcgag cctggcaaca actggataat 3840 ggatcatgtg cgcaaattag acgtgtttca gaacctgatg aattacgcga tatccctgcg 3900 ttttataggc tggtgcaacc ttttggttgg gaaaacccac gtcaccagca ggctcttttg 3960 cgcatggtgt tttgcctgag cgcaggaaag aatgtcatcc gacatcagga caaaaaatcg 4020 gagcaaacaa caggtatctc gttgggaaga gctttagcca atagtggaag aattaacgag 4080 cgccgtatct ttcaattaat tcgggctgac agaacagccg atatggtcca gttacgtcga 4140 ttacttactc acgccgaacc cgtacttgac tggccattaa tggccaggat gttgacctgg 4200 tggggaaagc gcgaacgcca gcaacttctg gaagattttg tattgaccac aaacaaaaat 4260 gcgtaaggaa acctttctat gtctaacttt atcaatattc atgttctgat ctctcacagc 4320 ccttcatgtc tgaaccgcga cgatatgaac atgcagaaag acgctatttt cggcggcaaa 4380 agacgagtaa gaatttcaag tcaaagcctt aaacgtgcga tgcgtaaaag tggttattac 4440 gcacaaaata ttggtgaatc cagtctcaga accattcatc ttgcacaatt acgtgatgtt 4500 cttcggcaaa aacttggtga acgttttgac caaaaaatca tcgataagac attagcgctg 4560 ctctccggta aatcagttga tgaagccgaa aagatttctg ccgatgcggt tactccctgg 4620 gttgtgggag aaatagcctg gttctgtgag caggttgcaa aagcagaggc tgataatctg 4680 gatgataaaa agctgctcaa agttcttaag gaagatattg ccgccatacg tgtgaattta 4740 cagcagggtg ttgatattgc gcttagtgga agaatggcaa ccagcggcat gatgactgag 4800 ttgggaaaag ttgatggtgc aatgtccatt gcgcatgcga tcactactca tcaggttgat 4860 tctgatattg actggttcac cgctgtagat gatttacagg aacaaggttc tgcacatctg 4920 ggaactcagg aattttcatc gggtgttttt tatcgttatg ccaacattaa cctcgctcaa 4980 cttcaggaaa atttaggtgg tgcctccagg gagcaggctc tggaaattgc aacccatgtt 5040 gttcatatgc tggcaacaga ggtccctgga gcaaaacagc gtacttatgc cgcttttaac 5100 cctgcggata tggtaatggt taatttctcc gatatgccac tttctatggc aaatgctttt 5160 gaaaaagcgg ttaaagcgaa agatggcttt ttgcaaccgt ctatacaggc gtttaatcaa 5220 tattgggatc gcgttgccaa tggatatggt ctgaacggag ctgctgcgca attcagctta 5280 tctgatgtag acccaattac tgctcaagtt aaacaaatgc ctactttaga acagttaaaa 5340 tcctgggttc gtaataatgg cgaggcgggc ggtagcccaa agaaaaaacg taaggtttga 5400 taaaggaggt atataatgag atcttatttg atcttgcggc ttgctgggcc aatgcaagcc 5460 tgggggcagc cgacctttga aggaacgcga cctaccggaa gatttccgac ccgaagcggg 5520 ttattagggc tactcggggc ttgtcttggg atccaacgtg atgatacttc ttcattacag 5580 gcgttatcag agagtgtgca atttgcagtg cgctgcgatg aactcattct tgacgatcgt 5640 cgtgtgtctg taacggggtt gcgtgattac catacagtcc ttggagcgcg agaagattac 5700 cgtggtttga aaagtcatga aacgattcaa acatggcgcg aatatttatg tgatgcctcc 5760 tttaccgtcg ctctctggtt aacaccccat gcaacgatgg ttatctcaga acttgaaaaa 5820 gcagtattaa agcctcggta tacaccttac ctggggcgga gaagttgccc actaacacac 5880 ccgctttttt tggggacatg tcaggcatcg gatcctcaga aggcgctatt aaattatgag 5940 cccgttggcg gcgatatata tagtgaggaa tcagttacag ggcatcattt aaaatttacg 6000 gcgcgcgacg aaccgatgat caccttgcct cgacaatttg cttcccgaga atggtatgtg 6060 attaaaggag gtatggatgt atctcagtaa agtcatcatt gccagggcct ggagcaggga 6120 tctttaccaa cttcaccagg gattatggca tttatttcca aacagaccgg atgctgctcg 6180 tgattttctt tttcatgttg agaagcgaaa cacaccagaa ggctgtcatg ttttattgca 6240 gtcagcgcaa atgcctgttt caactgccgt tgcgacagtc attaaaacta aacaggttga 6300 atttcaactt caggttggtg ttccactcta ttttcggctt cgggcaaatc cgatcaaaac 6360 tattctcgac aatcaaaagc gcctggacag taaagggaat attaaacgct gtcgggttcc 6420 gttaataaaa gaagcagaac aaatcgcgtg gttgcaacgt aaattgggca atgcggcgcg 6480 cgttgaagat gtgcatccca tatcggaacg gccacagtat ttttctggtg atggtaaaag 6540 tggaaagatc caaacggttt gctttgaagg tgtgctcacc atcaacgacg cgccagcgtt 6600 aatagatctt gtacagcaag gtattgggcc agctaaatcg atgggatgtg gcttgctatc 6660 tttggctcca ctgtgactgc aggcggccgc actcgagtct ggtaaagaaa ccgctgctgc 6720 gaaatttgaa cgccagcaca tggactcgtc tactagcgca gcttaattaa cctaggctgc 6780 tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg tcttgagggg 6840 ttttttgctg aaacctcagg catttgagaa gcacacggtc acactgcttc cggtagtcaa 6900 taaaccggta aaccagcaat agacataagc ggctatttaa cgaccctgcc ctgaaccgac 6960 gaccgggtca tcgtggccgg atcttgcggc ccctcggctt gaacgaattg ttagacatta 7020 tttgccgact accttggtga tctcgccttt cacgtagtgg acaaattctt ccaactgatc 7080 tgcgcgcgag gccaagcgat cttcttcttg tccaagataa gcctgtctag cttcaagtat 7140 gacgggctga tactgggccg gcaggcgctc cattgcccag tcggcagcga catccttcgg 7200 cgcgattttg ccggttactg cgctgtacca aatgcgggac aacgtaagca ctacatttcg 7260 ctcatcgcca gcccagtcgg gcggcgagtt ccatagcgtt aaggtttcat ttagcgcctc 7320 aaatagatcc tgttcaggaa ccggatcaaa gagttcctcc gccgctggac ctaccaaggc 7380 aacgctatgt tctcttgctt ttgtcagcaa gatagccaga tcaatgtcga tcgtggctgg 7440 ctcgaagata cctgcaagaa tgtcattgcg ctgccattct ccaaattgca gttcgcgctt 7500 agctggataa cgccacggaa tgatgtcgtc gtgcacaaca atggtgactt ctacagcgcg 7560 gagaatctcg ctctctccag gggaagccga agtttccaaa aggtcgttga tcaaagctcg 7620 ccgcgttgtt tcatcaagcc ttacggtcac cgtaaccagc aaatcaatat cactgtgtgg 7680 cttcaggccg ccatccactg cggagccgta caaatgtacg gccagcaacg tcggttcgag 7740 atggcgctcg atgacgccaa ctacctctga tagttgagtc gatacttcgg cgatcaccgc 7800 ttccctcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 7860 gagcggatac atatttgaat gtatttagaa aaataaacaa atagctagct cactcggtcg 7920 ctacgctccg ggcgtgagac tgcggcgggc gctgcggaca catacaaagt tacccacaga 7980 ttccgtggat aagcagggga ctaacatgtg aggcaaaaca gcagggccgc gccggtggcg 8040 tttttccata ggctccgccc tcctgccaga gttcacataa acagacgctt ttccggtgca 8100 tctgtgggag ccgtgaggct caaccatgaa tctgacagta cgggcgaaac ccgacaggac 8160 ttaaagatcc ccaccgtttc cggcgggtcg ctccctcttg cgctctcctg ttccgaccct 8220 gccgtttacc ggatacctgt tccgcctttc tcccttacgg gaagtgtggc gctttctcat 8280 agctcacaca ctggtatctc ggctcggtgt aggtcgttcg ctccaagctg ggctgtaagc 8340 aagaactccc cgttcagccc gactgctgcg ccttatccgg taactgttca cttgagtcca 8400 acccggaaaa gcacggtaaa acgccactgg cagcagccat tggtaactgg gagttcgcag 8460 aggatttgtt tagctaaaca cgcggttgct cttgaagtgt gcgccaaagt ccggctacac 8520 tggaaggaca gatttggttg ctgtgctctg cgaaagccag ttaccacggt taagcagttc 8580 cccaactgac ttaaccttcg atcaaaccac ctccccaggt ggttttttcg tttacagggc 8640 aaaagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatc 8687 <210> 362 <211> 8614 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas8_His6HRV3CCse2_Cas7_Cas5_Cas620aaFokI <400> 362 ttttctactg aaccgctcta gatttcagtg caatttatct cttcaaatgt agcacctgaa 60 gtcagcccca tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga 120 aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 180 tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 240 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300 gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 360 tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 420 tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 480 actaccgaga tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 540 agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 600 tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 660 tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 720 gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 780 acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 840 gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 900 tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 960 accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 1020 cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 1080 agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 1140 cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 1200 gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 1260 tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 1320 gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 1380 acgctctccc ttatgcgact cctgcattag gaaattaata cgactcacta taggggaatt 1440 gtgagcggat aacaattccc ctgtagaaat aattttgttt aactttaata aggagatata 1500 ccatggctaa tttgcttatt gataactgga tccctgtacg cccgcgaaac ggggggaaag 1560 tccaaatcat aaatctgcaa tcgctatact gcagtagaga tcagtggcga ttaagtttgc 1620 cccgtgacga tatggaactg gccgctttag cactgctggt ttgcattggg caaattatcg 1680 ccccggcaaa agatgacgtt gaatttcgac atcgcataat gaatccgctc actgaagatg 1740 agtttcaaca actcatcgcg ccgtggatag atatgttcta ccttaatcac gcagaacatc 1800 cctttatgca gaccaaaggt gtcaaagcaa atgatgtgac tccaatggaa aaactgttgg 1860 ctggggtaag cggcgcgacg aattgtgcat ttgtcaatca accggggcag ggtgaagcat 1920 tatgtggtgg atgcactgcg attgcgttat tcaaccaggc gaatcaggca ccaggttttg 1980 gtggtggttt taaaagcggt ttacgtggag gaacacctgt aacaacgttc gtacgtggga 2040 tcgatcttcg ttcaacggtg ttactcaatg tcctcacatt acctcgtctt caaaaacaat 2100 ttcctaatga atcacatacg gaaaaccaac ctacctggat taaacctatc aagtccaatg 2160 agtctatacc tgcttcgtca attgggtttg tccgtggtct attctggcaa ccagcgcata 2220 ttgaattatg cgatcccatt gggattggta aatgttcttg ctgtggacag gaaagcaatt 2280 tgcgttatac cggttttctt aaggaaaaat ttacctttac agttaatggg ctatggcccc 2340 atccgcattc cccttgtctg gtaacagtca agaaagggga ggttgaggaa aaatttcttg 2400 ctttcaccac ctccgcacca tcatggacac aaatcagccg agttgtggta gataagatta 2460 ttcaaaatga aaatggaaat cgcgtggcgg cggttgtgaa tcaattcaga aatattgcgc 2520 cgcaaagtcc tcttgaattg attatggggg gatatcgtaa taatcaagca tctattcttg 2580 aacggcgtca tgatgtgttg atgtttaatc aggggtggca acaatacggc aatgtgataa 2640 acgaaatagt gactgttggt ttgggatata aaacagcctt acgcaaggcg ttatatacct 2700 ttgcagaagg gtttaaaaat aaagacttca aaggggccgg agtctctgtt catgagactg 2760 cagaaaggca tttctatcga cagagtgaat tattaattcc cgatgtactg gcgaatgtta 2820 atttttccca ggctgatgag gtaatagctg atttacgaga caaacttcat caattgtgtg 2880 aaatgctatt taatcaatct gtagctccct atgcacatca tcctaaatta ataagcacat 2940 tagcgcttgc ccgcgccacg ctatacaaac atttacggga gttaaaaccg caaggagggc 3000 catcaaatgg ctgagcatca ccaccatcat cacggtgcac ttgaagtcct ctttcaggga 3060 cccgggtacc agatggctga tgaaattgat gcaatggctt tatatcgagc ctggcaacaa 3120 ctggataatg gatcatgtgc gcaaattaga cgtgtttcag aacctgatga attacgcgat 3180 atccctgcgt tttataggct ggtgcaacct tttggttggg aaaacccacg tcaccagcag 3240 gctcttttgc gcatggtgtt ttgcctgagc gcaggaaaga atgtcatccg acatcaggac 3300 aaaaaatcgg agcaaacaac aggtatctcg ttgggaagag ctttagccaa tagtggaaga 3360 attaacgagc gccgtatctt tcaattaatt cgggctgaca gaacagccga tatggtccag 3420 ttacgtcgat tacttactca cgccgaaccc gtacttgact ggccattaat ggccaggatg 3480 ttgacctggt ggggaaagcg cgaacgccag caacttctgg aagattttgt attgaccaca 3540 aacaaaaatg cgtaaggaaa cctttctatg tctaacttta tcaatattca tgttctgatc 3600 tctcacagcc cttcatgtct gaaccgcgac gatatgaaca tgcagaaaga cgctattttc 3660 ggcggcaaaa gacgagtaag aatttcaagt caaagcctta aacgtgcgat gcgtaaaagt 3720 ggttattacg cacaaaatat tggtgaatcc agtctcagaa ccattcatct tgcacaatta 3780 cgtgatgttc ttcggcaaaa acttggtgaa cgttttgacc aaaaaatcat cgataagaca 3840 ttagcgctgc tctccggtaa atcagttgat gaagccgaaa agatttctgc cgatgcggtt 3900 actccctggg ttgtgggaga aatagcctgg ttctgtgagc aggttgcaaa agcagaggct 3960 gataatctgg atgataaaaa gctgctcaaa gttcttaagg aagatattgc cgccatacgt 4020 gtgaatttac agcagggtgt tgatattgcg cttagtggaa gaatggcaac cagcggcatg 4080 atgactgagt tgggaaaagt tgatggtgca atgtccattg cgcatgcgat cactactcat 4140 caggttgatt ctgatattga ctggttcacc gctgtagatg atttacagga acaaggttct 4200 gcacatctgg gaactcagga attttcatcg ggtgtttttt atcgttatgc caacattaac 4260 ctcgctcaac ttcaggaaaa tttaggtggt gcctccaggg agcaggctct ggaaattgca 4320 acccatgttg ttcatatgct ggcaacagag gtccctggag caaaacagcg tacttatgcc 4380 gcttttaacc ctgcggatat ggtaatggtt aatttctccg atatgccact ttctatggca 4440 aatgcttttg aaaaagcggt taaagcgaaa gatggctttt tgcaaccgtc tatacaggcg 4500 tttaatcaat attgggatcg cgttgccaat ggatatggtc tgaacggagc tgctgcgcaa 4560 ttcagcttat ctgatgtaga cccaattact gctcaagtta aacaaatgcc tactttagaa 4620 cagttaaaat cctgggttcg taataatggc gaggcgtgaa catgagatct tatttgatct 4680 tgcggcttgc tgggccaatg caagcctggg ggcagccgac ctttgaagga acgcgaccta 4740 ccggaagatt tccgacccga agcgggttat tagggctact cggggcttgt cttgggatcc 4800 aacgtgatga tacttcttca ttacaggcgt tatcagagag tgtgcaattt gcagtgcgct 4860 gcgatgaact cattcttgac gatcgtcgtg tgtctgtaac ggggttgcgt gattaccata 4920 cagtccttgg agcgcgagaa gattaccgtg gtttgaaaag tcatgaaacg attcaaacat 4980 ggcgcgaata tttatgtgat gcctccttta ccgtcgctct ctggttaaca ccccatgcaa 5040 cgatggttat ctcagaactt gaaaaagcag tattaaagcc tcggtataca ccttacctgg 5100 ggcggagaag ttgcccacta acacacccgc tttttttggg gacatgtcag gcatcggatc 5160 ctcagaaggc gctattaaat tatgagcccg ttggcggcga tatatatagt gaggaatcag 5220 ttacagggca tcatttaaaa tttacggcgc gcgacgaacc gatgatcacc ttgcctcgac 5280 aatttgcttc ccgagaatgg tatgtgatta aaggaggtat ggatgtatct cagtaaagtc 5340 atcattgcca gggcctggag cagggatctt taccaacttc accagggatt atggcattta 5400 tttccaaaca gaccggatgc tgctcgtgat tttctttttc atgttgagaa gcgaaacaca 5460 ccagaaggct gtcatgtttt attgcagtca gcgcaaatgc ctgtttcaac tgccgttgcg 5520 acagtcatta aaactaaaca ggttgaattt caacttcagg ttggtgttcc actctatttt 5580 cggcttcggg caaatccgat caaaactatt ctcgacaatc aaaagcgcct ggacagtaaa 5640 gggaatatta aacgctgtcg ggttccgtta ataaaagaag cagaacaaat cgcgtggttg 5700 caacgtaaat tgggcaatgc ggcgcgcgtt gaagatgtgc atcccatatc ggaacggcca 5760 cagtattttt ctggtgatgg taaaagtgga aagatccaaa cggtttgctt tgaaggtgtg 5820 ctcaccatca acgacgcgcc agcgttaata gatcttgtac agcaaggtat tgggccagct 5880 aaatcgatgg gatgtggctt gctatctttg gctccactgt cgggctcaga aacgccgggg 5940 acatcggaat ccgccacacc tgagtcgggt ggttctggtc aactggttaa aagcgaactg 6000 gaagagaaaa aaagtgaact gcgccacaaa ctgaaatatg tgccgcatga atatatcgag 6060 ctgattgaaa ttgcacgtaa tccgacccag gatcgtattc tggaaatgaa agtgatggaa 6120 ttttttatga aagtgtacgg ctatcgcggt gaacatctgg gtggtagccg taaaccggat 6180 ggtgcaattt ataccgttgg tagcccgatt gattatggtg ttattgttga taccaaagcc 6240 tatagcggtg gttataatct gccgattggt caggcagatg aaatgcagcg ttatgtggaa 6300 gaaaatcaga cccgtaacaa acatattaat ccgaatgaat ggtggaaagt ttatccgagc 6360 agcgttaccg agtttaaatt cctgtttgtt agcggtcact tcaaaggcaa ctataaagca 6420 cagctgaccc gtctgaatca tattaccaat tgtaatggtg cagttctgag cgttgaagaa 6480 ctgctgattg gtggtgaaat gattaaagca ggcaccctga ccctggaaga agttcgtcgc 6540 aaatttaaca atggcgaaat caactttggt ggctctccga aaaaaaagcg caaagtgtaa 6600 taactgcagg cggccgcact cgagtctggt aaagaaaccg ctgctgcgaa atttgaacgc 6660 cagcacatgg actcgtctac tagcgcagct taattaacct aggctgctgc caccgctgag 6720 caataactag cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa 6780 cctcaggcat ttgagaagca cacggtcaca ctgcttccgg tagtcaataa accggtaaac 6840 cagcaataga cataagcggc tatttaacga ccctgccctg aaccgacgac cgggtcatcg 6900 tggccggatc ttgcggcccc tcggcttgaa cgaattgtta gacattattt gccgactacc 6960 ttggtgatct cgcctttcac gtagtggaca aattcttcca actgatctgc gcgcgaggcc 7020 aagcgatctt cttcttgtcc aagataagcc tgtctagctt caagtatgac gggctgatac 7080 tgggccggca ggcgctccat tgcccagtcg gcagcgacat ccttcggcgc gattttgccg 7140 gttactgcgc tgtaccaaat gcgggacaac gtaagcacta catttcgctc atcgccagcc 7200 cagtcgggcg gcgagttcca tagcgttaag gtttcattta gcgcctcaaa tagatcctgt 7260 tcaggaaccg gatcaaagag ttcctccgcc gctggaccta ccaaggcaac gctatgttct 7320 cttgcttttg tcagcaagat agccagatca atgtcgatcg tggctggctc gaagatacct 7380 gcaagaatgt cattgcgctg ccattctcca aattgcagtt cgcgcttagc tggataacgc 7440 cacggaatga tgtcgtcgtg cacaacaatg gtgacttcta cagcgcggag aatctcgctc 7500 tctccagggg aagccgaagt ttccaaaagg tcgttgatca aagctcgccg cgttgtttca 7560 tcaagcctta cggtcaccgt aaccagcaaa tcaatatcac tgtgtggctt caggccgcca 7620 tccactgcgg agccgtacaa atgtacggcc agcaacgtcg gttcgagatg gcgctcgatg 7680 acgccaacta cctctgatag ttgagtcgat acttcggcga tcaccgcttc cctcatactc 7740 ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 7800 tttgaatgta tttagaaaaa taaacaaata gctagctcac tcggtcgcta cgctccgggc 7860 gtgagactgc ggcgggcgct gcggacacat acaaagttac ccacagattc cgtggataag 7920 caggggacta acatgtgagg caaaacagca gggccgcgcc ggtggcgttt ttccataggc 7980 tccgccctcc tgccagagtt cacataaaca gacgcttttc cggtgcatct gtgggagccg 8040 tgaggctcaa ccatgaatct gacagtacgg gcgaaacccg acaggactta aagatcccca 8100 ccgtttccgg cgggtcgctc cctcttgcgc tctcctgttc cgaccctgcc gtttaccgga 8160 tacctgttcc gcctttctcc cttacgggaa gtgtggcgct ttctcatagc tcacacactg 8220 gtatctcggc tcggtgtagg tcgttcgctc caagctgggc tgtaagcaag aactccccgt 8280 tcagcccgac tgctgcgcct tatccggtaa ctgttcactt gagtccaacc cggaaaagca 8340 cggtaaaacg ccactggcag cagccattgg taactgggag ttcgcagagg atttgtttag 8400 ctaaacacgc ggttgctctt gaagtgtgcg ccaaagtccg gctacactgg aaggacagat 8460 ttggttgctg tgctctgcga aagccagtta ccacggttaa gcagttcccc aactgactta 8520 accttcgatc aaaccacctc cccaggtggt tttttcgttt acagggcaaa agattacgcg 8580 cagaaaaaaa ggatctcaag aagatccttt gatc 8614 <210> 363 <211> 12975 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polypromoter, Cas5_Cas3_Cse2_Cas7_Cas6_Cas8_CRISPR(J3) <400> 363 ggcaccatgc atcgatcccg cgaaatgcgg ccgcttaatt aaggcatcaa ataaaacgaa 60 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg agtccttcca 120 gtctgggcga aagcgcggtc gatcaaatta agcagaaggc catcctgacg gatggccttt 180 ttgcgtttct atcgatcccg cgaaattaat acgactcact ataggcccct ctagaaataa 240 ttttgtttaa ctttaagctt taagaaggag atatagatca tgagatctta tttgatcttg 300 cggcttgctg ggccaatgca agcctggggg cagccgacct ttgaaggaac gcgacctacc 360 ggaagatttc cgacccgaag cgggttatta gggctactcg gggcttgtct tgggatccaa 420 cgtgatgata cttcttcatt acaggcgtta tcagagagtg tgcaatttgc agtgcgctgc 480 gatgaactca ttcttgacga tcgtcgtgtg tctgtaacgg ggttgcgtga ttaccataca 540 gtccttggag cgcgagaaga ttaccgtggt ttgaaaagtc atgaaacgat tcaaacatgg 600 cgcgaatatt tatgtgatgc ctcctttacc gtcgctctct ggttaacacc ccatgcaacg 660 atggttatct cagaacttga aaaagcagta ttaaagcctc ggtatacacc ttacctgggg 720 cggagaagtt gcccactaac acacccgctt tttttgggga catgtcaggc atcggatcct 780 cagaaggcgc tattaaatta tgagcccgtt ggcggcgata tatatagtga ggaatcagtt 840 acagggcatc atttaaaatt tacggcgcgc gacgaaccga tgatcacctt gcctcgacaa 900 tttgcttccc gagaatggta tgtgattaaa ggaggtatgg atgtatctca gtaataataa 960 gatcccaact ccataagtgg ctgctgccac cgctgagcat agcataaccc cttggggcct 1020 ctaaacgggt cttgaggggt tttttgctga aaggaggaac tatatcaagt cccgaagtag 1080 ctgtcagact gctggcgacc gccgcaacta gtggcgtcat gcgtgccgta tggtctttcg 1140 cctgtagacg ccctacaagc cgtactaaag tggaaagacc cgcaaaaggt atcgcgatta 1200 aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt 1260 ttgtcggtga gtccttccag tctgggcgaa agcgcggtcg atcaaattaa gcagaaggcc 1320 atcctgacgg atggcctttt tgcgtttcta tcgatcccgc gaaattaata cgactcacta 1380 taggcccctc tagaaataat tttgtttaac tttaagcttt aagaaggaga tatagatcat 1440 ggaacctttt aaatatatat gccattactg gggaaaatcc tcaaaaagct tgacgaaagg 1500 aaatgatatt catctgttaa tttatcattg ccttgatgtt gctgctgttg cagattgctg 1560 gtgggatcaa tcagtcgtac tgcaaaatac tttttgccga aatgaaatgc tatcaaaaca 1620 gagggtgaag gcctggctgt tatttttcat tgctcttcat gatattggaa agtttgatat 1680 acgattccaa tataaatcag cagaaagttg gctgaaatta aatcctgcaa cgccatcact 1740 taatggtcca tcaacacaaa tgtgccgtaa atttaatcat ggtgcagccg gtctgtattg 1800 gtttaaccag gattcacttt cagagcaatc tctcggggat tttttcagtt tttttgatgc 1860 cgctcctcat ccttatgagt cctggtttcc atgggtagag gccgttacag gacatcatgg 1920 ttttatatta cattcccagg atcaagataa gtcgcgttgg gaaatgccag cttctctggc 1980 atcttatgct gcgcaagata aacaggctcg tgaggagtgg atatctgtac tggaagcatt 2040 atttttaacg ccagcggggt tatctataaa cgatatacca cctgattgtt catcactgtt 2100 agcaggtttt tgctcgcttg ctgactggtt aggctcctgg actacaacga atacctttct 2160 gtttaatgag gatgcgcctt ccgacataaa tgctctgaga acgtatttcc aggaccgaca 2220 gcaggatgcg agccgggtat tggagttgag tggacttgta tcaaataagc gatgttatga 2280 aggtgttcat gcactactgg acaatggcta tcaacccaga caattacagg tgttagttga 2340 tgctcttcca gtagctcccg ggctgacggt aatagaggca cctacaggct ccggtaaaac 2400 ggaaacagcg ctggcctatg cttggaaact tattgatcaa caaattgcgg atagtgttat 2460 ttttgccctc ccaacacaag ctaccgcgaa tgctatgctt acgagaatgg aagcgagcgc 2520 gagccactta ttttcatccc caaatcttat tcttgctcat ggcaattcac ggtttaacca 2580 cctctttcaa tcaataaaat cacgcgcgat tactgaacag gggcaagaag aagcgtgggt 2640 tcagtgttgt cagtggttgt cacaaagcaa taagaaagtg tttcttgggc aaatcggcgt 2700 ttgcacgatt gatcaggtgt tgatatcggt attgccagtt aaacaccgct ttatccgtgg 2760 tttgggaatt ggtcgaagtg ttttaattgt tgatgaagtt catgcttacg acacctatat 2820 gaacggcttg ctggaggcag tgctcaaggc tcaggctgat gtgggaggga gtgttattct 2880 tctttccgca accctaccaa tgaaacaaaa acagaaactt ctggatactt atggtctgca 2940 tacagatcca gtggaaaata actccgcata tccactcatt aactggcgag gtgtgaatgg 3000 tgcgcaacgt tttgatctgc tagctcatcc agaacaactc ccgccccgct tttcgattca 3060 gccagaacct atttgtttag ctgacatgtt acctgacctt acgatgttag agcgaatgat 3120 cgcagcggca aacgcgggtg cacaggtctg tcttatttgc aatttggttg acgttgcaca 3180 agtatgctac caacggctaa aggagctaaa taacacgcaa gtagatatag atttgtttca 3240 tgcgcgcttt acgctgaacg atcgtcgtga aaaagagaat cgagttatta gcaatttcgg 3300 caaaaatggg aagcgaaatg ttggacggat acttgtcgca acccaggtcg tggaacaatc 3360 actcgacgtt gattttgatt ggttaattac tcagcattgt cctgcagatt tgcttttcca 3420 acgattgggc cgtttacatc gccatcatcg caaatatcgt cccgctggtt ttgagattcc 3480 tgttgccacc attttgctgc ctgatggcga gggttacgga cgacatgagc atatttatag 3540 caacgttaga gtcatgtggc ggacgcagca acatattgag gagcttaatg gagcatcctt 3600 atttttccct gatgcttacc ggcaatggct ggatagcatt tacgatgatg cggaaatgga 3660 tgagccagaa tgggtcggca atggcatgga taaatttgaa agcgccgagt gtgaaaaaag 3720 gttcaaggct cgcaaggtcc tgcagtgggc tgaagaatat agcttgcagg ataacgatga 3780 aaccattctt gcggtaacga gggatgggga aatgagcctg ccattattgc cttatgtaca 3840 aacgtcttca ggtaaacaac tgctcgatgg ccaggtctac gaggacctaa gtcatgaaca 3900 gcagtatgag gcgcttgcac ttaatcgcgt caatgtaccc ttcacctgga aacgtagttt 3960 ttctgaagta gtagatgaag atgggttact ttggctggaa gggaaacaga atctggatgg 4020 atgggtctgg cagggtaaca gtattgttat tacctataca ggggatgaag ggatgaccag 4080 agtcatccct gcaaatccca aataataata agatcccaac tccataagtg gctgctgcca 4140 ccgctgagca tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg 4200 aaaggaggaa ctatatcaag tcccgaagta gctgtcagac tgctggcgac cgccgcaact 4260 agtggcgtca tgcgtgccgt atggtctttc gcctgtagac gccctacaag ccgtactaaa 4320 gtggaaagac ccgcaaaagg tatcgcgatt aaggcatcaa ataaaacgaa aggctcagtc 4380 gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg agtccttcca gtctgggcga 4440 aagcgcggtc gatcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct 4500 atcgatcccg cgaaattaat acgactcact ataggcccct ctagaaataa ttttgtttaa 4560 ctttaagctt taagaaggag atatagatca tggctgatga aattgatgca atggctttat 4620 atcgagcctg gcaacaactg gataatggat catgtgcgca aattagacgt gtttcagaac 4680 ctgatgaatt acgcgatatc cctgcgtttt ataggctggt gcaacctttt ggttgggaaa 4740 acccacgtca ccagcaggct cttttgcgca tggtgttttg cctgagcgca ggaaagaatg 4800 tcatccgaca tcaggacaaa aaatcggagc aaacaacagg tatctcgttg ggaagagctt 4860 tagccaatag tggaagaatt aacgagcgcc gtatctttca attaattcgg gctgacagaa 4920 cagccgatat ggtccagtta cgtcgattac ttactcacgc cgaacccgta cttgactggc 4980 cattaatggc caggatgttg acctggtggg gaaagcgcga acgccagcaa cttctggaag 5040 attttgtatt gaccacaaac aaaaatgcgt aataataaga tcccaactcc ataagtggct 5100 gctgccaccg ctgagcatag cataacccct tggggcctct aaacgggtct tgaggggttt 5160 tttgctgaaa ggaggaacta tatcaagtcc cgaagtagct gtcagactgc tggcgaccgc 5220 cgcaactagt ggcgtcatgc gtgccgtatg gtctttcgcc tgtagacgcc ctacaagccg 5280 tactaaagtg gaaagacccg caaaaggtat cgcgattaag gcatcaaata aaacgaaagg 5340 ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgagt ccttccagtc 5400 tgggcgaaag cgcggtcgat caaattaagc agaaggccat cctgacggat ggcctttttg 5460 cgtttctatc gatcccgcga aattaatacg actcactata ggcccctcta gaaataattt 5520 tgtttaactt taagctttaa gaaggagata tagatcatgt ctaactttat caatattcat 5580 gttctgatct ctcacagccc ttcatgtctg aaccgcgacg atatgaacat gcagaaagac 5640 gctattttcg gcggcaaaag acgagtaaga atttcaagtc aaagccttaa acgtgcgatg 5700 cgtaaaagtg gttattacgc acaaaatatt ggtgaatcca gtctcagaac cattcatctt 5760 gcacaattac gtgatgttct tcggcaaaaa cttggtgaac gttttgacca aaaaatcatc 5820 gataagacat tagcgctgct ctccggtaaa tcagttgatg aagccgaaaa gatttctgcc 5880 gatgcggtta ctccctgggt tgtgggagaa atagcctggt tctgtgagca ggttgcaaaa 5940 gcagaggctg ataatctgga tgataaaaag ctgctcaaag ttcttaagga agatattgcc 6000 gccatacgtg tgaatttaca gcagggtgtt gatattgcgc ttagtggaag aatggcaacc 6060 agcggcatga tgactgagtt gggaaaagtt gatggtgcaa tgtccattgc gcatgcgatc 6120 actactcatc aggttgattc tgatattgac tggttcaccg ctgtagatga tttacaggaa 6180 caaggttctg cacatctggg aactcaggaa ttttcatcgg gtgtttttta tcgttatgcc 6240 aacattaacc tcgctcaact tcaggaaaat ttaggtggtg cctccaggga gcaggctctg 6300 gaaattgcaa cccatgttgt tcatatgctg gcaacagagg tccctggagc aaaacagcgt 6360 acttatgccg cttttaaccc tgcggatatg gtaatggtta atttctccga tatgccactt 6420 tctatggcaa atgcttttga aaaagcggtt aaagcgaaag atggcttttt gcaaccgtct 6480 atacaggcgt ttaatcaata ttgggatcgc gttgccaatg gatatggtct gaacggagct 6540 gctgcgcaat tcagcttatc tgatgtagac ccaattactg ctcaagttaa acaaatgcct 6600 actttagaac agttaaaatc ctgggttcgt aataatggcg aggcgtgata ataagatccc 6660 aactccataa gtggctgctg ccaccgctga gcatagcata accccttggg gcctctaaac 6720 gggtcttgag gggttttttg ctgaaaggag gaactatatc aagtcccgaa gtagctgtca 6780 gactgctggc gaccgccgca actagtggcg tcatgcgtgc cgtatggtct ttcgcctgta 6840 gacgccctac aagccgtact aaagtggaaa gacccgcaaa aggtatcgcg attaaggcat 6900 caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 6960 gtgagtcctt ccagtctggg cgaaagcgcg gtcgatcaaa ttaagcagaa ggccatcctg 7020 acggatggcc tttttgcgtt tctatcgatc ccgcgaaatt aatacgactc actataggcc 7080 cctctagaaa taattttgtt taactttaag ctttaagaag gagatataga tcatgtatct 7140 cagtaaagtc atcattgcca gggcctggag cagggatctt taccaacttc accagggatt 7200 atggcattta tttccaaaca gaccggatgc tgctcgtgat tttctttttc atgttgagaa 7260 gcgaaacaca ccagaaggct gtcatgtttt attgcagtca gcgcaaatgc ctgtttcaac 7320 tgccgttgcg acagtcatta aaactaaaca ggttgaattt caacttcagg ttggtgttcc 7380 actctatttt cggcttcggg caaatccgat caaaactatt ctcgacaatc aaaagcgcct 7440 ggacagtaaa gggaatatta aacgctgtcg ggttccgtta ataaaagaag cagaacaaat 7500 cgcgtggttg caacgtaaat tgggcaatgc ggcgcgcgtt gaagatgtgc atcccatatc 7560 ggaacggcca cagtattttt ctggtgatgg taaaagtgga aagatccaaa cggtttgctt 7620 tgaaggtgtg ctcaccatca acgacgcgcc agcgttaata gatcttgtac agcaaggtat 7680 tgggccagct aaatcgatgg gatgtggctt gctatctttg gctccactgt gataataaga 7740 tcccaactcc ataagtggct gctgccaccg ctgagcatag cataacccct tggggcctct 7800 aaacgggtct tgaggggttt tttgctgaaa ggaggaacta tatcaagtcc cgaagtagct 7860 gtcagactgc tggcgaccgc cgcaactagt ggcgtcatgc gtgccgtatg gtctttcgcc 7920 tgtagacgcc ctacaagccg tactaaagtg gaaagacccg caaaaggtat cgcgattaag 7980 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 8040 gtcggtgagt ccttccagtc tgggcgaaag cgcggtcgat caaattaagc agaaggccat 8100 cctgacggat ggcctttttg cgtttctatc gatcccgcga aattaatacg actcactata 8160 ggcccctcta gaaataattt tgtttaactt taagctttaa gaaggagata tagatcatga 8220 atttgcttat tgataactgg atccctgtac gcccgcgaaa cggggggaaa gtccaaatca 8280 taaatctgca atcgctatac tgcagtagag atcagtggcg attaagtttg ccccgtgacg 8340 atatggaact ggccgcttta gcactgctgg tttgcattgg gcaaattatc gccccggcaa 8400 aagatgacgt tgaatttcga catcgcataa tgaatccgct cactgaagat gagtttcaac 8460 aactcatcgc gccgtggata gatatgttct accttaatca cgcagaacat ccctttatgc 8520 agaccaaagg tgtcaaagca aatgatgtga ctccaatgga aaaactgttg gctggggtaa 8580 gcggcgcgac gaattgtgca tttgtcaatc aaccggggca gggtgaagca ttatgtggtg 8640 gatgcactgc gattgcgtta ttcaaccagg cgaatcaggc accaggtttt ggtggtggtt 8700 ttaaaagcgg tttacgtgga ggaacacctg taacaacgtt cgtacgtggg atcgatcttc 8760 gttcaacggt gttactcaat gtcctcacat tacctcgtct tcaaaaacaa tttcctaatg 8820 aatcacatac ggaaaaccaa cctacctgga ttaaacctat caagtccaat gagtctatac 8880 ctgcttcgtc aattgggttt gtccgtggtc tattctggca accagcgcat attgaattat 8940 gcgatcccat tgggattggt aaatgttctt gctgtggaca ggaaagcaat ttgcgttata 9000 ccggttttct taaggaaaaa tttaccttta cagttaatgg gctatggccc catccgcatt 9060 ccccttgtct ggtaacagtc aagaaagggg aggttgagga aaaatttctt gctttcacca 9120 cctccgcacc atcatggaca caaatcagcc gagttgtggt agataagatt attcaaaatg 9180 aaaatggaaa tcgcgtggcg gcggttgtga atcaattcag aaatattgcg ccgcaaagtc 9240 ctcttgaatt gattatgggg ggatatcgta ataatcaagc atctattctt gaacggcgtc 9300 atgatgtgtt gatgtttaat caggggtggc aacaatacgg caatgtgata aacgaaatag 9360 tgactgttgg tttgggatat aaaacagcct tacgcaaggc gttatatacc tttgcagaag 9420 ggtttaaaaa taaagacttc aaaggggccg gagtctctgt tcatgagact gcagaaaggc 9480 atttctatcg acagagtgaa ttattaattc ccgatgtact ggcgaatgtt aatttttccc 9540 aggctgatga ggtaatagct gatttacgag acaaacttca tcaattgtgt gaaatgctat 9600 ttaatcaatc tgtagctccc tatgcacatc atcctaaatt aataagcaca ttagcgcttg 9660 cccgcgccac gctatacaaa catttacggg agttaaaacc gcaaggaggg ccatcaaatg 9720 gctgataata agatcccaac tccataagtg gctgctgcca ccgctgagca tagcataacc 9780 ccttggggcc tctaaacggg tcttgagggg ttttttgctg aaaggaggaa ctatatcaag 9840 tcccgaagta gctgtcagac tgctggcgac cgccgcaact agtggcgtca tgcgtgccgt 9900 atggtctttc gcctgtagac gccctacaag ccgtactaaa gtggaaagac ccgcaaaagg 9960 tatcgcgatt aaggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 10020 ttatctgttg tttgtcggtg agtccttcca gtctgggcga aagcgcggtc gatcaaatta 10080 agcagaaggc catcctgacg gatggccttt ttgcgtttct atcgatcccg cgaaattaat 10140 acgactcact ataggcccct ctagagctag cgagttcccc gcgccagcgg ggataaaccg 10200 ccagtgataa gtggaatgcc atgtgggctg tcgagttccc cgcgccagcg gggataaacc 10260 ggagctcgct gagcatagca taaccccttg gggcctctaa acgggtcttg aggggttttt 10320 tgctgaaagg aggaactata tcaagtcccg aagtagctgt cagactgctg gcgaccgccg 10380 caactagtgg cgtcatgcgt gccgtatggt ctttcgcctg tagacgccct acaagccgta 10440 ctaaagtgga aagacccgca aaaggtatcg cgatcgccct gcagggaact atatccgact 10500 agtagcccgc ctaatgagcg ggcttttttt taattcccct atttgtttat ttttctaaat 10560 acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc gaaaaaggaa 10620 gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 10680 tcctgttttt gctcacccag aaacgctcgt gaaagtaaaa gacgcagagg accaattggg 10740 ggcacgagtg ggatacatag aactggactt gaatagcggt aaaatccttg agagttttcg 10800 ccctgaagag cgttttccaa tgatgagcac tttcaaagtt ctgctatgtg gagcagtatt 10860 atcccgtgta gatgcggggc aagagcaact cggacgacga atacactatt cgcagaatga 10920 cttggttgaa tactccccag tgacagaaaa gcaccttacg gacggaatga cggtaagaga 10980 attatgtagt gccgccataa cgatgagtga taacactgcg gcgaacttac ttctgacaac 11040 catcggtgga ccgaaggaat taaccgcttt tttgcacaat atgggagacc atgtaactcg 11100 ccttgaccgt tgggaaccag aactgaatga agccatacca aacgacgagc gagacaccac 11160 aatgcctgcg gcaatggcaa caacattacg caaactatta actggcgaac tacttactct 11220 ggcttcacgg caacaattaa tagactggct tgaagcggat aaagttgcag gaccactact 11280 gcgttcggca cttcctgctg gctggtttat tgctgataaa tctggggcag gagagcgtgg 11340 ttcacggggt atcattgccg cacttggacc agatggtaag ccttcccgta tcgtagttat 11400 ctacacgacg ggtagtcagg caactatgga cgaacgaaat agacagattg ctgaaatagg 11460 ggcttcactg attaagcatt ggtaaaccga tacaattaaa ggctcctttt ggagcctttt 11520 tttttggacg gaccggtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 11580 gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 11640 caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 11700 actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 11760 acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 11820 cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 11880 gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 11940 cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 12000 gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 12060 tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 12120 tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 12180 gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat 12240 aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc 12300 agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct ccttacgcat 12360 ctgtgcggta tttcacaccg caatggtgca ctctcagtac aatctgctct gatgccgcat 12420 agttaagcca gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca 12480 cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag 12540 acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa 12600 acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg tgaagcgatt cacagatgtc 12660 tgcctgttca tccgcgtcca gctcgttgag tttctccaga agcgttaatg tctggcttct 12720 gataaagcgg gccatgttaa gggcggtttt ttcctgtttg gtcactgatg cctccgtgta 12780 agggggattt ctgttcatgg ggtaatgata ccgatgaaac gagagaggat gctcacgata 12840 cgggttactg atgatgaaca tgcccggtta ctggaacgtt gtgagggtaa acaactggcg 12900 gtatggatgc ggcgggacca gagaaaaatc actcagggtc aatgccagcg cttcgttaat 12960 acagatgtag gtgtt 12975 <210> 364 <211> 12975 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polypromoter, Cas5_Cas3_Cse2_Cas7_CRISPR(J3)_Cas6_Cas8 <400> 364 ggcaccatgc atcgatcccg cgaaatgcgg ccgcttaatt aaggcatcaa ataaaacgaa 60 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg agtccttcca 120 gtctgggcga aagcgcggtc gatcaaatta agcagaaggc catcctgacg gatggccttt 180 ttgcgtttct atcgatcccg cgaaattaat acgactcact ataggcccct ctagaaataa 240 ttttgtttaa ctttaagctt taagaaggag atatagatca tgagatctta tttgatcttg 300 cggcttgctg ggccaatgca agcctggggg cagccgacct ttgaaggaac gcgacctacc 360 ggaagatttc cgacccgaag cgggttatta gggctactcg gggcttgtct tgggatccaa 420 cgtgatgata cttcttcatt acaggcgtta tcagagagtg tgcaatttgc agtgcgctgc 480 gatgaactca ttcttgacga tcgtcgtgtg tctgtaacgg ggttgcgtga ttaccataca 540 gtccttggag cgcgagaaga ttaccgtggt ttgaaaagtc atgaaacgat tcaaacatgg 600 cgcgaatatt tatgtgatgc ctcctttacc gtcgctctct ggttaacacc ccatgcaacg 660 atggttatct cagaacttga aaaagcagta ttaaagcctc ggtatacacc ttacctgggg 720 cggagaagtt gcccactaac acacccgctt tttttgggga catgtcaggc atcggatcct 780 cagaaggcgc tattaaatta tgagcccgtt ggcggcgata tatatagtga ggaatcagtt 840 acagggcatc atttaaaatt tacggcgcgc gacgaaccga tgatcacctt gcctcgacaa 900 tttgcttccc gagaatggta tgtgattaaa ggaggtatgg atgtatctca gtaataataa 960 gatcccaact ccataagtgg ctgctgccac cgctgagcat agcataaccc cttggggcct 1020 ctaaacgggt cttgaggggt tttttgctga aaggaggaac tatatcaagt cccgaagtag 1080 ctgtcagact gctggcgacc gccgcaacta gtggcgtcat gcgtgccgta tggtctttcg 1140 cctgtagacg ccctacaagc cgtactaaag tggaaagacc cgcaaaaggt atcgcgatta 1200 aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt 1260 ttgtcggtga gtccttccag tctgggcgaa agcgcggtcg atcaaattaa gcagaaggcc 1320 atcctgacgg atggcctttt tgcgtttcta tcgatcccgc gaaattaata cgactcacta 1380 taggcccctc tagaaataat tttgtttaac tttaagcttt aagaaggaga tatagatcat 1440 ggaacctttt aaatatatat gccattactg gggaaaatcc tcaaaaagct tgacgaaagg 1500 aaatgatatt catctgttaa tttatcattg ccttgatgtt gctgctgttg cagattgctg 1560 gtgggatcaa tcagtcgtac tgcaaaatac tttttgccga aatgaaatgc tatcaaaaca 1620 gagggtgaag gcctggctgt tatttttcat tgctcttcat gatattggaa agtttgatat 1680 acgattccaa tataaatcag cagaaagttg gctgaaatta aatcctgcaa cgccatcact 1740 taatggtcca tcaacacaaa tgtgccgtaa atttaatcat ggtgcagccg gtctgtattg 1800 gtttaaccag gattcacttt cagagcaatc tctcggggat tttttcagtt tttttgatgc 1860 cgctcctcat ccttatgagt cctggtttcc atgggtagag gccgttacag gacatcatgg 1920 ttttatatta cattcccagg atcaagataa gtcgcgttgg gaaatgccag cttctctggc 1980 atcttatgct gcgcaagata aacaggctcg tgaggagtgg atatctgtac tggaagcatt 2040 atttttaacg ccagcggggt tatctataaa cgatatacca cctgattgtt catcactgtt 2100 agcaggtttt tgctcgcttg ctgactggtt aggctcctgg actacaacga atacctttct 2160 gtttaatgag gatgcgcctt ccgacataaa tgctctgaga acgtatttcc aggaccgaca 2220 gcaggatgcg agccgggtat tggagttgag tggacttgta tcaaataagc gatgttatga 2280 aggtgttcat gcactactgg acaatggcta tcaacccaga caattacagg tgttagttga 2340 tgctcttcca gtagctcccg ggctgacggt aatagaggca cctacaggct ccggtaaaac 2400 ggaaacagcg ctggcctatg cttggaaact tattgatcaa caaattgcgg atagtgttat 2460 ttttgccctc ccaacacaag ctaccgcgaa tgctatgctt acgagaatgg aagcgagcgc 2520 gagccactta ttttcatccc caaatcttat tcttgctcat ggcaattcac ggtttaacca 2580 cctctttcaa tcaataaaat cacgcgcgat tactgaacag gggcaagaag aagcgtgggt 2640 tcagtgttgt cagtggttgt cacaaagcaa taagaaagtg tttcttgggc aaatcggcgt 2700 ttgcacgatt gatcaggtgt tgatatcggt attgccagtt aaacaccgct ttatccgtgg 2760 tttgggaatt ggtcgaagtg ttttaattgt tgatgaagtt catgcttacg acacctatat 2820 gaacggcttg ctggaggcag tgctcaaggc tcaggctgat gtgggaggga gtgttattct 2880 tctttccgca accctaccaa tgaaacaaaa acagaaactt ctggatactt atggtctgca 2940 tacagatcca gtggaaaata actccgcata tccactcatt aactggcgag gtgtgaatgg 3000 tgcgcaacgt tttgatctgc tagctcatcc agaacaactc ccgccccgct tttcgattca 3060 gccagaacct atttgtttag ctgacatgtt acctgacctt acgatgttag agcgaatgat 3120 cgcagcggca aacgcgggtg cacaggtctg tcttatttgc aatttggttg acgttgcaca 3180 agtatgctac caacggctaa aggagctaaa taacacgcaa gtagatatag atttgtttca 3240 tgcgcgcttt acgctgaacg atcgtcgtga aaaagagaat cgagttatta gcaatttcgg 3300 caaaaatggg aagcgaaatg ttggacggat acttgtcgca acccaggtcg tggaacaatc 3360 actcgacgtt gattttgatt ggttaattac tcagcattgt cctgcagatt tgcttttcca 3420 acgattgggc cgtttacatc gccatcatcg caaatatcgt cccgctggtt ttgagattcc 3480 tgttgccacc attttgctgc ctgatggcga gggttacgga cgacatgagc atatttatag 3540 caacgttaga gtcatgtggc ggacgcagca acatattgag gagcttaatg gagcatcctt 3600 atttttccct gatgcttacc ggcaatggct ggatagcatt tacgatgatg cggaaatgga 3660 tgagccagaa tgggtcggca atggcatgga taaatttgaa agcgccgagt gtgaaaaaag 3720 gttcaaggct cgcaaggtcc tgcagtgggc tgaagaatat agcttgcagg ataacgatga 3780 aaccattctt gcggtaacga gggatgggga aatgagcctg ccattattgc cttatgtaca 3840 aacgtcttca ggtaaacaac tgctcgatgg ccaggtctac gaggacctaa gtcatgaaca 3900 gcagtatgag gcgcttgcac ttaatcgcgt caatgtaccc ttcacctgga aacgtagttt 3960 ttctgaagta gtagatgaag atgggttact ttggctggaa gggaaacaga atctggatgg 4020 atgggtctgg cagggtaaca gtattgttat tacctataca ggggatgaag ggatgaccag 4080 agtcatccct gcaaatccca aataataata agatcccaac tccataagtg gctgctgcca 4140 ccgctgagca tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg 4200 aaaggaggaa ctatatcaag tcccgaagta gctgtcagac tgctggcgac cgccgcaact 4260 agtggcgtca tgcgtgccgt atggtctttc gcctgtagac gccctacaag ccgtactaaa 4320 gtggaaagac ccgcaaaagg tatcgcgatt aaggcatcaa ataaaacgaa aggctcagtc 4380 gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg agtccttcca gtctgggcga 4440 aagcgcggtc gatcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct 4500 atcgatcccg cgaaattaat acgactcact ataggcccct ctagaaataa ttttgtttaa 4560 ctttaagctt taagaaggag atatagatca tggctgatga aattgatgca atggctttat 4620 atcgagcctg gcaacaactg gataatggat catgtgcgca aattagacgt gtttcagaac 4680 ctgatgaatt acgcgatatc cctgcgtttt ataggctggt gcaacctttt ggttgggaaa 4740 acccacgtca ccagcaggct cttttgcgca tggtgttttg cctgagcgca ggaaagaatg 4800 tcatccgaca tcaggacaaa aaatcggagc aaacaacagg tatctcgttg ggaagagctt 4860 tagccaatag tggaagaatt aacgagcgcc gtatctttca attaattcgg gctgacagaa 4920 cagccgatat ggtccagtta cgtcgattac ttactcacgc cgaacccgta cttgactggc 4980 cattaatggc caggatgttg acctggtggg gaaagcgcga acgccagcaa cttctggaag 5040 attttgtatt gaccacaaac aaaaatgcgt aataataaga tcccaactcc ataagtggct 5100 gctgccaccg ctgagcatag cataacccct tggggcctct aaacgggtct tgaggggttt 5160 tttgctgaaa ggaggaacta tatcaagtcc cgaagtagct gtcagactgc tggcgaccgc 5220 cgcaactagt ggcgtcatgc gtgccgtatg gtctttcgcc tgtagacgcc ctacaagccg 5280 tactaaagtg gaaagacccg caaaaggtat cgcgattaag gcatcaaata aaacgaaagg 5340 ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgagt ccttccagtc 5400 tgggcgaaag cgcggtcgat caaattaagc agaaggccat cctgacggat ggcctttttg 5460 cgtttctatc gatcccgcga aattaatacg actcactata ggcccctcta gaaataattt 5520 tgtttaactt taagctttaa gaaggagata tagatcatgt ctaactttat caatattcat 5580 gttctgatct ctcacagccc ttcatgtctg aaccgcgacg atatgaacat gcagaaagac 5640 gctattttcg gcggcaaaag acgagtaaga atttcaagtc aaagccttaa acgtgcgatg 5700 cgtaaaagtg gttattacgc acaaaatatt ggtgaatcca gtctcagaac cattcatctt 5760 gcacaattac gtgatgttct tcggcaaaaa cttggtgaac gttttgacca aaaaatcatc 5820 gataagacat tagcgctgct ctccggtaaa tcagttgatg aagccgaaaa gatttctgcc 5880 gatgcggtta ctccctgggt tgtgggagaa atagcctggt tctgtgagca ggttgcaaaa 5940 gcagaggctg ataatctgga tgataaaaag ctgctcaaag ttcttaagga agatattgcc 6000 gccatacgtg tgaatttaca gcagggtgtt gatattgcgc ttagtggaag aatggcaacc 6060 agcggcatga tgactgagtt gggaaaagtt gatggtgcaa tgtccattgc gcatgcgatc 6120 actactcatc aggttgattc tgatattgac tggttcaccg ctgtagatga tttacaggaa 6180 caaggttctg cacatctggg aactcaggaa ttttcatcgg gtgtttttta tcgttatgcc 6240 aacattaacc tcgctcaact tcaggaaaat ttaggtggtg cctccaggga gcaggctctg 6300 gaaattgcaa cccatgttgt tcatatgctg gcaacagagg tccctggagc aaaacagcgt 6360 acttatgccg cttttaaccc tgcggatatg gtaatggtta atttctccga tatgccactt 6420 tctatggcaa atgcttttga aaaagcggtt aaagcgaaag atggcttttt gcaaccgtct 6480 atacaggcgt ttaatcaata ttgggatcgc gttgccaatg gatatggtct gaacggagct 6540 gctgcgcaat tcagcttatc tgatgtagac ccaattactg ctcaagttaa acaaatgcct 6600 actttagaac agttaaaatc ctgggttcgt aataatggcg aggcgtgata ataagatccc 6660 aactccataa gtggctgctg ccaccgctga gcatagcata accccttggg gcctctaaac 6720 gggtcttgag gggttttttg ctgaaaggag gaactatatc aagtcccgaa gtagctgtca 6780 gactgctggc gaccgccgca actagtggcg tcatgcgtgc cgtatggtct ttcgcctgta 6840 gacgccctac aagccgtact aaagtggaaa gacccgcaaa aggtatcgcg attaaggcat 6900 caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 6960 gtgagtcctt ccagtctggg cgaaagcgcg gtcgatcaaa ttaagcagaa ggccatcctg 7020 acggatggcc tttttgcgtt tctatcgatc ccgcgaaatt aatacgactc actataggcc 7080 cctctagagc tagcgagttc cccgcgccag cggggataaa ccgccagtga taagtggaat 7140 gccatgtggg ctgtcgagtt ccccgcgcca gcggggataa accggagctc gctgagcata 7200 gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgctgaa aggaggaact 7260 atatcaagtc ccgaagtagc tgtcagactg ctggcgaccg ccgcaactag tggcgtcatg 7320 cgtgccgtat ggtctttcgc ctgtagacgc cctacaagcc gtactaaagt ggaaagaccc 7380 gcaaaaggta tcgcgattaa ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 7440 ctttcgtttt atctgttgtt tgtcggtgag tccttccagt ctgggcgaaa gcgcggtcga 7500 tcaaattaag cagaaggcca tcctgacgga tggccttttt gcgtttctat cgatcccgcg 7560 aaattaatac gactcactat aggcccctct agaaataatt ttgtttaact ttaagcttta 7620 agaaggagat atagatcatg tatctcagta aagtcatcat tgccagggcc tggagcaggg 7680 atctttacca acttcaccag ggattatggc atttatttcc aaacagaccg gatgctgctc 7740 gtgattttct ttttcatgtt gagaagcgaa acacaccaga aggctgtcat gttttattgc 7800 agtcagcgca aatgcctgtt tcaactgccg ttgcgacagt cattaaaact aaacaggttg 7860 aatttcaact tcaggttggt gttccactct attttcggct tcgggcaaat ccgatcaaaa 7920 ctattctcga caatcaaaag cgcctggaca gtaaagggaa tattaaacgc tgtcgggttc 7980 cgttaataaa agaagcagaa caaatcgcgt ggttgcaacg taaattgggc aatgcggcgc 8040 gcgttgaaga tgtgcatccc atatcggaac ggccacagta tttttctggt gatggtaaaa 8100 gtggaaagat ccaaacggtt tgctttgaag gtgtgctcac catcaacgac gcgccagcgt 8160 taatagatct tgtacagcaa ggtattgggc cagctaaatc gatgggatgt ggcttgctat 8220 ctttggctcc actgtgataa taagatccca actccataag tggctgctgc caccgctgag 8280 catagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc tgaaaggagg 8340 aactatatca agtcccgaag tagctgtcag actgctggcg accgccgcaa ctagtggcgt 8400 catgcgtgcc gtatggtctt tcgcctgtag acgccctaca agccgtacta aagtggaaag 8460 acccgcaaaa ggtatcgcga ttaaggcatc aaataaaacg aaaggctcag tcgaaagact 8520 gggcctttcg ttttatctgt tgtttgtcgg tgagtccttc cagtctgggc gaaagcgcgg 8580 tcgatcaaat taagcagaag gccatcctga cggatggcct ttttgcgttt ctatcgatcc 8640 cgcgaaatta atacgactca ctataggccc ctctagaaat aattttgttt aactttaagc 8700 tttaagaagg agatatagat catgaatttg cttattgata actggatccc tgtacgcccg 8760 cgaaacgggg ggaaagtcca aatcataaat ctgcaatcgc tatactgcag tagagatcag 8820 tggcgattaa gtttgccccg tgacgatatg gaactggccg ctttagcact gctggtttgc 8880 attgggcaaa ttatcgcccc ggcaaaagat gacgttgaat ttcgacatcg cataatgaat 8940 ccgctcactg aagatgagtt tcaacaactc atcgcgccgt ggatagatat gttctacctt 9000 aatcacgcag aacatccctt tatgcagacc aaaggtgtca aagcaaatga tgtgactcca 9060 atggaaaaac tgttggctgg ggtaagcggc gcgacgaatt gtgcatttgt caatcaaccg 9120 gggcagggtg aagcattatg tggtggatgc actgcgattg cgttattcaa ccaggcgaat 9180 caggcaccag gttttggtgg tggttttaaa agcggtttac gtggaggaac acctgtaaca 9240 acgttcgtac gtgggatcga tcttcgttca acggtgttac tcaatgtcct cacattacct 9300 cgtcttcaaa aacaatttcc taatgaatca catacggaaa accaacctac ctggattaaa 9360 cctatcaagt ccaatgagtc tatacctgct tcgtcaattg ggtttgtccg tggtctattc 9420 tggcaaccag cgcatattga attatgcgat cccattggga ttggtaaatg ttcttgctgt 9480 ggacaggaaa gcaatttgcg ttataccggt tttcttaagg aaaaatttac ctttacagtt 9540 aatgggctat ggccccatcc gcattcccct tgtctggtaa cagtcaagaa aggggaggtt 9600 gaggaaaaat ttcttgcttt caccacctcc gcaccatcat ggacacaaat cagccgagtt 9660 gtggtagata agattattca aaatgaaaat ggaaatcgcg tggcggcggt tgtgaatcaa 9720 ttcagaaata ttgcgccgca aagtcctctt gaattgatta tggggggata tcgtaataat 9780 caagcatcta ttcttgaacg gcgtcatgat gtgttgatgt ttaatcaggg gtggcaacaa 9840 tacggcaatg tgataaacga aatagtgact gttggtttgg gatataaaac agccttacgc 9900 aaggcgttat atacctttgc agaagggttt aaaaataaag acttcaaagg ggccggagtc 9960 tctgttcatg agactgcaga aaggcatttc tatcgacaga gtgaattatt aattcccgat 10020 gtactggcga atgttaattt ttcccaggct gatgaggtaa tagctgattt acgagacaaa 10080 cttcatcaat tgtgtgaaat gctatttaat caatctgtag ctccctatgc acatcatcct 10140 aaattaataa gcacattagc gcttgcccgc gccacgctat acaaacattt acgggagtta 10200 aaaccgcaag gagggccatc aaatggctga taataagatc ccaactccat aagtggctgc 10260 tgccaccgct gagcatagca taaccccttg gggcctctaa acgggtcttg aggggttttt 10320 tgctgaaagg aggaactata tcaagtcccg aagtagctgt cagactgctg gcgaccgccg 10380 caactagtgg cgtcatgcgt gccgtatggt ctttcgcctg tagacgccct acaagccgta 10440 ctaaagtgga aagacccgca aaaggtatcg cgatcgccct gcagggaact atatccgact 10500 agtagcccgc ctaatgagcg ggcttttttt taattcccct atttgtttat ttttctaaat 10560 acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc gaaaaaggaa 10620 gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 10680 tcctgttttt gctcacccag aaacgctcgt gaaagtaaaa gacgcagagg accaattggg 10740 ggcacgagtg ggatacatag aactggactt gaatagcggt aaaatccttg agagttttcg 10800 ccctgaagag cgttttccaa tgatgagcac tttcaaagtt ctgctatgtg gagcagtatt 10860 atcccgtgta gatgcggggc aagagcaact cggacgacga atacactatt cgcagaatga 10920 cttggttgaa tactccccag tgacagaaaa gcaccttacg gacggaatga cggtaagaga 10980 attatgtagt gccgccataa cgatgagtga taacactgcg gcgaacttac ttctgacaac 11040 catcggtgga ccgaaggaat taaccgcttt tttgcacaat atgggagacc atgtaactcg 11100 ccttgaccgt tgggaaccag aactgaatga agccatacca aacgacgagc gagacaccac 11160 aatgcctgcg gcaatggcaa caacattacg caaactatta actggcgaac tacttactct 11220 ggcttcacgg caacaattaa tagactggct tgaagcggat aaagttgcag gaccactact 11280 gcgttcggca cttcctgctg gctggtttat tgctgataaa tctggggcag gagagcgtgg 11340 ttcacggggt atcattgccg cacttggacc agatggtaag ccttcccgta tcgtagttat 11400 ctacacgacg ggtagtcagg caactatgga cgaacgaaat agacagattg ctgaaatagg 11460 ggcttcactg attaagcatt ggtaaaccga tacaattaaa ggctcctttt ggagcctttt 11520 tttttggacg gaccggtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 11580 gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 11640 caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 11700 actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 11760 acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 11820 cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 11880 gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 11940 cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 12000 gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 12060 tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 12120 tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 12180 gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat 12240 aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc 12300 agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct ccttacgcat 12360 ctgtgcggta tttcacaccg caatggtgca ctctcagtac aatctgctct gatgccgcat 12420 agttaagcca gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca 12480 cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag 12540 acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa 12600 acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg tgaagcgatt cacagatgtc 12660 tgcctgttca tccgcgtcca gctcgttgag tttctccaga agcgttaatg tctggcttct 12720 gataaagcgg gccatgttaa gggcggtttt ttcctgtttg gtcactgatg cctccgtgta 12780 agggggattt ctgttcatgg ggtaatgata ccgatgaaac gagagaggat gctcacgata 12840 cgggttactg atgatgaaca tgcccggtta ctggaacgtt gtgagggtaa acaactggcg 12900 gtatggatgc ggcgggacca gagaaaaatc actcagggtc aatgccagcg cttcgttaat 12960 acagatgtag gtgtt 12975 <210> 365 <211> 9499 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polypromoter(EcoCO), CRISPR(J3/L3)_Cse2_Cas7_Cas5_Cas8_Cas6 <400> 365 ggcaccatgc atcgatcccg cgaaatgcgg ccgcttaatt aaggcatcaa ataaaacgaa 60 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg agtccttcca 120 gtctgggcga aagcgcggtc gatcaaatta agcagaaggc catcctgacg gatggccttt 180 ttgcgtttct atcgatcccg cgaaattaat acgactcact ataggcccct ctagagctag 240 cgagttcccc gcgccagcgg ggataaaccg ccagtgataa gtggaatgcc atgtgggctg 300 tcgagttccc cgcgccagcg gggataaacc gagtggcaga tatagcctgg tggttcaggc 360 ggcgagttcc ccgcgccagc ggggataaac cggagctcgc tgagcatagc ataacccctt 420 ggggcctcta aacgggtctt gaggggtttt ttgctgaaag gaggaactat atcaagtccc 480 gaagtagctg tcagactgct ggcgaccgcc gcaactagtg gcgtcatgcg tgccgtatgg 540 tctttcgcct gtagacgccc tacaagccgt actaaagtgg aaagacccgc aaaaggtatc 600 gcgattaagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 660 ctgttgtttg tcggtgagtc cttccagtct gggcgaaagc gcggtcgatc aaattaagca 720 gaaggccatc ctgacggatg gcctttttgc gtttctatcg atcccgcgaa attaatacga 780 ctcactatag gcccctctag aaataatttt gtttaacttt aagctttaag aaggagatat 840 agatcatggc agatgaaatt gatgcaatgg cactgtatcg tgcatggcag cagctggata 900 atggtagctg tgcacagatt cgtcgtgtta gcgaaccgga tgaactgcgt gatattccgg 960 cattttatcg tctggttcag ccgtttggtt gggaaaatcc gcgtcatcag caggcactgc 1020 tgcgtatggt tttttgtctg agcgcaggta aaaatgttat tcgtcatcag gataaaaaaa 1080 gcgaacagac caccggtatt agcctgggtc gtgcactggc aaatagcggt cgtattaatg 1140 aacgtcgtat ttttcagctg attcgtgcag atcgtaccgc agatatggtt cagctgcgtc 1200 gtctgctgac ccatgcagaa ccggttctgg attggccgct gatggcacgt atgctgacct 1260 ggtggggtaa acgtgaacgt cagcagctgc tggaagattt tgttctgacc accaataaaa 1320 atgcctaata agcagaatgt tatcaatgcc atgcaggaat tctagcataa ccccttgggg 1380 cctctaaacg ggtcttgagg ggttttttgg ttttagccag ctggttgaag aactgctgaa 1440 aattatttgt gcatttcagc tggataccgg tctggaatat gcaaatagct acaattttgc 1500 caaaaaagat aatacgactc actataggcc cctgtagaaa taattttgtt taactttaat 1560 aaggagatat accatgagca actttattaa tattcatgtg ctgattagcc atagcccgag 1620 ctgcctgaat cgtgatgata tgaatatgca gaaagatgcc atttttggcg gtaaacgtcg 1680 tgttcgtatt agcagccaga gcctgaaacg tgcaatgcgt aaaagcggtt attatgcaca 1740 gaatattggt gaaagcagcc tgcgtaccat tcatctggca cagctgcgtg atgttctgcg 1800 tcagaaactg ggtgaacgtt ttgatcagaa aattattgat aaaaccctgg cactgctgag 1860 tggcaaaagc gttgatgaag cagaaaaaat tagcgcagat gcagttaccc cgtgggttgt 1920 tggtgaaatt gcctggtttt gcgaacaggt tgccaaagcc gaagcagata atctggatga 1980 taaaaaactg ctgaaagttc tgaaagaaga tattgccgcc attcgtgtta atctgcagca 2040 gggtgttgat attgcactga gcggtcgtat ggcaaccagc ggtatgatga ccgaactggg 2100 taaagttgat ggtgcaatga gcattgcaca tgcaattacc acccatcagg ttgatagcga 2160 tattgattgg tttaccgcag ttgatgatct gcaggaacag ggtagcgcac atctgggtac 2220 acaggaattt agcagcggtg tgttttatcg ttatgcaaat attaatctgg cccagctgca 2280 ggaaaatctg ggtggtgcaa gccgtgaaca ggcactggaa attgcaaccc atgttgttca 2340 tatgctggca accgaagttc cgggtgcaaa acagcgtacc tatgcagcct ttaatccggc 2400 agatatggtt atggttaatt ttagcgatat gccgctgtca atggcaaatg cctttgaaaa 2460 agcagtgaaa gccaaagatg gttttctgca gccgagcatt caggcattta atcagtattg 2520 ggatcgtgtt gcaaatggct atggtctgaa tggtgcagca gcacagttta gcctgagcga 2580 tgttgatccg attaccgcac aggttaaaca gatgccgacc ctggaacagc tgaaaagctg 2640 ggttcgtaat aatggtgaag cataataagg aatgtccgat ttgtctggaa ctgggcgcct 2700 agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgataa tagcccggaa 2760 catctgaaag atgaagtgtc tattattcag tcaatgggtt atcgcaatcg tgcaaaacgc 2820 ctgctgcaga gcgaaccgga aaatcctaat acgactcact ataggcccct caagaaataa 2880 ttttgtttaa ctttaagctt taagaaggag atatagatat gcgtagctat ctgattctgc 2940 gtctggcagg tccgatgcag gcatggggtc agccgacatt tgaaggtaca cgtccgacag 3000 gtcgttttcc gacacgtagt ggtctgctgg gtctgctggg tgcatgtctg ggtattcagc 3060 gtgatgatac cagcagtctg caggcactga gcgaaagcgt gcagtttgca gttcgttgtg 3120 atgaactgat tctggatgat cgtcgtgtta gcgtgaccgg tctgcgtgat tatcataccg 3180 ttctgggtgc acgtgaagat tatcgtggtc tgaaaagcca tgaaaccatt cagacctggc 3240 gtgaatatct gtgtgatgca agttttaccg ttgcactgtg gctgaccccg catgcaacaa 3300 tggttattag cgaactggaa aaagcagttc tgaaaccgcg ttataccccg tatctgggtc 3360 gtcgtagctg tccgctgacc catccgctgt ttctgggtac atgtcaggca agcgatccgc 3420 agaaagcact gctgaattat gaaccggttg gtggtgatat ttatagcgaa gaaagcgtta 3480 ccggtcatca tctgaaattt accgcacgtg atgaaccgat gattaccctg ccgcgtcagt 3540 ttgcaagccg tgaatggtat gttattaaag gtggtatgga tgttagccag taataagaac 3600 cggttagcac caagtgtgat cggtacccat cccaactcca taagtggctg ctgccaccgc 3660 tgagcatagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgctgaaag 3720 gaggaactat atcaagtccc gaagtagctg tcagactgct ggcgaccgcc gcaactagtg 3780 gcgtcatgcg tgccgtatgg tctttcgcct gtagacgccc tacaagccgt actaaagtgg 3840 aaagacccgc aaaaggtatc gcgattaagg catcaaataa aacgaaaggc tcagtcgaaa 3900 gactgggcct ttcgttttat ctgttgtttg tcggtgagtc cttccagtct gggcgaaagc 3960 gcggtcgatc aaattaagca gaaggccatc ctgacggatg gcctttttgc gtttctatcg 4020 atcccgcgaa attaatacga ctcactatag gcccctctag aaataatttt gtttaacttt 4080 aagctttaag aaggagatat agatcatgaa tctgctgatt gataattgga ttccggttcg 4140 tccgcgtaat ggtggtaaag ttcagattat taatctgcag agcctgtatt gtagccgtga 4200 tcagtggcgt ctgagcctgc cgcgtgatga tatggaactg gcagcactgg cactgctggt 4260 ttgtattggt cagattattg caccggcaaa agatgatgtt gaatttcgcc atcgtattat 4320 gaatccgctg accgaagatg aatttcagca gctgattgcc ccgtggattg atatgtttta 4380 tctgaatcat gcagaacatc cgtttatgca gaccaaaggt gttaaagcaa atgatgttac 4440 cccgatggaa aaactgctgg ccggtgttag cggtgcaacc aattgtgcat ttgttaatca 4500 gccgggtcag ggtgaagcac tgtgtggtgg ttgtaccgca attgcactgt ttaatcaggc 4560 gaatcaggcc ccgggttttg gtggtggttt taaaagcggt ctgcgtggtg gtacaccggt 4620 taccaccttt gttcgtggta ttgatctgcg tagcaccgtt ctgctgaatg ttctgaccct 4680 gccgcgtctg cagaaacagt ttccgaatga aagccatacc gaaaatcagc cgacctggat 4740 taaaccgatt aaaagcaatg aaagcattcc ggcaagcagc attggttttg tgcgtggtct 4800 gttttggcag ccggcacata ttgaactgtg tgatccgatt ggtattggta aatgtagctg 4860 ttgtggtcag gaaagcaatc tgcgttatac cggctttctg aaagagaaat ttacctttac 4920 cgttaatggt ctgtggccgc atccgcatag cccgtgtctg gttaccgtga aaaaaggtga 4980 agttgaagaa aaatttctgg catttaccac cagcgcaccg agctggaccc agattagccg 5040 tgttgttgtt gataaaatta ttcagaatga aaatggcaat cgtgttgcag cagttgtgaa 5100 tcagtttcgt aatattgcgc cgcagagccc gctggaacta attatgggtg gttatcgtaa 5160 taatcaggca agcattctgg aacgccgtca tgatgttctg atgtttaatc agggttggca 5220 gcagtatggt aatgtgatta atgaaattgt gaccgttggt ctgggctata aaaccgcact 5280 gcgtaaagcg ctgtatacct ttgccgaagg ctttaaaaac aaagatttta aaggtgcagg 5340 cgttagcgtt catgaaaccg ccgaacgtca tttttatcgt cagagcgaac tgctgattcc 5400 ggatgtgctg gcaaatgtta attttagcca ggcagatgaa gttattgcag atctgcgcga 5460 taaactgcat cagctgtgtg aaatgctgtt taatcagagc gttgcaccgt atgcacatca 5520 tccgaaactg attagcaccc tggccctggc acgtgcaacc ctgtataaac atctgcgtga 5580 actgaaaccg cagggtggtc cgagcaatgg ttaataagga tctgtcagca ctgcgtgttg 5640 aaggatccca tcccaactcc ataagtggct gctgccaccg ctgagcatag cataacccct 5700 tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta tatcaagtcc 5760 cgaagtagct gtcagactgc tggcgaccgc cgcaactagt ggcgtcatgc gtgccgtatg 5820 gtctttcgcc tgtagacgcc ctacaagccg tactaaagtg gaaagacccg caaaaggtat 5880 cgcgattaag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 5940 tctgttgttt gtcggtgagt ccttccagtc tgggcgaaag cgcggtcgat caaattaagc 6000 agaaggccat cctgacggat ggcctttttg cgtttctatc gatcccgcga aattaatacg 6060 actcactata ggcccctcta gaaataattt tgtttaactt taagctttaa gaaggagata 6120 tagatcatgt atctgagcaa agttattatt gcacgtgcat ggagccgtga tctgtatcag 6180 ctgcatcagg gtctgtggca tctgtttccg aatcgtccgg atgcagcccg tgattttctg 6240 tttcatgttg aaaaacgtaa taccccggaa ggttgtcatg ttctgctgca gagcgcacag 6300 atgccggtta gcaccgcagt tgcaaccgtt attaaaacca aacaggtgga atttcagctg 6360 caggttggtg ttccgctgta ttttcgtctg cgtgccaatc cgattaaaac cattctggat 6420 aatcagaaac gtctggatag caaaggtaat attaaacgtt gccgcgtgcc gctgattaaa 6480 gaagccgaac agattgcatg gctgcagcgt aaactgggta atgcagcacg tgttgaagat 6540 gttcatccga ttagcgaacg tccgcagtat tttagcggtg atggtaaaag cggtaaaatt 6600 cagaccgttt gttttgaagg tgttctgacc attaatgatg caccggcact gattgatctg 6660 gttcagcagg gtattggtcc ggcaaaaagc atgggttgtg gtctgctgag tctggccccg 6720 ctgtaataag tccgagtcag tgtcctctgt gtaaccatgg gatcccaact ccataagtgg 6780 ctgctgccac cgctgagcat agcataaccc cttggggcct ctaaacgggt cttgaggggt 6840 tttttgctga aaggaggaac tatatcaagt cccgaagtag ctgtcagact gctggcgacc 6900 gccgcaacta gtggcgtcat gcgtgccgta tggtctttcg cctgtagacg ccctacaagc 6960 cgtactaaag tggaaagacc cgcaaaaggt atcgcgatcg ccctgcaggg aactatatcc 7020 gactagtagc ccgcctaatg agcgggcttt tttttaattc ccctatttgt ttatttttct 7080 aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcgaaaaa 7140 ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 7200 gccttcctgt ttttgctcac ccagaaacgc tcgtgaaagt aaaagacgca gaggaccaat 7260 tgggggcacg agtgggatac atagaactgg acttgaatag cggtaaaatc cttgagagtt 7320 ttcgccctga agagcgtttt ccaatgatga gcactttcaa agttctgcta tgtggagcag 7380 tattatcccg tgtagatgcg gggcaagagc aactcggacg acgaatacac tattcgcaga 7440 atgacttggt tgaatactcc ccagtgacag aaaagcacct tacggacgga atgacggtaa 7500 gagaattatg tagtgccgcc ataacgatga gtgataacac tgcggcgaac ttacttctga 7560 caaccatcgg tggaccgaag gaattaaccg cttttttgca caatatggga gaccatgtaa 7620 ctcgccttga ccgttgggaa ccagaactga atgaagccat accaaacgac gagcgagaca 7680 ccacaatgcc tgcggcaatg gcaacaacat tacgcaaact attaactggc gaactactta 7740 ctctggcttc acggcaacaa ttaatagact ggcttgaagc ggataaagtt gcaggaccac 7800 tactgcgttc ggcacttcct gctggctggt ttattgctga taaatctggg gcaggagagc 7860 gtggttcacg gggtatcatt gccgcacttg gaccagatgg taagccttcc cgtatcgtag 7920 ttatctacac gacgggtagt caggcaacta tggacgaacg aaatagacag attgctgaaa 7980 taggggcttc actgattaag cattggtaaa ccgatacaat taaaggctcc ttttggagcc 8040 tttttttttg gacggaccgg tagaaaagat caaaggatct tcttgagatc ctttttttct 8100 gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc 8160 ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc 8220 aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc 8280 gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc 8340 gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg 8400 aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata 8460 cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta 8520 tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc 8580 ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg 8640 atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt 8700 cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt 8760 ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga 8820 gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac 8880 gcatctgtgc ggtatttcac accgcaatgg tgcactctca gtacaatctg ctctgatgcc 8940 gcatagttaa gccagtatac actccgctat cgctacgtga ctgggtcatg gctgcgcccc 9000 gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 9060 acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 9120 cgaaacgcgc gaggcagctg cggtaaagct catcagcgtg gtcgtgaagc gattcacaga 9180 tgtctgcctg ttcatccgcg tccagctcgt tgagtttctc cagaagcgtt aatgtctggc 9240 ttctgataaa gcgggccatg ttaagggcgg ttttttcctg tttggtcact gatgcctccg 9300 tgtaaggggg atttctgttc atggggtaat gataccgatg aaacgagaga ggatgctcac 9360 gatacgggtt actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact 9420 ggcggtatgg atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt 9480 taatacagat gtaggtgtt 9499 <210> 366 <211> 10210 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polypromoter(EcoCO), CRISPR(J3/L3)_Cse2_Cas7_Cas5_Cas8_FokI-30aa-Cas6 <400> 366 ggcaccatgc atcgatcccg cgaaatgcgg ccgcttaatt aaggcatcaa ataaaacgaa 60 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg agtccttcca 120 gtctgggcga aagcgcggtc gatcaaatta agcagaaggc catcctgacg gatggccttt 180 ttgcgtttct atcgatcccg cgaaattaat acgactcact ataggcccct ctagagctag 240 cgagttcccc gcgccagcgg ggataaaccg ccagtgataa gtggaatgcc atgtgggctg 300 tcgagttccc cgcgccagcg gggataaacc gagtggcaga tatagcctgg tggttcaggc 360 ggcgagttcc ccgcgccagc ggggataaac cggagctcgc tgagcatagc ataacccctt 420 ggggcctcta aacgggtctt gaggggtttt ttgctgaaag gaggaactat atcaagtccc 480 gaagtagctg tcagactgct ggcgaccgcc gcaactagtg gcgtcatgcg tgccgtatgg 540 tctttcgcct gtagacgccc tacaagccgt actaaagtgg aaagacccgc aaaaggtatc 600 gcgattaagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 660 ctgttgtttg tcggtgagtc cttccagtct gggcgaaagc gcggtcgatc aaattaagca 720 gaaggccatc ctgacggatg gcctttttgc gtttctatcg atcccgcgaa attaatacga 780 ctcactatag gcccctctag aaataatttt gtttaacttt aagctttaag aaggagatat 840 agatcatggc agatgaaatt gatgcaatgg cactgtatcg tgcatggcag cagctggata 900 atggtagctg tgcacagatt cgtcgtgtta gcgaaccgga tgaactgcgt gatattccgg 960 cattttatcg tctggttcag ccgtttggtt gggaaaatcc gcgtcatcag caggcactgc 1020 tgcgtatggt tttttgtctg agcgcaggta aaaatgttat tcgtcatcag gataaaaaaa 1080 gcgaacagac caccggtatt agcctgggtc gtgcactggc aaatagcggt cgtattaatg 1140 aacgtcgtat ttttcagctg attcgtgcag atcgtaccgc agatatggtt cagctgcgtc 1200 gtctgctgac ccatgcagaa ccggttctgg attggccgct gatggcacgt atgctgacct 1260 ggtggggtaa acgtgaacgt cagcagctgc tggaagattt tgttctgacc accaataaaa 1320 atgcctaata agcagaatgt tatcaatgcc atgcaggaat tctagcataa ccccttgggg 1380 cctctaaacg ggtcttgagg ggttttttgg ttttagccag ctggttgaag aactgctgaa 1440 aattatttgt gcatttcagc tggataccgg tctggaatat gcaaatagct acaattttgc 1500 caaaaaagat aatacgactc actataggcc cctgtagaaa taattttgtt taactttaat 1560 aaggagatat accatgagca actttattaa tattcatgtg ctgattagcc atagcccgag 1620 ctgcctgaat cgtgatgata tgaatatgca gaaagatgcc atttttggcg gtaaacgtcg 1680 tgttcgtatt agcagccaga gcctgaaacg tgcaatgcgt aaaagcggtt attatgcaca 1740 gaatattggt gaaagcagcc tgcgtaccat tcatctggca cagctgcgtg atgttctgcg 1800 tcagaaactg ggtgaacgtt ttgatcagaa aattattgat aaaaccctgg cactgctgag 1860 tggcaaaagc gttgatgaag cagaaaaaat tagcgcagat gcagttaccc cgtgggttgt 1920 tggtgaaatt gcctggtttt gcgaacaggt tgccaaagcc gaagcagata atctggatga 1980 taaaaaactg ctgaaagttc tgaaagaaga tattgccgcc attcgtgtta atctgcagca 2040 gggtgttgat attgcactga gcggtcgtat ggcaaccagc ggtatgatga ccgaactggg 2100 taaagttgat ggtgcaatga gcattgcaca tgcaattacc acccatcagg ttgatagcga 2160 tattgattgg tttaccgcag ttgatgatct gcaggaacag ggtagcgcac atctgggtac 2220 acaggaattt agcagcggtg tgttttatcg ttatgcaaat attaatctgg cccagctgca 2280 ggaaaatctg ggtggtgcaa gccgtgaaca ggcactggaa attgcaaccc atgttgttca 2340 tatgctggca accgaagttc cgggtgcaaa acagcgtacc tatgcagcct ttaatccggc 2400 agatatggtt atggttaatt ttagcgatat gccgctgtca atggcaaatg cctttgaaaa 2460 agcagtgaaa gccaaagatg gttttctgca gccgagcatt caggcattta atcagtattg 2520 ggatcgtgtt gcaaatggct atggtctgaa tggtgcagca gcacagttta gcctgagcga 2580 tgttgatccg attaccgcac aggttaaaca gatgccgacc ctggaacagc tgaaaagctg 2640 ggttcgtaat aatggtgaag cataataagg aatgtccgat ttgtctggaa ctgggcgcct 2700 agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgataa tagcccggaa 2760 catctgaaag atgaagtgtc tattattcag tcaatgggtt atcgcaatcg tgcaaaacgc 2820 ctgctgcaga gcgaaccgga aaatcctaat acgactcact ataggcccct caagaaataa 2880 ttttgtttaa ctttaagctt taagaaggag atatagatat gcgtagctat ctgattctgc 2940 gtctggcagg tccgatgcag gcatggggtc agccgacatt tgaaggtaca cgtccgacag 3000 gtcgttttcc gacacgtagt ggtctgctgg gtctgctggg tgcatgtctg ggtattcagc 3060 gtgatgatac cagcagtctg caggcactga gcgaaagcgt gcagtttgca gttcgttgtg 3120 atgaactgat tctggatgat cgtcgtgtta gcgtgaccgg tctgcgtgat tatcataccg 3180 ttctgggtgc acgtgaagat tatcgtggtc tgaaaagcca tgaaaccatt cagacctggc 3240 gtgaatatct gtgtgatgca agttttaccg ttgcactgtg gctgaccccg catgcaacaa 3300 tggttattag cgaactggaa aaagcagttc tgaaaccgcg ttataccccg tatctgggtc 3360 gtcgtagctg tccgctgacc catccgctgt ttctgggtac atgtcaggca agcgatccgc 3420 agaaagcact gctgaattat gaaccggttg gtggtgatat ttatagcgaa gaaagcgtta 3480 ccggtcatca tctgaaattt accgcacgtg atgaaccgat gattaccctg ccgcgtcagt 3540 ttgcaagccg tgaatggtat gttattaaag gtggtatgga tgttagccag taataagaac 3600 cggttagcac caagtgtgat cggtacccat cccaactcca taagtggctg ctgccaccgc 3660 tgagcatagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgctgaaag 3720 gaggaactat atcaagtccc gaagtagctg tcagactgct ggcgaccgcc gcaactagtg 3780 gcgtcatgcg tgccgtatgg tctttcgcct gtagacgccc tacaagccgt actaaagtgg 3840 aaagacccgc aaaaggtatc gcgattaagg catcaaataa aacgaaaggc tcagtcgaaa 3900 gactgggcct ttcgttttat ctgttgtttg tcggtgagtc cttccagtct gggcgaaagc 3960 gcggtcgatc aaattaagca gaaggccatc ctgacggatg gcctttttgc gtttctatcg 4020 atcccgcgaa attaatacga ctcactatag gcccctctag aaataatttt gtttaacttt 4080 aagctttaag aaggagatat agatcatgaa tctgctgatt gataattgga ttccggttcg 4140 tccgcgtaat ggtggtaaag ttcagattat taatctgcag agcctgtatt gtagccgtga 4200 tcagtggcgt ctgagcctgc cgcgtgatga tatggaactg gcagcactgg cactgctggt 4260 ttgtattggt cagattattg caccggcaaa agatgatgtt gaatttcgcc atcgtattat 4320 gaatccgctg accgaagatg aatttcagca gctgattgcc ccgtggattg atatgtttta 4380 tctgaatcat gcagaacatc cgtttatgca gaccaaaggt gttaaagcaa atgatgttac 4440 cccgatggaa aaactgctgg ccggtgttag cggtgcaacc aattgtgcat ttgttaatca 4500 gccgggtcag ggtgaagcac tgtgtggtgg ttgtaccgca attgcactgt ttaatcaggc 4560 gaatcaggcc ccgggttttg gtggtggttt taaaagcggt ctgcgtggtg gtacaccggt 4620 taccaccttt gttcgtggta ttgatctgcg tagcaccgtt ctgctgaatg ttctgaccct 4680 gccgcgtctg cagaaacagt ttccgaatga aagccatacc gaaaatcagc cgacctggat 4740 taaaccgatt aaaagcaatg aaagcattcc ggcaagcagc attggttttg tgcgtggtct 4800 gttttggcag ccggcacata ttgaactgtg tgatccgatt ggtattggta aatgtagctg 4860 ttgtggtcag gaaagcaatc tgcgttatac cggctttctg aaagagaaat ttacctttac 4920 cgttaatggt ctgtggccgc atccgcatag cccgtgtctg gttaccgtga aaaaaggtga 4980 agttgaagaa aaatttctgg catttaccac cagcgcaccg agctggaccc agattagccg 5040 tgttgttgtt gataaaatta ttcagaatga aaatggcaat cgtgttgcag cagttgtgaa 5100 tcagtttcgt aatattgcgc cgcagagccc gctggaacta attatgggtg gttatcgtaa 5160 taatcaggca agcattctgg aacgccgtca tgatgttctg atgtttaatc agggttggca 5220 gcagtatggt aatgtgatta atgaaattgt gaccgttggt ctgggctata aaaccgcact 5280 gcgtaaagcg ctgtatacct ttgccgaagg ctttaaaaac aaagatttta aaggtgcagg 5340 cgttagcgtt catgaaaccg ccgaacgtca tttttatcgt cagagcgaac tgctgattcc 5400 ggatgtgctg gcaaatgtta attttagcca ggcagatgaa gttattgcag atctgcgcga 5460 taaactgcat cagctgtgtg aaatgctgtt taatcagagc gttgcaccgt atgcacatca 5520 tccgaaactg attagcaccc tggccctggc acgtgcaacc ctgtataaac atctgcgtga 5580 actgaaaccg cagggtggtc cgagcaatgg ttaataagga tctgtcagca ctgcgtgttg 5640 aaggatccca tcccaactcc ataagtggct gctgccaccg ctgagcatag cataacccct 5700 tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta tatcaagtcc 5760 cgaagtagct gtcagactgc tggcgaccgc cgcaactagt ggcgtcatgc gtgccgtatg 5820 gtctttcgcc tgtagacgcc ctacaagccg tactaaagtg gaaagacccg caaaaggtat 5880 cgcgattaag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 5940 tctgttgttt gtcggtgagt ccttccagtc tgggcgaaag cgcggtcgat caaattaagc 6000 agaaggccat cctgacggat ggcctttttg cgtttctatc gatcccgcga aattaatacg 6060 actcactata ggcccctcta gaaataattt tgtttaactt taagctttaa gaaggagata 6120 tagatcatgc cgaaaaaaaa gcgcaaagtg ggtggctctc aactggttaa aagcgaactg 6180 gaagagaaaa aaagtgaact gcgccacaaa ctgaaatatg tgccgcatga atatatcgag 6240 ctgattgaaa ttgcacgtaa tccgacccag gatcgtattc tggaaatgaa agtgatggaa 6300 ttttttatga aagtgtacgg ctatcgcggt gaacatctgg gtggtagccg taaaccggat 6360 ggtgcaattt ataccgttgg tagcccgatt gattatggtg ttattgttga taccaaagcc 6420 tatagcggtg gttataatct gccgattggt caggcagatg aaatgcagcg ttatgtggaa 6480 gaaaatcaga cccgtaacaa acatattaat ccgaatgaat ggtggaaagt ttatccgagc 6540 agcgttaccg agtttaaatt cctgtttgtt agcggtcact tcaaaggcaa ctataaagca 6600 cagctgaccc gtctgaatca tattaccaat tgtaatggtg cagttctgag cgttgaagaa 6660 ctgctgattg gtggtgaaat gattaaagca ggcaccctga ccctggaaga agttcgtcgc 6720 aaatttaaca atggcgaaat caacttttca ggcagcgaaa cgccgggtac aagtgagtca 6780 gcaactccag agagcggcgg cagtggtagt agtgggggat ctgggtcatc tggtgggatg 6840 tatctgagca aagttattat tgcacgtgca tggagccgtg atctgtatca gctgcatcag 6900 ggtctgtggc atctgtttcc gaatcgtccg gatgcagccc gtgattttct gtttcatgtt 6960 gaaaaacgta ataccccgga aggttgtcat gttctgctgc agagcgcaca gatgccggtt 7020 agcaccgcag ttgcaaccgt tattaaaacc aaacaggtgg aatttcagct gcaggttggt 7080 gttccgctgt attttcgtct gcgtgccaat ccgattaaaa ccattctgga taatcagaaa 7140 cgtctggata gcaaaggtaa tattaaacgt tgccgcgtgc cgctgattaa agaagccgaa 7200 cagattgcat ggctgcagcg taaactgggt aatgcagcac gtgttgaaga tgttcatccg 7260 attagcgaac gtccgcagta ttttagcggt gatggtaaaa gcggtaaaat tcagaccgtt 7320 tgttttgaag gtgttctgac cattaatgat gcaccggcac tgattgatct ggttcagcag 7380 ggtattggtc cggcaaaaag catgggttgt ggtctgctga gtctggcccc gctgtaataa 7440 gtccgagtca gtgtcctctg tgtaaccatg ggatcccaac tccataagtg gctgctgcca 7500 ccgctgagca tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg 7560 aaaggaggaa ctatatcaag tcccgaagta gctgtcagac tgctggcgac cgccgcaact 7620 agtggcgtca tgcgtgccgt atggtctttc gcctgtagac gccctacaag ccgtactaaa 7680 gtggaaagac ccgcaaaagg tatcgcgatc gccctgcagg gaactatatc cgactagtag 7740 cccgcctaat gagcgggctt ttttttaatt cccctatttg tttatttttc taaatacatt 7800 caaatatgta tccgctcatg agacaataac cctgataaat gcttcgaaaa aggaagagta 7860 tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 7920 tttttgctca cccagaaacg ctcgtgaaag taaaagacgc agaggaccaa ttgggggcac 7980 gagtgggata catagaactg gacttgaata gcggtaaaat ccttgagagt tttcgccctg 8040 aagagcgttt tccaatgatg agcactttca aagttctgct atgtggagca gtattatccc 8100 gtgtagatgc ggggcaagag caactcggac gacgaataca ctattcgcag aatgacttgg 8160 ttgaatactc cccagtgaca gaaaagcacc ttacggacgg aatgacggta agagaattat 8220 gtagtgccgc cataacgatg agtgataaca ctgcggcgaa cttacttctg acaaccatcg 8280 gtggaccgaa ggaattaacc gcttttttgc acaatatggg agaccatgta actcgccttg 8340 accgttggga accagaactg aatgaagcca taccaaacga cgagcgagac accacaatgc 8400 ctgcggcaat ggcaacaaca ttacgcaaac tattaactgg cgaactactt actctggctt 8460 cacggcaaca attaatagac tggcttgaag cggataaagt tgcaggacca ctactgcgtt 8520 cggcacttcc tgctggctgg tttattgctg ataaatctgg ggcaggagag cgtggttcac 8580 ggggtatcat tgccgcactt ggaccagatg gtaagccttc ccgtatcgta gttatctaca 8640 cgacgggtag tcaggcaact atggacgaac gaaatagaca gattgctgaa ataggggctt 8700 cactgattaa gcattggtaa accgatacaa ttaaaggctc cttttggagc cttttttttt 8760 ggacggaccg gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 8820 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 8880 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 8940 ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 9000 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 9060 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 9120 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 9180 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 9240 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 9300 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 9360 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 9420 ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 9480 tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 9540 gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat tttctcctta cgcatctgtg 9600 cggtatttca caccgcaatg gtgcactctc agtacaatct gctctgatgc cgcatagtta 9660 agccagtata cactccgcta tcgctacgtg actgggtcat ggctgcgccc cgacacccgc 9720 caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 9780 ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 9840 cgaggcagct gcggtaaagc tcatcagcgt ggtcgtgaag cgattcacag atgtctgcct 9900 gttcatccgc gtccagctcg ttgagtttct ccagaagcgt taatgtctgg cttctgataa 9960 agcgggccat gttaagggcg gttttttcct gtttggtcac tgatgcctcc gtgtaagggg 10020 gatttctgtt catggggtaa tgataccgat gaaacgagag aggatgctca cgatacgggt 10080 tactgatgat gaacatgccc ggttactgga acgttgtgag ggtaaacaac tggcggtatg 10140 gatgcggcgg gaccagagaa aaatcactca gggtcaatgc cagcgcttcg ttaatacaga 10200 tgtaggtgtt 10210 <210> 367 <211> 10201 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polypromoter(EcoCO), CRISPR(J3/L3)_Cse2_Cas7_Cas5_Cas6_FokI-30aa-Cas8 <400> 367 ggcaccatgc atcgatcccg cgaaatgcgg ccgcttaatt aaggcatcaa ataaaacgaa 60 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg agtccttcca 120 gtctgggcga aagcgcggtc gatcaaatta agcagaaggc catcctgacg gatggccttt 180 ttgcgtttct atcgatcccg cgaaattaat acgactcact ataggcccct ctagagctag 240 cgagttcccc gcgccagcgg ggataaaccg ccagtgataa gtggaatgcc atgtgggctg 300 tcgagttccc cgcgccagcg gggataaacc gagtggcaga tatagcctgg tggttcaggc 360 ggcgagttcc ccgcgccagc ggggataaac cggagctcgc tgagcatagc ataacccctt 420 ggggcctcta aacgggtctt gaggggtttt ttgctgaaag gaggaactat atcaagtccc 480 gaagtagctg tcagactgct ggcgaccgcc gcaactagtg gcgtcatgcg tgccgtatgg 540 tctttcgcct gtagacgccc tacaagccgt actaaagtgg aaagacccgc aaaaggtatc 600 gcgattaagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 660 ctgttgtttg tcggtgagtc cttccagtct gggcgaaagc gcggtcgatc aaattaagca 720 gaaggccatc ctgacggatg gcctttttgc gtttctatcg atcccgcgaa attaatacga 780 ctcactatag gcccctctag aaataatttt gtttaacttt aagctttaag aaggagatat 840 agatcatggc agatgaaatt gatgcaatgg cactgtatcg tgcatggcag cagctggata 900 atggtagctg tgcacagatt cgtcgtgtta gcgaaccgga tgaactgcgt gatattccgg 960 cattttatcg tctggttcag ccgtttggtt gggaaaatcc gcgtcatcag caggcactgc 1020 tgcgtatggt tttttgtctg agcgcaggta aaaatgttat tcgtcatcag gataaaaaaa 1080 gcgaacagac caccggtatt agcctgggtc gtgcactggc aaatagcggt cgtattaatg 1140 aacgtcgtat ttttcagctg attcgtgcag atcgtaccgc agatatggtt cagctgcgtc 1200 gtctgctgac ccatgcagaa ccggttctgg attggccgct gatggcacgt atgctgacct 1260 ggtggggtaa acgtgaacgt cagcagctgc tggaagattt tgttctgacc accaataaaa 1320 atgcctaata agcagaatgt tatcaatgcc atgcaggaat tctagcataa ccccttgggg 1380 cctctaaacg ggtcttgagg ggttttttgg ttttagccag ctggttgaag aactgctgaa 1440 aattatttgt gcatttcagc tggataccgg tctggaatat gcaaatagct acaattttgc 1500 caaaaaagat aatacgactc actataggcc cctgtagaaa taattttgtt taactttaat 1560 aaggagatat accatgagca actttattaa tattcatgtg ctgattagcc atagcccgag 1620 ctgcctgaat cgtgatgata tgaatatgca gaaagatgcc atttttggcg gtaaacgtcg 1680 tgttcgtatt agcagccaga gcctgaaacg tgcaatgcgt aaaagcggtt attatgcaca 1740 gaatattggt gaaagcagcc tgcgtaccat tcatctggca cagctgcgtg atgttctgcg 1800 tcagaaactg ggtgaacgtt ttgatcagaa aattattgat aaaaccctgg cactgctgag 1860 tggcaaaagc gttgatgaag cagaaaaaat tagcgcagat gcagttaccc cgtgggttgt 1920 tggtgaaatt gcctggtttt gcgaacaggt tgccaaagcc gaagcagata atctggatga 1980 taaaaaactg ctgaaagttc tgaaagaaga tattgccgcc attcgtgtta atctgcagca 2040 gggtgttgat attgcactga gcggtcgtat ggcaaccagc ggtatgatga ccgaactggg 2100 taaagttgat ggtgcaatga gcattgcaca tgcaattacc acccatcagg ttgatagcga 2160 tattgattgg tttaccgcag ttgatgatct gcaggaacag ggtagcgcac atctgggtac 2220 acaggaattt agcagcggtg tgttttatcg ttatgcaaat attaatctgg cccagctgca 2280 ggaaaatctg ggtggtgcaa gccgtgaaca ggcactggaa attgcaaccc atgttgttca 2340 tatgctggca accgaagttc cgggtgcaaa acagcgtacc tatgcagcct ttaatccggc 2400 agatatggtt atggttaatt ttagcgatat gccgctgtca atggcaaatg cctttgaaaa 2460 agcagtgaaa gccaaagatg gttttctgca gccgagcatt caggcattta atcagtattg 2520 ggatcgtgtt gcaaatggct atggtctgaa tggtgcagca gcacagttta gcctgagcga 2580 tgttgatccg attaccgcac aggttaaaca gatgccgacc ctggaacagc tgaaaagctg 2640 ggttcgtaat aatggtgaag cataataagg aatgtccgat ttgtctggaa ctgggcgcct 2700 agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgataa tagcccggaa 2760 catctgaaag atgaagtgtc tattattcag tcaatgggtt atcgcaatcg tgcaaaacgc 2820 ctgctgcaga gcgaaccgga aaatcctaat acgactcact ataggcccct caagaaataa 2880 ttttgtttaa ctttaagctt taagaaggag atatagatat gcgtagctat ctgattctgc 2940 gtctggcagg tccgatgcag gcatggggtc agccgacatt tgaaggtaca cgtccgacag 3000 gtcgttttcc gacacgtagt ggtctgctgg gtctgctggg tgcatgtctg ggtattcagc 3060 gtgatgatac cagcagtctg caggcactga gcgaaagcgt gcagtttgca gttcgttgtg 3120 atgaactgat tctggatgat cgtcgtgtta gcgtgaccgg tctgcgtgat tatcataccg 3180 ttctgggtgc acgtgaagat tatcgtggtc tgaaaagcca tgaaaccatt cagacctggc 3240 gtgaatatct gtgtgatgca agttttaccg ttgcactgtg gctgaccccg catgcaacaa 3300 tggttattag cgaactggaa aaagcagttc tgaaaccgcg ttataccccg tatctgggtc 3360 gtcgtagctg tccgctgacc catccgctgt ttctgggtac atgtcaggca agcgatccgc 3420 agaaagcact gctgaattat gaaccggttg gtggtgatat ttatagcgaa gaaagcgtta 3480 ccggtcatca tctgaaattt accgcacgtg atgaaccgat gattaccctg ccgcgtcagt 3540 ttgcaagccg tgaatggtat gttattaaag gtggtatgga tgttagccag taataagaac 3600 cggttagcac caagtgtgat cggtacccat cccaactcca taagtggctg ctgccaccgc 3660 tgagcatagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgctgaaag 3720 gaggaactat atcaagtccc gaagtagctg tcagactgct ggcgaccgcc gcaactagtg 3780 gcgtcatgcg tgccgtatgg tctttcgcct gtagacgccc tacaagccgt actaaagtgg 3840 aaagacccgc aaaaggtatc gcgattaagg catcaaataa aacgaaaggc tcagtcgaaa 3900 gactgggcct ttcgttttat ctgttgtttg tcggtgagtc cttccagtct gggcgaaagc 3960 gcggtcgatc aaattaagca gaaggccatc ctgacggatg gcctttttgc gtttctatcg 4020 atcccgcgaa attaatacga ctcactatag gcccctctag aaataatttt gtttaacttt 4080 aagctttaag aaggagatat agatcatgta tctgagcaaa gttattattg cacgtgcatg 4140 gagccgtgat ctgtatcagc tgcatcaggg tctgtggcat ctgtttccga atcgtccgga 4200 tgcagcccgt gattttctgt ttcatgttga aaaacgtaat accccggaag gttgtcatgt 4260 tctgctgcag agcgcacaga tgccggttag caccgcagtt gcaaccgtta ttaaaaccaa 4320 acaggtggaa tttcagctgc aggttggtgt tccgctgtat tttcgtctgc gtgccaatcc 4380 gattaaaacc attctggata atcagaaacg tctggatagc aaaggtaata ttaaacgttg 4440 ccgcgtgccg ctgattaaag aagccgaaca gattgcatgg ctgcagcgta aactgggtaa 4500 tgcagcacgt gttgaagatg ttcatccgat tagcgaacgt ccgcagtatt ttagcggtga 4560 tggtaaaagc ggtaaaattc agaccgtttg ttttgaaggt gttctgacca ttaatgatgc 4620 accggcactg attgatctgg ttcagcaggg tattggtccg gcaaaaagca tgggttgtgg 4680 tctgctgagt ctggccccgc tgtaataagt ccgagtcagt gtcctctgtg taaccatggg 4740 atcccaactc cataagtggc tgctgccacc gctgagcata gcataacccc ttggggcctc 4800 taaacgggtc ttgaggggtt ttttgctgaa aggaggaact atatcaagtc ccgaagtagc 4860 tgtcagactg ctggcgaccg ccgcaactag tggcgtcatg cgtgccgtat ggtctttcgc 4920 ctgtagacgc cctacaagcc gtactaaagt ggaaagaccc gcaaaaggta tcgcgattaa 4980 ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 5040 tgtcggtgag tccttccagt ctgggcgaaa gcgcggtcga tcaaattaag cagaaggcca 5100 tcctgacgga tggccttttt gcgtttctat cgatcccgcg aaattaatac gactcactat 5160 aggcccctct agaaataatt ttgtttaact ttaagcttta agaaggagat atagatcatg 5220 ccgaaaaaaa agcgcaaagt gcaactggtt aaaagcgaac tggaagagaa aaaaagtgaa 5280 ctgcgccaca aactgaaata tgtgccgcat gaatatatcg agctgattga aattgcacgt 5340 aatccgaccc aggatcgtat tctggaaatg aaagtgatgg aattttttat gaaagtgtac 5400 ggctatcgcg gtgaacatct gggtggtagc cgtaaaccgg atggtgcaat ttataccgtt 5460 ggtagcccga ttgattatgg tgttattgtt gataccaaag cctatagcgg tggttataat 5520 ctgccgattg gtcaggcaga tgaaatgcag cgttatgtgg aagaaaatca gacccgtaac 5580 aaacatatta atccgaatga atggtggaaa gtttatccga gcagcgttac cgagtttaaa 5640 ttcctgtttg ttagcggtca cttcaaaggc aactataaag cacagctgac ccgtctgaat 5700 catattacca attgtaatgg tgcagttctg agcgttgaag aactgctgat tggtggtgaa 5760 atgattaaag caggcaccct gaccctggaa gaagttcgtc gcaaatttaa caatggcgaa 5820 atcaactttt caggcagcga aacgccgggt acaagtgagt cagcaactcc agagagcggc 5880 ggcagtggta gtagtggggg atctgggtca tctggtggga tgaatttgct tattgataac 5940 tggattcctg tacgcccgcg aaacgggggg aaagtccaaa tcataaatct gcaatcgcta 6000 tactgcagta gagatcagtg gcgattaagt ttgccccgtg acgatatgga actggccgct 6060 ttagcactgc tggtttgcat tgggcaaatt atcgccccgg caaaagatga cgttgaattt 6120 cgacatcgca taatgaatcc gctcactgaa gatgagtttc aacaactcat cgcgccgtgg 6180 atagatatgt tctaccttaa tcacgcagaa catcccttta tgcagaccaa aggtgtcaaa 6240 gcaaatgatg tgactccaat ggaaaaactg ttggctgggg taagcggcgc gacgaattgt 6300 gcatttgtca atcaaccggg gcagggtgaa gcattatgtg gtggatgcac tgcgattgcg 6360 ttattcaacc aggcgaatca ggcaccaggt tttggtggtg gttttaaaag cggtttacgt 6420 ggaggaacac ctgtaacaac gttcgtacgt gggatcgatc ttcgttcaac ggtgttactc 6480 aatgtcctca cattacctcg tcttcaaaaa caatttccta atgaatcaca tacggaaaac 6540 caacctacct ggattaaacc tatcaagtcc aatgagtcta tacctgcttc gtcaattggg 6600 tttgtccgtg gtctattctg gcaaccagcg catattgaat tatgcgatcc cattgggatt 6660 ggtaaatgtt cttgctgtgg acaggaaagc aatttgcgtt ataccggttt tcttaaggaa 6720 aaatttacct ttacagttaa tgggctatgg ccccatccgc attccccttg tctggtaaca 6780 gtcaagaaag gggaggttga ggaaaaattt cttgctttca ccacctccgc accatcatgg 6840 acacaaatca gccgagttgt ggtagataag attattcaaa atgaaaatgg aaatcgcgtg 6900 gcggcggttg tgaatcaatt cagaaatatt gcgccgcaaa gtcctcttga attgattatg 6960 gggggatatc gtaataatca agcatctatt cttgaacggc gtcatgatgt gttgatgttt 7020 aatcaggggt ggcaacaata cggcaatgtg ataaacgaaa tagtgactgt tggtttggga 7080 tataaaacag ccttacgcaa ggcgttatat acctttgcag aagggtttaa aaataaagac 7140 ttcaaagggg ccggagtctc tgttcatgag actgcagaaa ggcatttcta tcgacagagt 7200 gaattattaa ttcccgatgt actggcgaat gttaattttt cccaggctga tgaggtaata 7260 gctgatttac gagacaaact tcatcaattg tgtgaaatgc tatttaatca atctgtagct 7320 ccctatgcac atcatcctaa attaataagc acattagcgc ttgcccgcgc cacgctatac 7380 aaacatttac gggagttaaa accgcaagga gggccatcaa atggctaata aggatctgtc 7440 agcactgcgt gttgaaggat ccgatcccaa ctccataagt ggctgctgcc accgctgagc 7500 atagcataac cccttggggc ctctaaacgg gtcttgaggg gttttttgct gaaaggagga 7560 actatatcaa gtcccgaagt agctgtcaga ctgctggcga ccgccgcaac tagtggcgtc 7620 atgcgtgccg tatggtcttt cgcctgtaga cgccctacaa gccgtactaa agtggaaaga 7680 cccgcaaaag gtatcgcgat cgccctgcag ggaactatat ccgactagta gcccgcctaa 7740 tgagcgggct tttttttaat tcccctattt gtttattttt ctaaatacat tcaaatatgt 7800 atccgctcat gagacaataa ccctgataaa tgcttcgaaa aaggaagagt atgagtattc 7860 aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 7920 acccagaaac gctcgtgaaa gtaaaagacg cagaggacca attgggggca cgagtgggat 7980 acatagaact ggacttgaat agcggtaaaa tccttgagag ttttcgccct gaagagcgtt 8040 ttccaatgat gagcactttc aaagttctgc tatgtggagc agtattatcc cgtgtagatg 8100 cggggcaaga gcaactcgga cgacgaatac actattcgca gaatgacttg gttgaatact 8160 ccccagtgac agaaaagcac cttacggacg gaatgacggt aagagaatta tgtagtgccg 8220 ccataacgat gagtgataac actgcggcga acttacttct gacaaccatc ggtggaccga 8280 aggaattaac cgcttttttg cacaatatgg gagaccatgt aactcgcctt gaccgttggg 8340 aaccagaact gaatgaagcc ataccaaacg acgagcgaga caccacaatg cctgcggcaa 8400 tggcaacaac attacgcaaa ctattaactg gcgaactact tactctggct tcacggcaac 8460 aattaataga ctggcttgaa gcggataaag ttgcaggacc actactgcgt tcggcacttc 8520 ctgctggctg gtttattgct gataaatctg gggcaggaga gcgtggttca cggggtatca 8580 ttgccgcact tggaccagat ggtaagcctt cccgtatcgt agttatctac acgacgggta 8640 gtcaggcaac tatggacgaa cgaaatagac agattgctga aataggggct tcactgatta 8700 agcattggta aaccgataca attaaaggct ccttttggag cctttttttt tggacggacc 8760 ggtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 8820 gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 8880 tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt 8940 gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 9000 gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 9060 ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 9120 acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 9180 agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 9240 cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 9300 tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 9360 gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 9420 ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 9480 ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 9540 cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc 9600 acaccgcaat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagtat 9660 acactccgct atcgctacgt gactgggtca tggctgcgcc ccgacacccg ccaacacccg 9720 ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg 9780 tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgaggcagc 9840 tgcggtaaag ctcatcagcg tggtcgtgaa gcgattcaca gatgtctgcc tgttcatccg 9900 cgtccagctc gttgagtttc tccagaagcg ttaatgtctg gcttctgata aagcgggcca 9960 tgttaagggc ggttttttcc tgtttggtca ctgatgcctc cgtgtaaggg ggatttctgt 10020 tcatggggta atgataccga tgaaacgaga gaggatgctc acgatacggg ttactgatga 10080 tgaacatgcc cggttactgg aacgttgtga gggtaaacaa ctggcggtat ggatgcggcg 10140 ggaccagaga aaaatcactc agggtcaatg ccagcgcttc gttaatacag atgtaggtgt 10200 t 10201 <210> 368 <211> 6926 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas8, HsCO <400> 368 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatgaat ttgctcattg ataattggat 960 tccggtgcgc ccccggaacg gtgggaaagt gcagatcatc aatttgcaaa gtctctactg 1020 ttccagggac cagtggagac tcagcctgcc acgggatgat atggagctgg cggcgttggc 1080 tctgctcgta tgcatcggcc agattattgc gccagcaaag gatgacgttg aattccggca 1140 tcggataatg aaccccctta ctgaagatga gttccagcag cttatcgccc catggatcga 1200 catgttctac ctcaaccacg ccgagcatcc ttttatgcag accaagggag tcaaggcgaa 1260 tgatgtgact cccatggaga agctgctggc cggtgtatct ggggcgacca actgcgcatt 1320 cgtgaatcag cctggacagg gggaggccct ctgtggaggc tgcactgcta tagcactttt 1380 taaccaagct aatcaagccc ccggctttgg tggagggttt aagagtggat tgaggggggg 1440 cactcccgta accacttttg tgaggggaat tgatctgagg tctactgtgt tgctgaacgt 1500 cctcacactc ccaaggctcc agaagcagtt cccaaacgaa agtcataccg aaaaccagcc 1560 cacatggatc aagcccatca aatctaatga gagcataccg gctagcagta ttggatttgt 1620 acggggtctg ttctggcagc cagctcacat cgagctgtgt gatcctattg ggatcggcaa 1680 gtgctcttgt tgtgggcagg agtccaacct taggtatact ggatttctga aagagaagtt 1740 tacctttaca gtaaatgggc tctggcccca cccccactca ccttgccttg tgacagtgaa 1800 aaagggggaa gtcgaggaga agtttctggc ctttacaact tctgcccctt cctggactca 1860 gatttccaga gtggtggtag ataagataat tcaaaacgag aatggcaata gagtggccgc 1920 cgtggtgaac cagtttcgca acatcgcccc tcagtccccc ctggagctga ttatgggcgg 1980 ttatcggaat aaccaggcca gtatactcga gcgacggcac gatgtcctca tgttcaatca 2040 aggttggcag caatatggca atgtgattaa cgagatcgta accgtgggcc tgggatataa 2100 gaccgccctg cggaaggcgt tgtatacttt tgcagaaggc tttaagaata aggattttaa 2160 gggtgccggc gtgagtgtcc atgaaacagc tgaacggcac ttttatcggc agtccgagct 2220 gttgatacca gacgtgctgg ctaatgtgaa cttctcacag gccgacgaag tgatcgctga 2280 tctgcgggat aaactgcacc aactgtgcga gatgctgttt aatcaaagcg tcgctcctta 2340 tgcccaccac ccaaagctga tctccacgct ggccctggcg cgcgccacac tttataaaca 2400 tctccgcgaa ctgaaacccc aggggggccc cagcaatggc taataacatt ggaagtggat 2460 aatctagagg gccctattct atagtgtcac ctaaatgcta gagctcgctg atcagcctcg 2520 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 2580 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 2640 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 2700 tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 2760 agaaccagct ggggctctag ggggtatccc cacgcgccct gtagcggcgc attaagcgcg 2820 gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 2880 cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 2940 aatcggggca tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 3000 cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 3060 ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 3120 aaccctatct cggtctattc ttttgattta taagggattt tggggatttc ggcctattgg 3180 ttaaaaaatg agctgattta acaaaaattt aacgcgaatt aattctgtgg aatgtgtgtc 3240 agttagggtg tggaaagtcc ccaggctccc caggcaggca gaagtatgca aagcatgcat 3300 ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg 3360 caaagcatgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg 3420 cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt 3480 tatgcagagg ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt 3540 tttggaggcc taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggatct 3600 gatcaagaga caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt 3660 tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 3720 tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag 3780 accgacctgt ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg 3840 gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac 3900 tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 3960 gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 4020 tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 4080 ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 4140 ttcgccaggc tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat 4200 gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 4260 cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 4320 gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat 4380 tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt 4440 tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg 4500 ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc 4560 agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt gcagcttata 4620 atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 4680 attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgt ataccgtcga 4740 cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 4800 cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4860 aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4920 acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4980 ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 5040 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 5100 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 5160 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 5220 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 5280 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 5340 cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg 5400 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5460 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5520 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5580 agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5640 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5700 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5760 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5820 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5880 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5940 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 6000 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 6060 tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 6120 gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 6180 gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 6240 ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 6300 cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6360 tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6420 cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6480 agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6540 cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6600 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6660 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6720 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6780 gaatactcat actcttcctt tttcattatt attgaagcat ttatcagggt tattgtctca 6840 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6900 ttccccgaaa agtgccacct gacgtc 6926 <210> 369 <211> 6925 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSCas8, HsCO <400> 369 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc atgaatttgc 960 tcattgataa ttggattccg gtgcgccccc ggaacggtgg gaaagtgcag atcatcaatt 1020 tgcaaagtct ctactgttcc agggaccagt ggagactcag cctgccacgg gatgatatgg 1080 agctggcggc gttggctctg ctcgtatgca tcggccagat tattgcgcca gcaaaggatg 1140 acgttgaatt ccggcatcgg ataatgaacc cccttactga agatgagttc cagcagctta 1200 tcgccccatg gatcgacatg ttctacctca accacgccga gcatcctttt atgcagacca 1260 agggagtcaa ggcgaatgat gtgactccca tggagaagct gctggccggt gtatctgggg 1320 cgaccaactg cgcattcgtg aatcagcctg gacaggggga ggccctctgt ggaggctgca 1380 ctgctatagc actttttaac caagctaatc aagcccccgg ctttggtgga gggtttaaga 1440 gtggattgag ggggggcact cccgtaacca cttttgtgag gggaattgat ctgaggtcta 1500 ctgtgttgct gaacgtcctc acactcccaa ggctccagaa gcagttccca aacgaaagtc 1560 ataccgaaaa ccagcccaca tggatcaagc ccatcaaatc taatgagagc ataccggcta 1620 gcagtattgg atttgtacgg ggtctgttct ggcagccagc tcacatcgag ctgtgtgatc 1680 ctattgggat cggcaagtgc tcttgttgtg ggcaggagtc caaccttagg tatactggat 1740 ttctgaaaga gaagtttacc tttacagtaa atgggctctg gccccacccc cactcacctt 1800 gccttgtgac agtgaaaaag ggggaagtcg aggagaagtt tctggccttt acaacttctg 1860 ccccttcctg gactcagatt tccagagtgg tggtagataa gataattcaa aacgagaatg 1920 gcaatagagt ggccgccgtg gtgaaccagt ttcgcaacat cgcccctcag tcccccctgg 1980 agctgattat gggcggttat cggaataacc aggccagtat actcgagcga cggcacgatg 2040 tcctcatgtt caatcaaggt tggcagcaat atggcaatgt gattaacgag atcgtaaccg 2100 tgggcctggg atataagacc gccctgcgga aggcgttgta tacttttgca gaaggcttta 2160 agaataagga ttttaagggt gccggcgtga gtgtccatga aacagctgaa cggcactttt 2220 atcggcagtc cgagctgttg ataccagacg tgctggctaa tgtgaacttc tcacaggccg 2280 acgaagtgat cgctgatctg cgggataaac tgcaccaact gtgcgagatg ctgtttaatc 2340 aaagcgtcgc tccttatgcc caccacccaa agctgatctc cacgctggcc ctggcgcgcg 2400 ccacacttta taaacatctc cgcgaactga aaccccaggg gggccccagc aatggctaat 2460 aatctagagg gccctattct atagtgtcac ctaaatgcta gagctcgctg atcagcctcg 2520 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 2580 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 2640 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 2700 tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 2760 agaaccagct ggggctctag ggggtatccc cacgcgccct gtagcggcgc attaagcgcg 2820 gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 2880 cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 2940 aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 3000 cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 3060 ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 3120 aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 3180 ttaaaaaatg agctgattta acaaaaattt aacgcgaatt aattctgtgg aatgtgtgtc 3240 agttagggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc 3300 tcaattagtc agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 3360 aaagcatgca tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc 3420 ccctaactcc gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt 3480 atgcagaggc cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt 3540 ttggaggcct aggcttttgc aaaaagctcc cgggagcttg tatatccatt ttcggatctg 3600 atcaagagac aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggtt 3660 ctccggccgc ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcggct 3720 gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga 3780 ccgacctgtc cggtgccctg aatgaactgc aggacgaggc agcgcggcta tcgtggctgg 3840 ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact 3900 ggctgctatt gggcgaagtg ccggggcagg atctcctgtc atctcacctt gctcctgccg 3960 agaaagtatc catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct 4020 gcccattcga ccaccaagcg aaacatcgca tcgagcgagc acgtactcgg atggaagccg 4080 gtcttgtcga tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt 4140 tcgccaggct caaggcgcgc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg 4200 cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc 4260 ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctgaag 4320 agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt 4380 cgcagcgcat cgccttctat cgccttcttg acgagttctt ctgagcggga ctctggggtt 4440 cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 4500 cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 4560 gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa 4620 tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 4680 ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac 4740 ctctagctag agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 4800 gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 4860 atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 4920 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 4980 tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 5040 agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 5100 aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5160 gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 5220 tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 5280 cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5340 ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 5400 cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5460 atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5520 agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5580 gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 5640 gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5700 tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5760 agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5820 gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5880 aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 5940 aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 6000 ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 6060 gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6120 aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6180 ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6240 tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6300 ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 6360 cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6420 agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6480 gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6540 gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6600 acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6660 acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6720 agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6780 aatactcata ctcttccttt ttcattatta ttgaagcatt tatcagggtt attgtctcat 6840 gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6900 tccccgaaaa gtgccacctg acgtc 6925 <210> 370 <211> 7630 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSHAFokI30aaCas8, HsCO <400> 370 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggctcaggc tatccctatg 960 acgtacccga ctacgcgcaa ttggtcaaaa gcgaactgga agagaaaaaa tctgagctca 1020 gacacaagct gaagtatgtg ccccatgaat acatagaact catagaaata gctcgaaacc 1080 ccacgcagga ccggatcctt gaaatgaaag ttatggagtt ttttatgaaa gtgtatgggt 1140 atcgaggaga gcatcttggt ggaagtcgga aaccggatgg ggcaatatac actgttggga 1200 gccccattga ctatggtgtg atagtggaca ccaaggcata cagcggggga tacaatctgc 1260 cgatcgggca ggcagatgag atgcagcgct atgtggagga gaatcaaact aggaacaaac 1320 atattaaccc aaacgaatgg tggaaagtgt atccctcatc tgttacggag ttcaagttcc 1380 tttttgtatc tggccacttt aaaggaaact ataaagcaca gctcacgcga cttaaccaca 1440 tcaccaattg taacggtgct gtactcagtg ttgaggaact cctgatcggt ggtgaaatga 1500 taaaagctgg aaccttgaca ttggaggaag taaggagaaa gtttaataat ggtgagatca 1560 atttcagcgg ctccgaaacg ccgggtacat ccgagtccgc gactcctgag tcaggaggca 1620 gcggctcctc tggtggaagc ggctcaagtg gagggatgaa tttgctcatt gataattgga 1680 ttccggtgcg cccccggaac ggtgggaaag tgcagatcat caatttgcaa agtctctact 1740 gttccaggga ccagtggaga ctcagcctgc cacgggatga tatggagctg gcggcgttgg 1800 ctctgctcgt atgcatcggc cagattattg cgccagcaaa ggatgacgtt gaattccggc 1860 atcggataat gaaccccctt actgaagatg agttccagca gcttatcgcc ccatggatcg 1920 acatgttcta cctcaaccac gccgagcatc cttttatgca gaccaaggga gtcaaggcga 1980 atgatgtgac tcccatggag aagctgctgg ccggtgtatc tggggcgacc aactgcgcat 2040 tcgtgaatca gcctggacag ggggaggccc tctgtggagg ctgcactgct atagcacttt 2100 ttaaccaagc taatcaagcc cccggctttg gtggagggtt taagagtgga ttgagggggg 2160 gcactcccgt aaccactttt gtgaggggaa ttgatctgag gtctactgtg ttgctgaacg 2220 tcctcacact cccaaggctc cagaagcagt tcccaaacga aagtcatacc gaaaaccagc 2280 ccacatggat caagcccatc aaatctaatg agagcatacc ggctagcagt attggatttg 2340 tacggggtct gttctggcag ccagctcaca tcgagctgtg tgatcctatt gggatcggca 2400 agtgctcttg ttgtgggcag gagtccaacc ttaggtatac tggatttctg aaagagaagt 2460 ttacctttac agtaaatggg ctctggcccc acccccactc accttgcctt gtgacagtga 2520 aaaaggggga agtcgaggag aagtttctgg cctttacaac ttctgcccct tcctggactc 2580 agatttccag agtggtggta gataagataa ttcaaaacga gaatggcaat agagtggccg 2640 ccgtggtgaa ccagtttcgc aacatcgccc ctcagtcccc cctggagctg attatgggcg 2700 gttatcggaa taaccaggcc agtatactcg agcgacggca cgatgtcctc atgttcaatc 2760 aaggttggca gcaatatggc aatgtgatta acgagatcgt aaccgtgggc ctgggatata 2820 agaccgccct gcggaaggcg ttgtatactt ttgcagaagg ctttaagaat aaggatttta 2880 agggtgccgg cgtgagtgtc catgaaacag ctgaacggca cttttatcgg cagtccgagc 2940 tgttgatacc agacgtgctg gctaatgtga acttctcaca ggccgacgaa gtgatcgctg 3000 atctgcggga taaactgcac caactgtgcg agatgctgtt taatcaaagc gtcgctcctt 3060 atgcccacca cccaaagctg atctccacgc tggccctggc gcgcgccaca ctttataaac 3120 atctccgcga actgaaaccc caggggggcc ccagcaatgg ctaataatct agagggccct 3180 attctatagt gtcacctaaa tgctagagct cgctgatcag cctcgactgt gccttctagt 3240 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3300 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3360 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3420 aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac cagctggggc 3480 tctagggggt atccccacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 3540 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 3600 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 3660 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 3720 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 3780 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 3840 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 3900 atttaacaaa aatttaacgc gaattaattc tgtggaatgt gtgtcagtta gggtgtggaa 3960 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 4020 ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 4080 attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 4140 gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 4200 ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 4260 tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa gagacaggat 4320 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 4380 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 4440 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 4500 ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 4560 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 4620 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 4680 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 4740 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 4800 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 4860 cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 4920 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 4980 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 5040 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 5100 tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 5160 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 5220 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 5280 gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 5340 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 5400 gtccaaactc atcaatgtat cttatcatgt ctgtataccg tcgacctcta gctagagctt 5460 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 5520 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 5580 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 5640 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 5700 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 5760 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 5820 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 5880 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 5940 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 6000 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 6060 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 6120 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 6180 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 6240 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 6300 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 6360 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 6420 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 6480 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 6540 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 6600 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 6660 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 6720 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 6780 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 6840 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 6900 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 6960 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 7020 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 7080 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 7140 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 7200 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 7260 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 7320 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 7380 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 7440 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 7500 cctttttcat tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 7560 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 7620 acctgacgtc 7630 <210> 371 <211> 5933 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSCse2, HsCO <400> 371 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatgccg aaaaaaaagc ggaaggtcgg 960 atcaggaatg gccgacgaga ttgacgcaat ggcactttac cgggcctggc agcagttgga 1020 taatggttca tgtgcccaga ttcgcagagt tagtgaacct gacgaactga gagatatccc 1080 cgcgttttac agacttgtcc aaccgttcgg atgggagaac ccacggcacc aacaagcact 1140 ccttcgaatg gtcttctgtt tgtccgcagg aaaaaatgta atcagacacc aagacaaaaa 1200 gagcgagcaa accacaggta tcagcctggg cagggcactt gccaactctg ggcggatcaa 1260 cgaaaggaga atttttcagc tgatacgcgc tgatcggact gcggacatgg tgcagctgcg 1320 cagactcctt actcatgccg aacctgtcct ggattggccc ctgatggcac gcatgctgac 1380 ttggtgggga aagagagaaa gacagcaact gcttgaagac ttcgtgctca ctacaaataa 1440 gaatgcctaa taacattgga agtggataat ctagagggcc ctattctata gtgtcaccta 1500 aatgctagag ctcgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt 1560 tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 1620 taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 1680 gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg 1740 gtgggctcta tggcttctga ggcggaaaga accagctggg gctctagggg gtatccccac 1800 gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 1860 acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 1920 ttcgccggct ttccccgtca agctctaaat cggggcatcc ctttagggtt ccgatttagt 1980 gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 2040 tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 2100 ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 2160 gggattttgg ggatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 2220 gcgaattaat tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag 2280 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 2340 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 2400 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 2460 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc tgcctctgag 2520 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagctcccg 2580 ggagcttgta tatccatttt cggatctgat caagagacag gatgaggatc gtttcgcatg 2640 attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag gctattcggc 2700 tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg 2760 caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag 2820 gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc agctgtgctc 2880 gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc ggggcaggat 2940 ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga tgcaatgcgg 3000 cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa acatcgcatc 3060 gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct ggacgaagag 3120 catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat gcccgacggc 3180 gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt ggaaaatggc 3240 cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata 3300 gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga ccgcttcctc 3360 gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg ccttcttgac 3420 gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg cccaacctgc 3480 catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 3540 tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 3600 accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 3660 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 3720 tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa tcatggtcat 3780 agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 3840 gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 3900 gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 3960 aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 4020 cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 4080 ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 4140 aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 4200 acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 4260 gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 4320 ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caatgctcac 4380 gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 4440 cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 4500 taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 4560 atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 4620 cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 4680 cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 4740 ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 4800 ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 4860 tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 4920 aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 4980 tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 5040 gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 5100 atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 5160 tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 5220 ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 5280 ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 5340 tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 5400 ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 5460 ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 5520 tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 5580 gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 5640 taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 5700 cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 5760 agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt cattattatt 5820 gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 5880 ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtc 5933 <210> 372 <211> 6542 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas7, HsCO <400> 372 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatgccg aaaaaaaagc ggaaggtcgg 960 atcaggaatg tcaaatttta ttaatattca tgttctgatc agtcatagcc cgagttgcct 1020 gaatagagac gacatgaata tgcagaaaga cgcaattttc ggtggcaaga ggcgagtccg 1080 aataagcagc caaagtctta agcgagccat gaggaagagc ggctattatg cccagaatat 1140 cggcgagtcc tcattgcgga ccatccacct cgcccagttg agagacgtct tgaggcagaa 1200 actgggggaa agattcgacc agaaaatcat tgacaagacc cttgccctcc ttagtgggaa 1260 gagcgtggac gaggctgaaa aaatctctgc cgacgccgta acgccctggg ttgtgggtga 1320 gattgcttgg ttttgtgaac aggtggcgaa ggcggaggcc gataacctgg atgacaagaa 1380 gctgctgaag gtccttaagg aggacatagc tgccattcgg gtcaatttgc agcagggagt 1440 ggatatcgca ttgtccggaa gaatggctac atcaggcatg atgaccgagc tgggcaaggt 1500 agacggagcc atgagtatcg cacacgccat caccacccac caagtcgact cagacatcga 1560 ctggttcaca gcagtagatg acctccagga gcaggggtct gcccaccttg ggacacagga 1620 gttctcttcc ggggtgtttt atcgctatgc taatatcaat ctggcgcagc tgcaagaaaa 1680 cctgggggga gcctctcgag agcaggccct ggagattgca actcacgtcg tgcatatgct 1740 tgcgacagag gtacctggcg ccaagcagag gacatacgct gcttttaatc cagcagatat 1800 ggtcatggta aatttctctg atatgcctct ctccatggcc aacgcattcg agaaggcagt 1860 gaaggcaaag gacgggttcc tgcagccatc aattcaagcg tttaatcagt attgggacag 1920 agtggcgaac ggctatggac tgaacggagc cgcagctcag tttagcctca gcgatgtcga 1980 tcccataact gcacaggtga aacagatgcc tacgttggaa cagctgaagt catgggtaag 2040 aaataacggc gaagcctaat aacattggaa gtggataatc tagagggccc tattctatag 2100 tgtcacctaa atgctagagc tcgctgatca gcctcgactg tgccttctag ttgccagcca 2160 tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 2220 ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 2280 gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 2340 ggggatgcgg tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctctaggggg 2400 tatccccacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 2460 gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 2520 ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc ggggcatccc tttagggttc 2580 cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 2640 agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 2700 aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 2760 gatttataag ggattttggg gatttcggcc tattggttaa aaaatgagct gatttaacaa 2820 aaatttaacg cgaattaatt ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 2880 gctccccagg caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaggtgt 2940 ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca 3000 gcaaccatag tcccgcccct aactccgccc atcccgcccc taactccgcc cagttccgcc 3060 cattctccgc cccatggctg actaattttt tttatttatg cagaggccga ggccgcctct 3120 gcctctgagc tattccagaa gtagtgagga ggcttttttg gaggcctagg cttttgcaaa 3180 aagctcccgg gagcttgtat atccattttc ggatctgatc aagagacagg atgaggatcg 3240 tttcgcatga ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg 3300 ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg 3360 ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat 3420 gaactgcagg acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca 3480 gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg 3540 gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat 3600 gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa 3660 catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg 3720 gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg 3780 cccgacggcg aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg 3840 gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat 3900 caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac 3960 cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc 4020 cttcttgacg agttcttctg agcgggactc tggggttcga aatgaccgac caagcgacgc 4080 ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 4140 gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 4200 tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 4260 tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 4320 tcatcaatgt atcttatcat gtctgtatac cgtcgacctc tagctagagc ttggcgtaat 4380 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 4440 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 4500 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 4560 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 4620 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4680 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4740 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4800 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4860 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4920 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4980 aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 5040 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 5100 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 5160 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 5220 ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 5280 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 5340 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 5400 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 5460 aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 5520 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 5580 cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 5640 tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 5700 cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 5760 ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 5820 gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 5880 gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 5940 gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 6000 gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 6060 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 6120 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 6180 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 6240 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 6300 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 6360 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 6420 attattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 6480 tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 6540 tc 6542 <210> 373 <211> 6092 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas5, HsCO <400> 373 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatgcgg agctatctca tcctgagact 960 ggccggacca atgcaggcct ggggacagcc taccttcgaa ggtacacgcc ccacaggccg 1020 ctttcctacc aggagcggcc tgctgggcct gcttggcgct tgtcttggga tccagcgcga 1080 tgatactagc tccctgcaag cactgtcaga gagcgtgcag tttgccgtaa gatgcgacga 1140 actgatcctt gatgataggc gggtcagtgt cactggtctc cgggactacc acacggtgct 1200 gggggcccgg gaggattata ggggcctgaa aagtcacgag acgattcaaa cctggcgcga 1260 atatctgtgc gatgccagct tcaccgtggc cctgtggctg actccacatg ccactatggt 1320 catcagtgaa ctggaaaagg ctgttcttaa gcctcgatat actccgtatc tgggccgccg 1380 gagttgtcca cttacacacc cacttttcct cggcacctgc caggccagcg accctcaaaa 1440 ggcccttctg aattacgagc cagttggcgg tgacatatac agcgaagagt ccgtgacggg 1500 acaccatctt aagttcaccg ctcgggacga gcccatgatt accctcccac ggcagttcgc 1560 atcaagggag tggtacgtca taaagggggg catggatgtg agtcagtaat aacattggaa 1620 gtggataatc tagagggccc tattctatag tgtcacctaa atgctagagc tcgctgatca 1680 gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 1740 ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 1800 cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 1860 gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 1920 gcggaaagaa ccagctgggg ctctaggggg tatccccacg cgccctgtag cggcgcatta 1980 agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 2040 cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 2100 gctctaaatc ggggcatccc tttagggttc cgatttagtg ctttacggca cctcgacccc 2160 aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 2220 cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 2280 acactcaacc ctatctcggt ctattctttt gatttataag ggattttggg gatttcggcc 2340 tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattaatt ctgtggaatg 2400 tgtgtcagtt agggtgtgga aagtccccag gctccccagg caggcagaag tatgcaaagc 2460 atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc agcaggcaga 2520 agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 2580 atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 2640 tttatttatg cagaggccga ggccgcctct gcctctgagc tattccagaa gtagtgagga 2700 ggcttttttg gaggcctagg cttttgcaaa aagctcccgg gagcttgtat atccattttc 2760 ggatctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga tggattgcac 2820 gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca 2880 atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt 2940 gtcaagaccg acctgtccgg tgccctgaat gaactgcagg acgaggcagc gcggctatcg 3000 tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga 3060 agggactggc tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct 3120 cctgccgaga aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg 3180 gctacctgcc cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg 3240 gaagccggtc ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgccagcc 3300 gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg aggatctcgt cgtgacccat 3360 ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac 3420 tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac ccgtgatatt 3480 gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct 3540 cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg agcgggactc 3600 tggggttcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 3660 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 3720 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 3780 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 3840 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgtatac 3900 cgtcgacctc tagctagagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 3960 gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg 4020 gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 4080 cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 4140 tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 4200 tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 4260 ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 4320 ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 4380 gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 4440 gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 4500 ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg 4560 tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 4620 gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 4680 tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 4740 tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc 4800 tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 4860 ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 4920 ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 4980 gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt 5040 aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc 5100 aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg 5160 cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg 5220 ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc 5280 cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta 5340 ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg 5400 ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct 5460 ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta 5520 gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg 5580 ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga 5640 ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt 5700 gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca 5760 ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt 5820 cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt 5880 ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga 5940 aatgttgaat actcatactc ttcctttttc attattattg aagcatttat cagggttatt 6000 gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc 6060 gcacatttcc ccgaaaagtg ccacctgacg tc 6092 <210> 374 <211> 6091 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSCas5, HsCO <400> 374 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc atgcggagct 960 atctcatcct gagactggcc ggaccaatgc aggcctgggg acagcctacc ttcgaaggta 1020 cacgccccac aggccgcttt cctaccagga gcggcctgct gggcctgctt ggcgcttgtc 1080 ttgggatcca gcgcgatgat actagctccc tgcaagcact gtcagagagc gtgcagtttg 1140 ccgtaagatg cgacgaactg atccttgatg ataggcgggt cagtgtcact ggtctccggg 1200 actaccacac ggtgctgggg gcccgggagg attatagggg cctgaaaagt cacgagacga 1260 ttcaaacctg gcgcgaatat ctgtgcgatg ccagcttcac cgtggccctg tggctgactc 1320 cacatgccac tatggtcatc agtgaactgg aaaaggctgt tcttaagcct cgatatactc 1380 cgtatctggg ccgccggagt tgtccactta cacacccact tttcctcggc acctgccagg 1440 ccagcgaccc tcaaaaggcc cttctgaatt acgagccagt tggcggtgac atatacagcg 1500 aagagtccgt gacgggacac catcttaagt tcaccgctcg ggacgagccc atgattaccc 1560 tcccacggca gttcgcatca agggagtggt acgtcataaa ggggggcatg gatgtgagtc 1620 agtaataatc tagagggccc tattctatag tgtcacctaa atgctagagc tcgctgatca 1680 gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 1740 ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 1800 cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 1860 gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 1920 gcggaaagaa ccagctgggg ctctaggggg tatccccacg cgccctgtag cggcgcatta 1980 agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 2040 cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 2100 gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 2160 aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 2220 cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 2280 acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 2340 tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattaatt ctgtggaatg 2400 tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 2460 tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa 2520 gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta actccgccca 2580 tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt 2640 ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag tagtgaggag 2700 gcttttttgg aggcctaggc ttttgcaaaa agctcccggg agcttgtata tccattttcg 2760 gatctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg 2820 caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa 2880 tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg 2940 tcaagaccga cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt 3000 ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa 3060 gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc 3120 ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg 3180 ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg 3240 aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg 3300 aactgttcgc caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg 3360 gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact 3420 gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg 3480 ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc 3540 ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga gcgggactct 3600 ggggttcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac 3660 cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat 3720 cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc 3780 ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 3840 actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatacc 3900 gtcgacctct agctagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 3960 ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 4020 tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 4080 gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 4140 gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 4200 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 4260 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 4320 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 4380 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 4440 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 4500 tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 4560 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 4620 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 4680 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 4740 cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 4800 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 4860 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 4920 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 4980 ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 5040 aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 5100 atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 5160 ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 5220 tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 5280 agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 5340 taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 5400 tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 5460 cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 5520 ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 5580 tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 5640 tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 5700 cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 5760 tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 5820 gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 5880 tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 5940 atgttgaata ctcatactct tcctttttca ttattattga agcatttatc agggttattg 6000 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 6060 cacatttccc cgaaaagtgc cacctgacgt c 6091 <210> 375 <211> 6017 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas6, HsCO <400> 375 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatgtat ctgtcaaagg ttatcattgc 960 acgcgcgtgg agtagggatc tgtatcagct gcaccagggt ctgtggcatc ttttcccgaa 1020 ccgccccgac gcggcacgag actttctgtt tcacgttgaa aaaagaaaca cccccgaggg 1080 ctgtcatgtg ctcctgcagt ctgcccagat gccggtgagc acagctgtgg cgactgtgat 1140 caagaccaag caggtcgagt ttcagctcca ggtaggggtt ccactgtatt ttcgcctgag 1200 agctaatccg atcaaaacca tactggataa tcagaagagg ctcgacagca aaggaaatat 1260 taaaaggtgc cgggtcccgc tcatcaaaga ggctgagcaa atcgcttggc ttcaacggaa 1320 actggggaac gcagcccgcg tggaagacgt ccacccgatt agtgaacggc cccaatattt 1380 ttccggagac ggaaagagcg gcaagattca gacagtctgt ttcgaggggg tgctcaccat 1440 caatgatgcc cccgccctga tagacctggt gcagcagggc ataggccccg ctaaaagcat 1500 gggatgcgga ctgcttagtc tggcaccgct gtaataacat tggaagtgga taatctagag 1560 ggccctattc tatagtgtca cctaaatgct agagctcgct gatcagcctc gactgtgcct 1620 tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1680 gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1740 tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 1800 aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc 1860 tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 1920 gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 1980 ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggc 2040 atccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 2100 ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 2160 gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 2220 tcggtctatt cttttgattt ataagggatt ttggggattt cggcctattg gttaaaaaat 2280 gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt 2340 gtggaaagtc cccaggctcc ccaggcaggc agaagtatgc aaagcatgca tctcaattag 2400 tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg 2460 catctcaatt agtcagcaac catagtcccg cccctaactc cgcccatccc gcccctaact 2520 ccgcccagtt ccgcccattc tccgccccat ggctgactaa ttttttttat ttatgcagag 2580 gccgaggccg cctctgcctc tgagctattc cagaagtagt gaggaggctt ttttggaggc 2640 ctaggctttt gcaaaaagct cccgggagct tgtatatcca ttttcggatc tgatcaagag 2700 acaggatgag gatcgtttcg catgattgaa caagatggat tgcacgcagg ttctccggcc 2760 gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat 2820 gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg 2880 tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg 2940 ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta 3000 ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta 3060 tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc 3120 gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc 3180 gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg 3240 ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg 3300 ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt 3360 gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc 3420 ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc 3480 atcgccttct atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga 3540 ccgaccaagc gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg 3600 aaaggttggg cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg 3660 atctcatgct ggagttcttc gcccacccca acttgtttat tgcagcttat aatggttaca 3720 aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 3780 gtggtttgtc caaactcatc aatgtatctt atcatgtctg tataccgtcg acctctagct 3840 agagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa 3900 ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga 3960 gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt 4020 gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct 4080 cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 4140 cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 4200 acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 4260 ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 4320 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 4380 gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 4440 gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 4500 ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 4560 actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 4620 gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 4680 ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta 4740 ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 4800 gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 4860 tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 4920 tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 4980 aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 5040 aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg 5100 tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 5160 gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 5220 agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 5280 aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 5340 gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 5400 caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 5460 cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 5520 ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 5580 ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 5640 gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 5700 cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 5760 gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 5820 caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 5880 tactcttcct ttttcattat tattgaagca tttatcaggg ttattgtctc atgagcggat 5940 acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa 6000 aagtgccacc tgacgtc 6017 <210> 376 <211> 6016 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSCas6, HsCO <400> 376 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc atgtatctgt 960 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 1020 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 1080 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 1140 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 1200 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 1260 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 1320 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 1380 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 1440 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 1500 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctgtaa taatctagag 1560 ggccctattc tatagtgtca cctaaatgct agagctcgct gatcagcctc gactgtgcct 1620 tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1680 gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1740 tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 1800 aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc 1860 tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 1920 gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 1980 ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 2040 ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 2100 ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 2160 gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 2220 tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 2280 gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt 2340 gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 2400 cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 2460 atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 2520 cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 2580 ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 2640 taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggatct gatcaagaga 2700 caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg 2760 cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 2820 ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 2880 ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg 2940 gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 3000 tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 3060 ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 3120 accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 3180 atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 3240 tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc 3300 cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg 3360 tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 3420 gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 3480 tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac 3540 cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg ccttctatga 3600 aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc agcgcgggga 3660 tctcatgctg gagttcttcg cccaccccaa cttgtttatt gcagcttata atggttacaa 3720 ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 3780 tggtttgtcc aaactcatca atgtatctta tcatgtctgt ataccgtcga cctctagcta 3840 gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 3900 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 3960 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 4020 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 4080 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 4140 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 4200 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 4260 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 4320 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 4380 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 4440 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 4500 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 4560 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 4620 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 4680 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 4740 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 4800 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 4860 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 4920 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 4980 atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 5040 ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 5100 gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 5160 agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 5220 gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 5280 agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 5340 catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 5400 aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 5460 gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 5520 taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 5580 caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 5640 ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 5700 ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 5760 tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 5820 aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 5880 actcttcctt tttcattatt attgaagcat ttatcagggt tattgtctca tgagcggata 5940 catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 6000 agtgccacct gacgtc 6016 <210> 377 <211> 6736 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSV5FokI30aaCas8, HsCO <400> 377 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggctcaggc ggtaaaccca 960 tcccaaaccc cttgcttggt ctcgactcaa cccaattggt caaaagcgaa ctggaagaga 1020 aaaaatctga gctcagacac aagctgaagt atgtgcccca tgaatacata gaactcatag 1080 aaatagctcg aaaccccacg caggaccgga tccttgaaat gaaagttatg gagtttttta 1140 tgaaagtgta tgggtatcga ggagagcatc ttggtggaag tcggaaaccg gatggggcaa 1200 tatacactgt tgggagcccc attgactatg gtgtgatagt ggacaccaag gcatacagcg 1260 ggggatacaa tctgccgatc gggcaggcag atgagatgca gcgctatgtg gaggagaatc 1320 aaactaggaa caaacatatt aacccaaacg aatggtggaa agtgtatccc tcatctgtta 1380 cggagttcaa gttccttttt gtatctggcc actttaaagg aaactataaa gcacagctca 1440 cgcgacttaa ccacatcacc aattgtaacg gtgctgtact cagtgttgag gaactcctga 1500 tcggtggtga aatgataaaa gctggaacct tgacattgga ggaagtaagg agaaagttta 1560 ataatggtga gatcaatttc agcggctccg aaacgccggg tacatccgag tccgcgactc 1620 ctgagtcagg aggcagcggc tcctctggtg gaagcggctc aagtggaggg atgtatctgt 1680 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 1740 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 1800 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 1860 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 1920 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 1980 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 2040 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 2100 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 2160 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 2220 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctgtaa taatctagag 2280 ggccctattc tatagtgtca cctaaatgct agagctcgct gatcagcctc gactgtgcct 2340 tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 2400 gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 2460 tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 2520 aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc 2580 tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 2640 gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 2700 ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 2760 ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 2820 ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 2880 gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 2940 tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 3000 gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt 3060 gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 3120 cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 3180 atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 3240 cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 3300 ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 3360 taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggatct gatcaagaga 3420 caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg 3480 cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 3540 ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 3600 ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg 3660 gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 3720 tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 3780 ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 3840 accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 3900 atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 3960 tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc 4020 cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg 4080 tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 4140 gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 4200 tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac 4260 cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg ccttctatga 4320 aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc agcgcgggga 4380 tctcatgctg gagttcttcg cccaccccaa cttgtttatt gcagcttata atggttacaa 4440 ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 4500 tggtttgtcc aaactcatca atgtatctta tcatgtctgt ataccgtcga cctctagcta 4560 gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 4620 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 4680 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 4740 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 4800 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 4860 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 4920 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 4980 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 5040 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 5100 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 5160 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 5220 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 5280 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 5340 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 5400 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 5460 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 5520 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 5580 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 5640 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 5700 atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 5760 ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 5820 gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 5880 agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 5940 gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 6000 agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 6060 catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 6120 aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 6180 gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 6240 taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 6300 caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 6360 ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 6420 ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 6480 tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 6540 aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 6600 actcttcctt tttcattatt attgaagcat ttatcagggt tattgtctca tgagcggata 6660 catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 6720 agtgccacct gacgtc 6736 <210> 378 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3NLS, HsCO <400> 378 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatggag ccttttaaat atatttgtca 960 ttactggggt aagagttcca agagcctgac aaaaggcaat gatatacatc ttttgatcta 1020 tcactgtctc gacgtcgcag cggtagcgga ttgctggtgg gatcaaagtg tcgtgctcca 1080 gaacacgttt tgtcgaaacg aaatgctcag caagcagcgg gtaaaagcat ggctcctttt 1140 ctttattgct ctccacgaca taggcaaatt cgacattagg ttccagtaca aatctgcaga 1200 gagttggttg aaattgaacc cggccacccc tagcctgaac ggcccttcaa ctcagatgtg 1260 caggaaattt aaccatggag ccgctgggtt gtattggttt aatcaggaca gtttgtcaga 1320 gcaaagtctg ggggatttct tctccttttt tgacgccgcg cctcatcctt acgagagctg 1380 gtttccatgg gtcgaggccg tcacagggca ccatggcttt attcttcact ctcaggacca 1440 agacaaatct cgatgggaaa tgcctgccag tctggcgtct tacgccgcgc aggataagca 1500 agcacgagaa gaatggattt ccgtcttgga ggcgctgttt ctcacacccg ccgggctctc 1560 tatcaacgac ataccccccg attgctctag tctgcttgcc ggtttttgct cccttgccga 1620 ttggcttggt tcatggacga ccaccaatac gtttttgttc aatgaagatg caccatctga 1680 tataaatgca ttgaggacgt attttcaaga cagacagcaa gatgcctcca gagttttgga 1740 gctttctgga cttgtatcaa ataagagatg ctacgaagga gtgcatgctc tgctggacaa 1800 cggctaccag ccacgacaac ttcaagttct cgttgatgcc ctcccggtgg ctccggggtt 1860 gaccgtcata gaggcgccta ctggatcagg gaagaccgag acagccttgg cctatgcgtg 1920 gaaactgata gatcaacaga ttgccgactc agtgatcttc gcgctgccaa ctcaggcaac 1980 agccaacgcg atgctgacac gcatggaggc cagcgcaagt caccttttct ctagtccaaa 2040 tctgatactg gcccatggta attctaggtt taaccatctg tttcagtcca tcaagtctag 2100 ggcgataact gagcaaggac aggaagaagc ctgggttcaa tgctgccagt ggcttagcca 2160 gagtaacaag aaagtattct tgggacagat tggtgtctgc acaatagacc aagtactcat 2220 ctcagttttg cctgttaagc accgattcat acgaggactt ggaatcgggc gcagtgtcct 2280 catagtagat gaggtgcatg cttacgacac ctacatgaac ggtttgctcg aggcggtgct 2340 caaagcacaa gctgatgtcg gaggtagcgt gatccttctc agcgctacgc ttcctatgaa 2400 acagaagcag aagttgctcg atacctatgg tctgcatacg gatcctgtgg aaaataatag 2460 tgcctacccc ctcataaact ggaggggagt aaatggtgca cagaggtttg accttcttgc 2520 tcaccctgag cagcttcctc cccggttttc catacagccg gagccgattt gtcttgccga 2580 catgcttcca gatctcacaa tgctcgaacg gatgatcgcg gccgctaatg ccggcgcaca 2640 agtctgtctc atctgtaacc ttgtcgatgt agcgcaggtt tgttaccaac gactcaaaga 2700 actgaataat acacaagtag acatagatct gttccatgct cgctttacac tcaatgacag 2760 aagggaaaaa gaaaatcggg tcatctcaaa ttttggtaag aacggaaaac gaaacgttgg 2820 ccgaatcctc gtcgcaaccc aggtagtgga gcagtccctc gatgtggact ttgactggct 2880 tattacacag cactgccctg ctgacctcct gttccagcga cttggcagat tgcatagaca 2940 tcaccggaaa tatcggcctg caggttttga gataccagtc gcaactattc ttctccccga 3000 cggggaaggg tacgggcgac acgagcacat ctatagcaac gtacgggtaa tgtggcggac 3060 gcaacaacac atcgaggaac ttaacggagc atccctgttt ttccccgatg cctatagaca 3120 atggctcgac agtatttatg atgacgccga aatggacgaa cccgagtggg tcggaaatgg 3180 tatggataaa tttgaatccg cagaatgtga aaaacggttc aaagcacgga aggtcctcca 3240 gtgggctgag gagtattcat tgcaggataa cgacgaaacc atcttggctg tcactagaga 3300 cggcgaaatg tcccttccac tgcttcctta tgttcaaacc tcttctggga aacagcttct 3360 tgatggccag gtatatgagg acctgtccca cgaacaacag tacgaggcac ttgccttgaa 3420 ccgcgttaat gtacctttca cttggaaacg atcattttca gaggtcgtag atgaagatgg 3480 gctcctttgg ctggaaggca aacaaaacct ggatggatgg gtatggcagg gaaactctat 3540 tgtaataaca tacactggcg atgagggtat gacgagggtt ataccggcga atccgaaatc 3600 cgggtcaccc aaaaagaaga gaaaagtata ataacattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 379 <211> 4804 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(Hsa07) <400> 379 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc ctcaccgagg gcctatttcc 240 catgattcct tcatatttgc atatacgata caaggctgtt agagagataa ttggaattaa 300 tttgactgta aacacaaaga tattagtaca aaatacgtga cgtagaaagt aataatttct 360 tgggtagttt gcagttttaa aattatgttt taaaatggac tatcatatgc ttaccgtaac 420 ttgaaagtat ttcgatttct tggctttata tatcttgtgg aaaggacgaa acaccgagtt 480 ccccgcgcca gcggggataa accggttgat ttgcctgcat tggtgttaca cagtctgagt 540 tccccgcgcc agcggggata aaccgtaagt tgtgttcttc tttgcctagg ccttcaggag 600 ttccccgcgc cagcggggat aaaccgtttt tttcggaaag aaccagctgg ggctctaggg 660 ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 720 gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 780 ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc cctttagggt 840 tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 900 gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 960 ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 1020 ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag ctgatttaac 1080 aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc 1140 aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 1200 gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 1260 cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg 1320 cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct 1380 ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca 1440 aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca ggatgaggat 1500 cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1560 ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1620 ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1680 atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1740 cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1800 cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1860 atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1920 aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1980 tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca 2040 tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 2100 tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 2160 atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 2220 accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 2280 gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg accaagcgac 2340 gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt 2400 cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga 2460 gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag 2520 catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 2580 actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga gcttggcgta 2640 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 2700 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 2760 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 2820 atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 2880 gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 2940 ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 3000 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 3060 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 3120 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 3180 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 3240 tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 3300 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 3360 gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 3420 cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 3480 cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 3540 agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 3600 caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 3660 ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 3720 aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 3780 tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 3840 agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 3900 gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 3960 accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 4020 tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 4080 tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 4140 acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 4200 atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 4260 aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 4320 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 4380 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 4440 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 4500 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 4560 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 4620 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 4680 tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 4740 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 4800 cgtc 4804 <210> 380 <211> 8701 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polycistronic(HsCO), NLSCas7_NLSCse2_NLSCas5_NLSCas6 <400> 380 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc gaacagaaac 960 ttatatctga ggaggacctc ggatcgggca tgtcaaattt tattaatatt catgttctga 1020 tcagtcatag cccgagttgc ctgaatagag acgacatgaa tatgcagaaa gacgcaattt 1080 tcggtggcaa gaggcgagtc cgaataagca gccaaagtct taagcgagcc atgaggaaga 1140 gcggctatta tgcccagaat atcggcgagt cctcattgcg gaccatccac ctcgcccagt 1200 tgagagacgt cttgaggcag aaactggggg aaagattcga ccagaaaatc attgacaaga 1260 cccttgccct ccttagtggg aagagcgtgg acgaggctga aaaaatctct gccgacgccg 1320 taacgccctg ggttgtgggt gagattgctt ggttttgtga acaggtggcg aaggcggagg 1380 ccgataacct ggatgacaag aagctgctga aggtccttaa ggaggacata gctgccattc 1440 gggtcaattt gcagcaggga gtggatatcg cattgtccgg aagaatggct acatcaggca 1500 tgatgaccga gctgggcaag gtagacggag ccatgagtat cgcacacgcc atcaccaccc 1560 accaagtcga ctcagacatc gactggttca cagcagtaga tgacctccag gagcaggggt 1620 ctgcccacct tgggacacag gagttctctt ccggggtgtt ttatcgctat gctaatatca 1680 atctggcgca gctgcaagaa aacctggggg gagcctctcg agagcaggcc ctggagattg 1740 caactcacgt cgtgcatatg cttgcgacag aggtacctgg cgccaagcag aggacatacg 1800 ctgcttttaa tccagcagat atggtcatgg taaatttctc tgatatgcct ctctccatgg 1860 ccaacgcatt cgagaaggca gtgaaggcaa aggacgggtt cctgcagcca tcaattcaag 1920 cgtttaatca gtattgggac agagtggcga acggctatgg actgaacgga gccgcagctc 1980 agtttagcct cagcgatgtc gatcccataa ctgcacaggt gaaacagatg cctacgttgg 2040 aacagctgaa gtcatgggta agaaataacg gcgaagccgg cagcggcgag ggcagaggca 2100 gcctgctgac ctgcggcgac gtggaggaga accccggccc ccccaagaaa aagagaaaag 2160 taggatcggg cgattacaaa gatcacgatg gggactacaa ggatcacgat attgactata 2220 aggacgacga tgacaaggga tcgggcatgg ccgacgagat tgacgcaatg gcactttacc 2280 gggcctggca gcagttggat aatggttcat gtgcccagat tcgcagagtt agtgaacctg 2340 acgaactgag agatatcccc gcgttttaca gacttgtcca accgttcgga tgggagaacc 2400 cacggcacca acaagcactc cttcgaatgg tcttctgttt gtccgcagga aaaaatgtaa 2460 tcagacacca agacaaaaag agcgagcaaa ccacaggtat cagcctgggc agggcacttg 2520 ccaactctgg gcggatcaac gaaaggagaa tttttcagct gatacgcgct gatcggactg 2580 cggacatggt gcagctgcgc agactcctta ctcatgccga acctgtcctg gattggcccc 2640 tgatggcacg catgctgact tggtggggaa agagagaaag acagcaactg cttgaagact 2700 tcgtgctcac tacaaataag aatgccggat ccggagaagg aaggggatcc ctcctcacat 2760 gtggagatgt cgaagaaaat cctggacctc ccaagaaaaa gagaaaagta ggatcgggca 2820 tgcggagcta tctcatcctg agactggccg gaccaatgca ggcctgggga cagcctacct 2880 tcgaaggtac acgccccaca ggccgctttc ctaccaggag cggcctgctg ggcctgcttg 2940 gcgcttgtct tgggatccag cgcgatgata ctagctccct gcaagcactg tcagagagcg 3000 tgcagtttgc cgtaagatgc gacgaactga tccttgatga taggcgggtc agtgtcactg 3060 gtctccggga ctaccacacg gtgctggggg cccgggagga ttataggggc ctgaaaagtc 3120 acgagacgat tcaaacctgg cgcgaatatc tgtgcgatgc cagcttcacc gtggccctgt 3180 ggctgactcc acatgccact atggtcatca gtgaactgga aaaggctgtt cttaagcctc 3240 gatatactcc gtatctgggc cgccggagtt gtccacttac acacccactt ttcctcggca 3300 cctgccaggc cagcgaccct caaaaggccc ttctgaatta cgagccagtt ggcggtgaca 3360 tatacagcga agagtccgtg acgggacacc atcttaagtt caccgctcgg gacgagccca 3420 tgattaccct cccacggcag ttcgcatcaa gggagtggta cgtcataaag gggggcatgg 3480 atgtgagtca ggggtctggg gaggggcggg ggtctttgtt gacttgcggg gatgttgagg 3540 agaacccagg gccacccaag aaaaagagaa aagtaggctc aggcggtaaa cccatcccaa 3600 accccttgct tggtctcgac tcaaccggat cgggcatgta tctgtcaaag gttatcattg 3660 cacgcgcgtg gagtagggat ctgtatcagc tgcaccaggg tctgtggcat cttttcccga 3720 accgccccga cgcggcacga gactttctgt ttcacgttga aaaaagaaac acccccgagg 3780 gctgtcatgt gctcctgcag tctgcccaga tgccggtgag cacagctgtg gcgactgtga 3840 tcaagaccaa gcaggtcgag tttcagctcc aggtaggggt tccactgtat tttcgcctga 3900 gagctaatcc gatcaaaacc atactggata atcagaagag gctcgacagc aaaggaaata 3960 ttaaaaggtg ccgggtcccg ctcatcaaag aggctgagca aatcgcttgg cttcaacgga 4020 aactggggaa cgcagcccgc gtggaagacg tccacccgat tagtgaacgg ccccaatatt 4080 tttccggaga cggaaagagc ggcaagattc agacagtctg tttcgagggg gtgctcacca 4140 tcaatgatgc ccccgccctg atagacctgg tgcagcaggg cataggcccc gctaaaagca 4200 tgggatgcgg actgcttagt ctggcaccgc tgtaataatc tagagggccc tattctatag 4260 tgtcacctaa atgctagagc tcgctgatca gcctcgactg tgccttctag ttgccagcca 4320 tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 4380 ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 4440 gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 4500 ggggatgcgg tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctctaggggg 4560 tatccccacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 4620 gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 4680 ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc 4740 cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 4800 agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 4860 aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 4920 gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa 4980 aaatttaacg cgaattaatt ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 5040 gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 5100 gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 5160 caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 5220 attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctctg 5280 cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 5340 agctcccggg agcttgtata tccattttcg gatctgatca agagacagga tgaggatcgt 5400 ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 5460 tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 5520 tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 5580 aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 5640 ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 5700 ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 5760 caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 5820 atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 5880 acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc 5940 ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 6000 aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 6060 aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 6120 gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 6180 ttcttgacga gttcttctga gcgggactct ggggttcgaa atgaccgacc aagcgacgcc 6240 caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 6300 aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 6360 cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 6420 cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 6480 catcaatgta tcttatcatg tctgtatacc gtcgacctct agctagagct tggcgtaatc 6540 atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 6600 agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 6660 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 6720 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 6780 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 6840 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 6900 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 6960 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 7020 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 7080 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 7140 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 7200 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 7260 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 7320 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 7380 tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 7440 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 7500 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 7560 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 7620 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 7680 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 7740 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 7800 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 7860 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 7920 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 7980 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 8040 ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 8100 atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 8160 taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 8220 catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 8280 atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 8340 acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 8400 aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 8460 ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 8520 cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 8580 ttattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 8640 ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 8700 c 8701 <210> 381 <211> 10300 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polycistronic(HsCO), NLSCas7_NLSCse2_NLSCas5_NLSCas6_NLSCas8 <400> 381 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc gaacagaaac 960 ttatatctga ggaggacctc ggatcgggca tgtcaaattt tattaatatt catgttctga 1020 tcagtcatag cccgagttgc ctgaatagag acgacatgaa tatgcagaaa gacgcaattt 1080 tcggtggcaa gaggcgagtc cgaataagca gccaaagtct taagcgagcc atgaggaaga 1140 gcggctatta tgcccagaat atcggcgagt cctcattgcg gaccatccac ctcgcccagt 1200 tgagagacgt cttgaggcag aaactggggg aaagattcga ccagaaaatc attgacaaga 1260 cccttgccct ccttagtggg aagagcgtgg acgaggctga aaaaatctct gccgacgccg 1320 taacgccctg ggttgtgggt gagattgctt ggttttgtga acaggtggcg aaggcggagg 1380 ccgataacct ggatgacaag aagctgctga aggtccttaa ggaggacata gctgccattc 1440 gggtcaattt gcagcaggga gtggatatcg cattgtccgg aagaatggct acatcaggca 1500 tgatgaccga gctgggcaag gtagacggag ccatgagtat cgcacacgcc atcaccaccc 1560 accaagtcga ctcagacatc gactggttca cagcagtaga tgacctccag gagcaggggt 1620 ctgcccacct tgggacacag gagttctctt ccggggtgtt ttatcgctat gctaatatca 1680 atctggcgca gctgcaagaa aacctggggg gagcctctcg agagcaggcc ctggagattg 1740 caactcacgt cgtgcatatg cttgcgacag aggtacctgg cgccaagcag aggacatacg 1800 ctgcttttaa tccagcagat atggtcatgg taaatttctc tgatatgcct ctctccatgg 1860 ccaacgcatt cgagaaggca gtgaaggcaa aggacgggtt cctgcagcca tcaattcaag 1920 cgtttaatca gtattgggac agagtggcga acggctatgg actgaacgga gccgcagctc 1980 agtttagcct cagcgatgtc gatcccataa ctgcacaggt gaaacagatg cctacgttgg 2040 aacagctgaa gtcatgggta agaaataacg gcgaagccgg cagcggcgag ggcagaggca 2100 gcctgctgac ctgcggcgac gtggaggaga accccggccc ccccaagaaa aagagaaaag 2160 taggatcggg cgattacaaa gatcacgatg gggactacaa ggatcacgat attgactata 2220 aggacgacga tgacaaggga tcgggcatgg ccgacgagat tgacgcaatg gcactttacc 2280 gggcctggca gcagttggat aatggttcat gtgcccagat tcgcagagtt agtgaacctg 2340 acgaactgag agatatcccc gcgttttaca gacttgtcca accgttcgga tgggagaacc 2400 cacggcacca acaagcactc cttcgaatgg tcttctgttt gtccgcagga aaaaatgtaa 2460 tcagacacca agacaaaaag agcgagcaaa ccacaggtat cagcctgggc agggcacttg 2520 ccaactctgg gcggatcaac gaaaggagaa tttttcagct gatacgcgct gatcggactg 2580 cggacatggt gcagctgcgc agactcctta ctcatgccga acctgtcctg gattggcccc 2640 tgatggcacg catgctgact tggtggggaa agagagaaag acagcaactg cttgaagact 2700 tcgtgctcac tacaaataag aatgccggat ccggagaagg aaggggatcc ctcctcacat 2760 gtggagatgt cgaagaaaat cctggacctc ccaagaaaaa gagaaaagta ggatcgggca 2820 tgcggagcta tctcatcctg agactggccg gaccaatgca ggcctgggga cagcctacct 2880 tcgaaggtac acgccccaca ggccgctttc ctaccaggag cggcctgctg ggcctgcttg 2940 gcgcttgtct tgggatccag cgcgatgata ctagctccct gcaagcactg tcagagagcg 3000 tgcagtttgc cgtaagatgc gacgaactga tccttgatga taggcgggtc agtgtcactg 3060 gtctccggga ctaccacacg gtgctggggg cccgggagga ttataggggc ctgaaaagtc 3120 acgagacgat tcaaacctgg cgcgaatatc tgtgcgatgc cagcttcacc gtggccctgt 3180 ggctgactcc acatgccact atggtcatca gtgaactgga aaaggctgtt cttaagcctc 3240 gatatactcc gtatctgggc cgccggagtt gtccacttac acacccactt ttcctcggca 3300 cctgccaggc cagcgaccct caaaaggccc ttctgaatta cgagccagtt ggcggtgaca 3360 tatacagcga agagtccgtg acgggacacc atcttaagtt caccgctcgg gacgagccca 3420 tgattaccct cccacggcag ttcgcatcaa gggagtggta cgtcataaag gggggcatgg 3480 atgtgagtca ggggtctggg gaggggcggg ggtctttgtt gacttgcggg gatgttgagg 3540 agaacccagg gccacccaag aaaaagagaa aagtaggctc aggcggtaaa cccatcccaa 3600 accccttgct tggtctcgac tcaaccggat cgggcatgta tctgtcaaag gttatcattg 3660 cacgcgcgtg gagtagggat ctgtatcagc tgcaccaggg tctgtggcat cttttcccga 3720 accgccccga cgcggcacga gactttctgt ttcacgttga aaaaagaaac acccccgagg 3780 gctgtcatgt gctcctgcag tctgcccaga tgccggtgag cacagctgtg gcgactgtga 3840 tcaagaccaa gcaggtcgag tttcagctcc aggtaggggt tccactgtat tttcgcctga 3900 gagctaatcc gatcaaaacc atactggata atcagaagag gctcgacagc aaaggaaata 3960 ttaaaaggtg ccgggtcccg ctcatcaaag aggctgagca aatcgcttgg cttcaacgga 4020 aactggggaa cgcagcccgc gtggaagacg tccacccgat tagtgaacgg ccccaatatt 4080 tttccggaga cggaaagagc ggcaagattc agacagtctg tttcgagggg gtgctcacca 4140 tcaatgatgc ccccgccctg atagacctgg tgcagcaggg cataggcccc gctaaaagca 4200 tgggatgcgg actgcttagt ctggcaccgc tgggatccgg agagggcaga ggaagtctgc 4260 taacatgcgg tgacgtcgag gagaatcctg gacctcccaa gaaaaagaga aaagtaggat 4320 cgggcatgaa tttgctcatt gataattgga ttccggtgcg cccccggaac ggtgggaaag 4380 tgcagatcat caatttgcaa agtctctact gttccaggga ccagtggaga ctcagcctgc 4440 cacgggatga tatggagctg gcggcgttgg ctctgctcgt atgcatcggc cagattattg 4500 cgccagcaaa ggatgacgtt gaattccggc atcggataat gaaccccctt actgaagatg 4560 agttccagca gcttatcgcc ccatggatcg acatgttcta cctcaaccac gccgagcatc 4620 cttttatgca gaccaaggga gtcaaggcga atgatgtgac tcccatggag aagctgctgg 4680 ccggtgtatc tggggcgacc aactgcgcat tcgtgaatca gcctggacag ggggaggccc 4740 tctgtggagg ctgcactgct atagcacttt ttaaccaagc taatcaagcc cccggctttg 4800 gtggagggtt taagagtgga ttgagggggg gcactcccgt aaccactttt gtgaggggaa 4860 ttgatctgag gtctactgtg ttgctgaacg tcctcacact cccaaggctc cagaagcagt 4920 tcccaaacga aagtcatacc gaaaaccagc ccacatggat caagcccatc aaatctaatg 4980 agagcatacc ggctagcagt attggatttg tacggggtct gttctggcag ccagctcaca 5040 tcgagctgtg tgatcctatt gggatcggca agtgctcttg ttgtgggcag gagtccaacc 5100 ttaggtatac tggatttctg aaagagaagt ttacctttac agtaaatggg ctctggcccc 5160 acccccactc accttgcctt gtgacagtga aaaaggggga agtcgaggag aagtttctgg 5220 cctttacaac ttctgcccct tcctggactc agatttccag agtggtggta gataagataa 5280 ttcaaaacga gaatggcaat agagtggccg ccgtggtgaa ccagtttcgc aacatcgccc 5340 ctcagtcccc cctggagctg attatgggcg gttatcggaa taaccaggcc agtatactcg 5400 agcgacggca cgatgtcctc atgttcaatc aaggttggca gcaatatggc aatgtgatta 5460 acgagatcgt aaccgtgggc ctgggatata agaccgccct gcggaaggcg ttgtatactt 5520 ttgcagaagg ctttaagaat aaggatttta agggtgccgg cgtgagtgtc catgaaacag 5580 ctgaacggca cttttatcgg cagtccgagc tgttgatacc agacgtgctg gctaatgtga 5640 acttctcaca ggccgacgaa gtgatcgctg atctgcggga taaactgcac caactgtgcg 5700 agatgctgtt taatcaaagc gtcgctcctt atgcccacca cccaaagctg atctccacgc 5760 tggccctggc gcgcgccaca ctttataaac atctccgcga actgaaaccc caggggggcc 5820 ccagcaatgg ctaataatct agagggccct attctatagt gtcacctaaa tgctagagct 5880 cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 5940 gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 6000 attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 6060 agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 6120 gcttctgagg cggaaagaac cagctggggc tctagggggt atccccacgc gccctgtagc 6180 ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 6240 gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 6300 ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac 6360 ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag 6420 acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 6480 actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg 6540 atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattaattc 6600 tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta 6660 tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag 6720 caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa 6780 ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc catggctgac 6840 taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta ttccagaagt 6900 agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga gcttgtatat 6960 ccattttcgg atctgatcaa gagacaggat gaggatcgtt tcgcatgatt gaacaagatg 7020 gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat gactgggcac 7080 aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag gggcgcccgg 7140 ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaggac gaggcagcgc 7200 ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac gttgtcactg 7260 aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc ctgtcatctc 7320 accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg ctgcatacgc 7380 ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag cgagcacgta 7440 ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat caggggctcg 7500 cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag gatctcgtcg 7560 tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc ttttctggat 7620 tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg ttggctaccc 7680 gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg ctttacggta 7740 tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag ttcttctgag 7800 cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt 7860 cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 7920 ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 7980 tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 8040 atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 8100 ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc tgtttcctgt 8160 gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 8220 agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 8280 tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 8340 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8400 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8460 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8520 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8580 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8640 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8700 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 8760 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 8820 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 8880 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 8940 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9000 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9060 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9120 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9180 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9240 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9300 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9360 catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 9420 ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 9480 aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 9540 ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 9600 caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 9660 attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 9720 agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 9780 actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 9840 ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 9900 ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 9960 gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 10020 atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 10080 cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 10140 gacacggaaa tgttgaatac tcatactctt cctttttcat tattattgaa gcatttatca 10200 gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 10260 ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc 10300 <210> 382 <211> 10978 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polycistronic(HsCO), NLSCas7_NLSCse2_NLSCas5_NLSCas6_NLSFokI30aaCas8 <400> 382 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc gaacagaaac 960 ttatatctga ggaggacctc ggatcgggca tgtcaaattt tattaatatt catgttctga 1020 tcagtcatag cccgagttgc ctgaatagag acgacatgaa tatgcagaaa gacgcaattt 1080 tcggtggcaa gaggcgagtc cgaataagca gccaaagtct taagcgagcc atgaggaaga 1140 gcggctatta tgcccagaat atcggcgagt cctcattgcg gaccatccac ctcgcccagt 1200 tgagagacgt cttgaggcag aaactggggg aaagattcga ccagaaaatc attgacaaga 1260 cccttgccct ccttagtggg aagagcgtgg acgaggctga aaaaatctct gccgacgccg 1320 taacgccctg ggttgtgggt gagattgctt ggttttgtga acaggtggcg aaggcggagg 1380 ccgataacct ggatgacaag aagctgctga aggtccttaa ggaggacata gctgccattc 1440 gggtcaattt gcagcaggga gtggatatcg cattgtccgg aagaatggct acatcaggca 1500 tgatgaccga gctgggcaag gtagacggag ccatgagtat cgcacacgcc atcaccaccc 1560 accaagtcga ctcagacatc gactggttca cagcagtaga tgacctccag gagcaggggt 1620 ctgcccacct tgggacacag gagttctctt ccggggtgtt ttatcgctat gctaatatca 1680 atctggcgca gctgcaagaa aacctggggg gagcctctcg agagcaggcc ctggagattg 1740 caactcacgt cgtgcatatg cttgcgacag aggtacctgg cgccaagcag aggacatacg 1800 ctgcttttaa tccagcagat atggtcatgg taaatttctc tgatatgcct ctctccatgg 1860 ccaacgcatt cgagaaggca gtgaaggcaa aggacgggtt cctgcagcca tcaattcaag 1920 cgtttaatca gtattgggac agagtggcga acggctatgg actgaacgga gccgcagctc 1980 agtttagcct cagcgatgtc gatcccataa ctgcacaggt gaaacagatg cctacgttgg 2040 aacagctgaa gtcatgggta agaaataacg gcgaagccgg cagcggcgag ggcagaggca 2100 gcctgctgac ctgcggcgac gtggaggaga accccggccc ccccaagaaa aagagaaaag 2160 taggatcggg cgattacaaa gatcacgatg gggactacaa ggatcacgat attgactata 2220 aggacgacga tgacaaggga tcgggcatgg ccgacgagat tgacgcaatg gcactttacc 2280 gggcctggca gcagttggat aatggttcat gtgcccagat tcgcagagtt agtgaacctg 2340 acgaactgag agatatcccc gcgttttaca gacttgtcca accgttcgga tgggagaacc 2400 cacggcacca acaagcactc cttcgaatgg tcttctgttt gtccgcagga aaaaatgtaa 2460 tcagacacca agacaaaaag agcgagcaaa ccacaggtat cagcctgggc agggcacttg 2520 ccaactctgg gcggatcaac gaaaggagaa tttttcagct gatacgcgct gatcggactg 2580 cggacatggt gcagctgcgc agactcctta ctcatgccga acctgtcctg gattggcccc 2640 tgatggcacg catgctgact tggtggggaa agagagaaag acagcaactg cttgaagact 2700 tcgtgctcac tacaaataag aatgccggat ccggagaagg aaggggatcc ctcctcacat 2760 gtggagatgt cgaagaaaat cctggacctc ccaagaaaaa gagaaaagta ggatcgggca 2820 tgcggagcta tctcatcctg agactggccg gaccaatgca ggcctgggga cagcctacct 2880 tcgaaggtac acgccccaca ggccgctttc ctaccaggag cggcctgctg ggcctgcttg 2940 gcgcttgtct tgggatccag cgcgatgata ctagctccct gcaagcactg tcagagagcg 3000 tgcagtttgc cgtaagatgc gacgaactga tccttgatga taggcgggtc agtgtcactg 3060 gtctccggga ctaccacacg gtgctggggg cccgggagga ttataggggc ctgaaaagtc 3120 acgagacgat tcaaacctgg cgcgaatatc tgtgcgatgc cagcttcacc gtggccctgt 3180 ggctgactcc acatgccact atggtcatca gtgaactgga aaaggctgtt cttaagcctc 3240 gatatactcc gtatctgggc cgccggagtt gtccacttac acacccactt ttcctcggca 3300 cctgccaggc cagcgaccct caaaaggccc ttctgaatta cgagccagtt ggcggtgaca 3360 tatacagcga agagtccgtg acgggacacc atcttaagtt caccgctcgg gacgagccca 3420 tgattaccct cccacggcag ttcgcatcaa gggagtggta cgtcataaag gggggcatgg 3480 atgtgagtca ggggtctggg gaggggcggg ggtctttgtt gacttgcggg gatgttgagg 3540 agaacccagg gccacccaag aaaaagagaa aagtaggctc aggcggtaaa cccatcccaa 3600 accccttgct tggtctcgac tcaaccggat cgggcatgta tctgtcaaag gttatcattg 3660 cacgcgcgtg gagtagggat ctgtatcagc tgcaccaggg tctgtggcat cttttcccga 3720 accgccccga cgcggcacga gactttctgt ttcacgttga aaaaagaaac acccccgagg 3780 gctgtcatgt gctcctgcag tctgcccaga tgccggtgag cacagctgtg gcgactgtga 3840 tcaagaccaa gcaggtcgag tttcagctcc aggtaggggt tccactgtat tttcgcctga 3900 gagctaatcc gatcaaaacc atactggata atcagaagag gctcgacagc aaaggaaata 3960 ttaaaaggtg ccgggtcccg ctcatcaaag aggctgagca aatcgcttgg cttcaacgga 4020 aactggggaa cgcagcccgc gtggaagacg tccacccgat tagtgaacgg ccccaatatt 4080 tttccggaga cggaaagagc ggcaagattc agacagtctg tttcgagggg gtgctcacca 4140 tcaatgatgc ccccgccctg atagacctgg tgcagcaggg cataggcccc gctaaaagca 4200 tgggatgcgg actgcttagt ctggcaccgc tgggatccgg agagggcaga ggaagtctgc 4260 taacatgcgg tgacgtcgag gagaatcctg gacctcccaa gaaaaagaga aaagtaggcg 4320 gctcacaatt ggtcaaaagc gaactggaag agaaaaaatc tgagctcaga cacaagctga 4380 agtatgtgcc ccatgaatac atagaactca tagaaatagc tcgaaacccc acgcaggacc 4440 ggatccttga aatgaaagtt atggagtttt ttatgaaagt gtatgggtat cgaggagagc 4500 atcttggtgg aagtcggaaa ccggatgggg caatatacac tgttgggagc cccattgact 4560 atggtgtgat agtggacacc aaggcataca gcgggggata caatctgccg atcgggcagg 4620 cagatgagat gcagcgctat gtggaggaga atcaaactag gaacaaacat attaacccaa 4680 acgaatggtg gaaagtgtat ccctcatctg ttacggagtt caagttcctt tttgtatctg 4740 gccactttaa aggaaactat aaagcacagc tcacgcgact taaccacatc accaattgta 4800 acggtgctgt actcagtgtt gaggaactcc tgatcggtgg tgaaatgata aaagctggaa 4860 ccttgacatt ggaggaagta aggagaaagt ttaataatgg tgagatcaat ttcagcggct 4920 ccgaaacgcc gggtacatcc gagtccgcga ctcctgagtc aggaggcagc ggctcctctg 4980 gtggaagcgg ctcaagtgga gggatgaatt tgctcattga taattggatt ccggtgcgcc 5040 cccggaacgg tgggaaagtg cagatcatca atttgcaaag tctctactgt tccagggacc 5100 agtggagact cagcctgcca cgggatgata tggagctggc ggcgttggct ctgctcgtat 5160 gcatcggcca gattattgcg ccagcaaagg atgacgttga attccggcat cggataatga 5220 acccccttac tgaagatgag ttccagcagc ttatcgcccc atggatcgac atgttctacc 5280 tcaaccacgc cgagcatcct tttatgcaga ccaagggagt caaggcgaat gatgtgactc 5340 ccatggagaa gctgctggcc ggtgtatctg gggcgaccaa ctgcgcattc gtgaatcagc 5400 ctggacaggg ggaggccctc tgtggaggct gcactgctat agcacttttt aaccaagcta 5460 atcaagcccc cggctttggt ggagggttta agagtggatt gagggggggc actcccgtaa 5520 ccacttttgt gaggggaatt gatctgaggt ctactgtgtt gctgaacgtc ctcacactcc 5580 caaggctcca gaagcagttc ccaaacgaaa gtcataccga aaaccagccc acatggatca 5640 agcccatcaa atctaatgag agcataccgg ctagcagtat tggatttgta cggggtctgt 5700 tctggcagcc agctcacatc gagctgtgtg atcctattgg gatcggcaag tgctcttgtt 5760 gtgggcagga gtccaacctt aggtatactg gatttctgaa agagaagttt acctttacag 5820 taaatgggct ctggccccac ccccactcac cttgccttgt gacagtgaaa aagggggaag 5880 tcgaggagaa gtttctggcc tttacaactt ctgccccttc ctggactcag atttccagag 5940 tggtggtaga taagataatt caaaacgaga atggcaatag agtggccgcc gtggtgaacc 6000 agtttcgcaa catcgcccct cagtcccccc tggagctgat tatgggcggt tatcggaata 6060 accaggccag tatactcgag cgacggcacg atgtcctcat gttcaatcaa ggttggcagc 6120 aatatggcaa tgtgattaac gagatcgtaa ccgtgggcct gggatataag accgccctgc 6180 ggaaggcgtt gtatactttt gcagaaggct ttaagaataa ggattttaag ggtgccggcg 6240 tgagtgtcca tgaaacagct gaacggcact tttatcggca gtccgagctg ttgataccag 6300 acgtgctggc taatgtgaac ttctcacagg ccgacgaagt gatcgctgat ctgcgggata 6360 aactgcacca actgtgcgag atgctgttta atcaaagcgt cgctccttat gcccaccacc 6420 caaagctgat ctccacgctg gccctggcgc gcgccacact ttataaacat ctccgcgaac 6480 tgaaacccca ggggggcccc agcaatggct aataatctag agggccctat tctatagtgt 6540 cacctaaatg ctagagctcg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 6600 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 6660 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 6720 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 6780 gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 6840 ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 6900 accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 6960 gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 7020 tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 7080 gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 7140 agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 7200 ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 7260 tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 7320 ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 7380 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 7440 ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 7500 ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 7560 ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 7620 tcccgggagc ttgtatatcc attttcggat ctgatcaaga gacaggatga ggatcgtttc 7680 gcatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat 7740 tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt 7800 cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac 7860 tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg 7920 tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc 7980 aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa 8040 tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc 8100 gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg 8160 aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg cgcatgcccg 8220 acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa 8280 atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg 8340 acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct 8400 tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc 8460 ttgacgagtt cttctgagcg ggactctggg gttcgaaatg accgaccaag cgacgcccaa 8520 cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg gcttcggaat 8580 cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc tggagttctt 8640 cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 8700 aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 8760 caatgtatct tatcatgtct gtataccgtc gacctctagc tagagcttgg cgtaatcatg 8820 gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 8880 cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 8940 gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 9000 cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 9060 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 9120 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 9180 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 9240 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 9300 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 9360 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 9420 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 9480 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 9540 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 9600 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 9660 aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 9720 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 9780 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 9840 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 9900 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 9960 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 10020 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 10080 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 10140 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 10200 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 10260 gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 10320 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 10380 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 10440 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 10500 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 10560 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 10620 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 10680 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 10740 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 10800 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcatta 10860 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 10920 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtc 10978 <210> 383 <211> 10813 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polycistronic(HsCO), NLSCas7_NLSCse2_NLSCas5_NLSCas6_NLSFokI30aaCas8, no epitope tags <400> 383 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcagggg tctggggagg ggcgggggtc tttgttgact tgcggggatg 3420 ttgaggagaa tcctggacct cccaaaaaaa aacggaaggt gggctcaggc atgtatctgt 3480 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 3540 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 3600 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 3660 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 3720 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 3780 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 3840 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 3900 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 3960 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 4020 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctggga tccggagagg 4080 gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct cccaagaaaa 4140 agagaaaagt aggcggctca caattggtca aaagcgaact ggaagagaaa aaatctgagc 4200 tcagacacaa gctgaagtat gtgccccatg aatacataga actcatagaa atagctcgaa 4260 accccacgca ggaccggatc cttgaaatga aagttatgga gttttttatg aaagtgtatg 4320 ggtatcgagg agagcatctt ggtggaagtc ggaaaccgga tggggcaata tacactgttg 4380 ggagccccat tgactatggt gtgatagtgg acaccaaggc atacagcggg ggatacaatc 4440 tgccgatcgg gcaggcagat gagatgcagc gctatgtgga ggagaatcaa actaggaaca 4500 aacatattaa cccaaacgaa tggtggaaag tgtatccctc atctgttacg gagttcaagt 4560 tcctttttgt atctggccac tttaaaggaa actataaagc acagctcacg cgacttaacc 4620 acatcaccaa ttgtaacggt gctgtactca gtgttgagga actcctgatc ggtggtgaaa 4680 tgataaaagc tggaaccttg acattggagg aagtaaggag aaagtttaat aatggtgaga 4740 tcaatttcag cggctccgaa acgccgggta catccgagtc cgcgactcct gagtcaggag 4800 gcagcggctc ctctggtgga agcggctcaa gtggagggat gaatttgctc attgataatt 4860 ggattccggt gcgcccccgg aacggtggga aagtgcagat catcaatttg caaagtctct 4920 actgttccag ggaccagtgg agactcagcc tgccacggga tgatatggag ctggcggcgt 4980 tggctctgct cgtatgcatc ggccagatta ttgcgccagc aaaggatgac gttgaattcc 5040 ggcatcggat aatgaacccc cttactgaag atgagttcca gcagcttatc gccccatgga 5100 tcgacatgtt ctacctcaac cacgccgagc atccttttat gcagaccaag ggagtcaagg 5160 cgaatgatgt gactcccatg gagaagctgc tggccggtgt atctggggcg accaactgcg 5220 cattcgtgaa tcagcctgga cagggggagg ccctctgtgg aggctgcact gctatagcac 5280 tttttaacca agctaatcaa gcccccggct ttggtggagg gtttaagagt ggattgaggg 5340 ggggcactcc cgtaaccact tttgtgaggg gaattgatct gaggtctact gtgttgctga 5400 acgtcctcac actcccaagg ctccagaagc agttcccaaa cgaaagtcat accgaaaacc 5460 agcccacatg gatcaagccc atcaaatcta atgagagcat accggctagc agtattggat 5520 ttgtacgggg tctgttctgg cagccagctc acatcgagct gtgtgatcct attgggatcg 5580 gcaagtgctc ttgttgtggg caggagtcca accttaggta tactggattt ctgaaagaga 5640 agtttacctt tacagtaaat gggctctggc cccaccccca ctcaccttgc cttgtgacag 5700 tgaaaaaggg ggaagtcgag gagaagtttc tggcctttac aacttctgcc ccttcctgga 5760 ctcagatttc cagagtggtg gtagataaga taattcaaaa cgagaatggc aatagagtgg 5820 ccgccgtggt gaaccagttt cgcaacatcg cccctcagtc ccccctggag ctgattatgg 5880 gcggttatcg gaataaccag gccagtatac tcgagcgacg gcacgatgtc ctcatgttca 5940 atcaaggttg gcagcaatat ggcaatgtga ttaacgagat cgtaaccgtg ggcctgggat 6000 ataagaccgc cctgcggaag gcgttgtata cttttgcaga aggctttaag aataaggatt 6060 ttaagggtgc cggcgtgagt gtccatgaaa cagctgaacg gcacttttat cggcagtccg 6120 agctgttgat accagacgtg ctggctaatg tgaacttctc acaggccgac gaagtgatcg 6180 ctgatctgcg ggataaactg caccaactgt gcgagatgct gtttaatcaa agcgtcgctc 6240 cttatgccca ccacccaaag ctgatctcca cgctggccct ggcgcgcgcc acactttata 6300 aacatctccg cgaactgaaa ccccaggggg gccccagcaa tggctaataa tctagagggc 6360 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 6420 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 6480 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 6540 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 6600 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 6660 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 6720 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 6780 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc 6840 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 6900 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 6960 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 7020 gtctattctt ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag 7080 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 7140 gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 7200 caaccaggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc 7260 tcaattagtc agcaaccata gtcccgcccc taactccgcc catcccgccc ctaactccgc 7320 ccagttccgc ccattctccg ccccatggct gactaatttt ttttatttat gcagaggccg 7380 aggccgcctc tgcctctgag ctattccaga agtagtgagg aggctttttt ggaggcctag 7440 gcttttgcaa aaagctcccg ggagcttgta tatccatttt cggatctgat caagagacag 7500 gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 7560 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 7620 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 7680 gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 7740 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 7800 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 7860 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 7920 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 7980 aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 8040 aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga 8100 atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 8160 cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 8220 aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 8280 ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 8340 ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 8400 gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 8460 catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata 8520 aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 8580 tttgtccaaa ctcatcaatg tatcttatca tgtctgtata ccgtcgacct ctagctagag 8640 cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 8700 acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 8760 actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 8820 gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 8880 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 8940 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 9000 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 9060 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 9120 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 9180 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 9240 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 9300 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 9360 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 9420 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 9480 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 9540 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 9600 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 9660 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 9720 gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 9780 aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 9840 acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 9900 gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 9960 cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 10020 cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 10080 tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 10140 cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 10200 gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 10260 cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 10320 ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 10380 gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 10440 taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 10500 gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 10560 acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 10620 aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 10680 cttccttttt cattattatt gaagcattta tcagggttat tgtctcatga gcggatacat 10740 atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 10800 gccacctgac gtc 10813 <210> 384 <211> 10813 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Polycistronic(HsCO), NLSCas7_NLSCse2_NLSCas5_NLSFokI30aaCas6_NLSCas8, no epitope tags <400> 384 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcagggg tctggggagg ggcgggggtc tttgttgact tgcggggatg 3420 ttgaggagaa tcctggacct cccaaaaaaa aacggaaggt gggctcaggc caattggtca 3480 aaagcgaact ggaagagaaa aaatctgagc tcagacacaa gctgaagtat gtgccccatg 3540 aatacataga actcatagaa atagctcgaa accccacgca ggaccggatc cttgaaatga 3600 aagttatgga gttttttatg aaagtgtatg ggtatcgagg agagcatctt ggtggaagtc 3660 ggaaaccgga tggggcaata tacactgttg ggagccccat tgactatggt gtgatagtgg 3720 acaccaaggc atacagcggg ggatacaatc tgccgatcgg gcaggcagat gagatgcagc 3780 gctatgtgga ggagaatcaa actaggaaca aacatattaa cccaaacgaa tggtggaaag 3840 tgtatccctc atctgttacg gagttcaagt tcctttttgt atctggccac tttaaaggaa 3900 actataaagc acagctcacg cgacttaacc acatcaccaa ttgtaacggt gctgtactca 3960 gtgttgagga actcctgatc ggtggtgaaa tgataaaagc tggaaccttg acattggagg 4020 aagtaaggag aaagtttaat aatggtgaga tcaatttcag cggctccgaa acgccgggta 4080 catccgagtc cgcgactcct gagtcaggag gcagcggctc ctctggtgga agcggctcaa 4140 gtggagggat gtatctgtca aaggttatca ttgcacgcgc gtggagtagg gatctgtatc 4200 agctgcacca gggtctgtgg catcttttcc cgaaccgccc cgacgcggca cgagactttc 4260 tgtttcacgt tgaaaaaaga aacacccccg agggctgtca tgtgctcctg cagtctgccc 4320 agatgccggt gagcacagct gtggcgactg tgatcaagac caagcaggtc gagtttcagc 4380 tccaggtagg ggttccactg tattttcgcc tgagagctaa tccgatcaaa accatactgg 4440 ataatcagaa gaggctcgac agcaaaggaa atattaaaag gtgccgggtc ccgctcatca 4500 aagaggctga gcaaatcgct tggcttcaac ggaaactggg gaacgcagcc cgcgtggaag 4560 acgtccaccc gattagtgaa cggccccaat atttttccgg agacggaaag agcggcaaga 4620 ttcagacagt ctgtttcgag ggggtgctca ccatcaatga tgcccccgcc ctgatagacc 4680 tggtgcagca gggcataggc cccgctaaaa gcatgggatg cggactgctt agtctggcac 4740 cgctgggatc cggagagggc agaggaagtc tgctaacatg cggtgacgtc gaggagaatc 4800 ctggacctcc caagaaaaag agaaaagtag gatcgggcat gaatttgctc attgataatt 4860 ggattccggt gcgcccccgg aacggtggga aagtgcagat catcaatttg caaagtctct 4920 actgttccag ggaccagtgg agactcagcc tgccacggga tgatatggag ctggcggcgt 4980 tggctctgct cgtatgcatc ggccagatta ttgcgccagc aaaggatgac gttgaattcc 5040 ggcatcggat aatgaacccc cttactgaag atgagttcca gcagcttatc gccccatgga 5100 tcgacatgtt ctacctcaac cacgccgagc atccttttat gcagaccaag ggagtcaagg 5160 cgaatgatgt gactcccatg gagaagctgc tggccggtgt atctggggcg accaactgcg 5220 cattcgtgaa tcagcctgga cagggggagg ccctctgtgg aggctgcact gctatagcac 5280 tttttaacca agctaatcaa gcccccggct ttggtggagg gtttaagagt ggattgaggg 5340 ggggcactcc cgtaaccact tttgtgaggg gaattgatct gaggtctact gtgttgctga 5400 acgtcctcac actcccaagg ctccagaagc agttcccaaa cgaaagtcat accgaaaacc 5460 agcccacatg gatcaagccc atcaaatcta atgagagcat accggctagc agtattggat 5520 ttgtacgggg tctgttctgg cagccagctc acatcgagct gtgtgatcct attgggatcg 5580 gcaagtgctc ttgttgtggg caggagtcca accttaggta tactggattt ctgaaagaga 5640 agtttacctt tacagtaaat gggctctggc cccaccccca ctcaccttgc cttgtgacag 5700 tgaaaaaggg ggaagtcgag gagaagtttc tggcctttac aacttctgcc ccttcctgga 5760 ctcagatttc cagagtggtg gtagataaga taattcaaaa cgagaatggc aatagagtgg 5820 ccgccgtggt gaaccagttt cgcaacatcg cccctcagtc ccccctggag ctgattatgg 5880 gcggttatcg gaataaccag gccagtatac tcgagcgacg gcacgatgtc ctcatgttca 5940 atcaaggttg gcagcaatat ggcaatgtga ttaacgagat cgtaaccgtg ggcctgggat 6000 ataagaccgc cctgcggaag gcgttgtata cttttgcaga aggctttaag aataaggatt 6060 ttaagggtgc cggcgtgagt gtccatgaaa cagctgaacg gcacttttat cggcagtccg 6120 agctgttgat accagacgtg ctggctaatg tgaacttctc acaggccgac gaagtgatcg 6180 ctgatctgcg ggataaactg caccaactgt gcgagatgct gtttaatcaa agcgtcgctc 6240 cttatgccca ccacccaaag ctgatctcca cgctggccct ggcgcgcgcc acactttata 6300 aacatctccg cgaactgaaa ccccaggggg gccccagcaa tggctaataa tctagagggc 6360 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 6420 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 6480 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 6540 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 6600 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 6660 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 6720 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 6780 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc 6840 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 6900 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 6960 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 7020 gtctattctt ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag 7080 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 7140 gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 7200 caaccaggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc 7260 tcaattagtc agcaaccata gtcccgcccc taactccgcc catcccgccc ctaactccgc 7320 ccagttccgc ccattctccg ccccatggct gactaatttt ttttatttat gcagaggccg 7380 aggccgcctc tgcctctgag ctattccaga agtagtgagg aggctttttt ggaggcctag 7440 gcttttgcaa aaagctcccg ggagcttgta tatccatttt cggatctgat caagagacag 7500 gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 7560 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 7620 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 7680 gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 7740 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 7800 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 7860 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 7920 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 7980 aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 8040 aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga 8100 atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 8160 cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 8220 aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 8280 ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 8340 ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 8400 gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 8460 catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata 8520 aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 8580 tttgtccaaa ctcatcaatg tatcttatca tgtctgtata ccgtcgacct ctagctagag 8640 cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 8700 acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 8760 actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 8820 gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 8880 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 8940 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 9000 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 9060 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 9120 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 9180 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 9240 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 9300 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 9360 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 9420 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 9480 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 9540 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 9600 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 9660 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 9720 gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 9780 aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 9840 acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 9900 gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 9960 cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 10020 cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 10080 tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 10140 cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 10200 gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 10260 cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 10320 ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 10380 gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 10440 taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 10500 gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 10560 acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 10620 aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 10680 cttccttttt cattattatt gaagcattta tcagggttat tgtctcatga gcggatacat 10740 atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 10800 gccacctgac gtc 10813 <210> 385 <211> 6475 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: eGFP_MALAT1-triplex_CRISPR(Hsa07) <400> 385 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatgggc tccgggattg gtagtgggag 960 caacggcagc agcggatccg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat 1020 cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgcgcg gcgagggcga 1080 gggcgatgcc accaacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc 1140 cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta 1200 ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca 1260 ggagcgcacc atctccttca aggacgacgg cacctacaag acccgcgccg aggtgaagtt 1320 cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg 1380 caacatcctg gggcacaagc tggagtacaa cttcaacagc cacaacgtct atatcacggc 1440 cgacaagcag aagaacggca tcaaggcgaa cttcaagatc cgccacaacg tcgaggacgg 1500 cagcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct 1560 gctgcccgac aaccactacc tgagcaccca gtccaagctg agcaaagacc ccaacgagaa 1620 gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga 1680 cgagctgtac aagtagtaat ctagagattc gtcagtaggg ttgtaaaggt ttttcttttc 1740 ctgagaaaac aaccttttgt tttctcaggt tttgcttttt ggcctttccc tagctttaaa 1800 aaaaaaaaag caaaactcac cgaggcagtt ataccatggg ctagcgagtt ccccgcgcca 1860 gcggggataa accggttgat ttgcctgcat tggtgttaca cagtctgagt tccccgcgcc 1920 agcggggata aaccgtaagt tgtgttcttc tttgcctagg ccttcaggag ttccccgcgc 1980 cagcggggat aaaccggagc tcgctgagca atctagaggg ccctattcta tagtgtcacc 2040 taaatgctag agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg 2100 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2160 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2220 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2280 cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg gggtatcccc 2340 acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 2400 ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 2460 cgttcgccgg ctttccccgt caagctctaa atcggggcat ccctttaggg ttccgattta 2520 gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 2580 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 2640 gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 2700 aagggatttt ggggatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 2760 acgcgaatta attctgtgga atgtgtgtca gttagggtgt ggaaagtccc caggctcccc 2820 aggcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt 2880 ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 2940 tagtcccgcc cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc 3000 cgccccatgg ctgactaatt ttttttattt atgcagaggc cgaggccgcc tctgcctctg 3060 agctattcca gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc 3120 cgggagcttg tatatccatt ttcggatctg atcaagagac aggatgagga tcgtttcgca 3180 tgattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg 3240 gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag 3300 cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc 3360 aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc 3420 tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg 3480 atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc 3540 ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca 3600 tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag 3660 agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc atgcccgacg 3720 gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg 3780 gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca 3840 tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc 3900 tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg 3960 acgagttctt ctgagcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct 4020 gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt 4080 tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc 4140 ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 4200 tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 4260 tgtatcttat catgtctgta taccgtcgac ctctagctag agcttggcgt aatcatggtc 4320 atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 4380 aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 4440 gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 4500 ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 4560 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 4620 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 4680 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 4740 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 4800 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 4860 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc 4920 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 4980 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 5040 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 5100 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 5160 gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 5220 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 5280 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 5340 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 5400 cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 5460 gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 5520 tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 5580 gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 5640 agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 5700 tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 5760 agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 5820 gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 5880 catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 5940 ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 6000 atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 6060 tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 6120 cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 6180 cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 6240 atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 6300 aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcattatta 6360 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 6420 aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtc 6475 <210> 386 <211> 6854 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSCas7_MALAT1-triplex_CRISPR(Hsa07) <400> 386 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatgccg aaaaaaaagc ggaaggtcgg 960 atcaggaatg tcaaatttta ttaatattca tgttctgatc agtcatagcc cgagttgcct 1020 gaatagagac gacatgaata tgcagaaaga cgcaattttc ggtggcaaga ggcgagtccg 1080 aataagcagc caaagtctta agcgagccat gaggaagagc ggctattatg cccagaatat 1140 cggcgagtcc tcattgcgga ccatccacct cgcccagttg agagacgtct tgaggcagaa 1200 actgggggaa agattcgacc agaaaatcat tgacaagacc cttgccctcc ttagtgggaa 1260 gagcgtggac gaggctgaaa aaatctctgc cgacgccgta acgccctggg ttgtgggtga 1320 gattgcttgg ttttgtgaac aggtggcgaa ggcggaggcc gataacctgg atgacaagaa 1380 gctgctgaag gtccttaagg aggacatagc tgccattcgg gtcaatttgc agcagggagt 1440 ggatatcgca ttgtccggaa gaatggctac atcaggcatg atgaccgagc tgggcaaggt 1500 agacggagcc atgagtatcg cacacgccat caccacccac caagtcgact cagacatcga 1560 ctggttcaca gcagtagatg acctccagga gcaggggtct gcccaccttg ggacacagga 1620 gttctcttcc ggggtgtttt atcgctatgc taatatcaat ctggcgcagc tgcaagaaaa 1680 cctgggggga gcctctcgag agcaggccct ggagattgca actcacgtcg tgcatatgct 1740 tgcgacagag gtacctggcg ccaagcagag gacatacgct gcttttaatc cagcagatat 1800 ggtcatggta aatttctctg atatgcctct ctccatggcc aacgcattcg agaaggcagt 1860 gaaggcaaag gacgggttcc tgcagccatc aattcaagcg tttaatcagt attgggacag 1920 agtggcgaac ggctatggac tgaacggagc cgcagctcag tttagcctca gcgatgtcga 1980 tcccataact gcacaggtga aacagatgcc tacgttggaa cagctgaagt catgggtaag 2040 aaataacggc gaagcctaat aacattggaa gtggataatc tagagattcg tcagtagggt 2100 tgtaaaggtt tttcttttcc tgagaaaaca accttttgtt ttctcaggtt ttgctttttg 2160 gcctttccct agctttaaaa aaaaaaaagc aaaactcacc gaggcagtta taccatgggc 2220 tagcgagttc cccgcgccag cggggataaa ccggttgatt tgcctgcatt ggtgttacac 2280 agtctgagtt ccccgcgcca gcggggataa accgtaagtt gtgttcttct ttgcctaggc 2340 cttcaggagt tccccgcgcc agcggggata aaccggagct cgctgagcaa tctagagggc 2400 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 2460 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 2520 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 2580 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 2640 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 2700 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 2760 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 2820 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 2880 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 2940 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 3000 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 3060 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 3120 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 3180 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 3240 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 3300 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 3360 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 3420 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 3480 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 3540 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 3600 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 3660 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 3720 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 3780 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 3840 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 3900 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 3960 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 4020 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 4080 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 4140 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 4200 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 4260 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 4320 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 4380 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 4440 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 4500 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 4560 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 4620 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 4680 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 4740 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 4800 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 4860 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 4920 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 4980 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 5040 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 5100 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 5160 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 5220 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 5280 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 5340 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 5400 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 5460 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 5520 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 5580 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 5640 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 5700 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 5760 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 5820 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 5880 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 5940 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 6000 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 6060 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 6120 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 6180 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 6240 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 6300 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 6360 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 6420 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 6480 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 6540 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 6600 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 6660 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 6720 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 6780 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 6840 tgccacctga cgtc 6854 <210> 387 <211> 6328 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSCas6_MALAT1-triplex_CRISPR(Hsa07) <400> 387 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc atgtatctgt 960 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 1020 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 1080 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 1140 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 1200 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 1260 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 1320 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 1380 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 1440 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 1500 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctgtaa taatctagag 1560 attcgtcagt agggttgtaa aggtttttct tttcctgaga aaacaacctt ttgttttctc 1620 aggttttgct ttttggcctt tccctagctt taaaaaaaaa aaagcaaaac tcaccgaggc 1680 agttatacca tgggctagcg agttccccgc gccagcgggg ataaaccggt tgatttgcct 1740 gcattggtgt tacacagtct gagttccccg cgccagcggg gataaaccgt aagttgtgtt 1800 cttctttgcc taggccttca ggagttcccc gcgccagcgg ggataaaccg gagctcgctg 1860 agcaatctag agggccctat tctatagtgt cacctaaatg ctagagctcg ctgatcagcc 1920 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1980 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 2040 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 2100 gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 2160 gaaagaacca gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc 2220 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 2280 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 2340 ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 2400 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 2460 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 2520 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 2580 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt 2640 gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 2700 atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca ggcagaagta 2760 tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact ccgcccatcc 2820 cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta atttttttta 2880 tttatgcaga ggccgaggcc gcctctgcct ctgagctatt ccagaagtag tgaggaggct 2940 tttttggagg cctaggcttt tgcaaaaagc tcccgggagc ttgtatatcc attttcggat 3000 ctgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga ttgcacgcag 3060 gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg 3120 gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca 3180 agaccgacct gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc 3240 tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg 3300 actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg 3360 ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta 3420 cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag 3480 ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac 3540 tgttcgccag gctcaaggcg cgcatgcccg acggcgagga tctcgtcgtg acccatggcg 3600 atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg 3660 gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg 3720 aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg 3780 attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgagcg ggactctggg 3840 gttcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg attccaccgc 3900 cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct 3960 ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta ttgcagctta 4020 taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 4080 gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct gtataccgtc 4140 gacctctagc tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 4200 tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 4260 ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 4320 aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 4380 tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4440 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4500 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4560 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4620 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4680 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4740 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4800 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4860 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 4920 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 4980 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 5040 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 5100 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 5160 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 5220 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 5280 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 5340 cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 5400 actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 5460 aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 5520 cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 5580 ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 5640 cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 5700 ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 5760 cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 5820 ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 5880 tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 5940 ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 6000 aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 6060 gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 6120 gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 6180 ttgaatactc atactcttcc tttttcatta ttattgaagc atttatcagg gttattgtct 6240 catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 6300 atttccccga aaagtgccac ctgacgtc 6328 <210> 388 <211> 11541 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: hU6_CRISPR(Hsa07)_F, CMV_NLSCas7_NLSCse2_NLSCas5_NLSCas6_NLSFokI30aaCas8 <400> 388 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgtgagggcc 240 tatttcccat gattccttca tatttgcata tacgatacaa ggctgttaga gagataattg 300 gaattaattt gactgtaaac acaaagatat tagtacaaaa tacgtgacgt agaaagtaat 360 aatttcttgg gtagtttgca gttttaaaat tatgttttaa aatggactat catatgctta 420 ccgtaacttg aaagtatttc gatttcttgg ctttatatat cttgtggaaa ggacgaaaca 480 ccggatccta atacgactca ctatagggta aggagatata ccatgggcta gcgagttccc 540 cgcgccagcg gggataaacc ggttgatttg cctgcattgg tgttacacag tctgagttcc 600 ccgcgccagc ggggataaac cgtaagttgt gttcttcttt gcctaggcct tcaggagttc 660 cccgcgccag cggggataaa ccggagctcg ctgagcaata actctgaaac ctcaggcatt 720 tgagaagtct agattttttt cggaaagaac cagctggggc tctagggggt atccccacgc 780 gccctgtagc acgcgttgac attgattatt gactagttat taatagtaat caattacggg 840 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 900 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 960 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 1020 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 1080 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 1140 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 1200 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 1260 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1320 cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1380 tctctggcta actagagaac ccactgctta ctggcttatc gaaattaata cgactcacta 1440 tagggagacc caagcttggt accgagctcg gatcgccacc atgcccaaga aaaagagaaa 1500 agtaggatcg ggcgaacaga aacttatatc tgaggaggac ctcggatcgg gcatgtcaaa 1560 ttttattaat attcatgttc tgatcagtca tagcccgagt tgcctgaata gagacgacat 1620 gaatatgcag aaagacgcaa ttttcggtgg caagaggcga gtccgaataa gcagccaaag 1680 tcttaagcga gccatgagga agagcggcta ttatgcccag aatatcggcg agtcctcatt 1740 gcggaccatc cacctcgccc agttgagaga cgtcttgagg cagaaactgg gggaaagatt 1800 cgaccagaaa atcattgaca agacccttgc cctccttagt gggaagagcg tggacgaggc 1860 tgaaaaaatc tctgccgacg ccgtaacgcc ctgggttgtg ggtgagattg cttggttttg 1920 tgaacaggtg gcgaaggcgg aggccgataa cctggatgac aagaagctgc tgaaggtcct 1980 taaggaggac atagctgcca ttcgggtcaa tttgcagcag ggagtggata tcgcattgtc 2040 cggaagaatg gctacatcag gcatgatgac cgagctgggc aaggtagacg gagccatgag 2100 tatcgcacac gccatcacca cccaccaagt cgactcagac atcgactggt tcacagcagt 2160 agatgacctc caggagcagg ggtctgccca ccttgggaca caggagttct cttccggggt 2220 gttttatcgc tatgctaata tcaatctggc gcagctgcaa gaaaacctgg ggggagcctc 2280 tcgagagcag gccctggaga ttgcaactca cgtcgtgcat atgcttgcga cagaggtacc 2340 tggcgccaag cagaggacat acgctgcttt taatccagca gatatggtca tggtaaattt 2400 ctctgatatg cctctctcca tggccaacgc attcgagaag gcagtgaagg caaaggacgg 2460 gttcctgcag ccatcaattc aagcgtttaa tcagtattgg gacagagtgg cgaacggcta 2520 tggactgaac ggagccgcag ctcagtttag cctcagcgat gtcgatccca taactgcaca 2580 ggtgaaacag atgcctacgt tggaacagct gaagtcatgg gtaagaaata acggcgaagc 2640 cggcagcggc gagggcagag gcagcctgct gacctgcggc gacgtggagg agaaccccgg 2700 cccccccaag aaaaagagaa aagtaggatc gggcgattac aaagatcacg atggggacta 2760 caaggatcac gatattgact ataaggacga cgatgacaag ggatcgggca tggccgacga 2820 gattgacgca atggcacttt accgggcctg gcagcagttg gataatggtt catgtgccca 2880 gattcgcaga gttagtgaac ctgacgaact gagagatatc cccgcgtttt acagacttgt 2940 ccaaccgttc ggatgggaga acccacggca ccaacaagca ctccttcgaa tggtcttctg 3000 tttgtccgca ggaaaaaatg taatcagaca ccaagacaaa aagagcgagc aaaccacagg 3060 tatcagcctg ggcagggcac ttgccaactc tgggcggatc aacgaaagga gaatttttca 3120 gctgatacgc gctgatcgga ctgcggacat ggtgcagctg cgcagactcc ttactcatgc 3180 cgaacctgtc ctggattggc ccctgatggc acgcatgctg acttggtggg gaaagagaga 3240 aagacagcaa ctgcttgaag acttcgtgct cactacaaat aagaatgccg gatccggaga 3300 aggaagggga tccctcctca catgtggaga tgtcgaagaa aatcctggac ctcccaagaa 3360 aaagagaaaa gtaggatcgg gcatgcggag ctatctcatc ctgagactgg ccggaccaat 3420 gcaggcctgg ggacagccta ccttcgaagg tacacgcccc acaggccgct ttcctaccag 3480 gagcggcctg ctgggcctgc ttggcgcttg tcttgggatc cagcgcgatg atactagctc 3540 cctgcaagca ctgtcagaga gcgtgcagtt tgccgtaaga tgcgacgaac tgatccttga 3600 tgataggcgg gtcagtgtca ctggtctccg ggactaccac acggtgctgg gggcccggga 3660 ggattatagg ggcctgaaaa gtcacgagac gattcaaacc tggcgcgaat atctgtgcga 3720 tgccagcttc accgtggccc tgtggctgac tccacatgcc actatggtca tcagtgaact 3780 ggaaaaggct gttcttaagc ctcgatatac tccgtatctg ggccgccgga gttgtccact 3840 tacacaccca cttttcctcg gcacctgcca ggccagcgac cctcaaaagg cccttctgaa 3900 ttacgagcca gttggcggtg acatatacag cgaagagtcc gtgacgggac accatcttaa 3960 gttcaccgct cgggacgagc ccatgattac cctcccacgg cagttcgcat caagggagtg 4020 gtacgtcata aaggggggca tggatgtgag tcaggggtct ggggaggggc gggggtcttt 4080 gttgacttgc ggggatgttg aggagaaccc agggccaccc aagaaaaaga gaaaagtagg 4140 ctcaggcggt aaacccatcc caaacccctt gcttggtctc gactcaaccg gatcgggcat 4200 gtatctgtca aaggttatca ttgcacgcgc gtggagtagg gatctgtatc agctgcacca 4260 gggtctgtgg catcttttcc cgaaccgccc cgacgcggca cgagactttc tgtttcacgt 4320 tgaaaaaaga aacacccccg agggctgtca tgtgctcctg cagtctgccc agatgccggt 4380 gagcacagct gtggcgactg tgatcaagac caagcaggtc gagtttcagc tccaggtagg 4440 ggttccactg tattttcgcc tgagagctaa tccgatcaaa accatactgg ataatcagaa 4500 gaggctcgac agcaaaggaa atattaaaag gtgccgggtc ccgctcatca aagaggctga 4560 gcaaatcgct tggcttcaac ggaaactggg gaacgcagcc cgcgtggaag acgtccaccc 4620 gattagtgaa cggccccaat atttttccgg agacggaaag agcggcaaga ttcagacagt 4680 ctgtttcgag ggggtgctca ccatcaatga tgcccccgcc ctgatagacc tggtgcagca 4740 gggcataggc cccgctaaaa gcatgggatg cggactgctt agtctggcac cgctgggatc 4800 cggagagggc agaggaagtc tgctaacatg cggtgacgtc gaggagaatc ctggacctcc 4860 caagaaaaag agaaaagtag gcggctcaca attggtcaaa agcgaactgg aagagaaaaa 4920 atctgagctc agacacaagc tgaagtatgt gccccatgaa tacatagaac tcatagaaat 4980 agctcgaaac cccacgcagg accggatcct tgaaatgaaa gttatggagt tttttatgaa 5040 agtgtatggg tatcgaggag agcatcttgg tggaagtcgg aaaccggatg gggcaatata 5100 cactgttggg agccccattg actatggtgt gatagtggac accaaggcat acagcggggg 5160 atacaatctg ccgatcgggc aggcagatga gatgcagcgc tatgtggagg agaatcaaac 5220 taggaacaaa catattaacc caaacgaatg gtggaaagtg tatccctcat ctgttacgga 5280 gttcaagttc ctttttgtat ctggccactt taaaggaaac tataaagcac agctcacgcg 5340 acttaaccac atcaccaatt gtaacggtgc tgtactcagt gttgaggaac tcctgatcgg 5400 tggtgaaatg ataaaagctg gaaccttgac attggaggaa gtaaggagaa agtttaataa 5460 tggtgagatc aatttcagcg gctccgaaac gccgggtaca tccgagtccg cgactcctga 5520 gtcaggaggc agcggctcct ctggtggaag cggctcaagt ggagggatga atttgctcat 5580 tgataattgg attccggtgc gcccccggaa cggtgggaaa gtgcagatca tcaatttgca 5640 aagtctctac tgttccaggg accagtggag actcagcctg ccacgggatg atatggagct 5700 ggcggcgttg gctctgctcg tatgcatcgg ccagattatt gcgccagcaa aggatgacgt 5760 tgaattccgg catcggataa tgaaccccct tactgaagat gagttccagc agcttatcgc 5820 cccatggatc gacatgttct acctcaacca cgccgagcat ccttttatgc agaccaaggg 5880 agtcaaggcg aatgatgtga ctcccatgga gaagctgctg gccggtgtat ctggggcgac 5940 caactgcgca ttcgtgaatc agcctggaca gggggaggcc ctctgtggag gctgcactgc 6000 tatagcactt tttaaccaag ctaatcaagc ccccggcttt ggtggagggt ttaagagtgg 6060 attgaggggg ggcactcccg taaccacttt tgtgagggga attgatctga ggtctactgt 6120 gttgctgaac gtcctcacac tcccaaggct ccagaagcag ttcccaaacg aaagtcatac 6180 cgaaaaccag cccacatgga tcaagcccat caaatctaat gagagcatac cggctagcag 6240 tattggattt gtacggggtc tgttctggca gccagctcac atcgagctgt gtgatcctat 6300 tgggatcggc aagtgctctt gttgtgggca ggagtccaac cttaggtata ctggatttct 6360 gaaagagaag tttaccttta cagtaaatgg gctctggccc cacccccact caccttgcct 6420 tgtgacagtg aaaaaggggg aagtcgagga gaagtttctg gcctttacaa cttctgcccc 6480 ttcctggact cagatttcca gagtggtggt agataagata attcaaaacg agaatggcaa 6540 tagagtggcc gccgtggtga accagtttcg caacatcgcc cctcagtccc ccctggagct 6600 gattatgggc ggttatcgga ataaccaggc cagtatactc gagcgacggc acgatgtcct 6660 catgttcaat caaggttggc agcaatatgg caatgtgatt aacgagatcg taaccgtggg 6720 cctgggatat aagaccgccc tgcggaaggc gttgtatact tttgcagaag gctttaagaa 6780 taaggatttt aagggtgccg gcgtgagtgt ccatgaaaca gctgaacggc acttttatcg 6840 gcagtccgag ctgttgatac cagacgtgct ggctaatgtg aacttctcac aggccgacga 6900 agtgatcgct gatctgcggg ataaactgca ccaactgtgc gagatgctgt ttaatcaaag 6960 cgtcgctcct tatgcccacc acccaaagct gatctccacg ctggccctgg cgcgcgccac 7020 actttataaa catctccgcg aactgaaacc ccaggggggc cccagcaatg gctaataatc 7080 tagagggccc tattctatag tgtcacctaa atgctagagc tcgctgatca gcctcgactg 7140 tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg 7200 aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga 7260 gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg 7320 aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag gcggaaagaa 7380 ccagctgggg ctctaggggg tatccccacg cgccctgtag cggcgcatta agcgcggcgg 7440 gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 7500 tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 7560 gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 7620 attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 7680 cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 7740 ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 7800 aaaatgagct gatttaacaa aaatttaacg cgaattaatt ctgtggaatg tgtgtcagtt 7860 agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa 7920 ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 7980 catgcatctc aattagtcag caaccatagt cccgccccta actccgccca tcccgcccct 8040 aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt ttatttatgc 8100 agaggccgag gccgcctctg cctctgagct attccagaag tagtgaggag gcttttttgg 8160 aggcctaggc ttttgcaaaa agctcccggg agcttgtata tccattttcg gatctgatca 8220 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 8280 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 8340 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 8400 cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt ggctggccac 8460 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 8520 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 8580 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 8640 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 8700 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 8760 caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 8820 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 8880 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 8940 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 9000 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga gcgggactct ggggttcgaa 9060 atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc 9120 tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc 9180 ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt 9240 tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 9300 agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatacc gtcgacctct 9360 agctagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 9420 acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 9480 gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 9540 tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 9600 cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 9660 gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 9720 aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 9780 gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 9840 aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 9900 gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 9960 ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 10020 cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 10080 ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 10140 actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 10200 tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 10260 gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 10320 ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 10380 cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 10440 ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 10500 tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 10560 agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 10620 gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 10680 ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 10740 gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 10800 cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 10860 acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 10920 cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 10980 cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 11040 ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 11100 tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 11160 atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 11220 tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 11280 actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 11340 aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 11400 ctcatactct tcctttttca ttattattga agcatttatc agggttattg tctcatgagc 11460 ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 11520 cgaaaagtgc cacctgacgt c 11541 <210> 389 <211> 11541 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: hU6_CRISPR(Hsa07)_R, CMV_NLSCas7_NLSCse2_NLSCas5_NLSCas6_NLSFokI30aaCas8 <400> 389 ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt 60 catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat 120 ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag 180 caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct 240 ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt 300 tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg 360 cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca 420 aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt 480 tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat 540 gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac 600 cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa 660 aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt 720 tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt 780 tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa 840 gggcgacacg gaaatgttga atactcatac tcttcctttt tcattattat tgaagcattt 900 atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 960 taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtcgacgga tcgggagatc 1020 tcccgatccc ctatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 1080 gtatctgctc cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca aaatttaagc 1140 tacaacaagg caaggcttga ccgacaattg catgaagaat ctgcttaggg ttaggcgttt 1200 tgcgctgctt cgcgatgtac gggccagata tacgcgtgct acagggcgcg tggggatacc 1260 ccctagagcc ccagctggtt ctttccgaaa aaaatctaga cttctcaaat gcctgaggtt 1320 tcagagttat tgctcagcga gctccggttt atccccgctg gcgcggggaa ctcctgaagg 1380 cctaggcaaa gaagaacaca acttacggtt tatccccgct ggcgcgggga actcagactg 1440 tgtaacacca atgcaggcaa atcaaccggt ttatccccgc tggcgcgggg aactcgctag 1500 cccatggtat atctccttac cctatagtga gtcgtattag gatccggtgt ttcgtccttt 1560 ccacaagata tataaagcca agaaatcgaa atactttcaa gttacggtaa gcatatgata 1620 gtccatttta aaacataatt ttaaaactgc aaactaccca agaaattatt actttctacg 1680 tcacgtattt tgtactaata tctttgtgtt tacagtcaaa ttaattccaa ttatctctct 1740 aacagccttg tatcgtatat gcaaatatga aggaatcatg ggaaataggc cctcacgcgt 1800 tgacattgat tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc 1860 ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 1920 aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 1980 actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat 2040 caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 2100 tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 2160 ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 2220 cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 2280 tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 2340 atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctctctg gctaactaga 2400 gaacccactg cttactggct tatcgaaatt aatacgactc actataggga gacccaagct 2460 tggtaccgag ctcggatcgc caccatgccc aagaaaaaga gaaaagtagg atcgggcgaa 2520 cagaaactta tatctgagga ggacctcgga tcgggcatgt caaattttat taatattcat 2580 gttctgatca gtcatagccc gagttgcctg aatagagacg acatgaatat gcagaaagac 2640 gcaattttcg gtggcaagag gcgagtccga ataagcagcc aaagtcttaa gcgagccatg 2700 aggaagagcg gctattatgc ccagaatatc ggcgagtcct cattgcggac catccacctc 2760 gcccagttga gagacgtctt gaggcagaaa ctgggggaaa gattcgacca gaaaatcatt 2820 gacaagaccc ttgccctcct tagtgggaag agcgtggacg aggctgaaaa aatctctgcc 2880 gacgccgtaa cgccctgggt tgtgggtgag attgcttggt tttgtgaaca ggtggcgaag 2940 gcggaggccg ataacctgga tgacaagaag ctgctgaagg tccttaagga ggacatagct 3000 gccattcggg tcaatttgca gcagggagtg gatatcgcat tgtccggaag aatggctaca 3060 tcaggcatga tgaccgagct gggcaaggta gacggagcca tgagtatcgc acacgccatc 3120 accacccacc aagtcgactc agacatcgac tggttcacag cagtagatga cctccaggag 3180 caggggtctg cccaccttgg gacacaggag ttctcttccg gggtgtttta tcgctatgct 3240 aatatcaatc tggcgcagct gcaagaaaac ctggggggag cctctcgaga gcaggccctg 3300 gagattgcaa ctcacgtcgt gcatatgctt gcgacagagg tacctggcgc caagcagagg 3360 acatacgctg cttttaatcc agcagatatg gtcatggtaa atttctctga tatgcctctc 3420 tccatggcca acgcattcga gaaggcagtg aaggcaaagg acgggttcct gcagccatca 3480 attcaagcgt ttaatcagta ttgggacaga gtggcgaacg gctatggact gaacggagcc 3540 gcagctcagt ttagcctcag cgatgtcgat cccataactg cacaggtgaa acagatgcct 3600 acgttggaac agctgaagtc atgggtaaga aataacggcg aagccggcag cggcgagggc 3660 agaggcagcc tgctgacctg cggcgacgtg gaggagaacc ccggcccccc caagaaaaag 3720 agaaaagtag gatcgggcga ttacaaagat cacgatgggg actacaagga tcacgatatt 3780 gactataagg acgacgatga caagggatcg ggcatggccg acgagattga cgcaatggca 3840 ctttaccggg cctggcagca gttggataat ggttcatgtg cccagattcg cagagttagt 3900 gaacctgacg aactgagaga tatccccgcg ttttacagac ttgtccaacc gttcggatgg 3960 gagaacccac ggcaccaaca agcactcctt cgaatggtct tctgtttgtc cgcaggaaaa 4020 aatgtaatca gacaccaaga caaaaagagc gagcaaacca caggtatcag cctgggcagg 4080 gcacttgcca actctgggcg gatcaacgaa aggagaattt ttcagctgat acgcgctgat 4140 cggactgcgg acatggtgca gctgcgcaga ctccttactc atgccgaacc tgtcctggat 4200 tggcccctga tggcacgcat gctgacttgg tggggaaaga gagaaagaca gcaactgctt 4260 gaagacttcg tgctcactac aaataagaat gccggatccg gagaaggaag gggatccctc 4320 ctcacatgtg gagatgtcga agaaaatcct ggacctccca agaaaaagag aaaagtagga 4380 tcgggcatgc ggagctatct catcctgaga ctggccggac caatgcaggc ctggggacag 4440 cctaccttcg aaggtacacg ccccacaggc cgctttccta ccaggagcgg cctgctgggc 4500 ctgcttggcg cttgtcttgg gatccagcgc gatgatacta gctccctgca agcactgtca 4560 gagagcgtgc agtttgccgt aagatgcgac gaactgatcc ttgatgatag gcgggtcagt 4620 gtcactggtc tccgggacta ccacacggtg ctgggggccc gggaggatta taggggcctg 4680 aaaagtcacg agacgattca aacctggcgc gaatatctgt gcgatgccag cttcaccgtg 4740 gccctgtggc tgactccaca tgccactatg gtcatcagtg aactggaaaa ggctgttctt 4800 aagcctcgat atactccgta tctgggccgc cggagttgtc cacttacaca cccacttttc 4860 ctcggcacct gccaggccag cgaccctcaa aaggcccttc tgaattacga gccagttggc 4920 ggtgacatat acagcgaaga gtccgtgacg ggacaccatc ttaagttcac cgctcgggac 4980 gagcccatga ttaccctccc acggcagttc gcatcaaggg agtggtacgt cataaagggg 5040 ggcatggatg tgagtcaggg gtctggggag gggcgggggt ctttgttgac ttgcggggat 5100 gttgaggaga acccagggcc acccaagaaa aagagaaaag taggctcagg cggtaaaccc 5160 atcccaaacc ccttgcttgg tctcgactca accggatcgg gcatgtatct gtcaaaggtt 5220 atcattgcac gcgcgtggag tagggatctg tatcagctgc accagggtct gtggcatctt 5280 ttcccgaacc gccccgacgc ggcacgagac tttctgtttc acgttgaaaa aagaaacacc 5340 cccgagggct gtcatgtgct cctgcagtct gcccagatgc cggtgagcac agctgtggcg 5400 actgtgatca agaccaagca ggtcgagttt cagctccagg taggggttcc actgtatttt 5460 cgcctgagag ctaatccgat caaaaccata ctggataatc agaagaggct cgacagcaaa 5520 ggaaatatta aaaggtgccg ggtcccgctc atcaaagagg ctgagcaaat cgcttggctt 5580 caacggaaac tggggaacgc agcccgcgtg gaagacgtcc acccgattag tgaacggccc 5640 caatattttt ccggagacgg aaagagcggc aagattcaga cagtctgttt cgagggggtg 5700 ctcaccatca atgatgcccc cgccctgata gacctggtgc agcagggcat aggccccgct 5760 aaaagcatgg gatgcggact gcttagtctg gcaccgctgg gatccggaga gggcagagga 5820 agtctgctaa catgcggtga cgtcgaggag aatcctggac ctcccaagaa aaagagaaaa 5880 gtaggcggct cacaattggt caaaagcgaa ctggaagaga aaaaatctga gctcagacac 5940 aagctgaagt atgtgcccca tgaatacata gaactcatag aaatagctcg aaaccccacg 6000 caggaccgga tccttgaaat gaaagttatg gagtttttta tgaaagtgta tgggtatcga 6060 ggagagcatc ttggtggaag tcggaaaccg gatggggcaa tatacactgt tgggagcccc 6120 attgactatg gtgtgatagt ggacaccaag gcatacagcg ggggatacaa tctgccgatc 6180 gggcaggcag atgagatgca gcgctatgtg gaggagaatc aaactaggaa caaacatatt 6240 aacccaaacg aatggtggaa agtgtatccc tcatctgtta cggagttcaa gttccttttt 6300 gtatctggcc actttaaagg aaactataaa gcacagctca cgcgacttaa ccacatcacc 6360 aattgtaacg gtgctgtact cagtgttgag gaactcctga tcggtggtga aatgataaaa 6420 gctggaacct tgacattgga ggaagtaagg agaaagttta ataatggtga gatcaatttc 6480 agcggctccg aaacgccggg tacatccgag tccgcgactc ctgagtcagg aggcagcggc 6540 tcctctggtg gaagcggctc aagtggaggg atgaatttgc tcattgataa ttggattccg 6600 gtgcgccccc ggaacggtgg gaaagtgcag atcatcaatt tgcaaagtct ctactgttcc 6660 agggaccagt ggagactcag cctgccacgg gatgatatgg agctggcggc gttggctctg 6720 ctcgtatgca tcggccagat tattgcgcca gcaaaggatg acgttgaatt ccggcatcgg 6780 ataatgaacc cccttactga agatgagttc cagcagctta tcgccccatg gatcgacatg 6840 ttctacctca accacgccga gcatcctttt atgcagacca agggagtcaa ggcgaatgat 6900 gtgactccca tggagaagct gctggccggt gtatctgggg cgaccaactg cgcattcgtg 6960 aatcagcctg gacaggggga ggccctctgt ggaggctgca ctgctatagc actttttaac 7020 caagctaatc aagcccccgg ctttggtgga gggtttaaga gtggattgag ggggggcact 7080 cccgtaacca cttttgtgag gggaattgat ctgaggtcta ctgtgttgct gaacgtcctc 7140 acactcccaa ggctccagaa gcagttccca aacgaaagtc ataccgaaaa ccagcccaca 7200 tggatcaagc ccatcaaatc taatgagagc ataccggcta gcagtattgg atttgtacgg 7260 ggtctgttct ggcagccagc tcacatcgag ctgtgtgatc ctattgggat cggcaagtgc 7320 tcttgttgtg ggcaggagtc caaccttagg tatactggat ttctgaaaga gaagtttacc 7380 tttacagtaa atgggctctg gccccacccc cactcacctt gccttgtgac agtgaaaaag 7440 ggggaagtcg aggagaagtt tctggccttt acaacttctg ccccttcctg gactcagatt 7500 tccagagtgg tggtagataa gataattcaa aacgagaatg gcaatagagt ggccgccgtg 7560 gtgaaccagt ttcgcaacat cgcccctcag tcccccctgg agctgattat gggcggttat 7620 cggaataacc aggccagtat actcgagcga cggcacgatg tcctcatgtt caatcaaggt 7680 tggcagcaat atggcaatgt gattaacgag atcgtaaccg tgggcctggg atataagacc 7740 gccctgcgga aggcgttgta tacttttgca gaaggcttta agaataagga ttttaagggt 7800 gccggcgtga gtgtccatga aacagctgaa cggcactttt atcggcagtc cgagctgttg 7860 ataccagacg tgctggctaa tgtgaacttc tcacaggccg acgaagtgat cgctgatctg 7920 cgggataaac tgcaccaact gtgcgagatg ctgtttaatc aaagcgtcgc tccttatgcc 7980 caccacccaa agctgatctc cacgctggcc ctggcgcgcg ccacacttta taaacatctc 8040 cgcgaactga aaccccaggg gggccccagc aatggctaat aatctagagg gccctattct 8100 atagtgtcac ctaaatgcta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 8160 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 8220 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 8280 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 8340 tgctggggat gcggtgggct ctatggcttc tgaggcggaa agaaccagct ggggctctag 8400 ggggtatccc cacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 8460 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 8520 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 8580 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 8640 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 8700 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 8760 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 8820 acaaaaattt aacgcgaatt aattctgtgg aatgtgtgtc agttagggtg tggaaagtcc 8880 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg 8940 tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 9000 tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc gcccagttcc 9060 gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc cgaggccgcc 9120 tctgcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct aggcttttgc 9180 aaaaagctcc cgggagcttg tatatccatt ttcggatctg atcaagagac aggatgagga 9240 tcgtttcgca tgattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 9300 aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 9360 cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 9420 aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 9480 gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 9540 ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 9600 gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 9660 aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 9720 ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 9780 atgcccgacg gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 9840 gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 9900 tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 9960 gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 10020 cgccttcttg acgagttctt ctgagcggga ctctggggtt cgaaatgacc gaccaagcga 10080 cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 10140 tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 10200 agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 10260 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 10320 aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag agcttggcgt 10380 aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca 10440 tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat 10500 taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt 10560 aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct 10620 cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 10680 aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 10740 aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 10800 tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 10860 caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 10920 cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 10980 ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 11040 gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 11100 agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 11160 gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 11220 acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 11280 gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 11340 gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 11400 cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 11460 caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 11520 gtatatatga gtaaacttgg t 11541 <210> 390 <211> 555 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: StrepIIHRV3C-Cse2 <400> 390 atggcaagct ggagccaccc gcagttcgaa aagggtgcac ttgaagtcct ctttcaggga 60 cccgggtacc agatggctga tgaaattgat gcaatggctt tatatcgagc ctggcaacaa 120 ctggataatg gatcatgtgc gcaaattaga cgtgtttcag aacctgatga attacgcgat 180 atccctgcgt tttataggct ggtgcaacct tttggttggg aaaacccacg tcaccagcag 240 gctcttttgc gcatggtgtt ttgcctgagc gcaggaaaga atgtcatccg acatcaggac 300 aaaaaatcgg agcaaacaac aggtatctcg ttgggaagag ctttagccaa tagtggaaga 360 attaacgagc gccgtatctt tcaattaatt cgggctgaca gaacagccga tatggtccag 420 ttacgtcgat tacttactca cgccgaaccc gtacttgact ggccattaat ggccaggatg 480 ttgacctggt ggggaaagcg cgaacgccag caacttctgg aagattttgt attgaccaca 540 aacaaaaatg cgtaa 555 <210> 391 <211> 184 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: StrepIIHRV3C-Cse2 <400> 391 Met Ala Ser Trp Ser His Pro Gln Phe Glu Lys Gly Ala Leu Glu Val 1 5 10 15 Leu Phe Gln Gly Pro Gly Tyr Gln Met Ala Asp Glu Ile Asp Ala Met 20 25 30 Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln 35 40 45 Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe 50 55 60 Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln 65 70 75 80 Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile 85 90 95 Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly 100 105 110 Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln 115 120 125 Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu 130 135 140 Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met 145 150 155 160 Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe 165 170 175 Val Leu Thr Thr Asn Lys Asn Ala 180 <210> 392 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: His6HRV3CCse2 <400> 392 atggctgagc atcaccacca tcatcacggt gcacttgaag tcctctttca gggacccggg 60 taccagatgg ctgatgaaat tgatgcaatg gctttatatc gagcctggca acaactggat 120 aatggatcat gtgcgcaaat tagacgtgtt tcagaacctg atgaattacg cgatatccct 180 gcgttttata ggctggtgca accttttggt tgggaaaacc cacgtcacca gcaggctctt 240 ttgcgcatgg tgttttgcct gagcgcagga aagaatgtca tccgacatca ggacaaaaaa 300 tcggagcaaa caacaggtat ctcgttggga agagctttag ccaatagtgg aagaattaac 360 gagcgccgta tctttcaatt aattcgggct gacagaacag ccgatatggt ccagttacgt 420 cgattactta ctcacgccga acccgtactt gactggccat taatggccag gatgttgacc 480 tggtggggaa agcgcgaacg ccagcaactt ctggaagatt ttgtattgac cacaaacaaa 540 aatgcgtaa 549 <210> 393 <211> 182 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: His6HRV3CCse2 <400> 393 Met Ala Glu His His His His His His Gly Ala Leu Glu Val Leu Phe 1 5 10 15 Gln Gly Pro Gly Tyr Gln Met Ala Asp Glu Ile Asp Ala Met Ala Leu 20 25 30 Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg 35 40 45 Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg 50 55 60 Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu 65 70 75 80 Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His 85 90 95 Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala 100 105 110 Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile 115 120 125 Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr 130 135 140 His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr 145 150 155 160 Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu 165 170 175 Thr Thr Asn Lys Asn Ala 180 <210> 394 <211> 516 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSCse2 <400> 394 atgccgaaaa aaaagcggaa ggtcggatca ggaatggccg acgagattga cgcaatggca 60 ctttaccggg cctggcagca gttggataat ggttcatgtg cccagattcg cagagttagt 120 gaacctgacg aactgagaga tatccccgcg ttttacagac ttgtccaacc gttcggatgg 180 gagaacccac ggcaccaaca agcactcctt cgaatggtct tctgtttgtc cgcaggaaaa 240 aatgtaatca gacaccaaga caaaaagagc gagcaaacca caggtatcag cctgggcagg 300 gcacttgcca actctgggcg gatcaacgaa aggagaattt ttcagctgat acgcgctgat 360 cggactgcgg acatggtgca gctgcgcaga ctccttactc atgccgaacc tgtcctggat 420 tggcccctga tggcacgcat gctgacttgg tggggaaaga gagaaagaca gcaactgctt 480 gaagacttcg tgctcactac aaataagaat gcctaa 516 <210> 395 <211> 171 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLSCse2 <400> 395 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ala Asp Glu Ile 1 5 10 15 Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser 20 25 30 Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile 35 40 45 Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg 50 55 60 His Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys 65 70 75 80 Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile 85 90 95 Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg 100 105 110 Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu 115 120 125 Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met 130 135 140 Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu 145 150 155 160 Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala 165 170 <210> 396 <211> 708 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLSCas5 <400> 396 atgcccaaga aaaagagaaa agtaggatcg ggcatgcgga gctatctcat cctgagactg 60 gccggaccaa tgcaggcctg gggacagcct accttcgaag gtacacgccc cacaggccgc 120 tttcctacca ggagcggcct gctgggcctg cttggcgctt gtcttgggat ccagcgcgat 180 gatactagct ccctgcaagc actgtcagag agcgtgcagt ttgccgtaag atgcgacgaa 240 ctgatccttg atgataggcg ggtcagtgtc actggtctcc gggactacca cacggtgctg 300 ggggcccggg aggattatag gggcctgaaa agtcacgaga cgattcaaac ctggcgcgaa 360 tatctgtgcg atgccagctt caccgtggcc ctgtggctga ctccacatgc cactatggtc 420 atcagtgaac tggaaaaggc tgttcttaag cctcgatata ctccgtatct gggccgccgg 480 agttgtccac ttacacaccc acttttcctc ggcacctgcc aggccagcga ccctcaaaag 540 gcccttctga attacgagcc agttggcggt gacatataca gcgaagagtc cgtgacggga 600 caccatctta agttcaccgc tcgggacgag cccatgatta ccctcccacg gcagttcgca 660 tcaagggagt ggtacgtcat aaaggggggc atggatgtga gtcagtaa 708 <210> 397 <211> 235 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLSCas5 <400> 397 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Arg Ser Tyr Leu 1 5 10 15 Ile Leu Arg Leu Ala Gly Pro Met Gln Ala Trp Gly Gln Pro Thr Phe 20 25 30 Glu Gly Thr Arg Pro Thr Gly Arg Phe Pro Thr Arg Ser Gly Leu Leu 35 40 45 Gly Leu Leu Gly Ala Cys Leu Gly Ile Gln Arg Asp Asp Thr Ser Ser 50 55 60 Leu Gln Ala Leu Ser Glu Ser Val Gln Phe Ala Val Arg Cys Asp Glu 65 70 75 80 Leu Ile Leu Asp Asp Arg Arg Val Ser Val Thr Gly Leu Arg Asp Tyr 85 90 95 His Thr Val Leu Gly Ala Arg Glu Asp Tyr Arg Gly Leu Lys Ser His 100 105 110 Glu Thr Ile Gln Thr Trp Arg Glu Tyr Leu Cys Asp Ala Ser Phe Thr 115 120 125 Val Ala Leu Trp Leu Thr Pro His Ala Thr Met Val Ile Ser Glu Leu 130 135 140 Glu Lys Ala Val Leu Lys Pro Arg Tyr Thr Pro Tyr Leu Gly Arg Arg 145 150 155 160 Ser Cys Pro Leu Thr His Pro Leu Phe Leu Gly Thr Cys Gln Ala Ser 165 170 175 Asp Pro Gln Lys Ala Leu Leu Asn Tyr Glu Pro Val Gly Gly Asp Ile 180 185 190 Tyr Ser Glu Glu Ser Val Thr Gly His His Leu Lys Phe Thr Ala Arg 195 200 205 Asp Glu Pro Met Ile Thr Leu Pro Arg Gln Phe Ala Ser Arg Glu Trp 210 215 220 Tyr Val Ile Lys Gly Gly Met Asp Val Ser Gln 225 230 235 <210> 398 <211> 633 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas6 <400> 398 atgccaaaga aaaaacgtaa ggttggcggt agcatgtacc tcagcaaagt catcattgcc 60 agggcctgga gcagggatct ttaccaactt caccagggat tatggcattt atttccaaac 120 agaccggatg ctgctcgtga ttttcttttt catgttgaga agcgaaacac accagaaggc 180 tgtcatgttt tattgcagtc agcgcaaatg cctgtttcaa ctgccgttgc gacagtcatt 240 aaaactaaac aggttgaatt tcaacttcag gttggtgttc cactctattt tcggcttcgg 300 gcaaatccga tcaaaactat tctcgacaat caaaagcgcc tggacagtaa agggaatatt 360 aaacgctgtc gggttccgtt aataaaagaa gcagaacaaa tcgcgtggtt gcaacgtaaa 420 ttgggcaatg cggcgcgcgt tgaagatgtg catcccatat cggaacggcc acagtatttt 480 tctggtgatg gtaaaagtgg aaagatccaa acggtttgct ttgaaggtgt gctcaccatc 540 aacgacgcgc cagcgttaat agatcttgta cagcaaggta ttgggccagc taaatcgatg 600 ggatgtggct tgctatcttt ggctccactg tga 633 <210> 399 <211> 210 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas6 <400> 399 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Met Tyr Leu Ser Lys 1 5 10 15 Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu Tyr Gln Leu His Gln 20 25 30 Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp Ala Ala Arg Asp Phe 35 40 45 Leu Phe His Val Glu Lys Arg Asn Thr Pro Glu Gly Cys His Val Leu 50 55 60 Leu Gln Ser Ala Gln Met Pro Val Ser Thr Ala Val Ala Thr Val Ile 65 70 75 80 Lys Thr Lys Gln Val Glu Phe Gln Leu Gln Val Gly Val Pro Leu Tyr 85 90 95 Phe Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile Leu Asp Asn Gln Lys 100 105 110 Arg Leu Asp Ser Lys Gly Asn Ile Lys Arg Cys Arg Val Pro Leu Ile 115 120 125 Lys Glu Ala Glu Gln Ile Ala Trp Leu Gln Arg Lys Leu Gly Asn Ala 130 135 140 Ala Arg Val Glu Asp Val His Pro Ile Ser Glu Arg Pro Gln Tyr Phe 145 150 155 160 Ser Gly Asp Gly Lys Ser Gly Lys Ile Gln Thr Val Cys Phe Glu Gly 165 170 175 Val Leu Thr Ile Asn Asp Ala Pro Ala Leu Ile Asp Leu Val Gln Gln 180 185 190 Gly Ile Gly Pro Ala Lys Ser Met Gly Cys Gly Leu Leu Ser Leu Ala 195 200 205 Pro Leu 210 <210> 400 <211> 669 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-HA-Cas6 <400> 400 atgccaaaga aaaaacgtaa ggttggcggt agctatccgt acgatgttcc agactacgcc 60 ggcggctcca tgtacctcag caaagtcatc attgccaggg cctggagcag ggatctttac 120 caacttcacc agggattatg gcatttattt ccaaacagac cggatgctgc tcgtgatttt 180 ctttttcatg ttgagaagcg aaacacacca gaaggctgtc atgttttatt gcagtcagcg 240 caaatgcctg tttcaactgc cgttgcgaca gtcattaaaa ctaaacaggt tgaatttcaa 300 cttcaggttg gtgttccact ctattttcgg cttcgggcaa atccgatcaa aactattctc 360 gacaatcaaa agcgcctgga cagtaaaggg aatattaaac gctgtcgggt tccgttaata 420 aaagaagcag aacaaatcgc gtggttgcaa cgtaaattgg gcaatgcggc gcgcgttgaa 480 gatgtgcatc ccatatcgga acggccacag tatttttctg gtgatggtaa aagtggaaag 540 atccaaacgg tttgctttga aggtgtgctc accatcaacg acgcgccagc gttaatagat 600 cttgtacagc aaggtattgg gccagctaaa tcgatgggat gtggcttgct atctttggct 660 ccactgtga 669 <210> 401 <211> 222 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLS-HA-Cas6 <400> 401 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Tyr Pro Tyr Asp Val 1 5 10 15 Pro Asp Tyr Ala Gly Gly Ser Met Tyr Leu Ser Lys Val Ile Ile Ala 20 25 30 Arg Ala Trp Ser Arg Asp Leu Tyr Gln Leu His Gln Gly Leu Trp His 35 40 45 Leu Phe Pro Asn Arg Pro Asp Ala Ala Arg Asp Phe Leu Phe His Val 50 55 60 Glu Lys Arg Asn Thr Pro Glu Gly Cys His Val Leu Leu Gln Ser Ala 65 70 75 80 Gln Met Pro Val Ser Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln 85 90 95 Val Glu Phe Gln Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg 100 105 110 Ala Asn Pro Ile Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser 115 120 125 Lys Gly Asn Ile Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu 130 135 140 Gln Ile Ala Trp Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu 145 150 155 160 Asp Val His Pro Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp Gly 165 170 175 Lys Ser Gly Lys Ile Gln Thr Val Cys Phe Glu Gly Val Leu Thr Ile 180 185 190 Asn Asp Ala Pro Ala Leu Ile Asp Leu Val Gln Gln Gly Ile Gly Pro 195 200 205 Ala Lys Ser Met Gly Cys Gly Leu Leu Ser Leu Ala Pro Leu 210 215 220 <210> 402 <211> 633 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas6 <400> 402 atgcccaaga aaaagagaaa agtaggatcg ggcatgtatc tgtcaaaggt tatcattgca 60 cgcgcgtgga gtagggatct gtatcagctg caccagggtc tgtggcatct tttcccgaac 120 cgccccgacg cggcacgaga ctttctgttt cacgttgaaa aaagaaacac ccccgagggc 180 tgtcatgtgc tcctgcagtc tgcccagatg ccggtgagca cagctgtggc gactgtgatc 240 aagaccaagc aggtcgagtt tcagctccag gtaggggttc cactgtattt tcgcctgaga 300 gctaatccga tcaaaaccat actggataat cagaagaggc tcgacagcaa aggaaatatt 360 aaaaggtgcc gggtcccgct catcaaagag gctgagcaaa tcgcttggct tcaacggaaa 420 ctggggaacg cagcccgcgt ggaagacgtc cacccgatta gtgaacggcc ccaatatttt 480 tccggagacg gaaagagcgg caagattcag acagtctgtt tcgagggggt gctcaccatc 540 aatgatgccc ccgccctgat agacctggtg cagcagggca taggccccgc taaaagcatg 600 ggatgcggac tgcttagtct ggcaccgctg taa 633 <210> 403 <211> 210 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas6 <400> 403 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Tyr Leu Ser Lys 1 5 10 15 Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu Tyr Gln Leu His Gln 20 25 30 Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp Ala Ala Arg Asp Phe 35 40 45 Leu Phe His Val Glu Lys Arg Asn Thr Pro Glu Gly Cys His Val Leu 50 55 60 Leu Gln Ser Ala Gln Met Pro Val Ser Thr Ala Val Ala Thr Val Ile 65 70 75 80 Lys Thr Lys Gln Val Glu Phe Gln Leu Gln Val Gly Val Pro Leu Tyr 85 90 95 Phe Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile Leu Asp Asn Gln Lys 100 105 110 Arg Leu Asp Ser Lys Gly Asn Ile Lys Arg Cys Arg Val Pro Leu Ile 115 120 125 Lys Glu Ala Glu Gln Ile Ala Trp Leu Gln Arg Lys Leu Gly Asn Ala 130 135 140 Ala Arg Val Glu Asp Val His Pro Ile Ser Glu Arg Pro Gln Tyr Phe 145 150 155 160 Ser Gly Asp Gly Lys Ser Gly Lys Ile Gln Thr Val Cys Phe Glu Gly 165 170 175 Val Leu Thr Ile Asn Asp Ala Pro Ala Leu Ile Asp Leu Val Gln Gln 180 185 190 Gly Ile Gly Pro Ala Lys Ser Met Gly Cys Gly Leu Leu Ser Leu Ala 195 200 205 Pro Leu 210 <210> 404 <211> 1122 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas7-NLS <400> 404 atgtctaact ttatcaatat tcatgttctg atctctcaca gcccttcatg tctgaaccgc 60 gacgatatga acatgcagaa agacgctatt ttcggcggca aaagacgagt aagaatttca 120 agtcaaagcc ttaaacgtgc gatgcgtaaa agtggttatt acgcacaaaa tattggtgaa 180 tccagtctca gaaccattca tcttgcacaa ttacgtgatg ttcttcggca aaaacttggt 240 gaacgttttg accaaaaaat catcgataag acattagcgc tgctctccgg taaatcagtt 300 gatgaagccg aaaagatttc tgccgatgcg gttactccct gggttgtggg agaaatagcc 360 tggttctgtg agcaggttgc aaaagcagag gctgataatc tggatgataa aaagctgctc 420 aaagttctta aggaagatat tgccgccata cgtgtgaatt tacagcaggg tgttgatatt 480 gcgcttagtg gaagaatggc aaccagcggc atgatgactg agttgggaaa agttgatggt 540 gcaatgtcca ttgcgcatgc gatcactact catcaggttg attctgatat tgactggttc 600 accgctgtag atgatttaca ggaacaaggt tctgcacatc tgggaactca ggaattttca 660 tcgggtgttt tttatcgtta tgccaacatt aacctcgctc aacttcagga aaatttaggt 720 ggtgcctcca gggagcaggc tctggaaatt gcaacccatg ttgttcatat gctggcaaca 780 gaggtccctg gagcaaaaca gcgtacttat gccgctttta accctgcgga tatggtaatg 840 gttaatttct ccgatatgcc actttctatg gcaaatgctt ttgaaaaagc ggttaaagcg 900 aaagatggct ttttgcaacc gtctatacag gcgtttaatc aatattggga tcgcgttgcc 960 aatggatatg gtctgaacgg agctgctgcg caattcagct tatctgatgt agacccaatt 1020 actgctcaag ttaaacaaat gcctacttta gaacagttaa aatcctgggt tcgtaataat 1080 ggcgaggcgg gcggtagccc aaagaaaaaa cgtaaggttt ga 1122 <210> 405 <211> 373 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas7-NLS <400> 405 Met Ser Asn Phe Ile Asn Ile His Val Leu Ile Ser His Ser Pro Ser 1 5 10 15 Cys Leu Asn Arg Asp Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly 20 25 30 Gly Lys Arg Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met 35 40 45 Arg Lys Ser Gly Tyr Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg 50 55 60 Thr Ile His Leu Ala Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly 65 70 75 80 Glu Arg Phe Asp Gln Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser 85 90 95 Gly Lys Ser Val Asp Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr 100 105 110 Pro Trp Val Val Gly Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys 115 120 125 Ala Glu Ala Asp Asn Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys 130 135 140 Glu Asp Ile Ala Ala Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile 145 150 155 160 Ala Leu Ser Gly Arg Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly 165 170 175 Lys Val Asp Gly Ala Met Ser Ile Ala His Ala Ile Thr Thr His Gln 180 185 190 Val Asp Ser Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu 195 200 205 Gln Gly Ser Ala His Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe 210 215 220 Tyr Arg Tyr Ala Asn Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly 225 230 235 240 Gly Ala Ser Arg Glu Gln Ala Leu Glu Ile Ala Thr His Val Val His 245 250 255 Met Leu Ala Thr Glu Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala 260 265 270 Phe Asn Pro Ala Asp Met Val Met Val Asn Phe Ser Asp Met Pro Leu 275 280 285 Ser Met Ala Asn Ala Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe 290 295 300 Leu Gln Pro Ser Ile Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala 305 310 315 320 Asn Gly Tyr Gly Leu Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp 325 330 335 Val Asp Pro Ile Thr Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln 340 345 350 Leu Lys Ser Trp Val Arg Asn Asn Gly Glu Ala Gly Gly Ser Pro Lys 355 360 365 Lys Lys Arg Lys Val 370 <210> 406 <211> 1158 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas7-HA-NLS <400> 406 atgtctaact ttatcaatat tcatgttctg atctctcaca gcccttcatg tctgaaccgc 60 gacgatatga acatgcagaa agacgctatt ttcggcggca aaagacgagt aagaatttca 120 agtcaaagcc ttaaacgtgc gatgcgtaaa agtggttatt acgcacaaaa tattggtgaa 180 tccagtctca gaaccattca tcttgcacaa ttacgtgatg ttcttcggca aaaacttggt 240 gaacgttttg accaaaaaat catcgataag acattagcgc tgctctccgg taaatcagtt 300 gatgaagccg aaaagatttc tgccgatgcg gttactccct gggttgtggg agaaatagcc 360 tggttctgtg agcaggttgc aaaagcagag gctgataatc tggatgataa aaagctgctc 420 aaagttctta aggaagatat tgccgccata cgtgtgaatt tacagcaggg tgttgatatt 480 gcgcttagtg gaagaatggc aaccagcggc atgatgactg agttgggaaa agttgatggt 540 gcaatgtcca ttgcgcatgc gatcactact catcaggttg attctgatat tgactggttc 600 accgctgtag atgatttaca ggaacaaggt tctgcacatc tgggaactca ggaattttca 660 tcgggtgttt tttatcgtta tgccaacatt aacctcgctc aacttcagga aaatttaggt 720 ggtgcctcca gggagcaggc tctggaaatt gcaacccatg ttgttcatat gctggcaaca 780 gaggtccctg gagcaaaaca gcgtacttat gccgctttta accctgcgga tatggtaatg 840 gttaatttct ccgatatgcc actttctatg gcaaatgctt ttgaaaaagc ggttaaagcg 900 aaagatggct ttttgcaacc gtctatacag gcgtttaatc aatattggga tcgcgttgcc 960 aatggatatg gtctgaacgg agctgctgcg caattcagct tatctgatgt agacccaatt 1020 actgctcaag ttaaacaaat gcctacttta gaacagttaa aatcctgggt tcgtaataat 1080 ggcgaggcgg gcggctccta tccgtacgat gttccagact acgccggcgg tagcccaaag 1140 aaaaaacgta aggtttga 1158 <210> 407 <211> 385 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas7-HA-NLS <400> 407 Met Ser Asn Phe Ile Asn Ile His Val Leu Ile Ser His Ser Pro Ser 1 5 10 15 Cys Leu Asn Arg Asp Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly 20 25 30 Gly Lys Arg Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met 35 40 45 Arg Lys Ser Gly Tyr Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg 50 55 60 Thr Ile His Leu Ala Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly 65 70 75 80 Glu Arg Phe Asp Gln Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser 85 90 95 Gly Lys Ser Val Asp Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr 100 105 110 Pro Trp Val Val Gly Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys 115 120 125 Ala Glu Ala Asp Asn Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys 130 135 140 Glu Asp Ile Ala Ala Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile 145 150 155 160 Ala Leu Ser Gly Arg Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly 165 170 175 Lys Val Asp Gly Ala Met Ser Ile Ala His Ala Ile Thr Thr His Gln 180 185 190 Val Asp Ser Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu 195 200 205 Gln Gly Ser Ala His Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe 210 215 220 Tyr Arg Tyr Ala Asn Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly 225 230 235 240 Gly Ala Ser Arg Glu Gln Ala Leu Glu Ile Ala Thr His Val Val His 245 250 255 Met Leu Ala Thr Glu Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala 260 265 270 Phe Asn Pro Ala Asp Met Val Met Val Asn Phe Ser Asp Met Pro Leu 275 280 285 Ser Met Ala Asn Ala Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe 290 295 300 Leu Gln Pro Ser Ile Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala 305 310 315 320 Asn Gly Tyr Gly Leu Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp 325 330 335 Val Asp Pro Ile Thr Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln 340 345 350 Leu Lys Ser Trp Val Arg Asn Asn Gly Glu Ala Gly Gly Ser Tyr Pro 355 360 365 Tyr Asp Val Pro Asp Tyr Ala Gly Gly Ser Pro Lys Lys Lys Arg Lys 370 375 380 Val 385 <210> 408 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas7 <400> 408 atgccgaaaa aaaagcggaa ggtcggatca ggaatgtcaa attttattaa tattcatgtt 60 ctgatcagtc atagcccgag ttgcctgaat agagacgaca tgaatatgca gaaagacgca 120 attttcggtg gcaagaggcg agtccgaata agcagccaaa gtcttaagcg agccatgagg 180 aagagcggct attatgccca gaatatcggc gagtcctcat tgcggaccat ccacctcgcc 240 cagttgagag acgtcttgag gcagaaactg ggggaaagat tcgaccagaa aatcattgac 300 aagacccttg ccctccttag tgggaagagc gtggacgagg ctgaaaaaat ctctgccgac 360 gccgtaacgc cctgggttgt gggtgagatt gcttggtttt gtgaacaggt ggcgaaggcg 420 gaggccgata acctggatga caagaagctg ctgaaggtcc ttaaggagga catagctgcc 480 attcgggtca atttgcagca gggagtggat atcgcattgt ccggaagaat ggctacatca 540 ggcatgatga ccgagctggg caaggtagac ggagccatga gtatcgcaca cgccatcacc 600 acccaccaag tcgactcaga catcgactgg ttcacagcag tagatgacct ccaggagcag 660 gggtctgccc accttgggac acaggagttc tcttccgggg tgttttatcg ctatgctaat 720 atcaatctgg cgcagctgca agaaaacctg gggggagcct ctcgagagca ggccctggag 780 attgcaactc acgtcgtgca tatgcttgcg acagaggtac ctggcgccaa gcagaggaca 840 tacgctgctt ttaatccagc agatatggtc atggtaaatt tctctgatat gcctctctcc 900 atggccaacg cattcgagaa ggcagtgaag gcaaaggacg ggttcctgca gccatcaatt 960 caagcgttta atcagtattg ggacagagtg gcgaacggct atggactgaa cggagccgca 1020 gctcagttta gcctcagcga tgtcgatccc ataactgcac aggtgaaaca gatgcctacg 1080 ttggaacagc tgaagtcatg ggtaagaaat aacggcgaag cctaa 1125 <210> 409 <211> 374 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas7 <400> 409 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala 370 <210> 410 <211> 2670 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-Cas8 <400> 410 atgcaccatc accatcacca tggaaaaatc gaagaaggta aactggtaat ctggattaac 60 ggcgataaag gctataacgg tctcgctgaa gtcggtaaga aattcgagaa agataccgga 120 attaaagtca ccgttgagca tccggataaa ctggaagaga aattcccaca ggttgcggca 180 actggcgatg gccctgacat tatcttctgg gcacacgacc gctttggtgg ctacgctcaa 240 tctggcctgt tggctgaaat caccccggac aaagcgttcc aggacaagct gtatccgttt 300 acctgggatg ccgtacgtta caacggcaag ctgattgctt acccgatcgc tgttgaagcg 360 ttatcgctga tttataacaa agatctgctg ccgaacccgc caaaaacctg ggaagagatc 420 ccggcgctgg ataaagaact gaaagcgaaa ggtaagagcg cgctgatgtt caacctgcaa 480 gaaccgtact tcacctggcc gctgattgct gctgacgggg gttatgcgtt caagtatgaa 540 aacggcaagt acgacattaa agacgtgggc gtggataacg ctggcgcgaa agcgggtctg 600 accttcctgg ttgacctgat taaaaacaaa cacatgaatg cagacaccga ttactccatc 660 gcagaagctg cctttaataa aggcgaaaca gcgatgacca tcaacggccc gtgggcatgg 720 tccaacatcg acaccagcaa agtgaattat ggtgtaacgg tactgccgac cttcaagggt 780 caaccatcca aaccgttcgt tggcgtgctg agcgcaggta ttaacgccgc cagtccgaac 840 aaagagctgg caaaagagtt cctcgaaaac tatctgctga ctgatgaagg tctggaagcg 900 gttaataaag acaaaccgct gggtgccgta gcgctgaagt cttacgagga agagttggcg 960 aaagatccac gtattgccgc cactatggaa aacgcccaga aaggtgaaat catgccgaac 1020 atcccgcaga tgtccgcttt ctggtatgcc gtgcgtactg cggtgatcaa cgccgccagc 1080 ggtcgtcaga ctgtcgatga agccctgaaa gacgcgcaga ctaatgggat cgaggaaaac 1140 ctgtacttcc aatccaatgc aatgaatttg cttattgata actggatccc tgtacgcccg 1200 cgaaacgggg ggaaagtcca aatcataaat ctgcaatcgc tatactgcag tagagatcag 1260 tggcgattaa gtttgccccg tgacgatatg gaactggccg ctttagcact gctggtttgc 1320 attgggcaaa ttatcgcccc ggcaaaagat gacgttgaat ttcgacatcg cataatgaat 1380 ccgctcactg aagatgagtt tcaacaactc atcgcgccgt ggatagatat gttctacctt 1440 aatcacgcag aacatccctt tatgcagacc aaaggtgtca aagcaaatga tgtgactcca 1500 atggaaaaac tgttggctgg ggtaagcggc gcgacgaatt gtgcatttgt caatcaaccg 1560 gggcagggtg aagcattatg tggtggatgc actgcgattg cgttattcaa ccaggcgaat 1620 caggcaccag gttttggtgg tggttttaaa agcggtttac gtggaggaac acctgtaaca 1680 acgttcgtac gtgggatcga tcttcgttca acggtgttac tcaatgtcct cacattacct 1740 cgtcttcaaa aacaatttcc taatgaatca catacggaaa accaacctac ctggattaaa 1800 cctatcaagt ccaatgagtc tatacctgct tcgtcaattg ggtttgtccg tggtctattc 1860 tggcaaccag cgcatattga attatgcgat cccattggga ttggtaaatg ttcttgctgt 1920 ggacaggaaa gcaatttgcg ttataccggt tttcttaagg aaaaatttac ctttacagtt 1980 aatgggctat ggccccatcc gcattcccct tgtctggtaa cagtcaagaa aggggaggtt 2040 gaggaaaaat ttcttgcttt caccacctcc gcaccatcat ggacacaaat cagccgagtt 2100 gtggtagata agattattca aaatgaaaat ggaaatcgcg tggcggcggt tgtgaatcaa 2160 ttcagaaata ttgcgccgca aagtcctctt gaattgatta tggggggata tcgtaataat 2220 caagcatcta ttcttgaacg gcgtcatgat gtgttgatgt ttaatcaggg gtggcaacaa 2280 tacggcaatg tgataaacga aatagtgact gttggtttgg gatataaaac agccttacgc 2340 aaggcgttat atacctttgc agaagggttt aaaaataaag acttcaaagg ggccggagtc 2400 tctgttcatg agactgcaga aaggcatttc tatcgacaga gtgaattatt aattcccgat 2460 gtactggcga atgttaattt ttcccaggct gatgaggtaa tagctgattt acgagacaaa 2520 cttcatcaat tgtgtgaaat gctatttaat caatctgtag ctccctatgc acatcatcct 2580 aaattaataa gcacattagc gcttgcccgc gccacgctat acaaacattt acgggagtta 2640 aaaccgcaag gagggccatc aaatggctga 2670 <210> 411 <211> 889 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-Cas8 <400> 411 Met His His His His His His Gly Lys Ile Glu Glu Gly Lys Leu Val 1 5 10 15 Ile Trp Ile Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly 20 25 30 Lys Lys Phe Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro 35 40 45 Asp Lys Leu Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly 50 55 60 Pro Asp Ile Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln 65 70 75 80 Ser Gly Leu Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys 85 90 95 Leu Tyr Pro Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile 100 105 110 Ala Tyr Pro Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp 115 120 125 Leu Leu Pro Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp 130 135 140 Lys Glu Leu Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln 145 150 155 160 Glu Pro Tyr Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala 165 170 175 Phe Lys Tyr Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp 180 185 190 Asn Ala Gly Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys 195 200 205 Asn Lys His Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala 210 215 220 Phe Asn Lys Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp 225 230 235 240 Ser Asn Ile Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro 245 250 255 Thr Phe Lys Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala 260 265 270 Gly Ile Asn Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu 275 280 285 Glu Asn Tyr Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp 290 295 300 Lys Pro Leu Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala 305 310 315 320 Lys Asp Pro Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu 325 330 335 Ile Met Pro Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg 340 345 350 Thr Ala Val Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala 355 360 365 Leu Lys Asp Ala Gln Thr Asn Gly Ile Glu Glu Asn Leu Tyr Phe Gln 370 375 380 Ser Asn Ala Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro 385 390 395 400 Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys 405 410 415 Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu 420 425 430 Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala 435 440 445 Lys Asp Asp Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu 450 455 460 Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu 465 470 475 480 Asn His Ala Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn 485 490 495 Asp Val Thr Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr 500 505 510 Asn Cys Ala Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly 515 520 525 Gly Cys Thr Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly 530 535 540 Phe Gly Gly Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr 545 550 555 560 Thr Phe Val Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val 565 570 575 Leu Thr Leu Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr 580 585 590 Glu Asn Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile 595 600 605 Pro Ala Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala 610 615 620 His Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys 625 630 635 640 Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe 645 650 655 Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu 660 665 670 Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr 675 680 685 Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys 690 695 700 Ile Ile Gln Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln 705 710 715 720 Phe Arg Asn Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly 725 730 735 Tyr Arg Asn Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu 740 745 750 Met Phe Asn Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile 755 760 765 Val Thr Val Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr 770 775 780 Thr Phe Ala Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val 785 790 795 800 Ser Val His Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu 805 810 815 Leu Ile Pro Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu 820 825 830 Val Ile Ala Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu 835 840 845 Phe Asn Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser 850 855 860 Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu 865 870 875 880 Lys Pro Gln Gly Gly Pro Ser Asn Gly 885 <210> 412 <211> 3369 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-NLS-FokI-linker-Cas8 <400> 412 atgcaccatc accatcacca tggaaaaatc gaagaaggta aactggtaat ctggattaac 60 ggcgataaag gctataacgg tctcgctgaa gtcggtaaga aattcgagaa agataccgga 120 attaaagtca ccgttgagca tccggataaa ctggaagaga aattcccaca ggttgcggca 180 actggcgatg gccctgacat tatcttctgg gcacacgacc gctttggtgg ctacgctcaa 240 tctggcctgt tggctgaaat caccccggac aaagcgttcc aggacaagct gtatccgttt 300 acctgggatg ccgtacgtta caacggcaag ctgattgctt acccgatcgc tgttgaagcg 360 ttatcgctga tttataacaa agatctgctg ccgaacccgc caaaaacctg ggaagagatc 420 ccggcgctgg ataaagaact gaaagcgaaa ggtaagagcg cgctgatgtt caacctgcaa 480 gaaccgtact tcacctggcc gctgattgct gctgacgggg gttatgcgtt caagtatgaa 540 aacggcaagt acgacattaa agacgtgggc gtggataacg ctggcgcgaa agcgggtctg 600 accttcctgg ttgacctgat taaaaacaaa cacatgaatg cagacaccga ttactccatc 660 gcagaagctg cctttaataa aggcgaaaca gcgatgacca tcaacggccc gtgggcatgg 720 tccaacatcg acaccagcaa agtgaattat ggtgtaacgg tactgccgac cttcaagggt 780 caaccatcca aaccgttcgt tggcgtgctg agcgcaggta ttaacgccgc cagtccgaac 840 aaagagctgg caaaagagtt cctcgaaaac tatctgctga ctgatgaagg tctggaagcg 900 gttaataaag acaaaccgct gggtgccgta gcgctgaagt cttacgagga agagttggcg 960 aaagatccac gtattgccgc cactatggaa aacgcccaga aaggtgaaat catgccgaac 1020 atcccgcaga tgtccgcttt ctggtatgcc gtgcgtactg cggtgatcaa cgccgccagc 1080 ggtcgtcaga ctgtcgatga agccctgaaa gacgcgcaga ctaatgggat cgaggaaaac 1140 ctgtacttcc aatccaatat gccgaaaaaa aagcgcaaag tgcaactggt taaaagcgaa 1200 ctggaagaga aaaaaagtga actgcgccac aaactgaaat atgtgccgca tgaatatatc 1260 gagctgattg aaattgcacg taatccgacc caggatcgta ttctggaaat gaaagtgatg 1320 gaatttttta tgaaagtgta cggctatcgc ggtgaacatc tgggtggtag ccgtaaaccg 1380 gatggtgcaa tttataccgt tggtagcccg attgattatg gtgttattgt tgataccaaa 1440 gcctatagcg gtggttataa tctgccgatt ggtcaggcag atgaaatgca gcgttatgtg 1500 gaagaaaatc agacccgtaa caaacatatt aatccgaatg aatggtggaa agtttatccg 1560 agcagcgtta ccgagtttaa attcctgttt gttagcggtc acttcaaagg caactataaa 1620 gcacagctga cccgtctgaa tcatattacc aattgtaatg gtgcagttct gagcgttgaa 1680 gaactgctga ttggtggtga aatgattaaa gcaggcaccc tgaccctgga agaagttcgt 1740 cgcaaattta acaatggcga aatcaacttt tcaggcagcg aaacgccggg tacaagtgag 1800 tcagcaactc cagagagcgg cggcagtggt agtagtgggg gatctgggtc atctggtggg 1860 atgaatttgc ttattgataa ctggattcct gtacgcccgc gaaacggggg gaaagtccaa 1920 atcataaatc tgcaatcgct atactgcagt agagatcagt ggcgattaag tttgccccgt 1980 gacgatatgg aactggccgc tttagcactg ctggtttgca ttgggcaaat tatcgccccg 2040 gcaaaagatg acgttgaatt tcgacatcgc ataatgaatc cgctcactga agatgagttt 2100 caacaactca tcgcgccgtg gatagatatg ttctacctta atcacgcaga acatcccttt 2160 atgcagacca aaggtgtcaa agcaaatgat gtgactccaa tggaaaaact gttggctggg 2220 gtaagcggcg cgacgaattg tgcatttgtc aatcaaccgg ggcagggtga agcattatgt 2280 ggtggatgca ctgcgattgc gttattcaac caggcgaatc aggcaccagg ttttggtggt 2340 ggttttaaaa gcggtttacg tggaggaaca cctgtaacaa cgttcgtacg tgggatcgat 2400 cttcgttcaa cggtgttact caatgtcctc acattacctc gtcttcaaaa acaatttcct 2460 aatgaatcac atacggaaaa ccaacctacc tggattaaac ctatcaagtc caatgagtct 2520 atacctgctt cgtcaattgg gtttgtccgt ggtctattct ggcaaccagc gcatattgaa 2580 ttatgcgatc ccattgggat tggtaaatgt tcttgctgtg gacaggaaag caatttgcgt 2640 tataccggtt ttcttaagga aaaatttacc tttacagtta atgggctatg gccccatccg 2700 cattcccctt gtctggtaac agtcaagaaa ggggaggttg aggaaaaatt tcttgctttc 2760 accacctccg caccatcatg gacacaaatc agccgagttg tggtagataa gattattcaa 2820 aatgaaaatg gaaatcgcgt ggcggcggtt gtgaatcaat tcagaaatat tgcgccgcaa 2880 agtcctcttg aattgattat ggggggatat cgtaataatc aagcatctat tcttgaacgg 2940 cgtcatgatg tgttgatgtt taatcagggg tggcaacaat acggcaatgt gataaacgaa 3000 atagtgactg ttggtttggg atataaaaca gccttacgca aggcgttata tacctttgca 3060 gaagggttta aaaataaaga cttcaaaggg gccggagtct ctgttcatga gactgcagaa 3120 aggcatttct atcgacagag tgaattatta attcccgatg tactggcgaa tgttaatttt 3180 tcccaggctg atgaggtaat agctgattta cgagacaaac ttcatcaatt gtgtgaaatg 3240 ctatttaatc aatctgtagc tccctatgca catcatccta aattaataag cacattagcg 3300 cttgcccgcg ccacgctata caaacattta cgggagttaa aaccgcaagg agggccatca 3360 aatggctga 3369 <210> 413 <211> 1122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-NLS-FokI-linker-Cas8 <400> 413 Met His His His His His His Gly Lys Ile Glu Glu Gly Lys Leu Val 1 5 10 15 Ile Trp Ile Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly 20 25 30 Lys Lys Phe Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro 35 40 45 Asp Lys Leu Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly 50 55 60 Pro Asp Ile Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln 65 70 75 80 Ser Gly Leu Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys 85 90 95 Leu Tyr Pro Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile 100 105 110 Ala Tyr Pro Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp 115 120 125 Leu Leu Pro Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp 130 135 140 Lys Glu Leu Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln 145 150 155 160 Glu Pro Tyr Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala 165 170 175 Phe Lys Tyr Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp 180 185 190 Asn Ala Gly Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys 195 200 205 Asn Lys His Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala 210 215 220 Phe Asn Lys Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp 225 230 235 240 Ser Asn Ile Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro 245 250 255 Thr Phe Lys Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala 260 265 270 Gly Ile Asn Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu 275 280 285 Glu Asn Tyr Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp 290 295 300 Lys Pro Leu Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala 305 310 315 320 Lys Asp Pro Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu 325 330 335 Ile Met Pro Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg 340 345 350 Thr Ala Val Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala 355 360 365 Leu Lys Asp Ala Gln Thr Asn Gly Ile Glu Glu Asn Leu Tyr Phe Gln 370 375 380 Ser Asn Met Pro Lys Lys Lys Arg Lys Val Gln Leu Val Lys Ser Glu 385 390 395 400 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 405 410 415 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Pro Thr Gln Asp 420 425 430 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 435 440 445 Tyr Arg Gly Glu His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 450 455 460 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 465 470 475 480 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 485 490 495 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 500 505 510 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 515 520 525 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 530 535 540 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 545 550 555 560 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 565 570 575 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ser Gly 580 585 590 Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Gly 595 600 605 Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly Met Asn Leu Leu 610 615 620 Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly Gly Lys Val Gln 625 630 635 640 Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp Gln Trp Arg Leu 645 650 655 Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu Ala Leu Leu Val 660 665 670 Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg 675 680 685 His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile 690 695 700 Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe 705 710 715 720 Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys 725 730 735 Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln 740 745 750 Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala Leu 755 760 765 Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe Lys Ser 770 775 780 Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg Gly Ile Asp 785 790 795 800 Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu Pro Arg Leu Gln 805 810 815 Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln Pro Thr Trp Ile 820 825 830 Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser Ser Ile Gly Phe 835 840 845 Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu Leu Cys Asp Pro 850 855 860 Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu Ser Asn Leu Arg 865 870 875 880 Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr Val Asn Gly Leu 885 890 895 Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val Lys Lys Gly Glu 900 905 910 Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr 915 920 925 Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly 930 935 940 Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln 945 950 955 960 Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser 965 970 975 Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln 980 985 990 Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly Tyr 995 1000 1005 Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly Phe 1010 1015 1020 Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu Thr 1025 1030 1035 Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro Asp 1040 1045 1050 Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 1055 1060 1065 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn 1070 1075 1080 Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr 1085 1090 1095 Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu 1100 1105 1110 Lys Pro Gln Gly Gly Pro Ser Asn Gly 1115 1120 <210> 414 <211> 1542 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas8 <400> 414 atgcccaaga aaaagagaaa agtaggatcg ggcatgaatt tgctcattga taattggatt 60 ccggtgcgcc cccggaacgg tgggaaagtg cagatcatca atttgcaaag tctctactgt 120 tccagggacc agtggagact cagcctgcca cgggatgata tggagctggc ggcgttggct 180 ctgctcgtat gcatcggcca gattattgcg ccagcaaagg atgacgttga attccggcat 240 cggataatga acccccttac tgaagatgag ttccagcagc ttatcgcccc atggatcgac 300 atgttctacc tcaaccacgc cgagcatcct tttatgcaga ccaagggagt caaggcgaat 360 gatgtgactc ccatggagaa gctgctggcc ggtgtatctg gggcgaccaa ctgcgcattc 420 gtgaatcagc ctggacaggg ggaggccctc tgtggaggct gcactgctat agcacttttt 480 aaccaagcta atcaagcccc cggctttggt ggagggttta agagtggatt gagggggggc 540 actcccgtaa ccacttttgt gaggggaatt gatctgaggt ctactgtgtt gctgaacgtc 600 ctcacactcc caaggctcca gaagcagttc ccaaacgaaa gtcataccga aaaccagccc 660 acatggatca agcccatcaa atctaatgag agcataccgg ctagcagtat tggatttgta 720 cggggtctgt tctggcagcc agctcacatc gagctgtgtg atcctattgg gatcggcaag 780 tgctcttgtt gtgggcagga gtccaacctt aggtatactg gatttctgaa agagaagttt 840 acctttacag taaatgggct ctggccccac ccccactcac cttgccttgt gacagtgaaa 900 aagggggaag tcgaggagaa gtttctggcc tttacaactt ctgccccttc ctggactcag 960 atttccagag tggtggtaga taagataatt caaaacgaga atggcaatag agtggccgcc 1020 gtggtgaacc agtttcgcaa catcgcccct cagtcccccc tggagctgat tatgggcggt 1080 tatcggaata accaggccag tatactcgag cgacggcacg atgtcctcat gttcaatcaa 1140 ggttggcagc aatatggcaa tgtgattaac gagatcgtaa ccgtgggcct gggatataag 1200 accgccctgc ggaaggcgtt gtatactttt gcagaaggct ttaagaataa ggattttaag 1260 ggtgccggcg tgagtgtcca tgaaacagct gaacggcact tttatcggca gtccgagctg 1320 ttgataccag acgtgctggc taatgtgaac ttctcacagg ccgacgaagt gatcgctgat 1380 ctgcgggata aactgcacca actgtgcgag atgctgttta atcaaagcgt cgctccttat 1440 gcccaccacc caaagctgat ctccacgctg gccctggcgc gcgccacact ttataaacat 1500 ctccgcgaac tgaaacccca ggggggcccc agcaatggct aa 1542 <210> 415 <211> 513 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas8 <400> 415 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Asn Leu Leu Ile 1 5 10 15 Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly Gly Lys Val Gln Ile 20 25 30 Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser 35 40 45 Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu Ala Leu Leu Val Cys 50 55 60 Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His 65 70 75 80 Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala 85 90 95 Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe Met 100 105 110 Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu 115 120 125 Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln Pro 130 135 140 Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala Leu Phe 145 150 155 160 Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe Lys Ser Gly 165 170 175 Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg Gly Ile Asp Leu 180 185 190 Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu Pro Arg Leu Gln Lys 195 200 205 Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln Pro Thr Trp Ile Lys 210 215 220 Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser Ser Ile Gly Phe Val 225 230 235 240 Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu Leu Cys Asp Pro Ile 245 250 255 Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu Ser Asn Leu Arg Tyr 260 265 270 Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr Val Asn Gly Leu Trp 275 280 285 Pro His Pro His Ser Pro Cys Leu Val Thr Val Lys Lys Gly Glu Val 290 295 300 Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln 305 310 315 320 Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn 325 330 335 Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser 340 345 350 Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile 355 360 365 Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln Gln 370 375 380 Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly Tyr Lys 385 390 395 400 Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly Phe Lys Asn 405 410 415 Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu Thr Ala Glu Arg 420 425 430 His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro Asp Val Leu Ala Asn 435 440 445 Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala Asp Leu Arg Asp Lys 450 455 460 Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln Ser Val Ala Pro Tyr 465 470 475 480 Ala His His Pro Lys Leu Ile Ser Thr Leu Ala Leu Ala Arg Ala Thr 485 490 495 Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln Gly Gly Pro Ser Asn 500 505 510 Gly <210> 416 <211> 2247 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-HA-FokI-linker-Cas8 <400> 416 atgcccaaga aaaagagaaa agtaggctca ggctatccct atgacgtacc cgactacgcg 60 caattggtca aaagcgaact ggaagagaaa aaatctgagc tcagacacaa gctgaagtat 120 gtgccccatg aatacataga actcatagaa atagctcgaa accccacgca ggaccggatc 180 cttgaaatga aagttatgga gttttttatg aaagtgtatg ggtatcgagg agagcatctt 240 ggtggaagtc ggaaaccgga tggggcaata tacactgttg ggagccccat tgactatggt 300 gtgatagtgg acaccaaggc atacagcggg ggatacaatc tgccgatcgg gcaggcagat 360 gagatgcagc gctatgtgga ggagaatcaa actaggaaca aacatattaa cccaaacgaa 420 tggtggaaag tgtatccctc atctgttacg gagttcaagt tcctttttgt atctggccac 480 tttaaaggaa actataaagc acagctcacg cgacttaacc acatcaccaa ttgtaacggt 540 gctgtactca gtgttgagga actcctgatc ggtggtgaaa tgataaaagc tggaaccttg 600 acattggagg aagtaaggag aaagtttaat aatggtgaga tcaatttcag cggctccgaa 660 acgccgggta catccgagtc cgcgactcct gagtcaggag gcagcggctc ctctggtgga 720 agcggctcaa gtggagggat gaatttgctc attgataatt ggattccggt gcgcccccgg 780 aacggtggga aagtgcagat catcaatttg caaagtctct actgttccag ggaccagtgg 840 agactcagcc tgccacggga tgatatggag ctggcggcgt tggctctgct cgtatgcatc 900 ggccagatta ttgcgccagc aaaggatgac gttgaattcc ggcatcggat aatgaacccc 960 cttactgaag atgagttcca gcagcttatc gccccatgga tcgacatgtt ctacctcaac 1020 cacgccgagc atccttttat gcagaccaag ggagtcaagg cgaatgatgt gactcccatg 1080 gagaagctgc tggccggtgt atctggggcg accaactgcg cattcgtgaa tcagcctgga 1140 cagggggagg ccctctgtgg aggctgcact gctatagcac tttttaacca agctaatcaa 1200 gcccccggct ttggtggagg gtttaagagt ggattgaggg ggggcactcc cgtaaccact 1260 tttgtgaggg gaattgatct gaggtctact gtgttgctga acgtcctcac actcccaagg 1320 ctccagaagc agttcccaaa cgaaagtcat accgaaaacc agcccacatg gatcaagccc 1380 atcaaatcta atgagagcat accggctagc agtattggat ttgtacgggg tctgttctgg 1440 cagccagctc acatcgagct gtgtgatcct attgggatcg gcaagtgctc ttgttgtggg 1500 caggagtcca accttaggta tactggattt ctgaaagaga agtttacctt tacagtaaat 1560 gggctctggc cccaccccca ctcaccttgc cttgtgacag tgaaaaaggg ggaagtcgag 1620 gagaagtttc tggcctttac aacttctgcc ccttcctgga ctcagatttc cagagtggtg 1680 gtagataaga taattcaaaa cgagaatggc aatagagtgg ccgccgtggt gaaccagttt 1740 cgcaacatcg cccctcagtc ccccctggag ctgattatgg gcggttatcg gaataaccag 1800 gccagtatac tcgagcgacg gcacgatgtc ctcatgttca atcaaggttg gcagcaatat 1860 ggcaatgtga ttaacgagat cgtaaccgtg ggcctgggat ataagaccgc cctgcggaag 1920 gcgttgtata cttttgcaga aggctttaag aataaggatt ttaagggtgc cggcgtgagt 1980 gtccatgaaa cagctgaacg gcacttttat cggcagtccg agctgttgat accagacgtg 2040 ctggctaatg tgaacttctc acaggccgac gaagtgatcg ctgatctgcg ggataaactg 2100 caccaactgt gcgagatgct gtttaatcaa agcgtcgctc cttatgccca ccacccaaag 2160 ctgatctcca cgctggccct ggcgcgcgcc acactttata aacatctccg cgaactgaaa 2220 ccccaggggg gccccagcaa tggctaa 2247 <210> 417 <211> 748 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLS-HA-FokI-linker-Cas8 <400> 417 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Tyr Pro Tyr Asp Val 1 5 10 15 Pro Asp Tyr Ala Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser 20 25 30 Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu 35 40 45 Ile Glu Ile Ala Arg Asn Pro Thr Gln Asp Arg Ile Leu Glu Met Lys 50 55 60 Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Glu His Leu 65 70 75 80 Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro 85 90 95 Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr 100 105 110 Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu 115 120 125 Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val 130 135 140 Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His 145 150 155 160 Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr 165 170 175 Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly 180 185 190 Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys 195 200 205 Phe Asn Asn Gly Glu Ile Asn Phe Ser Gly Ser Glu Thr Pro Gly Thr 210 215 220 Ser Glu Ser Ala Thr Pro Glu Ser Gly Gly Ser Gly Ser Ser Gly Gly 225 230 235 240 Ser Gly Ser Ser Gly Gly Met Asn Leu Leu Ile Asp Asn Trp Ile Pro 245 250 255 Val Arg Pro Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser 260 265 270 Leu Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp 275 280 285 Met Glu Leu Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile Ile 290 295 300 Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His Arg Ile Met Asn Pro 305 310 315 320 Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp Ile Asp Met 325 330 335 Phe Tyr Leu Asn His Ala Glu His Pro Phe Met Gln Thr Lys Gly Val 340 345 350 Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu Leu Ala Gly Val Ser 355 360 365 Gly Ala Thr Asn Cys Ala Phe Val Asn Gln Pro Gly Gln Gly Glu Ala 370 375 380 Leu Cys Gly Gly Cys Thr Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln 385 390 395 400 Ala Pro Gly Phe Gly Gly Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr 405 410 415 Pro Val Thr Thr Phe Val Arg Gly Ile Asp Leu Arg Ser Thr Val Leu 420 425 430 Leu Asn Val Leu Thr Leu Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu 435 440 445 Ser His Thr Glu Asn Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn 450 455 460 Glu Ser Ile Pro Ala Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp 465 470 475 480 Gln Pro Ala His Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys 485 490 495 Ser Cys Cys Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys 500 505 510 Glu Lys Phe Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser 515 520 525 Pro Cys Leu Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe Leu 530 535 540 Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg Val Val 545 550 555 560 Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn Arg Val Ala Ala Val 565 570 575 Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile 580 585 590 Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile Leu Glu Arg Arg His 595 600 605 Asp Val Leu Met Phe Asn Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile 610 615 620 Asn Glu Ile Val Thr Val Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys 625 630 635 640 Ala Leu Tyr Thr Phe Ala Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly 645 650 655 Ala Gly Val Ser Val His Glu Thr Ala Glu Arg His Phe Tyr Arg Gln 660 665 670 Ser Glu Leu Leu Ile Pro Asp Val Leu Ala Asn Val Asn Phe Ser Gln 675 680 685 Ala Asp Glu Val Ile Ala Asp Leu Arg Asp Lys Leu His Gln Leu Cys 690 695 700 Glu Met Leu Phe Asn Gln Ser Val Ala Pro Tyr Ala His His Pro Lys 705 710 715 720 Leu Ile Ser Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu 725 730 735 Arg Glu Leu Lys Pro Gln Gly Gly Pro Ser Asn Gly 740 745 <210> 418 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: hexahistidine <400> 418 His His His His His His 1 5 <210> 419 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Strep-tag <400> 419 Trp Ser His Pro Gln Phe Glu Lys 1 5 <210> 420 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: HRV3C (human rhinovirus 3C) protease recognition sequence <400> 420 Leu Glu Val Leu Phe Gln Gly Pro 1 5 <210> 421 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: nuclear localization signal <400> 421 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 422 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: hemagglutinin <400> 422 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 423 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: maltose binding protein <400> 423 Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys Gly 1 5 10 15 Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr Gly 20 25 30 Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe Pro 35 40 45 Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala His 50 55 60 Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile Thr 65 70 75 80 Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp Ala 85 90 95 Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu Ala 100 105 110 Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys Thr 115 120 125 Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly Lys 130 135 140 Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro Leu 145 150 155 160 Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys Tyr 165 170 175 Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly Leu 180 185 190 Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp Thr 195 200 205 Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala Met 210 215 220 Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys Val 225 230 235 240 Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser Lys 245 250 255 Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro Asn 260 265 270 Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp Glu 275 280 285 Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala Leu 290 295 300 Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala Thr 305 310 315 320 Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln Met 325 330 335 Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala Ser 340 345 350 Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn 355 360 365 <210> 424 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: TEV (tobacco etch virus) protease recognition sequence <400> 424 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 425 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: linker polypeptide <400> 425 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly 20 25 30 <210> 426 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: 5-amino acid linker, FokI-Cas8 fusion <400> 426 Gly Gly Gly Gly Ser 1 5 <210> 427 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: 8-amino acid linker, FokI-Cas8 fusion <400> 427 Thr Gly Pro Gly Ala Ala Ala Arg 1 5 <210> 428 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: 10-amino acid linker, FokI-Cas8 fusion <400> 428 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly 1 5 10 <210> 429 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: 12-amino acid linker, FokI-Cas8 fusion <400> 429 Thr Gly Pro Gly Ala Ala Ala Arg Ala Ala Ser Gly 1 5 10 <210> 430 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: 15-amino acid linker, FokI-Cas8 fusion <400> 430 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly Ser 1 5 10 15 <210> 431 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: 16-amino acid linker, FokI-Cas8 fusion <400> 431 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 432 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: 20-amino acid linker, FokI-Cas8 fusion <400> 432 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Gly Gly Ser Gly 20 <210> 433 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: 30-amino acid linker, FokI-Cas8 fusion <400> 433 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly 20 25 30 <210> 434 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(J3) <400> 434 gagttccccg cgccagcggg gataaaccgc cagtgataag tggaatgcca tgtgggctgt 60 cgagttcccc gcgccagcgg ggataaaccg 90 <210> 435 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(L3) <400> 435 gagttccccg cgccagcggg gataaaccga gtggcagata tagcctggtg gttcaggcgg 60 cgagttcccc gcgccagcgg ggataaaccg 90 <210> 436 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(J3/L3) <400> 436 gagttccccg cgccagcggg gataaaccgc cagtgataag tggaatgcca tgtgggctgt 60 cgagttcccc gcgccagcgg ggataaaccg agtggcagat atagcctggt ggttcaggcg 120 gcgagttccc cgcgccagcg gggataaacc g 151 <210> 437 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(TRAC) <400> 437 gagttccccg cgccagcggg gataaaccgg ttgatttgcc tgcattggtg ttacacagtc 60 tgagttcccc gcgccagcgg ggataaaccg taagttgtgt tcttctttgc ctaggccttc 120 aggagttccc cgcgccagcg gggataaacc g 151 <210> 438 <211> 7967 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-Cas8 <400> 438 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaact agtaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatgt 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaactaa ggaggtccgc tatgcaccat caccatcacc atggaaaaat 5100 cgaagaaggt aaactggtaa tctggattaa cggcgataaa ggctataacg gtctcgctga 5160 agtcggtaag aaattcgaga aagataccgg aattaaagtc accgttgagc atccggataa 5220 actggaagag aaattcccac aggttgcggc aactggcgat ggccctgaca ttatcttctg 5280 ggcacacgac cgctttggtg gctacgctca atctggcctg ttggctgaaa tcaccccgga 5340 caaagcgttc caggacaagc tgtatccgtt tacctgggat gccgtacgtt acaacggcaa 5400 gctgattgct tacccgatcg ctgttgaagc gttatcgctg atttataaca aagatctgct 5460 gccgaacccg ccaaaaacct gggaagagat cccggcgctg gataaagaac tgaaagcgaa 5520 aggtaagagc gcgctgatgt tcaacctgca agaaccgtac ttcacctggc cgctgattgc 5580 tgctgacggg ggttatgcgt tcaagtatga aaacggcaag tacgacatta aagacgtggg 5640 cgtggataac gctggcgcga aagcgggtct gaccttcctg gttgacctga ttaaaaacaa 5700 acacatgaat gcagacaccg attactccat cgcagaagct gcctttaata aaggcgaaac 5760 agcgatgacc atcaacggcc cgtgggcatg gtccaacatc gacaccagca aagtgaatta 5820 tggtgtaacg gtactgccga ccttcaaggg tcaaccatcc aaaccgttcg ttggcgtgct 5880 gagcgcaggt attaacgccg ccagtccgaa caaagagctg gcaaaagagt tcctcgaaaa 5940 ctatctgctg actgatgaag gtctggaagc ggttaataaa gacaaaccgc tgggtgccgt 6000 agcgctgaag tcttacgagg aagagttggc gaaagatcca cgtattgccg ccactatgga 6060 aaacgcccag aaaggtgaaa tcatgccgaa catcccgcag atgtccgctt tctggtatgc 6120 cgtgcgtact gcggtgatca acgccgccag cggtcgtcag actgtcgatg aagccctgaa 6180 agacgcgcag actaatggga tcgaggaaaa cctgtacttc caatccaatg caatgaattt 6240 gcttattgat aactggatcc ctgtacgccc gcgaaacggg gggaaagtcc aaatcataaa 6300 tctgcaatcg ctatactgca gtagagatca gtggcgatta agtttgcccc gtgacgatat 6360 ggaactggcc gctttagcac tgctggtttg cattgggcaa attatcgccc cggcaaaaga 6420 tgacgttgaa tttcgacatc gcataatgaa tccgctcact gaagatgagt ttcaacaact 6480 catcgcgccg tggatagata tgttctacct taatcacgca gaacatccct ttatgcagac 6540 caaaggtgtc aaagcaaatg atgtgactcc aatggaaaaa ctgttggctg gggtaagcgg 6600 cgcgacgaat tgtgcatttg tcaatcaacc ggggcagggt gaagcattat gtggtggatg 6660 cactgcgatt gcgttattca accaggcgaa tcaggcacca ggttttggtg gtggttttaa 6720 aagcggttta cgtggaggaa cacctgtaac aacgttcgta cgtgggatcg atcttcgttc 6780 aacggtgtta ctcaatgtcc tcacattacc tcgtcttcaa aaacaatttc ctaatgaatc 6840 acatacggaa aaccaaccta cctggattaa acctatcaag tccaatgagt ctatacctgc 6900 ttcgtcaatt gggtttgtcc gtggtctatt ctggcaacca gcgcatattg aattatgcga 6960 tcccattggg attggtaaat gttcttgctg tggacaggaa agcaatttgc gttataccgg 7020 ttttcttaag gaaaaattta cctttacagt taatgggcta tggccccatc cgcattcccc 7080 ttgtctggta acagtcaaga aaggggaggt tgaggaaaaa tttcttgctt tcaccacctc 7140 cgcaccatca tggacacaaa tcagccgagt tgtggtagat aagattattc aaaatgaaaa 7200 tggaaatcgc gtggcggcgg ttgtgaatca attcagaaat attgcgccgc aaagtcctct 7260 tgaattgatt atggggggat atcgtaataa tcaagcatct attcttgaac ggcgtcatga 7320 tgtgttgatg tttaatcagg ggtggcaaca atacggcaat gtgataaacg aaatagtgac 7380 tgttggtttg ggatataaaa cagccttacg caaggcgtta tatacctttg cagaagggtt 7440 taaaaataaa gacttcaaag gggccggagt ctctgttcat gagactgcag aaaggcattt 7500 ctatcgacag agtgaattat taattcccga tgtactggcg aatgttaatt tttcccaggc 7560 tgatgaggta atagctgatt tacgagacaa acttcatcaa ttgtgtgaaa tgctatttaa 7620 tcaatctgta gctccctatg cacatcatcc taaattaata agcacattag cgcttgcccg 7680 cgccacgcta tacaaacatt tacgggagtt aaaaccgcaa ggagggccat caaatggctg 7740 ataataacat tggaagtgga taacggatcc gaattcgagc gccgtcgaca agcttgcggc 7800 cgcactcgag caccaccacc accaccactg agatccggct gctaacaaag cccgaaagga 7860 agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa 7920 acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 7967 <210> 439 <211> 8659 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-NLS-Fok1-linker-Cas8 <400> 439 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaact agtaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatgt 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaactaa ggaggtccgc tatgcaccat caccatcacc atggaaaaat 5100 cgaagaaggt aaactggtaa tctggattaa cggcgataaa ggctataacg gtctcgctga 5160 agtcggtaag aaattcgaga aagataccgg aattaaagtc accgttgagc atccggataa 5220 actggaagag aaattcccac aggttgcggc aactggcgat ggccctgaca ttatcttctg 5280 ggcacacgac cgctttggtg gctacgctca atctggcctg ttggctgaaa tcaccccgga 5340 caaagcgttc caggacaagc tgtatccgtt tacctgggat gccgtacgtt acaacggcaa 5400 gctgattgct tacccgatcg ctgttgaagc gttatcgctg atttataaca aagatctgct 5460 gccgaacccg ccaaaaacct gggaagagat cccggcgctg gataaagaac tgaaagcgaa 5520 aggtaagagc gcgctgatgt tcaacctgca agaaccgtac ttcacctggc cgctgattgc 5580 tgctgacggg ggttatgcgt tcaagtatga aaacggcaag tacgacatta aagacgtggg 5640 cgtggataac gctggcgcga aagcgggtct gaccttcctg gttgacctga ttaaaaacaa 5700 acacatgaat gcagacaccg attactccat cgcagaagct gcctttaata aaggcgaaac 5760 agcgatgacc atcaacggcc cgtgggcatg gtccaacatc gacaccagca aagtgaatta 5820 tggtgtaacg gtactgccga ccttcaaggg tcaaccatcc aaaccgttcg ttggcgtgct 5880 gagcgcaggt attaacgccg ccagtccgaa caaagagctg gcaaaagagt tcctcgaaaa 5940 ctatctgctg actgatgaag gtctggaagc ggttaataaa gacaaaccgc tgggtgccgt 6000 agcgctgaag tcttacgagg aagagttggc gaaagatcca cgtattgccg ccactatgga 6060 aaacgcccag aaaggtgaaa tcatgccgaa catcccgcag atgtccgctt tctggtatgc 6120 cgtgcgtact gcggtgatca acgccgccag cggtcgtcag actgtcgatg aagccctgaa 6180 agacgcgcag actaatggga tcgaggaaaa cctgtacttc caatccaata tgccgaaaaa 6240 aaagcgcaaa gtgcaactgg ttaaaagcga actggaagag aaaaaaagtg aactgcgcca 6300 caaactgaaa tatgtgccgc atgaatatat cgagctgatt gaaattgcac gtaatccgac 6360 ccaggatcgt attctggaaa tgaaagtgat ggaatttttt atgaaagtgt acggctatcg 6420 cggtgaacat ctgggtggta gccgtaaacc ggatggtgca atttataccg ttggtagccc 6480 gattgattat ggtgttattg ttgataccaa agcctatagc ggtggttata atctgccgat 6540 tggtcaggca gatgaaatgc agcgttatgt ggaagaaaat cagacccgta acaaacatat 6600 taatccgaat gaatggtgga aagtttatcc gagcagcgtt accgagttta aattcctgtt 6660 tgttagcggt cacttcaaag gcaactataa agcacagctg acccgtctga atcatattac 6720 caattgtaat ggtgcagttc tgagcgttga agaactgctg attggtggtg aaatgattaa 6780 agcaggcacc ctgaccctgg aagaagttcg tcgcaaattt aacaatggcg aaatcaactt 6840 ttcaggcagc gaaacgccgg gtacaagtga gtcagcaact ccagagagcg gcggcagtgg 6900 tagtagtggg ggatctgggt catctggtgg gatgaatttg cttattgata actggattcc 6960 tgtacgcccg cgaaacgggg ggaaagtcca aatcataaat ctgcaatcgc tatactgcag 7020 tagagatcag tggcgattaa gtttgccccg tgacgatatg gaactggccg ctttagcact 7080 gctggtttgc attgggcaaa ttatcgcccc ggcaaaagat gacgttgaat ttcgacatcg 7140 cataatgaat ccgctcactg aagatgagtt tcaacaactc atcgcgccgt ggatagatat 7200 gttctacctt aatcacgcag aacatccctt tatgcagacc aaaggtgtca aagcaaatga 7260 tgtgactcca atggaaaaac tgttggctgg ggtaagcggc gcgacgaatt gtgcatttgt 7320 caatcaaccg gggcagggtg aagcattatg tggtggatgc actgcgattg cgttattcaa 7380 ccaggcgaat caggcaccag gttttggtgg tggttttaaa agcggtttac gtggaggaac 7440 acctgtaaca acgttcgtac gtgggatcga tcttcgttca acggtgttac tcaatgtcct 7500 cacattacct cgtcttcaaa aacaatttcc taatgaatca catacggaaa accaacctac 7560 ctggattaaa cctatcaagt ccaatgagtc tatacctgct tcgtcaattg ggtttgtccg 7620 tggtctattc tggcaaccag cgcatattga attatgcgat cccattggga ttggtaaatg 7680 ttcttgctgt ggacaggaaa gcaatttgcg ttataccggt tttcttaagg aaaaatttac 7740 ctttacagtt aatgggctat ggccccatcc gcattcccct tgtctggtaa cagtcaagaa 7800 aggggaggtt gaggaaaaat ttcttgcttt caccacctcc gcaccatcat ggacacaaat 7860 cagccgagtt gtggtagata agattattca aaatgaaaat ggaaatcgcg tggcggcggt 7920 tgtgaatcaa ttcagaaata ttgcgccgca aagtcctctt gaattgatta tggggggata 7980 tcgtaataat caagcatcta ttcttgaacg gcgtcatgat gtgttgatgt ttaatcaggg 8040 gtggcaacaa tacggcaatg tgataaacga aatagtgact gttggtttgg gatataaaac 8100 agccttacgc aaggcgttat atacctttgc agaagggttt aaaaataaag acttcaaagg 8160 ggccggagtc tctgttcatg agactgcaga aaggcatttc tatcgacaga gtgaattatt 8220 aattcccgat gtactggcga atgttaattt ttcccaggct gatgaggtaa tagctgattt 8280 acgagacaaa cttcatcaat tgtgtgaaat gctatttaat caatctgtag ctccctatgc 8340 acatcatcct aaattaataa gcacattagc gcttgcccgc gccacgctat acaaacattt 8400 acgggagtta aaaccgcaag gagggccatc aaatggctga attggaagtg gataacggat 8460 ccgaattcga gcgccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac 8520 tgagatccgg ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag 8580 caataactag cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa 8640 ggaggaacta tatccggat 8659 <210> 440 <211> 6435 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: StrepII-HRV3C-Cse2_Cas7_Cas5_Cas6 <400> 440 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg gcaagctgga gccacccgca gttcgaaaag 120 ggtgcacttg aagtcctctt tcagggaccc gggtaccaga tggctgatga aattgatgca 180 atggctttat atcgagcctg gcaacaactg gataatggat catgtgcgca aattagacgt 240 gtttcagaac ctgatgaatt acgcgatatc cctgcgtttt ataggctggt gcaacctttt 300 ggttgggaaa acccacgtca ccagcaggct cttttgcgca tggtgttttg cctgagcgca 360 ggaaagaatg tcatccgaca tcaggacaaa aaatcggagc aaacaacagg tatctcgttg 420 ggaagagctt tagccaatag tggaagaatt aacgagcgcc gtatctttca attaattcgg 480 gctgacagaa cagccgatat ggtccagtta cgtcgattac ttactcacgc cgaacccgta 540 cttgactggc cattaatggc caggatgttg acctggtggg gaaagcgcga acgccagcaa 600 cttctggaag attttgtatt gaccacaaac aaaaatgcgt aaggaaacct ttctatgtct 660 aactttatca atattcatgt tctgatctct cacagccctt catgtctgaa ccgcgacgat 720 atgaacatgc agaaagacgc tattttcggc ggcaaaagac gagtaagaat ttcaagtcaa 780 agccttaaac gtgcgatgcg taaaagtggt tattacgcac aaaatattgg tgaatccagt 840 ctcagaacca ttcatcttgc acaattacgt gatgttcttc ggcaaaaact tggtgaacgt 900 tttgaccaaa aaatcatcga taagacatta gcgctgctct ccggtaaatc agttgatgaa 960 gccgaaaaga tttctgccga tgcggttact ccctgggttg tgggagaaat agcctggttc 1020 tgtgagcagg ttgcaaaagc agaggctgat aatctggatg ataaaaagct gctcaaagtt 1080 cttaaggaag atattgccgc catacgtgtg aatttacagc agggtgttga tattgcgctt 1140 agtggaagaa tggcaaccag cggcatgatg actgagttgg gaaaagttga tggtgcaatg 1200 tccattgcgc atgcgatcac tactcatcag gttgattctg atattgactg gttcaccgct 1260 gtagatgatt tacaggaaca aggttctgca catctgggaa ctcaggaatt ttcatcgggt 1320 gttttttatc gttatgccaa cattaacctc gctcaacttc aggaaaattt aggtggtgcc 1380 tccagggagc aggctctgga aattgcaacc catgttgttc atatgctggc aacagaggtc 1440 cctggagcaa aacagcgtac ttatgccgct tttaaccctg cggatatggt aatggttaat 1500 ttctccgata tgccactttc tatggcaaat gcttttgaaa aagcggttaa agcgaaagat 1560 ggctttttgc aaccgtctat acaggcgttt aatcaatatt gggatcgcgt tgccaatgga 1620 tatggtctga acggagctgc tgcgcaattc agcttatctg atgtagaccc aattactgct 1680 caagttaaac aaatgcctac tttagaacag ttaaaatcct gggttcgtaa taatggcgag 1740 gcgtgaacat gagatcttat ttgatcttgc ggcttgctgg gccaatgcaa gcctgggggc 1800 agccgacctt tgaaggaacg cgacctaccg gaagatttcc gacccgaagc gggttattag 1860 ggctactcgg ggcttgtctt gggatccaac gtgatgatac ttcttcatta caggcgttat 1920 cagagagtgt gcaatttgca gtgcgctgcg atgaactcat tcttgacgat cgtcgtgtgt 1980 ctgtaacggg gttgcgtgat taccatacag tccttggagc gcgagaagat taccgtggtt 2040 tgaaaagtca tgaaacgatt caaacatggc gcgaatattt atgtgatgcc tcctttaccg 2100 tcgctctctg gttaacaccc catgcaacga tggttatctc agaacttgaa aaagcagtat 2160 taaagcctcg gtatacacct tacctggggc ggagaagttg cccactaaca cacccgcttt 2220 ttttggggac atgtcaggca tcggatcctc agaaggcgct attaaattat gagcccgttg 2280 gcggcgatat atatagtgag gaatcagtta cagggcatca tttaaaattt acggcgcgcg 2340 acgaaccgat gatcaccttg cctcgacaat ttgcttcccg agaatggtat gtgattaaag 2400 gaggtatgga tgtatctcag taaagtcatc attgccaggg cctggagcag ggatctttac 2460 caacttcacc agggattatg gcatttattt ccaaacagac cggatgctgc tcgtgatttt 2520 ctttttcatg ttgagaagcg aaacacacca gaaggctgtc atgttttatt gcagtcagcg 2580 caaatgcctg tttcaactgc cgttgcgaca gtcattaaaa ctaaacaggt tgaatttcaa 2640 cttcaggttg gtgttccact ctattttcgg cttcgggcaa atccgatcaa aactattctc 2700 gacaatcaaa agcgcctgga cagtaaaggg aatattaaac gctgtcgggt tccgttaata 2760 aaagaagcag aacaaatcgc gtggttgcaa cgtaaattgg gcaatgcggc gcgcgttgaa 2820 gatgtgcatc ccatatcgga acggccacag tatttttctg gtgatggtaa aagtggaaag 2880 atccaaacgg tttgctttga aggtgtgctc accatcaacg acgcgccagc gttaatagat 2940 cttgtacagc aaggtattgg gccagctaaa tcgatgggat gtggcttgct atctttggct 3000 ccactgtgac tgcaggcggc cgcactcgag tctggtaaag aaaccgctgc tgcgaaattt 3060 gaacgccagc acatggactc gtctactagc gcagcttaat taacctaggc tgctgccacc 3120 gctgagcaat aactagcata accccttggg gcctctaaac gggtcttgag gggttttttg 3180 ctgaaacctc aggcatttga gaagcacacg gtcacactgc ttccggtagt caataaaccg 3240 gtaaaccagc aatagacata agcggctatt taacgaccct gccctgaacc gacgaccggg 3300 tcatcgtggc cggatcttgc ggcccctcgg cttgaacgaa ttgttagaca ttatttgccg 3360 actaccttgg tgatctcgcc tttcacgtag tggacaaatt cttccaactg atctgcgcgc 3420 gaggccaagc gatcttcttc ttgtccaaga taagcctgtc tagcttcaag tatgacgggc 3480 tgatactggg ccggcaggcg ctccattgcc cagtcggcag cgacatcctt cggcgcgatt 3540 ttgccggtta ctgcgctgta ccaaatgcgg gacaacgtaa gcactacatt tcgctcatcg 3600 ccagcccagt cgggcggcga gttccatagc gttaaggttt catttagcgc ctcaaataga 3660 tcctgttcag gaaccggatc aaagagttcc tccgccgctg gacctaccaa ggcaacgcta 3720 tgttctcttg cttttgtcag caagatagcc agatcaatgt cgatcgtggc tggctcgaag 3780 atacctgcaa gaatgtcatt gcgctgccat tctccaaatt gcagttcgcg cttagctgga 3840 taacgccacg gaatgatgtc gtcgtgcaca acaatggtga cttctacagc gcggagaatc 3900 tcgctctctc caggggaagc cgaagtttcc aaaaggtcgt tgatcaaagc tcgccgcgtt 3960 gtttcatcaa gccttacggt caccgtaacc agcaaatcaa tatcactgtg tggcttcagg 4020 ccgccatcca ctgcggagcc gtacaaatgt acggccagca acgtcggttc gagatggcgc 4080 tcgatgacgc caactacctc tgatagttga gtcgatactt cggcgatcac cgcttccctc 4140 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 4200 tacatatttg aatgtattta gaaaaataaa caaatagcta gctcactcgg tcgctacgct 4260 ccgggcgtga gactgcggcg ggcgctgcgg acacatacaa agttacccac agattccgtg 4320 gataagcagg ggactaacat gtgaggcaaa acagcagggc cgcgccggtg gcgtttttcc 4380 ataggctccg ccctcctgcc agagttcaca taaacagacg cttttccggt gcatctgtgg 4440 gagccgtgag gctcaaccat gaatctgaca gtacgggcga aacccgacag gacttaaaga 4500 tccccaccgt ttccggcggg tcgctccctc ttgcgctctc ctgttccgac cctgccgttt 4560 accggatacc tgttccgcct ttctccctta cgggaagtgt ggcgctttct catagctcac 4620 acactggtat ctcggctcgg tgtaggtcgt tcgctccaag ctgggctgta agcaagaact 4680 ccccgttcag cccgactgct gcgccttatc cggtaactgt tcacttgagt ccaacccgga 4740 aaagcacggt aaaacgccac tggcagcagc cattggtaac tgggagttcg cagaggattt 4800 gtttagctaa acacgcggtt gctcttgaag tgtgcgccaa agtccggcta cactggaagg 4860 acagatttgg ttgctgtgct ctgcgaaagc cagttaccac ggttaagcag ttccccaact 4920 gacttaacct tcgatcaaac cacctcccca ggtggttttt tcgtttacag ggcaaaagat 4980 tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctactg aaccgctcta 5040 gatttcagtg caatttatct cttcaaatgt agcacctgaa gtcagcccca tacgatataa 5100 gttgtaattc tcatgttagt catgccccgc gcccaccgga aggagctgac tgggttgaag 5160 gctctcaagg gcatcggtcg agatcccggt gcctaatgag tgagctaact tacattaatt 5220 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 5280 atcggccaac gcgcggggag aggcggtttg cgtattgggc gccagggtgg tttttctttt 5340 caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag agagttgcag 5400 caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg tggttaacgg 5460 cgggatataa catgagctgt cttcggtatc gtcgtatccc actaccgaga tgtccgcacc 5520 aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct gatcgttggc 5580 aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt gttgaaaacc 5640 ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat tgcgagtgag 5700 atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg ggcccgctaa 5760 cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc gcgtaccgtc 5820 ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa gaaataacgc 5880 cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca gcggatagtt 5940 aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt tacaggcttc 6000 gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat cggcgcgaga 6060 tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg tggcaacgcc 6120 aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa tgtaattcag 6180 ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc tggcctggtt 6240 caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat cgtataacgt 6300 tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc atgccatacc 6360 gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg acgctctccc ttatgcgact 6420 cctgcattag gaaat 6435 <210> 441 <211> 7933 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas8_His6HRV3CCse2_Cas7_Cas5_Cas6 <400> 441 ttttctactg aaccgctcta gatttcagtg caatttatct cttcaaatgt agcacctgaa 60 gtcagcccca tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga 120 aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 180 tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 240 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300 gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 360 tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 420 tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 480 actaccgaga tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 540 agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 600 tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 660 tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 720 gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 780 acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 840 gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 900 tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 960 accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 1020 cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 1080 agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 1140 cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 1200 gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 1260 tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 1320 gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 1380 acgctctccc ttatgcgact cctgcattag gaaattaata cgactcacta taggggaatt 1440 gtgagcggat aacaattccc ctgtagaaat aattttgttt aactttaata aggagatata 1500 ccatggctaa tttgcttatt gataactgga tccctgtacg cccgcgaaac ggggggaaag 1560 tccaaatcat aaatctgcaa tcgctatact gcagtagaga tcagtggcga ttaagtttgc 1620 cccgtgacga tatggaactg gccgctttag cactgctggt ttgcattggg caaattatcg 1680 ccccggcaaa agatgacgtt gaatttcgac atcgcataat gaatccgctc actgaagatg 1740 agtttcaaca actcatcgcg ccgtggatag atatgttcta ccttaatcac gcagaacatc 1800 cctttatgca gaccaaaggt gtcaaagcaa atgatgtgac tccaatggaa aaactgttgg 1860 ctggggtaag cggcgcgacg aattgtgcat ttgtcaatca accggggcag ggtgaagcat 1920 tatgtggtgg atgcactgcg attgcgttat tcaaccaggc gaatcaggca ccaggttttg 1980 gtggtggttt taaaagcggt ttacgtggag gaacacctgt aacaacgttc gtacgtggga 2040 tcgatcttcg ttcaacggtg ttactcaatg tcctcacatt acctcgtctt caaaaacaat 2100 ttcctaatga atcacatacg gaaaaccaac ctacctggat taaacctatc aagtccaatg 2160 agtctatacc tgcttcgtca attgggtttg tccgtggtct attctggcaa ccagcgcata 2220 ttgaattatg cgatcccatt gggattggta aatgttcttg ctgtggacag gaaagcaatt 2280 tgcgttatac cggttttctt aaggaaaaat ttacctttac agttaatggg ctatggcccc 2340 atccgcattc cccttgtctg gtaacagtca agaaagggga ggttgaggaa aaatttcttg 2400 ctttcaccac ctccgcacca tcatggacac aaatcagccg agttgtggta gataagatta 2460 ttcaaaatga aaatggaaat cgcgtggcgg cggttgtgaa tcaattcaga aatattgcgc 2520 cgcaaagtcc tcttgaattg attatggggg gatatcgtaa taatcaagca tctattcttg 2580 aacggcgtca tgatgtgttg atgtttaatc aggggtggca acaatacggc aatgtgataa 2640 acgaaatagt gactgttggt ttgggatata aaacagcctt acgcaaggcg ttatatacct 2700 ttgcagaagg gtttaaaaat aaagacttca aaggggccgg agtctctgtt catgagactg 2760 cagaaaggca tttctatcga cagagtgaat tattaattcc cgatgtactg gcgaatgtta 2820 atttttccca ggctgatgag gtaatagctg atttacgaga caaacttcat caattgtgtg 2880 aaatgctatt taatcaatct gtagctccct atgcacatca tcctaaatta ataagcacat 2940 tagcgcttgc ccgcgccacg ctatacaaac atttacggga gttaaaaccg caaggagggc 3000 catcaaatgg ctgagcatca ccaccatcat cacggtgcac ttgaagtcct ctttcaggga 3060 cccgggtacc agatggctga tgaaattgat gcaatggctt tatatcgagc ctggcaacaa 3120 ctggataatg gatcatgtgc gcaaattaga cgtgtttcag aacctgatga attacgcgat 3180 atccctgcgt tttataggct ggtgcaacct tttggttggg aaaacccacg tcaccagcag 3240 gctcttttgc gcatggtgtt ttgcctgagc gcaggaaaga atgtcatccg acatcaggac 3300 aaaaaatcgg agcaaacaac aggtatctcg ttgggaagag ctttagccaa tagtggaaga 3360 attaacgagc gccgtatctt tcaattaatt cgggctgaca gaacagccga tatggtccag 3420 ttacgtcgat tacttactca cgccgaaccc gtacttgact ggccattaat ggccaggatg 3480 ttgacctggt ggggaaagcg cgaacgccag caacttctgg aagattttgt attgaccaca 3540 aacaaaaatg cgtaaggaaa cctttctatg tctaacttta tcaatattca tgttctgatc 3600 tctcacagcc cttcatgtct gaaccgcgac gatatgaaca tgcagaaaga cgctattttc 3660 ggcggcaaaa gacgagtaag aatttcaagt caaagcctta aacgtgcgat gcgtaaaagt 3720 ggttattacg cacaaaatat tggtgaatcc agtctcagaa ccattcatct tgcacaatta 3780 cgtgatgttc ttcggcaaaa acttggtgaa cgttttgacc aaaaaatcat cgataagaca 3840 ttagcgctgc tctccggtaa atcagttgat gaagccgaaa agatttctgc cgatgcggtt 3900 actccctggg ttgtgggaga aatagcctgg ttctgtgagc aggttgcaaa agcagaggct 3960 gataatctgg atgataaaaa gctgctcaaa gttcttaagg aagatattgc cgccatacgt 4020 gtgaatttac agcagggtgt tgatattgcg cttagtggaa gaatggcaac cagcggcatg 4080 atgactgagt tgggaaaagt tgatggtgca atgtccattg cgcatgcgat cactactcat 4140 caggttgatt ctgatattga ctggttcacc gctgtagatg atttacagga acaaggttct 4200 gcacatctgg gaactcagga attttcatcg ggtgtttttt atcgttatgc caacattaac 4260 ctcgctcaac ttcaggaaaa tttaggtggt gcctccaggg agcaggctct ggaaattgca 4320 acccatgttg ttcatatgct ggcaacagag gtccctggag caaaacagcg tacttatgcc 4380 gcttttaacc ctgcggatat ggtaatggtt aatttctccg atatgccact ttctatggca 4440 aatgcttttg aaaaagcggt taaagcgaaa gatggctttt tgcaaccgtc tatacaggcg 4500 tttaatcaat attgggatcg cgttgccaat ggatatggtc tgaacggagc tgctgcgcaa 4560 ttcagcttat ctgatgtaga cccaattact gctcaagtta aacaaatgcc tactttagaa 4620 cagttaaaat cctgggttcg taataatggc gaggcgtgaa catgagatct tatttgatct 4680 tgcggcttgc tgggccaatg caagcctggg ggcagccgac ctttgaagga acgcgaccta 4740 ccggaagatt tccgacccga agcgggttat tagggctact cggggcttgt cttgggatcc 4800 aacgtgatga tacttcttca ttacaggcgt tatcagagag tgtgcaattt gcagtgcgct 4860 gcgatgaact cattcttgac gatcgtcgtg tgtctgtaac ggggttgcgt gattaccata 4920 cagtccttgg agcgcgagaa gattaccgtg gtttgaaaag tcatgaaacg attcaaacat 4980 ggcgcgaata tttatgtgat gcctccttta ccgtcgctct ctggttaaca ccccatgcaa 5040 cgatggttat ctcagaactt gaaaaagcag tattaaagcc tcggtataca ccttacctgg 5100 ggcggagaag ttgcccacta acacacccgc tttttttggg gacatgtcag gcatcggatc 5160 ctcagaaggc gctattaaat tatgagcccg ttggcggcga tatatatagt gaggaatcag 5220 ttacagggca tcatttaaaa tttacggcgc gcgacgaacc gatgatcacc ttgcctcgac 5280 aatttgcttc ccgagaatgg tatgtgatta aaggaggtat ggatgtatct cagtaaagtc 5340 atcattgcca gggcctggag cagggatctt taccaacttc accagggatt atggcattta 5400 tttccaaaca gaccggatgc tgctcgtgat tttctttttc atgttgagaa gcgaaacaca 5460 ccagaaggct gtcatgtttt attgcagtca gcgcaaatgc ctgtttcaac tgccgttgcg 5520 acagtcatta aaactaaaca ggttgaattt caacttcagg ttggtgttcc actctatttt 5580 cggcttcggg caaatccgat caaaactatt ctcgacaatc aaaagcgcct ggacagtaaa 5640 gggaatatta aacgctgtcg ggttccgtta ataaaagaag cagaacaaat cgcgtggttg 5700 caacgtaaat tgggcaatgc ggcgcgcgtt gaagatgtgc atcccatatc ggaacggcca 5760 cagtattttt ctggtgatgg taaaagtgga aagatccaaa cggtttgctt tgaaggtgtg 5820 ctcaccatca acgacgcgcc agcgttaata gatcttgtac agcaaggtat tgggccagct 5880 aaatcgatgg gatgtggctt gctatctttg gctccactgt gactgcaggc ggccgcactc 5940 gagtctggta aagaaaccgc tgctgcgaaa tttgaacgcc agcacatgga ctcgtctact 6000 agcgcagctt aattaaccta ggctgctgcc accgctgagc aataactagc ataacccctt 6060 ggggcctcta aacgggtctt gaggggtttt ttgctgaaac ctcaggcatt tgagaagcac 6120 acggtcacac tgcttccggt agtcaataaa ccggtaaacc agcaatagac ataagcggct 6180 atttaacgac cctgccctga accgacgacc gggtcatcgt ggccggatct tgcggcccct 6240 cggcttgaac gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg 6300 tagtggacaa attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttcttgtcca 6360 agataagcct gtctagcttc aagtatgacg ggctgatact gggccggcag gcgctccatt 6420 gcccagtcgg cagcgacatc cttcggcgcg attttgccgg ttactgcgct gtaccaaatg 6480 cgggacaacg taagcactac atttcgctca tcgccagccc agtcgggcgg cgagttccat 6540 agcgttaagg tttcatttag cgcctcaaat agatcctgtt caggaaccgg atcaaagagt 6600 tcctccgccg ctggacctac caaggcaacg ctatgttctc ttgcttttgt cagcaagata 6660 gccagatcaa tgtcgatcgt ggctggctcg aagatacctg caagaatgtc attgcgctgc 6720 cattctccaa attgcagttc gcgcttagct ggataacgcc acggaatgat gtcgtcgtgc 6780 acaacaatgg tgacttctac agcgcggaga atctcgctct ctccagggga agccgaagtt 6840 tccaaaaggt cgttgatcaa agctcgccgc gttgtttcat caagccttac ggtcaccgta 6900 accagcaaat caatatcact gtgtggcttc aggccgccat ccactgcgga gccgtacaaa 6960 tgtacggcca gcaacgtcgg ttcgagatgg cgctcgatga cgccaactac ctctgatagt 7020 tgagtcgata cttcggcgat caccgcttcc ctcatactct tcctttttca atattattga 7080 agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 7140 aaacaaatag ctagctcact cggtcgctac gctccgggcg tgagactgcg gcgggcgctg 7200 cggacacata caaagttacc cacagattcc gtggataagc aggggactaa catgtgaggc 7260 aaaacagcag ggccgcgccg gtggcgtttt tccataggct ccgccctcct gccagagttc 7320 acataaacag acgcttttcc ggtgcatctg tgggagccgt gaggctcaac catgaatctg 7380 acagtacggg cgaaacccga caggacttaa agatccccac cgtttccggc gggtcgctcc 7440 ctcttgcgct ctcctgttcc gaccctgccg tttaccggat acctgttccg cctttctccc 7500 ttacgggaag tgtggcgctt tctcatagct cacacactgg tatctcggct cggtgtaggt 7560 cgttcgctcc aagctgggct gtaagcaaga actccccgtt cagcccgact gctgcgcctt 7620 atccggtaac tgttcacttg agtccaaccc ggaaaagcac ggtaaaacgc cactggcagc 7680 agccattggt aactgggagt tcgcagagga tttgtttagc taaacacgcg gttgctcttg 7740 aagtgtgcgc caaagtccgg ctacactgga aggacagatt tggttgctgt gctctgcgaa 7800 agccagttac cacggttaag cagttcccca actgacttaa ccttcgatca aaccacctcc 7860 ccaggtggtt ttttcgttta cagggcaaaa gattacgcgc agaaaaaaag gatctcaaga 7920 agatcctttg atc 7933 <210> 442 <211> 8644 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-FokI-linker-Cas8_His6HRV3CCse2_Cas7_Cas5_Cas6 <400> 442 ttttctactg aaccgctcta gatttcagtg caatttatct cttcaaatgt agcacctgaa 60 gtcagcccca tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga 120 aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 180 tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 240 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300 gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 360 tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 420 tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 480 actaccgaga tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 540 agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 600 tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 660 tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 720 gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 780 acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 840 gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 900 tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 960 accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 1020 cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 1080 agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 1140 cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 1200 gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 1260 tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 1320 gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 1380 acgctctccc ttatgcgact cctgcattag gaaattaata cgactcacta taggggaatt 1440 gtgagcggat aacaattccc ctgtagaaat aattttgttt aactttaata aggagatata 1500 ccatggctcc gaaaaaaaag cgcaaagtgg gtggctctca actggttaaa agcgaactgg 1560 aagagaaaaa aagtgaactg cgccacaaac tgaaatatgt gccgcatgaa tatatcgagc 1620 tgattgaaat tgcacgtaat ccgacccagg atcgtattct ggaaatgaaa gtgatggaat 1680 tttttatgaa agtgtacggc tatcgcggtg aacatctggg tggtagccgt aaaccggatg 1740 gtgcaattta taccgttggt agcccgattg attatggtgt tattgttgat accaaagcct 1800 atagcggtgg ttataatctg ccgattggtc aggcagatga aatgcagcgt tatgtggaag 1860 aaaatcagac ccgtaacaaa catattaatc cgaatgaatg gtggaaagtt tatccgagca 1920 gcgttaccga gtttaaattc ctgtttgtta gcggtcactt caaaggcaac tataaagcac 1980 agctgacccg tctgaatcat attaccaatt gtaatggtgc agttctgagc gttgaagaac 2040 tgctgattgg tggtgaaatg attaaagcag gcaccctgac cctggaagaa gttcgtcgca 2100 aatttaacaa tggcgaaatc aacttttcag gcagcgaaac gccgggtaca agtgagtcag 2160 caactccaga gagcggcggc agtggtagta gtgggggatc tgggtcatct ggtgggatga 2220 atttgcttat tgataactgg attcctgtac gcccgcgaaa cggggggaaa gtccaaatca 2280 taaatctgca atcgctatac tgcagtagag atcagtggcg attaagtttg ccccgtgacg 2340 atatggaact ggccgcttta gcactgctgg tttgcattgg gcaaattatc gccccggcaa 2400 aagatgacgt tgaatttcga catcgcataa tgaatccgct cactgaagat gagtttcaac 2460 aactcatcgc gccgtggata gatatgttct accttaatca cgcagaacat ccctttatgc 2520 agaccaaagg tgtcaaagca aatgatgtga ctccaatgga aaaactgttg gctggggtaa 2580 gcggcgcgac gaattgtgca tttgtcaatc aaccggggca gggtgaagca ttatgtggtg 2640 gatgcactgc gattgcgtta ttcaaccagg cgaatcaggc accaggtttt ggtggtggtt 2700 ttaaaagcgg tttacgtgga ggaacacctg taacaacgtt cgtacgtggg atcgatcttc 2760 gttcaacggt gttactcaat gtcctcacat tacctcgtct tcaaaaacaa tttcctaatg 2820 aatcacatac ggaaaaccaa cctacctgga ttaaacctat caagtccaat gagtctatac 2880 ctgcttcgtc aattgggttt gtccgtggtc tattctggca accagcgcat attgaattat 2940 gcgatcccat tgggattggt aaatgttctt gctgtggaca ggaaagcaat ttgcgttata 3000 ccggttttct taaggaaaaa tttaccttta cagttaatgg gctatggccc catccgcatt 3060 ccccttgtct ggtaacagtc aagaaagggg aggttgagga aaaatttctt gctttcacca 3120 cctccgcacc atcatggaca caaatcagcc gagttgtggt agataagatt attcaaaatg 3180 aaaatggaaa tcgcgtggcg gcggttgtga atcaattcag aaatattgcg ccgcaaagtc 3240 ctcttgaatt gattatgggg ggatatcgta ataatcaagc atctattctt gaacggcgtc 3300 atgatgtgtt gatgtttaat caggggtggc aacaatacgg caatgtgata aacgaaatag 3360 tgactgttgg tttgggatat aaaacagcct tacgcaaggc gttatatacc tttgcagaag 3420 ggtttaaaaa taaagacttc aaaggggccg gagtctctgt tcatgagact gcagaaaggc 3480 atttctatcg acagagtgaa ttattaattc ccgatgtact ggcgaatgtt aatttttccc 3540 aggctgatga ggtaatagct gatttacgag acaaacttca tcaattgtgt gaaatgctat 3600 ttaatcaatc tgtagctccc tatgcacatc atcctaaatt aataagcaca ttagcgcttg 3660 cccgcgccac gctatacaaa catttacggg agttaaaacc gcaaggaggg ccatcaaatg 3720 gctgagcatc accaccatca tcacggtgca cttgaagtcc tctttcaggg acccgggtac 3780 cagatggctg atgaaattga tgcaatggct ttatatcgag cctggcaaca actggataat 3840 ggatcatgtg cgcaaattag acgtgtttca gaacctgatg aattacgcga tatccctgcg 3900 ttttataggc tggtgcaacc ttttggttgg gaaaacccac gtcaccagca ggctcttttg 3960 cgcatggtgt tttgcctgag cgcaggaaag aatgtcatcc gacatcagga caaaaaatcg 4020 gagcaaacaa caggtatctc gttgggaaga gctttagcca atagtggaag aattaacgag 4080 cgccgtatct ttcaattaat tcgggctgac agaacagccg atatggtcca gttacgtcga 4140 ttacttactc acgccgaacc cgtacttgac tggccattaa tggccaggat gttgacctgg 4200 tggggaaagc gcgaacgcca gcaacttctg gaagattttg tattgaccac aaacaaaaat 4260 gcgtaaggaa acctttctat gtctaacttt atcaatattc atgttctgat ctctcacagc 4320 ccttcatgtc tgaaccgcga cgatatgaac atgcagaaag acgctatttt cggcggcaaa 4380 agacgagtaa gaatttcaag tcaaagcctt aaacgtgcga tgcgtaaaag tggttattac 4440 gcacaaaata ttggtgaatc cagtctcaga accattcatc ttgcacaatt acgtgatgtt 4500 cttcggcaaa aacttggtga acgttttgac caaaaaatca tcgataagac attagcgctg 4560 ctctccggta aatcagttga tgaagccgaa aagatttctg ccgatgcggt tactccctgg 4620 gttgtgggag aaatagcctg gttctgtgag caggttgcaa aagcagaggc tgataatctg 4680 gatgataaaa agctgctcaa agttcttaag gaagatattg ccgccatacg tgtgaattta 4740 cagcagggtg ttgatattgc gcttagtgga agaatggcaa ccagcggcat gatgactgag 4800 ttgggaaaag ttgatggtgc aatgtccatt gcgcatgcga tcactactca tcaggttgat 4860 tctgatattg actggttcac cgctgtagat gatttacagg aacaaggttc tgcacatctg 4920 ggaactcagg aattttcatc gggtgttttt tatcgttatg ccaacattaa cctcgctcaa 4980 cttcaggaaa atttaggtgg tgcctccagg gagcaggctc tggaaattgc aacccatgtt 5040 gttcatatgc tggcaacaga ggtccctgga gcaaaacagc gtacttatgc cgcttttaac 5100 cctgcggata tggtaatggt taatttctcc gatatgccac tttctatggc aaatgctttt 5160 gaaaaagcgg ttaaagcgaa agatggcttt ttgcaaccgt ctatacaggc gtttaatcaa 5220 tattgggatc gcgttgccaa tggatatggt ctgaacggag ctgctgcgca attcagctta 5280 tctgatgtag acccaattac tgctcaagtt aaacaaatgc ctactttaga acagttaaaa 5340 tcctgggttc gtaataatgg cgaggcgtga acatgagatc ttatttgatc ttgcggcttg 5400 ctgggccaat gcaagcctgg gggcagccga cctttgaagg aacgcgacct accggaagat 5460 ttccgacccg aagcgggtta ttagggctac tcggggcttg tcttgggatc caacgtgatg 5520 atacttcttc attacaggcg ttatcagaga gtgtgcaatt tgcagtgcgc tgcgatgaac 5580 tcattcttga cgatcgtcgt gtgtctgtaa cggggttgcg tgattaccat acagtccttg 5640 gagcgcgaga agattaccgt ggtttgaaaa gtcatgaaac gattcaaaca tggcgcgaat 5700 atttatgtga tgcctccttt accgtcgctc tctggttaac accccatgca acgatggtta 5760 tctcagaact tgaaaaagca gtattaaagc ctcggtatac accttacctg gggcggagaa 5820 gttgcccact aacacacccg ctttttttgg ggacatgtca ggcatcggat cctcagaagg 5880 cgctattaaa ttatgagccc gttggcggcg atatatatag tgaggaatca gttacagggc 5940 atcatttaaa atttacggcg cgcgacgaac cgatgatcac cttgcctcga caatttgctt 6000 cccgagaatg gtatgtgatt aaaggaggta tggatgtatc tcagtaaagt catcattgcc 6060 agggcctgga gcagggatct ttaccaactt caccagggat tatggcattt atttccaaac 6120 agaccggatg ctgctcgtga ttttcttttt catgttgaga agcgaaacac accagaaggc 6180 tgtcatgttt tattgcagtc agcgcaaatg cctgtttcaa ctgccgttgc gacagtcatt 6240 aaaactaaac aggttgaatt tcaacttcag gttggtgttc cactctattt tcggcttcgg 6300 gcaaatccga tcaaaactat tctcgacaat caaaagcgcc tggacagtaa agggaatatt 6360 aaacgctgtc gggttccgtt aataaaagaa gcagaacaaa tcgcgtggtt gcaacgtaaa 6420 ttgggcaatg cggcgcgcgt tgaagatgtg catcccatat cggaacggcc acagtatttt 6480 tctggtgatg gtaaaagtgg aaagatccaa acggtttgct ttgaaggtgt gctcaccatc 6540 aacgacgcgc cagcgttaat agatcttgta cagcaaggta ttgggccagc taaatcgatg 6600 ggatgtggct tgctatcttt ggctccactg tgactgcagg cggccgcact cgagtctggt 6660 aaagaaaccg ctgctgcgaa atttgaacgc cagcacatgg actcgtctac tagcgcagct 6720 taattaacct aggctgctgc caccgctgag caataactag cataacccct tggggcctct 6780 aaacgggtct tgaggggttt tttgctgaaa cctcaggcat ttgagaagca cacggtcaca 6840 ctgcttccgg tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga 6900 ccctgccctg aaccgacgac cgggtcatcg tggccggatc ttgcggcccc tcggcttgaa 6960 cgaattgtta gacattattt gccgactacc ttggtgatct cgcctttcac gtagtggaca 7020 aattcttcca actgatctgc gcgcgaggcc aagcgatctt cttcttgtcc aagataagcc 7080 tgtctagctt caagtatgac gggctgatac tgggccggca ggcgctccat tgcccagtcg 7140 gcagcgacat ccttcggcgc gattttgccg gttactgcgc tgtaccaaat gcgggacaac 7200 gtaagcacta catttcgctc atcgccagcc cagtcgggcg gcgagttcca tagcgttaag 7260 gtttcattta gcgcctcaaa tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc 7320 gctggaccta ccaaggcaac gctatgttct cttgcttttg tcagcaagat agccagatca 7380 atgtcgatcg tggctggctc gaagatacct gcaagaatgt cattgcgctg ccattctcca 7440 aattgcagtt cgcgcttagc tggataacgc cacggaatga tgtcgtcgtg cacaacaatg 7500 gtgacttcta cagcgcggag aatctcgctc tctccagggg aagccgaagt ttccaaaagg 7560 tcgttgatca aagctcgccg cgttgtttca tcaagcctta cggtcaccgt aaccagcaaa 7620 tcaatatcac tgtgtggctt caggccgcca tccactgcgg agccgtacaa atgtacggcc 7680 agcaacgtcg gttcgagatg gcgctcgatg acgccaacta cctctgatag ttgagtcgat 7740 acttcggcga tcaccgcttc cctcatactc ttcctttttc aatattattg aagcatttat 7800 cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 7860 gctagctcac tcggtcgcta cgctccgggc gtgagactgc ggcgggcgct gcggacacat 7920 acaaagttac ccacagattc cgtggataag caggggacta acatgtgagg caaaacagca 7980 gggccgcgcc ggtggcgttt ttccataggc tccgccctcc tgccagagtt cacataaaca 8040 gacgcttttc cggtgcatct gtgggagccg tgaggctcaa ccatgaatct gacagtacgg 8100 gcgaaacccg acaggactta aagatcccca ccgtttccgg cgggtcgctc cctcttgcgc 8160 tctcctgttc cgaccctgcc gtttaccgga tacctgttcc gcctttctcc cttacgggaa 8220 gtgtggcgct ttctcatagc tcacacactg gtatctcggc tcggtgtagg tcgttcgctc 8280 caagctgggc tgtaagcaag aactccccgt tcagcccgac tgctgcgcct tatccggtaa 8340 ctgttcactt gagtccaacc cggaaaagca cggtaaaacg ccactggcag cagccattgg 8400 taactgggag ttcgcagagg atttgtttag ctaaacacgc ggttgctctt gaagtgtgcg 8460 ccaaagtccg gctacactgg aaggacagat ttggttgctg tgctctgcga aagccagtta 8520 ccacggttaa gcagttcccc aactgactta accttcgatc aaaccacctc cccaggtggt 8580 tttttcgttt acagggcaaa agattacgcg cagaaaaaaa ggatctcaag aagatccttt 8640 gatc 8644 <210> 443 <211> 8687 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-FokI-linker-Cas8_His6HRV3CCse2_Cas7-NLS_Cas5_Cas6 <400> 443 ttttctactg aaccgctcta gatttcagtg caatttatct cttcaaatgt agcacctgaa 60 gtcagcccca tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga 120 aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 180 tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 240 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300 gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 360 tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 420 tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 480 actaccgaga tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 540 agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 600 tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 660 tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 720 gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 780 acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 840 gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 900 tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 960 accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 1020 cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 1080 agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 1140 cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 1200 gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 1260 tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 1320 gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 1380 acgctctccc ttatgcgact cctgcattag gaaattaata cgactcacta taggggaatt 1440 gtgagcggat aacaattccc ctgtagaaat aattttgttt aactttaata aggagatata 1500 ccatggctcc gaaaaaaaag cgcaaagtgg gtggctctca actggttaaa agcgaactgg 1560 aagagaaaaa aagtgaactg cgccacaaac tgaaatatgt gccgcatgaa tatatcgagc 1620 tgattgaaat tgcacgtaat ccgacccagg atcgtattct ggaaatgaaa gtgatggaat 1680 tttttatgaa agtgtacggc tatcgcggtg aacatctggg tggtagccgt aaaccggatg 1740 gtgcaattta taccgttggt agcccgattg attatggtgt tattgttgat accaaagcct 1800 atagcggtgg ttataatctg ccgattggtc aggcagatga aatgcagcgt tatgtggaag 1860 aaaatcagac ccgtaacaaa catattaatc cgaatgaatg gtggaaagtt tatccgagca 1920 gcgttaccga gtttaaattc ctgtttgtta gcggtcactt caaaggcaac tataaagcac 1980 agctgacccg tctgaatcat attaccaatt gtaatggtgc agttctgagc gttgaagaac 2040 tgctgattgg tggtgaaatg attaaagcag gcaccctgac cctggaagaa gttcgtcgca 2100 aatttaacaa tggcgaaatc aacttttcag gcagcgaaac gccgggtaca agtgagtcag 2160 caactccaga gagcggcggc agtggtagta gtgggggatc tgggtcatct ggtgggatga 2220 atttgcttat tgataactgg attcctgtac gcccgcgaaa cggggggaaa gtccaaatca 2280 taaatctgca atcgctatac tgcagtagag atcagtggcg attaagtttg ccccgtgacg 2340 atatggaact ggccgcttta gcactgctgg tttgcattgg gcaaattatc gccccggcaa 2400 aagatgacgt tgaatttcga catcgcataa tgaatccgct cactgaagat gagtttcaac 2460 aactcatcgc gccgtggata gatatgttct accttaatca cgcagaacat ccctttatgc 2520 agaccaaagg tgtcaaagca aatgatgtga ctccaatgga aaaactgttg gctggggtaa 2580 gcggcgcgac gaattgtgca tttgtcaatc aaccggggca gggtgaagca ttatgtggtg 2640 gatgcactgc gattgcgtta ttcaaccagg cgaatcaggc accaggtttt ggtggtggtt 2700 ttaaaagcgg tttacgtgga ggaacacctg taacaacgtt cgtacgtggg atcgatcttc 2760 gttcaacggt gttactcaat gtcctcacat tacctcgtct tcaaaaacaa tttcctaatg 2820 aatcacatac ggaaaaccaa cctacctgga ttaaacctat caagtccaat gagtctatac 2880 ctgcttcgtc aattgggttt gtccgtggtc tattctggca accagcgcat attgaattat 2940 gcgatcccat tgggattggt aaatgttctt gctgtggaca ggaaagcaat ttgcgttata 3000 ccggttttct taaggaaaaa tttaccttta cagttaatgg gctatggccc catccgcatt 3060 ccccttgtct ggtaacagtc aagaaagggg aggttgagga aaaatttctt gctttcacca 3120 cctccgcacc atcatggaca caaatcagcc gagttgtggt agataagatt attcaaaatg 3180 aaaatggaaa tcgcgtggcg gcggttgtga atcaattcag aaatattgcg ccgcaaagtc 3240 ctcttgaatt gattatgggg ggatatcgta ataatcaagc atctattctt gaacggcgtc 3300 atgatgtgtt gatgtttaat caggggtggc aacaatacgg caatgtgata aacgaaatag 3360 tgactgttgg tttgggatat aaaacagcct tacgcaaggc gttatatacc tttgcagaag 3420 ggtttaaaaa taaagacttc aaaggggccg gagtctctgt tcatgagact gcagaaaggc 3480 atttctatcg acagagtgaa ttattaattc ccgatgtact ggcgaatgtt aatttttccc 3540 aggctgatga ggtaatagct gatttacgag acaaacttca tcaattgtgt gaaatgctat 3600 ttaatcaatc tgtagctccc tatgcacatc atcctaaatt aataagcaca ttagcgcttg 3660 cccgcgccac gctatacaaa catttacggg agttaaaacc gcaaggaggg ccatcaaatg 3720 gctgagcatc accaccatca tcacggtgca cttgaagtcc tctttcaggg acccgggtac 3780 cagatggctg atgaaattga tgcaatggct ttatatcgag cctggcaaca actggataat 3840 ggatcatgtg cgcaaattag acgtgtttca gaacctgatg aattacgcga tatccctgcg 3900 ttttataggc tggtgcaacc ttttggttgg gaaaacccac gtcaccagca ggctcttttg 3960 cgcatggtgt tttgcctgag cgcaggaaag aatgtcatcc gacatcagga caaaaaatcg 4020 gagcaaacaa caggtatctc gttgggaaga gctttagcca atagtggaag aattaacgag 4080 cgccgtatct ttcaattaat tcgggctgac agaacagccg atatggtcca gttacgtcga 4140 ttacttactc acgccgaacc cgtacttgac tggccattaa tggccaggat gttgacctgg 4200 tggggaaagc gcgaacgcca gcaacttctg gaagattttg tattgaccac aaacaaaaat 4260 gcgtaaggaa acctttctat gtctaacttt atcaatattc atgttctgat ctctcacagc 4320 ccttcatgtc tgaaccgcga cgatatgaac atgcagaaag acgctatttt cggcggcaaa 4380 agacgagtaa gaatttcaag tcaaagcctt aaacgtgcga tgcgtaaaag tggttattac 4440 gcacaaaata ttggtgaatc cagtctcaga accattcatc ttgcacaatt acgtgatgtt 4500 cttcggcaaa aacttggtga acgttttgac caaaaaatca tcgataagac attagcgctg 4560 ctctccggta aatcagttga tgaagccgaa aagatttctg ccgatgcggt tactccctgg 4620 gttgtgggag aaatagcctg gttctgtgag caggttgcaa aagcagaggc tgataatctg 4680 gatgataaaa agctgctcaa agttcttaag gaagatattg ccgccatacg tgtgaattta 4740 cagcagggtg ttgatattgc gcttagtgga agaatggcaa ccagcggcat gatgactgag 4800 ttgggaaaag ttgatggtgc aatgtccatt gcgcatgcga tcactactca tcaggttgat 4860 tctgatattg actggttcac cgctgtagat gatttacagg aacaaggttc tgcacatctg 4920 ggaactcagg aattttcatc gggtgttttt tatcgttatg ccaacattaa cctcgctcaa 4980 cttcaggaaa atttaggtgg tgcctccagg gagcaggctc tggaaattgc aacccatgtt 5040 gttcatatgc tggcaacaga ggtccctgga gcaaaacagc gtacttatgc cgcttttaac 5100 cctgcggata tggtaatggt taatttctcc gatatgccac tttctatggc aaatgctttt 5160 gaaaaagcgg ttaaagcgaa agatggcttt ttgcaaccgt ctatacaggc gtttaatcaa 5220 tattgggatc gcgttgccaa tggatatggt ctgaacggag ctgctgcgca attcagctta 5280 tctgatgtag acccaattac tgctcaagtt aaacaaatgc ctactttaga acagttaaaa 5340 tcctgggttc gtaataatgg cgaggcgggc ggtagcccaa agaaaaaacg taaggtttga 5400 taaaggaggt atataatgag atcttatttg atcttgcggc ttgctgggcc aatgcaagcc 5460 tgggggcagc cgacctttga aggaacgcga cctaccggaa gatttccgac ccgaagcggg 5520 ttattagggc tactcggggc ttgtcttggg atccaacgtg atgatacttc ttcattacag 5580 gcgttatcag agagtgtgca atttgcagtg cgctgcgatg aactcattct tgacgatcgt 5640 cgtgtgtctg taacggggtt gcgtgattac catacagtcc ttggagcgcg agaagattac 5700 cgtggtttga aaagtcatga aacgattcaa acatggcgcg aatatttatg tgatgcctcc 5760 tttaccgtcg ctctctggtt aacaccccat gcaacgatgg ttatctcaga acttgaaaaa 5820 gcagtattaa agcctcggta tacaccttac ctggggcgga gaagttgccc actaacacac 5880 ccgctttttt tggggacatg tcaggcatcg gatcctcaga aggcgctatt aaattatgag 5940 cccgttggcg gcgatatata tagtgaggaa tcagttacag ggcatcattt aaaatttacg 6000 gcgcgcgacg aaccgatgat caccttgcct cgacaatttg cttcccgaga atggtatgtg 6060 attaaaggag gtatggatgt atctcagtaa agtcatcatt gccagggcct ggagcaggga 6120 tctttaccaa cttcaccagg gattatggca tttatttcca aacagaccgg atgctgctcg 6180 tgattttctt tttcatgttg agaagcgaaa cacaccagaa ggctgtcatg ttttattgca 6240 gtcagcgcaa atgcctgttt caactgccgt tgcgacagtc attaaaacta aacaggttga 6300 atttcaactt caggttggtg ttccactcta ttttcggctt cgggcaaatc cgatcaaaac 6360 tattctcgac aatcaaaagc gcctggacag taaagggaat attaaacgct gtcgggttcc 6420 gttaataaaa gaagcagaac aaatcgcgtg gttgcaacgt aaattgggca atgcggcgcg 6480 cgttgaagat gtgcatccca tatcggaacg gccacagtat ttttctggtg atggtaaaag 6540 tggaaagatc caaacggttt gctttgaagg tgtgctcacc atcaacgacg cgccagcgtt 6600 aatagatctt gtacagcaag gtattgggcc agctaaatcg atgggatgtg gcttgctatc 6660 tttggctcca ctgtgactgc aggcggccgc actcgagtct ggtaaagaaa ccgctgctgc 6720 gaaatttgaa cgccagcaca tggactcgtc tactagcgca gcttaattaa cctaggctgc 6780 tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg tcttgagggg 6840 ttttttgctg aaacctcagg catttgagaa gcacacggtc acactgcttc cggtagtcaa 6900 taaaccggta aaccagcaat agacataagc ggctatttaa cgaccctgcc ctgaaccgac 6960 gaccgggtca tcgtggccgg atcttgcggc ccctcggctt gaacgaattg ttagacatta 7020 tttgccgact accttggtga tctcgccttt cacgtagtgg acaaattctt ccaactgatc 7080 tgcgcgcgag gccaagcgat cttcttcttg tccaagataa gcctgtctag cttcaagtat 7140 gacgggctga tactgggccg gcaggcgctc cattgcccag tcggcagcga catccttcgg 7200 cgcgattttg ccggttactg cgctgtacca aatgcgggac aacgtaagca ctacatttcg 7260 ctcatcgcca gcccagtcgg gcggcgagtt ccatagcgtt aaggtttcat ttagcgcctc 7320 aaatagatcc tgttcaggaa ccggatcaaa gagttcctcc gccgctggac ctaccaaggc 7380 aacgctatgt tctcttgctt ttgtcagcaa gatagccaga tcaatgtcga tcgtggctgg 7440 ctcgaagata cctgcaagaa tgtcattgcg ctgccattct ccaaattgca gttcgcgctt 7500 agctggataa cgccacggaa tgatgtcgtc gtgcacaaca atggtgactt ctacagcgcg 7560 gagaatctcg ctctctccag gggaagccga agtttccaaa aggtcgttga tcaaagctcg 7620 ccgcgttgtt tcatcaagcc ttacggtcac cgtaaccagc aaatcaatat cactgtgtgg 7680 cttcaggccg ccatccactg cggagccgta caaatgtacg gccagcaacg tcggttcgag 7740 atggcgctcg atgacgccaa ctacctctga tagttgagtc gatacttcgg cgatcaccgc 7800 ttccctcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 7860 gagcggatac atatttgaat gtatttagaa aaataaacaa atagctagct cactcggtcg 7920 ctacgctccg ggcgtgagac tgcggcgggc gctgcggaca catacaaagt tacccacaga 7980 ttccgtggat aagcagggga ctaacatgtg aggcaaaaca gcagggccgc gccggtggcg 8040 tttttccata ggctccgccc tcctgccaga gttcacataa acagacgctt ttccggtgca 8100 tctgtgggag ccgtgaggct caaccatgaa tctgacagta cgggcgaaac ccgacaggac 8160 ttaaagatcc ccaccgtttc cggcgggtcg ctccctcttg cgctctcctg ttccgaccct 8220 gccgtttacc ggatacctgt tccgcctttc tcccttacgg gaagtgtggc gctttctcat 8280 agctcacaca ctggtatctc ggctcggtgt aggtcgttcg ctccaagctg ggctgtaagc 8340 aagaactccc cgttcagccc gactgctgcg ccttatccgg taactgttca cttgagtcca 8400 acccggaaaa gcacggtaaa acgccactgg cagcagccat tggtaactgg gagttcgcag 8460 aggatttgtt tagctaaaca cgcggttgct cttgaagtgt gcgccaaagt ccggctacac 8520 tggaaggaca gatttggttg ctgtgctctg cgaaagccag ttaccacggt taagcagttc 8580 cccaactgac ttaaccttcg atcaaaccac ctccccaggt ggttttttcg tttacagggc 8640 aaaagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatc 8687 <210> 444 <211> 3736 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(J3) <400> 444 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggctagcgag ttccccgcgc cagcggggat 120 aaaccgccag tgataagtgg aatgccatgt gggctgtcga gttccccgcg ccagcgggga 180 taaaccggag ctcgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt 240 gaggggtttt ttgctgaaac ctcaggcatt tgagaagcac acggtcacac tgcttccggt 300 agtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgac cctgccctga 360 accgacgacc gggtcgaatt tgctttcgaa tttctgccat tcatccgctt attatcactt 420 attcaggcgt agcaaccagg cgtttaaggg caccaataac tgccttaaaa aaattacgcc 480 ccgccctgcc actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag 540 ccatcacaaa cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc 600 gtataatatt tgcccatagt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt 660 aaatcaaaac tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata 720 aaccctttag ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg 780 tgtagaaact gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt 840 tgctcatgga aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct 900 ttcattgcca tacggaactc cggatgagca ttcatcaggc gggcaagaat gtgaataaag 960 gccggataaa acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc 1020 tgaacggtct ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta 1080 cgatgccatt gggatatatc aacggtggta tatccagtga tttttttctc cattttagct 1140 tccttagctc ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca 1200 ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccaaaagttg 1260 gcccagggct tcccggtatc aacagggaca ccaggattta tttattctgc gaagtgatct 1320 tccgtcacag gtatttattc ggcgcaaagt gcgtcgggtg atgctgccaa cttactgatt 1380 tagtgtatga tggtgttttt gaggtgctcc agtggcttct gtttctatca gctgtccctc 1440 ctgttcagct actgacgggg tggtgcgtaa cggcaaaagc accgccggac atcagcgcta 1500 gcggagtgta tactggctta ctatgttggc actgatgagg gtgtcagtga agtgcttcat 1560 gtggcaggag aaaaaaggct gcaccggtgc gtcagcagaa tatgtgatac aggatatatt 1620 ccgcttcctc gctcactgac tcgctacgct cggtcgttcg actgcggcga gcggaaatgg 1680 cttacgaacg gggcggagat ttcctggaag atgccaggaa gatacttaac agggaagtga 1740 gagggccgcg gcaaagccgt ttttccatag gctccgcccc cctgacaagc atcacgaaat 1800 ctgacgctca aatcagtggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1860 cctggcggct ccctcgtgcg ctctcctgtt cctgcctttc ggtttaccgg tgtcattccg 1920 ctgttatggc cgcgtttgtc tcattccacg cctgacactc agttccgggt aggcagttcg 1980 ctccaagctg gactgtatgc acgaaccccc cgttcagtcc gaccgctgcg ccttatccgg 2040 taactatcgt cttgagtcca acccggaaag acatgcaaaa gcaccactgg cagcagccac 2100 tggtaattga tttagaggag ttagtcttga agtcatgcgc cggttaaggc taaactgaaa 2160 ggacaagttt tggtgactgc gctcctccaa gccagttacc tcggttcaaa gagttggtag 2220 ctcagagaac cttcgaaaaa ccgccctgca aggcggtttt ttcgttttca gagcaagaga 2280 ttacgcgcag accaaaacga tctcaagaag atcatcttat taatcagata aaatatttct 2340 agatttcagt gcaatttatc tcttcaaatg tagcacctga agtcagcccc atacgatata 2400 agttgtaatt ctcatgttag tcatgccccg cgcccaccgg aaggagctga ctgggttgaa 2460 ggctctcaag ggcatcggtc gagatcccgg tgcctaatga gtgagctaac ttacattaat 2520 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 2580 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgccagggtg gtttttcttt 2640 tcaccagtga gacgggcaac agctgattgc ccttcaccgc ctggccctga gagagttgca 2700 gcaagcggtc cacgctggtt tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg 2760 gcgggatata acatgagctg tcttcggtat cgtcgtatcc cactaccgag atgtccgcac 2820 caacgcgcag cccggactcg gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg 2880 caaccagcat cgcagtggga acgatgccct cattcagcat ttgcatggtt tgttgaaaac 2940 cggacatggc actccagtcg ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga 3000 gatatttatg ccagccagcc agacgcagac gcgccgagac agaacttaat gggcccgcta 3060 acagcgcgat ttgctggtga cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt 3120 cttcatggga gaaaataata ctgttgatgg gtgtctggtc agagacatca agaaataacg 3180 ccggaacatt agtgcaggca gcttccacag caatggcatc ctggtcatcc agcggatagt 3240 taatgatcag cccactgacg cgttgcgcga gaagattgtg caccgccgct ttacaggctt 3300 cgacgccgct tcgttctacc atcgacacca ccacgctggc acccagttga tcggcgcgag 3360 atttaatcgc cgcgacaatt tgcgacggcg cgtgcagggc cagactggag gtggcaacgc 3420 caatcagcaa cgactgtttg cccgccagtt gttgtgccac gcggttggga atgtaattca 3480 gctccgccat cgccgcttcc actttttccc gcgttttcgc agaaacgtgg ctggcctggt 3540 tcaccacgcg ggaaacggtc tgataagaga caccggcata ctctgcgaca tcgtataacg 3600 ttactggttt cacattcacc accctgaatt gactctcttc cgggcgctat catgccatac 3660 cgcgaaaggt tttgcgccat tcgatggtgt ccgggatctc gacgctctcc cttatgcgac 3720 tcctgcatta ggaaat 3736 <210> 445 <211> 3736 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(L3) <400> 445 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggctagcgag ttccccgcgc cagcggggat 120 aaaccgagtg gcagatatag cctggtggtt caggcggcga gttccccgcg ccagcgggga 180 taaaccggag ctcgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt 240 gaggggtttt ttgctgaaac ctcaggcatt tgagaagcac acggtcacac tgcttccggt 300 agtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgac cctgccctga 360 accgacgacc gggtcgaatt tgctttcgaa tttctgccat tcatccgctt attatcactt 420 attcaggcgt agcaaccagg cgtttaaggg caccaataac tgccttaaaa aaattacgcc 480 ccgccctgcc actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag 540 ccatcacaaa cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc 600 gtataatatt tgcccatagt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt 660 aaatcaaaac tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata 720 aaccctttag ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg 780 tgtagaaact gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt 840 tgctcatgga aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct 900 ttcattgcca tacggaactc cggatgagca ttcatcaggc gggcaagaat gtgaataaag 960 gccggataaa acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc 1020 tgaacggtct ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta 1080 cgatgccatt gggatatatc aacggtggta tatccagtga tttttttctc cattttagct 1140 tccttagctc ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca 1200 ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccaaaagttg 1260 gcccagggct tcccggtatc aacagggaca ccaggattta tttattctgc gaagtgatct 1320 tccgtcacag gtatttattc ggcgcaaagt gcgtcgggtg atgctgccaa cttactgatt 1380 tagtgtatga tggtgttttt gaggtgctcc agtggcttct gtttctatca gctgtccctc 1440 ctgttcagct actgacgggg tggtgcgtaa cggcaaaagc accgccggac atcagcgcta 1500 gcggagtgta tactggctta ctatgttggc actgatgagg gtgtcagtga agtgcttcat 1560 gtggcaggag aaaaaaggct gcaccggtgc gtcagcagaa tatgtgatac aggatatatt 1620 ccgcttcctc gctcactgac tcgctacgct cggtcgttcg actgcggcga gcggaaatgg 1680 cttacgaacg gggcggagat ttcctggaag atgccaggaa gatacttaac agggaagtga 1740 gagggccgcg gcaaagccgt ttttccatag gctccgcccc cctgacaagc atcacgaaat 1800 ctgacgctca aatcagtggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1860 cctggcggct ccctcgtgcg ctctcctgtt cctgcctttc ggtttaccgg tgtcattccg 1920 ctgttatggc cgcgtttgtc tcattccacg cctgacactc agttccgggt aggcagttcg 1980 ctccaagctg gactgtatgc acgaaccccc cgttcagtcc gaccgctgcg ccttatccgg 2040 taactatcgt cttgagtcca acccggaaag acatgcaaaa gcaccactgg cagcagccac 2100 tggtaattga tttagaggag ttagtcttga agtcatgcgc cggttaaggc taaactgaaa 2160 ggacaagttt tggtgactgc gctcctccaa gccagttacc tcggttcaaa gagttggtag 2220 ctcagagaac cttcgaaaaa ccgccctgca aggcggtttt ttcgttttca gagcaagaga 2280 ttacgcgcag accaaaacga tctcaagaag atcatcttat taatcagata aaatatttct 2340 agatttcagt gcaatttatc tcttcaaatg tagcacctga agtcagcccc atacgatata 2400 agttgtaatt ctcatgttag tcatgccccg cgcccaccgg aaggagctga ctgggttgaa 2460 ggctctcaag ggcatcggtc gagatcccgg tgcctaatga gtgagctaac ttacattaat 2520 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 2580 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgccagggtg gtttttcttt 2640 tcaccagtga gacgggcaac agctgattgc ccttcaccgc ctggccctga gagagttgca 2700 gcaagcggtc cacgctggtt tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg 2760 gcgggatata acatgagctg tcttcggtat cgtcgtatcc cactaccgag atgtccgcac 2820 caacgcgcag cccggactcg gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg 2880 caaccagcat cgcagtggga acgatgccct cattcagcat ttgcatggtt tgttgaaaac 2940 cggacatggc actccagtcg ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga 3000 gatatttatg ccagccagcc agacgcagac gcgccgagac agaacttaat gggcccgcta 3060 acagcgcgat ttgctggtga cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt 3120 cttcatggga gaaaataata ctgttgatgg gtgtctggtc agagacatca agaaataacg 3180 ccggaacatt agtgcaggca gcttccacag caatggcatc ctggtcatcc agcggatagt 3240 taatgatcag cccactgacg cgttgcgcga gaagattgtg caccgccgct ttacaggctt 3300 cgacgccgct tcgttctacc atcgacacca ccacgctggc acccagttga tcggcgcgag 3360 atttaatcgc cgcgacaatt tgcgacggcg cgtgcagggc cagactggag gtggcaacgc 3420 caatcagcaa cgactgtttg cccgccagtt gttgtgccac gcggttggga atgtaattca 3480 gctccgccat cgccgcttcc actttttccc gcgttttcgc agaaacgtgg ctggcctggt 3540 tcaccacgcg ggaaacggtc tgataagaga caccggcata ctctgcgaca tcgtataacg 3600 ttactggttt cacattcacc accctgaatt gactctcttc cgggcgctat catgccatac 3660 cgcgaaaggt tttgcgccat tcgatggtgt ccgggatctc gacgctctcc cttatgcgac 3720 tcctgcatta ggaaat 3736 <210> 446 <211> 3797 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(J3/L3) <400> 446 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggctagcgag ttccccgcgc cagcggggat 120 aaaccgccag tgataagtgg aatgccatgt gggctgtcga gttccccgcg ccagcgggga 180 taaaccgagt ggcagatata gcctggtggt tcaggcggcg agttccccgc gccagcgggg 240 ataaaccgga gctcgctgag caataactag cataacccct tggggcctct aaacgggtct 300 tgaggggttt tttgctgaaa cctcaggcat ttgagaagca cacggtcaca ctgcttccgg 360 tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga ccctgccctg 420 aaccgacgac cgggtcgaat ttgctttcga atttctgcca ttcatccgct tattatcact 480 tattcaggcg tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc 540 cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 600 gccatcacaa acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 660 cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 720 taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 780 aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 840 gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 900 ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 960 tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 1020 ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 1080 ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 1140 acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccattttagc 1200 ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc 1260 attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt 1320 ggcccagggc ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc 1380 ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca acttactgat 1440 ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc agctgtccct 1500 cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga catcagcgct 1560 agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg aagtgcttca 1620 tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata caggatatat 1680 tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg 1740 gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa cagggaagtg 1800 agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag catcacgaaa 1860 tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1920 ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 1980 gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 2040 gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 2100 gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg gcagcagcca 2160 ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 2220 aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa agagttggta 2280 gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 2340 attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 2400 tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 2460 aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg actgggttga 2520 aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa cttacattaa 2580 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 2640 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt ggtttttctt 2700 ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg agagagttgc 2760 agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat ggtggttaac 2820 ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga gatgtccgca 2880 ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg 2940 gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt ttgttgaaaa 3000 ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg attgcgagtg 3060 agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa tgggcccgct 3120 aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag tcgcgtaccg 3180 tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc aagaaataac 3240 gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc cagcggatag 3300 ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc tttacaggct 3360 tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg atcggcgcga 3420 gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg 3480 ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg aatgtaattc 3540 agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg gctggcctgg 3600 ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac atcgtataac 3660 gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta tcatgccata 3720 ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc ccttatgcga 3780 ctcctgcatt aggaaat 3797 <210> 447 <211> 3797 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(TRAC) <400> 447 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggctagcgag ttccccgcgc cagcggggat 120 aaaccggttg atttgcctgc attggtgtta cacagtctga gttccccgcg ccagcgggga 180 taaaccgtaa gttgtgttct tctttgccta ggccttcagg agttccccgc gccagcgggg 240 ataaaccgga gctcgctgag caataactag cataacccct tggggcctct aaacgggtct 300 tgaggggttt tttgctgaaa cctcaggcat ttgagaagca cacggtcaca ctgcttccgg 360 tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga ccctgccctg 420 aaccgacgac cgggtcgaat ttgctttcga atttctgcca ttcatccgct tattatcact 480 tattcaggcg tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc 540 cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 600 gccatcacaa acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 660 cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 720 taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 780 aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 840 gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 900 ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 960 tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 1020 ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 1080 ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 1140 acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccattttagc 1200 ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc 1260 attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt 1320 ggcccagggc ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc 1380 ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca acttactgat 1440 ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc agctgtccct 1500 cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga catcagcgct 1560 agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg aagtgcttca 1620 tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata caggatatat 1680 tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg 1740 gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa cagggaagtg 1800 agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag catcacgaaa 1860 tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1920 ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 1980 gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 2040 gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 2100 gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg gcagcagcca 2160 ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 2220 aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa agagttggta 2280 gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 2340 attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 2400 tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 2460 aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg actgggttga 2520 aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa cttacattaa 2580 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 2640 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt ggtttttctt 2700 ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg agagagttgc 2760 agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat ggtggttaac 2820 ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga gatgtccgca 2880 ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg 2940 gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt ttgttgaaaa 3000 ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg attgcgagtg 3060 agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa tgggcccgct 3120 aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag tcgcgtaccg 3180 tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc aagaaataac 3240 gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc cagcggatag 3300 ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc tttacaggct 3360 tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg atcggcgcga 3420 gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg 3480 ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg aatgtaattc 3540 agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg gctggcctgg 3600 ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac atcgtataac 3660 gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta tcatgccata 3720 ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc ccttatgcga 3780 ctcctgcatt aggaaat 3797 <210> 448 <211> 5974 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cse2 <400> 448 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc gattacaaag 960 atcacgatgg ggactacaag gatcacgata ttgactataa ggacgacgat gacaagggat 1020 cgggcatggc cgacgagatt gacgcaatgg cactttaccg ggcctggcag cagttggata 1080 atggttcatg tgcccagatt cgcagagtta gtgaacctga cgaactgaga gatatccccg 1140 cgttttacag acttgtccaa ccgttcggat gggagaaccc acggcaccaa caagcactcc 1200 ttcgaatggt cttctgtttg tccgcaggaa aaaatgtaat cagacaccaa gacaaaaaga 1260 gcgagcaaac cacaggtatc agcctgggca gggcacttgc caactctggg cggatcaacg 1320 aaaggagaat ttttcagctg atacgcgctg atcggactgc ggacatggtg cagctgcgca 1380 gactccttac tcatgccgaa cctgtcctgg attggcccct gatggcacgc atgctgactt 1440 ggtggggaaa gagagaaaga cagcaactgc ttgaagactt cgtgctcact acaaataaga 1500 atgcctaata atctagaggg ccctattcta tagtgtcacc taaatgctag agctcgctga 1560 tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 1620 tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 1680 tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 1740 ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggcttct 1800 gaggcggaaa gaaccagctg gggctctagg gggtatcccc acgcgccctg tagcggcgca 1860 ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 1920 gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 1980 caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 2040 cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt 2100 tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 2160 acaacactca accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg 2220 gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaatta attctgtgga 2280 atgtgtgtca gttagggtgt ggaaagtccc caggctcccc agcaggcaga agtatgcaaa 2340 gcatgcatct caattagtca gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca 2400 gaagtatgca aagcatgcat ctcaattagt cagcaaccat agtcccgccc ctaactccgc 2460 ccatcccgcc cctaactccg cccagttccg cccattctcc gccccatggc tgactaattt 2520 tttttattta tgcagaggcc gaggccgcct ctgcctctga gctattccag aagtagtgag 2580 gaggcttttt tggaggccta ggcttttgca aaaagctccc gggagcttgt atatccattt 2640 tcggatctga tcaagagaca ggatgaggat cgtttcgcat gattgaacaa gatggattgc 2700 acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 2760 caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 2820 ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 2880 cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 2940 gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 3000 ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 3060 cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 3120 tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 3180 ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 3240 atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 3300 actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 3360 ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 3420 ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagcgggac 3480 tctggggttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc 3540 caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 3600 gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 3660 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 3720 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgtat 3780 accgtcgacc tctagctaga gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 3840 ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 3900 gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 3960 gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 4020 tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 4080 gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 4140 ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 4200 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 4260 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 4320 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 4380 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 4440 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 4500 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 4560 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 4620 gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 4680 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 4740 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 4800 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 4860 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 4920 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 4980 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 5040 tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 5100 tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 5160 gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 5220 tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 5280 tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 5340 ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 5400 tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 5460 ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 5520 gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 5580 ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 5640 cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 5700 ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 5760 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 5820 gaaatgttga atactcatac tcttcctttt tcattattat tgaagcattt atcagggtta 5880 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 5940 gcgcacattt ccccgaaaag tgccacctga cgtc 5974 <210> 449 <211> 6091 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas5 <400> 449 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc atgcggagct 960 atctcatcct gagactggcc ggaccaatgc aggcctgggg acagcctacc ttcgaaggta 1020 cacgccccac aggccgcttt cctaccagga gcggcctgct gggcctgctt ggcgcttgtc 1080 ttgggatcca gcgcgatgat actagctccc tgcaagcact gtcagagagc gtgcagtttg 1140 ccgtaagatg cgacgaactg atccttgatg ataggcgggt cagtgtcact ggtctccggg 1200 actaccacac ggtgctgggg gcccgggagg attatagggg cctgaaaagt cacgagacga 1260 ttcaaacctg gcgcgaatat ctgtgcgatg ccagcttcac cgtggccctg tggctgactc 1320 cacatgccac tatggtcatc agtgaactgg aaaaggctgt tcttaagcct cgatatactc 1380 cgtatctggg ccgccggagt tgtccactta cacacccact tttcctcggc acctgccagg 1440 ccagcgaccc tcaaaaggcc cttctgaatt acgagccagt tggcggtgac atatacagcg 1500 aagagtccgt gacgggacac catcttaagt tcaccgctcg ggacgagccc atgattaccc 1560 tcccacggca gttcgcatca agggagtggt acgtcataaa ggggggcatg gatgtgagtc 1620 agtaataatc tagagggccc tattctatag tgtcacctaa atgctagagc tcgctgatca 1680 gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 1740 ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 1800 cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 1860 gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 1920 gcggaaagaa ccagctgggg ctctaggggg tatccccacg cgccctgtag cggcgcatta 1980 agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 2040 cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 2100 gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 2160 aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 2220 cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 2280 acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 2340 tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattaatt ctgtggaatg 2400 tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 2460 tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa 2520 gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta actccgccca 2580 tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt 2640 ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag tagtgaggag 2700 gcttttttgg aggcctaggc ttttgcaaaa agctcccggg agcttgtata tccattttcg 2760 gatctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg 2820 caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa 2880 tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg 2940 tcaagaccga cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt 3000 ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa 3060 gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc 3120 ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg 3180 ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg 3240 aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg 3300 aactgttcgc caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg 3360 gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact 3420 gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg 3480 ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc 3540 ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga gcgggactct 3600 ggggttcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac 3660 cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat 3720 cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc 3780 ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 3840 actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatacc 3900 gtcgacctct agctagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 3960 ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 4020 tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 4080 gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 4140 gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 4200 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 4260 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 4320 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 4380 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 4440 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 4500 tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 4560 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 4620 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 4680 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 4740 cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 4800 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 4860 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 4920 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 4980 ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 5040 aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 5100 atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 5160 ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 5220 tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 5280 agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 5340 taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 5400 tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 5460 cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 5520 ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 5580 tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 5640 tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 5700 cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 5760 tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 5820 gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 5880 tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 5940 atgttgaata ctcatactct tcctttttca ttattattga agcatttatc agggttattg 6000 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 6060 cacatttccc cgaaaagtgc cacctgacgt c 6091 <210> 450 <211> 6052 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas6 <400> 450 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggctcaggc tatccctatg 960 acgtacccga ctacgcggga tcgggcatgt atctgtcaaa ggttatcatt gcacgcgcgt 1020 ggagtaggga tctgtatcag ctgcaccagg gtctgtggca tcttttcccg aaccgccccg 1080 acgcggcacg agactttctg tttcacgttg aaaaaagaaa cacccccgag ggctgtcatg 1140 tgctcctgca gtctgcccag atgccggtga gcacagctgt ggcgactgtg atcaagacca 1200 agcaggtcga gtttcagctc caggtagggg ttccactgta ttttcgcctg agagctaatc 1260 cgatcaaaac catactggat aatcagaaga ggctcgacag caaaggaaat attaaaaggt 1320 gccgggtccc gctcatcaaa gaggctgagc aaatcgcttg gcttcaacgg aaactgggga 1380 acgcagcccg cgtggaagac gtccacccga ttagtgaacg gccccaatat ttttccggag 1440 acggaaagag cggcaagatt cagacagtct gtttcgaggg ggtgctcacc atcaatgatg 1500 cccccgccct gatagacctg gtgcagcagg gcataggccc cgctaaaagc atgggatgcg 1560 gactgcttag tctggcaccg ctgtaataat ctagagggcc ctattctata gtgtcaccta 1620 aatgctagag ctcgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt 1680 tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 1740 taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 1800 gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg 1860 gtgggctcta tggcttctga ggcggaaaga accagctggg gctctagggg gtatccccac 1920 gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 1980 acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 2040 ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 2100 gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 2160 tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 2220 ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 2280 gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 2340 gcgaattaat tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag 2400 caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc 2460 caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag 2520 tcccgcccct aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc 2580 cccatggctg actaattttt tttatttatg cagaggccga ggccgcctct gcctctgagc 2640 tattccagaa gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg 2700 gagcttgtat atccattttc ggatctgatc aagagacagg atgaggatcg tttcgcatga 2760 ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 2820 atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 2880 aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg 2940 acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 3000 acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 3060 tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 3120 ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 3180 agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 3240 atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg 3300 aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 3360 gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 3420 cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 3480 tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 3540 agttcttctg agcgggactc tggggttcga aatgaccgac caagcgacgc ccaacctgcc 3600 atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt 3660 ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt tcttcgccca 3720 ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt 3780 cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt 3840 atcttatcat gtctgtatac cgtcgacctc tagctagagc ttggcgtaat catggtcata 3900 gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 3960 cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 4020 ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 4080 acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 4140 gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 4200 gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 4260 ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 4320 cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 4380 ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 4440 taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 4500 ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 4560 ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 4620 aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 4680 tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 4740 agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 4800 ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 4860 tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 4920 tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 4980 cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 5040 aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 5100 atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 5160 cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 5220 tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 5280 atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 5340 taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 5400 tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 5460 gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 5520 cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 5580 cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 5640 gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 5700 aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 5760 accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 5820 ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 5880 gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc attattattg 5940 aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 6000 taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tc 6052 <210> 451 <211> 6547 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas7 <400> 451 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc gaacagaaac 960 ttatatctga ggaggacctc ggatcgggca tgtcaaattt tattaatatt catgttctga 1020 tcagtcatag cccgagttgc ctgaatagag acgacatgaa tatgcagaaa gacgcaattt 1080 tcggtggcaa gaggcgagtc cgaataagca gccaaagtct taagcgagcc atgaggaaga 1140 gcggctatta tgcccagaat atcggcgagt cctcattgcg gaccatccac ctcgcccagt 1200 tgagagacgt cttgaggcag aaactggggg aaagattcga ccagaaaatc attgacaaga 1260 cccttgccct ccttagtggg aagagcgtgg acgaggctga aaaaatctct gccgacgccg 1320 taacgccctg ggttgtgggt gagattgctt ggttttgtga acaggtggcg aaggcggagg 1380 ccgataacct ggatgacaag aagctgctga aggtccttaa ggaggacata gctgccattc 1440 gggtcaattt gcagcaggga gtggatatcg cattgtccgg aagaatggct acatcaggca 1500 tgatgaccga gctgggcaag gtagacggag ccatgagtat cgcacacgcc atcaccaccc 1560 accaagtcga ctcagacatc gactggttca cagcagtaga tgacctccag gagcaggggt 1620 ctgcccacct tgggacacag gagttctctt ccggggtgtt ttatcgctat gctaatatca 1680 atctggcgca gctgcaagaa aacctggggg gagcctctcg agagcaggcc ctggagattg 1740 caactcacgt cgtgcatatg cttgcgacag aggtacctgg cgccaagcag aggacatacg 1800 ctgcttttaa tccagcagat atggtcatgg taaatttctc tgatatgcct ctctccatgg 1860 ccaacgcatt cgagaaggca gtgaaggcaa aggacgggtt cctgcagcca tcaattcaag 1920 cgtttaatca gtattgggac agagtggcga acggctatgg actgaacgga gccgcagctc 1980 agtttagcct cagcgatgtc gatcccataa ctgcacaggt gaaacagatg cctacgttgg 2040 aacagctgaa gtcatgggta agaaataacg gcgaagccta ataatctaga gggccctatt 2100 ctatagtgtc acctaaatgc tagagctcgc tgatcagcct cgactgtgcc ttctagttgc 2160 cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 2220 actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 2280 attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 2340 catgctgggg atgcggtggg ctctatggct tctgaggcgg aaagaaccag ctggggctct 2400 agggggtatc cccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 2460 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 2520 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 2580 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 2640 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 2700 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 2760 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 2820 taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg tcagttaggg tgtggaaagt 2880 ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 2940 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 3000 agtcagcaac catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt 3060 ccgcccattc tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg 3120 cctctgcctc tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt 3180 gcaaaaagct cccgggagct tgtatatcca ttttcggatc tgatcaagag acaggatgag 3240 gatcgtttcg catgattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg 3300 agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt 3360 tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc 3420 tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt 3480 gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag 3540 tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg 3600 ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag 3660 cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg 3720 atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc 3780 gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 3840 tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc 3900 gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 3960 ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 4020 atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga ccgaccaagc 4080 gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg aaaggttggg 4140 cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct 4200 ggagttcttc gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa 4260 tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc 4320 caaactcatc aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc 4380 gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa 4440 catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac 4500 attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 4560 ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 4620 ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 4680 aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 4740 aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 4800 gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 4860 gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 4920 tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 4980 ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 5040 ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 5100 tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 5160 tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 5220 ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 5280 aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 5340 ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 5400 tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 5460 atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 5520 aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 5580 ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 5640 tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 5700 ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 5760 tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 5820 aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 5880 gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 5940 tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 6000 cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 6060 tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 6120 ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 6180 cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 6240 actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 6300 ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 6360 aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 6420 ttttcattat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 6480 atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 6540 tgacgtc 6547 <210> 452 <211> 6925 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas8 <400> 452 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc atgaatttgc 960 tcattgataa ttggattccg gtgcgccccc ggaacggtgg gaaagtgcag atcatcaatt 1020 tgcaaagtct ctactgttcc agggaccagt ggagactcag cctgccacgg gatgatatgg 1080 agctggcggc gttggctctg ctcgtatgca tcggccagat tattgcgcca gcaaaggatg 1140 acgttgaatt ccggcatcgg ataatgaacc cccttactga agatgagttc cagcagctta 1200 tcgccccatg gatcgacatg ttctacctca accacgccga gcatcctttt atgcagacca 1260 agggagtcaa ggcgaatgat gtgactccca tggagaagct gctggccggt gtatctgggg 1320 cgaccaactg cgcattcgtg aatcagcctg gacaggggga ggccctctgt ggaggctgca 1380 ctgctatagc actttttaac caagctaatc aagcccccgg ctttggtgga gggtttaaga 1440 gtggattgag ggggggcact cccgtaacca cttttgtgag gggaattgat ctgaggtcta 1500 ctgtgttgct gaacgtcctc acactcccaa ggctccagaa gcagttccca aacgaaagtc 1560 ataccgaaaa ccagcccaca tggatcaagc ccatcaaatc taatgagagc ataccggcta 1620 gcagtattgg atttgtacgg ggtctgttct ggcagccagc tcacatcgag ctgtgtgatc 1680 ctattgggat cggcaagtgc tcttgttgtg ggcaggagtc caaccttagg tatactggat 1740 ttctgaaaga gaagtttacc tttacagtaa atgggctctg gccccacccc cactcacctt 1800 gccttgtgac agtgaaaaag ggggaagtcg aggagaagtt tctggccttt acaacttctg 1860 ccccttcctg gactcagatt tccagagtgg tggtagataa gataattcaa aacgagaatg 1920 gcaatagagt ggccgccgtg gtgaaccagt ttcgcaacat cgcccctcag tcccccctgg 1980 agctgattat gggcggttat cggaataacc aggccagtat actcgagcga cggcacgatg 2040 tcctcatgtt caatcaaggt tggcagcaat atggcaatgt gattaacgag atcgtaaccg 2100 tgggcctggg atataagacc gccctgcgga aggcgttgta tacttttgca gaaggcttta 2160 agaataagga ttttaagggt gccggcgtga gtgtccatga aacagctgaa cggcactttt 2220 atcggcagtc cgagctgttg ataccagacg tgctggctaa tgtgaacttc tcacaggccg 2280 acgaagtgat cgctgatctg cgggataaac tgcaccaact gtgcgagatg ctgtttaatc 2340 aaagcgtcgc tccttatgcc caccacccaa agctgatctc cacgctggcc ctggcgcgcg 2400 ccacacttta taaacatctc cgcgaactga aaccccaggg gggccccagc aatggctaat 2460 aatctagagg gccctattct atagtgtcac ctaaatgcta gagctcgctg atcagcctcg 2520 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 2580 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 2640 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 2700 tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 2760 agaaccagct ggggctctag ggggtatccc cacgcgccct gtagcggcgc attaagcgcg 2820 gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 2880 cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 2940 aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 3000 cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 3060 ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 3120 aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 3180 ttaaaaaatg agctgattta acaaaaattt aacgcgaatt aattctgtgg aatgtgtgtc 3240 agttagggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc 3300 tcaattagtc agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 3360 aaagcatgca tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc 3420 ccctaactcc gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt 3480 atgcagaggc cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt 3540 ttggaggcct aggcttttgc aaaaagctcc cgggagcttg tatatccatt ttcggatctg 3600 atcaagagac aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggtt 3660 ctccggccgc ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcggct 3720 gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga 3780 ccgacctgtc cggtgccctg aatgaactgc aggacgaggc agcgcggcta tcgtggctgg 3840 ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact 3900 ggctgctatt gggcgaagtg ccggggcagg atctcctgtc atctcacctt gctcctgccg 3960 agaaagtatc catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct 4020 gcccattcga ccaccaagcg aaacatcgca tcgagcgagc acgtactcgg atggaagccg 4080 gtcttgtcga tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt 4140 tcgccaggct caaggcgcgc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg 4200 cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc 4260 ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctgaag 4320 agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt 4380 cgcagcgcat cgccttctat cgccttcttg acgagttctt ctgagcggga ctctggggtt 4440 cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 4500 cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 4560 gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa 4620 tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 4680 ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac 4740 ctctagctag agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 4800 gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 4860 atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 4920 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 4980 tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 5040 agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 5100 aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5160 gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 5220 tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 5280 cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5340 ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 5400 cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5460 atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5520 agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5580 gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 5640 gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5700 tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5760 agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5820 gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5880 aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 5940 aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 6000 ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 6060 gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6120 aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6180 ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6240 tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6300 ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 6360 cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6420 agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6480 gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6540 gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6600 acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6660 acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6720 agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6780 aatactcata ctcttccttt ttcattatta ttgaagcatt tatcagggtt attgtctcat 6840 gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6900 tccccgaaaa gtgccacctg acgtc 6925 <210> 453 <211> 7630 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: FokI-Cas8 <400> 453 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggctcaggc tatccctatg 960 acgtacccga ctacgcgcaa ttggtcaaaa gcgaactgga agagaaaaaa tctgagctca 1020 gacacaagct gaagtatgtg ccccatgaat acatagaact catagaaata gctcgaaacc 1080 ccacgcagga ccggatcctt gaaatgaaag ttatggagtt ttttatgaaa gtgtatgggt 1140 atcgaggaga gcatcttggt ggaagtcgga aaccggatgg ggcaatatac actgttggga 1200 gccccattga ctatggtgtg atagtggaca ccaaggcata cagcggggga tacaatctgc 1260 cgatcgggca ggcagatgag atgcagcgct atgtggagga gaatcaaact aggaacaaac 1320 atattaaccc aaacgaatgg tggaaagtgt atccctcatc tgttacggag ttcaagttcc 1380 tttttgtatc tggccacttt aaaggaaact ataaagcaca gctcacgcga cttaaccaca 1440 tcaccaattg taacggtgct gtactcagtg ttgaggaact cctgatcggt ggtgaaatga 1500 taaaagctgg aaccttgaca ttggaggaag taaggagaaa gtttaataat ggtgagatca 1560 atttcagcgg ctccgaaacg ccgggtacat ccgagtccgc gactcctgag tcaggaggca 1620 gcggctcctc tggtggaagc ggctcaagtg gagggatgaa tttgctcatt gataattgga 1680 ttccggtgcg cccccggaac ggtgggaaag tgcagatcat caatttgcaa agtctctact 1740 gttccaggga ccagtggaga ctcagcctgc cacgggatga tatggagctg gcggcgttgg 1800 ctctgctcgt atgcatcggc cagattattg cgccagcaaa ggatgacgtt gaattccggc 1860 atcggataat gaaccccctt actgaagatg agttccagca gcttatcgcc ccatggatcg 1920 acatgttcta cctcaaccac gccgagcatc cttttatgca gaccaaggga gtcaaggcga 1980 atgatgtgac tcccatggag aagctgctgg ccggtgtatc tggggcgacc aactgcgcat 2040 tcgtgaatca gcctggacag ggggaggccc tctgtggagg ctgcactgct atagcacttt 2100 ttaaccaagc taatcaagcc cccggctttg gtggagggtt taagagtgga ttgagggggg 2160 gcactcccgt aaccactttt gtgaggggaa ttgatctgag gtctactgtg ttgctgaacg 2220 tcctcacact cccaaggctc cagaagcagt tcccaaacga aagtcatacc gaaaaccagc 2280 ccacatggat caagcccatc aaatctaatg agagcatacc ggctagcagt attggatttg 2340 tacggggtct gttctggcag ccagctcaca tcgagctgtg tgatcctatt gggatcggca 2400 agtgctcttg ttgtgggcag gagtccaacc ttaggtatac tggatttctg aaagagaagt 2460 ttacctttac agtaaatggg ctctggcccc acccccactc accttgcctt gtgacagtga 2520 aaaaggggga agtcgaggag aagtttctgg cctttacaac ttctgcccct tcctggactc 2580 agatttccag agtggtggta gataagataa ttcaaaacga gaatggcaat agagtggccg 2640 ccgtggtgaa ccagtttcgc aacatcgccc ctcagtcccc cctggagctg attatgggcg 2700 gttatcggaa taaccaggcc agtatactcg agcgacggca cgatgtcctc atgttcaatc 2760 aaggttggca gcaatatggc aatgtgatta acgagatcgt aaccgtgggc ctgggatata 2820 agaccgccct gcggaaggcg ttgtatactt ttgcagaagg ctttaagaat aaggatttta 2880 agggtgccgg cgtgagtgtc catgaaacag ctgaacggca cttttatcgg cagtccgagc 2940 tgttgatacc agacgtgctg gctaatgtga acttctcaca ggccgacgaa gtgatcgctg 3000 atctgcggga taaactgcac caactgtgcg agatgctgtt taatcaaagc gtcgctcctt 3060 atgcccacca cccaaagctg atctccacgc tggccctggc gcgcgccaca ctttataaac 3120 atctccgcga actgaaaccc caggggggcc ccagcaatgg ctaataatct agagggccct 3180 attctatagt gtcacctaaa tgctagagct cgctgatcag cctcgactgt gccttctagt 3240 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3300 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3360 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3420 aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac cagctggggc 3480 tctagggggt atccccacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 3540 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 3600 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 3660 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 3720 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 3780 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 3840 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 3900 atttaacaaa aatttaacgc gaattaattc tgtggaatgt gtgtcagtta gggtgtggaa 3960 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 4020 ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 4080 attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 4140 gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 4200 ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 4260 tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa gagacaggat 4320 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 4380 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 4440 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 4500 ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 4560 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 4620 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 4680 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 4740 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 4800 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 4860 cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 4920 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 4980 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 5040 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 5100 tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 5160 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 5220 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 5280 gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 5340 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 5400 gtccaaactc atcaatgtat cttatcatgt ctgtataccg tcgacctcta gctagagctt 5460 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 5520 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 5580 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 5640 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 5700 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 5760 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 5820 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 5880 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 5940 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 6000 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 6060 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 6120 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 6180 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 6240 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 6300 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 6360 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 6420 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 6480 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 6540 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 6600 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 6660 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 6720 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 6780 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 6840 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 6900 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 6960 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 7020 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 7080 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 7140 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 7200 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 7260 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 7320 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 7380 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 7440 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 7500 cctttttcat tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 7560 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 7620 acctgacgtc 7630 <210> 454 <211> 4804 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR(TRAC) <400> 454 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc ctcaccgagg gcctatttcc 240 catgattcct tcatatttgc atatacgata caaggctgtt agagagataa ttggaattaa 300 tttgactgta aacacaaaga tattagtaca aaatacgtga cgtagaaagt aataatttct 360 tgggtagttt gcagttttaa aattatgttt taaaatggac tatcatatgc ttaccgtaac 420 ttgaaagtat ttcgatttct tggctttata tatcttgtgg aaaggacgaa acaccgagtt 480 ccccgcgcca gcggggataa accggttgat ttgcctgcat tggtgttaca cagtctgagt 540 tccccgcgcc agcggggata aaccgtaagt tgtgttcttc tttgcctagg ccttcaggag 600 ttccccgcgc cagcggggat aaaccgtttt tttcggaaag aaccagctgg ggctctaggg 660 ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 720 gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 780 ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc cctttagggt 840 tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 900 gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 960 ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 1020 ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag ctgatttaac 1080 aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc 1140 aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 1200 gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 1260 cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg 1320 cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct 1380 ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca 1440 aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca ggatgaggat 1500 cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1560 ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1620 ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1680 atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1740 cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1800 cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1860 atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1920 aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1980 tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca 2040 tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 2100 tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 2160 atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 2220 accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 2280 gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg accaagcgac 2340 gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt 2400 cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga 2460 gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag 2520 catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 2580 actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga gcttggcgta 2640 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 2700 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 2760 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 2820 atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 2880 gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 2940 ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 3000 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 3060 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 3120 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 3180 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 3240 tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 3300 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 3360 gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 3420 cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 3480 cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 3540 agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 3600 caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 3660 ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 3720 aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 3780 tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 3840 agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 3900 gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 3960 accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 4020 tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 4080 tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 4140 acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 4200 atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 4260 aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 4320 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 4380 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 4440 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 4500 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 4560 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 4620 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 4680 tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 4740 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 4800 cgtc 4804 <210> 455 <211> 10813 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas7_NLS-Cse2_NLS-Cas5_NLS-Cas6_NLS-FokI-Cas8 <400> 455 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcagggg tctggggagg ggcgggggtc tttgttgact tgcggggatg 3420 ttgaggagaa tcctggacct cccaaaaaaa aacggaaggt gggctcaggc atgtatctgt 3480 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 3540 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 3600 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 3660 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 3720 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 3780 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 3840 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 3900 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 3960 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 4020 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctggga tccggagagg 4080 gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct cccaagaaaa 4140 agagaaaagt aggcggctca caattggtca aaagcgaact ggaagagaaa aaatctgagc 4200 tcagacacaa gctgaagtat gtgccccatg aatacataga actcatagaa atagctcgaa 4260 accccacgca ggaccggatc cttgaaatga aagttatgga gttttttatg aaagtgtatg 4320 ggtatcgagg agagcatctt ggtggaagtc ggaaaccgga tggggcaata tacactgttg 4380 ggagccccat tgactatggt gtgatagtgg acaccaaggc atacagcggg ggatacaatc 4440 tgccgatcgg gcaggcagat gagatgcagc gctatgtgga ggagaatcaa actaggaaca 4500 aacatattaa cccaaacgaa tggtggaaag tgtatccctc atctgttacg gagttcaagt 4560 tcctttttgt atctggccac tttaaaggaa actataaagc acagctcacg cgacttaacc 4620 acatcaccaa ttgtaacggt gctgtactca gtgttgagga actcctgatc ggtggtgaaa 4680 tgataaaagc tggaaccttg acattggagg aagtaaggag aaagtttaat aatggtgaga 4740 tcaatttcag cggctccgaa acgccgggta catccgagtc cgcgactcct gagtcaggag 4800 gcagcggctc ctctggtgga agcggctcaa gtggagggat gaatttgctc attgataatt 4860 ggattccggt gcgcccccgg aacggtggga aagtgcagat catcaatttg caaagtctct 4920 actgttccag ggaccagtgg agactcagcc tgccacggga tgatatggag ctggcggcgt 4980 tggctctgct cgtatgcatc ggccagatta ttgcgccagc aaaggatgac gttgaattcc 5040 ggcatcggat aatgaacccc cttactgaag atgagttcca gcagcttatc gccccatgga 5100 tcgacatgtt ctacctcaac cacgccgagc atccttttat gcagaccaag ggagtcaagg 5160 cgaatgatgt gactcccatg gagaagctgc tggccggtgt atctggggcg accaactgcg 5220 cattcgtgaa tcagcctgga cagggggagg ccctctgtgg aggctgcact gctatagcac 5280 tttttaacca agctaatcaa gcccccggct ttggtggagg gtttaagagt ggattgaggg 5340 ggggcactcc cgtaaccact tttgtgaggg gaattgatct gaggtctact gtgttgctga 5400 acgtcctcac actcccaagg ctccagaagc agttcccaaa cgaaagtcat accgaaaacc 5460 agcccacatg gatcaagccc atcaaatcta atgagagcat accggctagc agtattggat 5520 ttgtacgggg tctgttctgg cagccagctc acatcgagct gtgtgatcct attgggatcg 5580 gcaagtgctc ttgttgtggg caggagtcca accttaggta tactggattt ctgaaagaga 5640 agtttacctt tacagtaaat gggctctggc cccaccccca ctcaccttgc cttgtgacag 5700 tgaaaaaggg ggaagtcgag gagaagtttc tggcctttac aacttctgcc ccttcctgga 5760 ctcagatttc cagagtggtg gtagataaga taattcaaaa cgagaatggc aatagagtgg 5820 ccgccgtggt gaaccagttt cgcaacatcg cccctcagtc ccccctggag ctgattatgg 5880 gcggttatcg gaataaccag gccagtatac tcgagcgacg gcacgatgtc ctcatgttca 5940 atcaaggttg gcagcaatat ggcaatgtga ttaacgagat cgtaaccgtg ggcctgggat 6000 ataagaccgc cctgcggaag gcgttgtata cttttgcaga aggctttaag aataaggatt 6060 ttaagggtgc cggcgtgagt gtccatgaaa cagctgaacg gcacttttat cggcagtccg 6120 agctgttgat accagacgtg ctggctaatg tgaacttctc acaggccgac gaagtgatcg 6180 ctgatctgcg ggataaactg caccaactgt gcgagatgct gtttaatcaa agcgtcgctc 6240 cttatgccca ccacccaaag ctgatctcca cgctggccct ggcgcgcgcc acactttata 6300 aacatctccg cgaactgaaa ccccaggggg gccccagcaa tggctaataa tctagagggc 6360 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 6420 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 6480 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 6540 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 6600 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 6660 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 6720 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 6780 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc 6840 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 6900 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 6960 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 7020 gtctattctt ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag 7080 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 7140 gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 7200 caaccaggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc 7260 tcaattagtc agcaaccata gtcccgcccc taactccgcc catcccgccc ctaactccgc 7320 ccagttccgc ccattctccg ccccatggct gactaatttt ttttatttat gcagaggccg 7380 aggccgcctc tgcctctgag ctattccaga agtagtgagg aggctttttt ggaggcctag 7440 gcttttgcaa aaagctcccg ggagcttgta tatccatttt cggatctgat caagagacag 7500 gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 7560 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 7620 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 7680 gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 7740 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 7800 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 7860 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 7920 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 7980 aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 8040 aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga 8100 atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 8160 cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 8220 aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 8280 ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 8340 ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 8400 gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 8460 catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata 8520 aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 8580 tttgtccaaa ctcatcaatg tatcttatca tgtctgtata ccgtcgacct ctagctagag 8640 cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 8700 acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 8760 actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 8820 gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 8880 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 8940 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 9000 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 9060 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 9120 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 9180 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 9240 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 9300 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 9360 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 9420 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 9480 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 9540 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 9600 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 9660 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 9720 gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 9780 aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 9840 acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 9900 gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 9960 cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 10020 cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 10080 tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 10140 cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 10200 gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 10260 cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 10320 ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 10380 gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 10440 taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 10500 gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 10560 acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 10620 aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 10680 cttccttttt cattattatt gaagcattta tcagggttat tgtctcatga gcggatacat 10740 atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 10800 gccacctgac gtc 10813 <210> 456 <211> 11541 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: hU6_CRISPR(TRAC), CMV_NLSCas7_NLSCse2_NLSCas5_NLSCas6_NLSFokICas8 <400> 456 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgtgagggcc 240 tatttcccat gattccttca tatttgcata tacgatacaa ggctgttaga gagataattg 300 gaattaattt gactgtaaac acaaagatat tagtacaaaa tacgtgacgt agaaagtaat 360 aatttcttgg gtagtttgca gttttaaaat tatgttttaa aatggactat catatgctta 420 ccgtaacttg aaagtatttc gatttcttgg ctttatatat cttgtggaaa ggacgaaaca 480 ccggatccta atacgactca ctatagggta aggagatata ccatgggcta gcgagttccc 540 cgcgccagcg gggataaacc ggttgatttg cctgcattgg tgttacacag tctgagttcc 600 ccgcgccagc ggggataaac cgtaagttgt gttcttcttt gcctaggcct tcaggagttc 660 cccgcgccag cggggataaa ccggagctcg ctgagcaata actctgaaac ctcaggcatt 720 tgagaagtct agattttttt cggaaagaac cagctggggc tctagggggt atccccacgc 780 gccctgtagc acgcgttgac attgattatt gactagttat taatagtaat caattacggg 840 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 900 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 960 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 1020 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 1080 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 1140 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 1200 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 1260 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1320 cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1380 tctctggcta actagagaac ccactgctta ctggcttatc gaaattaata cgactcacta 1440 tagggagacc caagcttggt accgagctcg gatcgccacc atgcccaaga aaaagagaaa 1500 agtaggatcg ggcgaacaga aacttatatc tgaggaggac ctcggatcgg gcatgtcaaa 1560 ttttattaat attcatgttc tgatcagtca tagcccgagt tgcctgaata gagacgacat 1620 gaatatgcag aaagacgcaa ttttcggtgg caagaggcga gtccgaataa gcagccaaag 1680 tcttaagcga gccatgagga agagcggcta ttatgcccag aatatcggcg agtcctcatt 1740 gcggaccatc cacctcgccc agttgagaga cgtcttgagg cagaaactgg gggaaagatt 1800 cgaccagaaa atcattgaca agacccttgc cctccttagt gggaagagcg tggacgaggc 1860 tgaaaaaatc tctgccgacg ccgtaacgcc ctgggttgtg ggtgagattg cttggttttg 1920 tgaacaggtg gcgaaggcgg aggccgataa cctggatgac aagaagctgc tgaaggtcct 1980 taaggaggac atagctgcca ttcgggtcaa tttgcagcag ggagtggata tcgcattgtc 2040 cggaagaatg gctacatcag gcatgatgac cgagctgggc aaggtagacg gagccatgag 2100 tatcgcacac gccatcacca cccaccaagt cgactcagac atcgactggt tcacagcagt 2160 agatgacctc caggagcagg ggtctgccca ccttgggaca caggagttct cttccggggt 2220 gttttatcgc tatgctaata tcaatctggc gcagctgcaa gaaaacctgg ggggagcctc 2280 tcgagagcag gccctggaga ttgcaactca cgtcgtgcat atgcttgcga cagaggtacc 2340 tggcgccaag cagaggacat acgctgcttt taatccagca gatatggtca tggtaaattt 2400 ctctgatatg cctctctcca tggccaacgc attcgagaag gcagtgaagg caaaggacgg 2460 gttcctgcag ccatcaattc aagcgtttaa tcagtattgg gacagagtgg cgaacggcta 2520 tggactgaac ggagccgcag ctcagtttag cctcagcgat gtcgatccca taactgcaca 2580 ggtgaaacag atgcctacgt tggaacagct gaagtcatgg gtaagaaata acggcgaagc 2640 cggcagcggc gagggcagag gcagcctgct gacctgcggc gacgtggagg agaaccccgg 2700 cccccccaag aaaaagagaa aagtaggatc gggcgattac aaagatcacg atggggacta 2760 caaggatcac gatattgact ataaggacga cgatgacaag ggatcgggca tggccgacga 2820 gattgacgca atggcacttt accgggcctg gcagcagttg gataatggtt catgtgccca 2880 gattcgcaga gttagtgaac ctgacgaact gagagatatc cccgcgtttt acagacttgt 2940 ccaaccgttc ggatgggaga acccacggca ccaacaagca ctccttcgaa tggtcttctg 3000 tttgtccgca ggaaaaaatg taatcagaca ccaagacaaa aagagcgagc aaaccacagg 3060 tatcagcctg ggcagggcac ttgccaactc tgggcggatc aacgaaagga gaatttttca 3120 gctgatacgc gctgatcgga ctgcggacat ggtgcagctg cgcagactcc ttactcatgc 3180 cgaacctgtc ctggattggc ccctgatggc acgcatgctg acttggtggg gaaagagaga 3240 aagacagcaa ctgcttgaag acttcgtgct cactacaaat aagaatgccg gatccggaga 3300 aggaagggga tccctcctca catgtggaga tgtcgaagaa aatcctggac ctcccaagaa 3360 aaagagaaaa gtaggatcgg gcatgcggag ctatctcatc ctgagactgg ccggaccaat 3420 gcaggcctgg ggacagccta ccttcgaagg tacacgcccc acaggccgct ttcctaccag 3480 gagcggcctg ctgggcctgc ttggcgcttg tcttgggatc cagcgcgatg atactagctc 3540 cctgcaagca ctgtcagaga gcgtgcagtt tgccgtaaga tgcgacgaac tgatccttga 3600 tgataggcgg gtcagtgtca ctggtctccg ggactaccac acggtgctgg gggcccggga 3660 ggattatagg ggcctgaaaa gtcacgagac gattcaaacc tggcgcgaat atctgtgcga 3720 tgccagcttc accgtggccc tgtggctgac tccacatgcc actatggtca tcagtgaact 3780 ggaaaaggct gttcttaagc ctcgatatac tccgtatctg ggccgccgga gttgtccact 3840 tacacaccca cttttcctcg gcacctgcca ggccagcgac cctcaaaagg cccttctgaa 3900 ttacgagcca gttggcggtg acatatacag cgaagagtcc gtgacgggac accatcttaa 3960 gttcaccgct cgggacgagc ccatgattac cctcccacgg cagttcgcat caagggagtg 4020 gtacgtcata aaggggggca tggatgtgag tcaggggtct ggggaggggc gggggtcttt 4080 gttgacttgc ggggatgttg aggagaaccc agggccaccc aagaaaaaga gaaaagtagg 4140 ctcaggcggt aaacccatcc caaacccctt gcttggtctc gactcaaccg gatcgggcat 4200 gtatctgtca aaggttatca ttgcacgcgc gtggagtagg gatctgtatc agctgcacca 4260 gggtctgtgg catcttttcc cgaaccgccc cgacgcggca cgagactttc tgtttcacgt 4320 tgaaaaaaga aacacccccg agggctgtca tgtgctcctg cagtctgccc agatgccggt 4380 gagcacagct gtggcgactg tgatcaagac caagcaggtc gagtttcagc tccaggtagg 4440 ggttccactg tattttcgcc tgagagctaa tccgatcaaa accatactgg ataatcagaa 4500 gaggctcgac agcaaaggaa atattaaaag gtgccgggtc ccgctcatca aagaggctga 4560 gcaaatcgct tggcttcaac ggaaactggg gaacgcagcc cgcgtggaag acgtccaccc 4620 gattagtgaa cggccccaat atttttccgg agacggaaag agcggcaaga ttcagacagt 4680 ctgtttcgag ggggtgctca ccatcaatga tgcccccgcc ctgatagacc tggtgcagca 4740 gggcataggc cccgctaaaa gcatgggatg cggactgctt agtctggcac cgctgggatc 4800 cggagagggc agaggaagtc tgctaacatg cggtgacgtc gaggagaatc ctggacctcc 4860 caagaaaaag agaaaagtag gcggctcaca attggtcaaa agcgaactgg aagagaaaaa 4920 atctgagctc agacacaagc tgaagtatgt gccccatgaa tacatagaac tcatagaaat 4980 agctcgaaac cccacgcagg accggatcct tgaaatgaaa gttatggagt tttttatgaa 5040 agtgtatggg tatcgaggag agcatcttgg tggaagtcgg aaaccggatg gggcaatata 5100 cactgttggg agccccattg actatggtgt gatagtggac accaaggcat acagcggggg 5160 atacaatctg ccgatcgggc aggcagatga gatgcagcgc tatgtggagg agaatcaaac 5220 taggaacaaa catattaacc caaacgaatg gtggaaagtg tatccctcat ctgttacgga 5280 gttcaagttc ctttttgtat ctggccactt taaaggaaac tataaagcac agctcacgcg 5340 acttaaccac atcaccaatt gtaacggtgc tgtactcagt gttgaggaac tcctgatcgg 5400 tggtgaaatg ataaaagctg gaaccttgac attggaggaa gtaaggagaa agtttaataa 5460 tggtgagatc aatttcagcg gctccgaaac gccgggtaca tccgagtccg cgactcctga 5520 gtcaggaggc agcggctcct ctggtggaag cggctcaagt ggagggatga atttgctcat 5580 tgataattgg attccggtgc gcccccggaa cggtgggaaa gtgcagatca tcaatttgca 5640 aagtctctac tgttccaggg accagtggag actcagcctg ccacgggatg atatggagct 5700 ggcggcgttg gctctgctcg tatgcatcgg ccagattatt gcgccagcaa aggatgacgt 5760 tgaattccgg catcggataa tgaaccccct tactgaagat gagttccagc agcttatcgc 5820 cccatggatc gacatgttct acctcaacca cgccgagcat ccttttatgc agaccaaggg 5880 agtcaaggcg aatgatgtga ctcccatgga gaagctgctg gccggtgtat ctggggcgac 5940 caactgcgca ttcgtgaatc agcctggaca gggggaggcc ctctgtggag gctgcactgc 6000 tatagcactt tttaaccaag ctaatcaagc ccccggcttt ggtggagggt ttaagagtgg 6060 attgaggggg ggcactcccg taaccacttt tgtgagggga attgatctga ggtctactgt 6120 gttgctgaac gtcctcacac tcccaaggct ccagaagcag ttcccaaacg aaagtcatac 6180 cgaaaaccag cccacatgga tcaagcccat caaatctaat gagagcatac cggctagcag 6240 tattggattt gtacggggtc tgttctggca gccagctcac atcgagctgt gtgatcctat 6300 tgggatcggc aagtgctctt gttgtgggca ggagtccaac cttaggtata ctggatttct 6360 gaaagagaag tttaccttta cagtaaatgg gctctggccc cacccccact caccttgcct 6420 tgtgacagtg aaaaaggggg aagtcgagga gaagtttctg gcctttacaa cttctgcccc 6480 ttcctggact cagatttcca gagtggtggt agataagata attcaaaacg agaatggcaa 6540 tagagtggcc gccgtggtga accagtttcg caacatcgcc cctcagtccc ccctggagct 6600 gattatgggc ggttatcgga ataaccaggc cagtatactc gagcgacggc acgatgtcct 6660 catgttcaat caaggttggc agcaatatgg caatgtgatt aacgagatcg taaccgtggg 6720 cctgggatat aagaccgccc tgcggaaggc gttgtatact tttgcagaag gctttaagaa 6780 taaggatttt aagggtgccg gcgtgagtgt ccatgaaaca gctgaacggc acttttatcg 6840 gcagtccgag ctgttgatac cagacgtgct ggctaatgtg aacttctcac aggccgacga 6900 agtgatcgct gatctgcggg ataaactgca ccaactgtgc gagatgctgt ttaatcaaag 6960 cgtcgctcct tatgcccacc acccaaagct gatctccacg ctggccctgg cgcgcgccac 7020 actttataaa catctccgcg aactgaaacc ccaggggggc cccagcaatg gctaataatc 7080 tagagggccc tattctatag tgtcacctaa atgctagagc tcgctgatca gcctcgactg 7140 tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg 7200 aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga 7260 gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg 7320 aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag gcggaaagaa 7380 ccagctgggg ctctaggggg tatccccacg cgccctgtag cggcgcatta agcgcggcgg 7440 gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 7500 tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 7560 gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 7620 attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 7680 cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 7740 ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 7800 aaaatgagct gatttaacaa aaatttaacg cgaattaatt ctgtggaatg tgtgtcagtt 7860 agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa 7920 ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 7980 catgcatctc aattagtcag caaccatagt cccgccccta actccgccca tcccgcccct 8040 aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt ttatttatgc 8100 agaggccgag gccgcctctg cctctgagct attccagaag tagtgaggag gcttttttgg 8160 aggcctaggc ttttgcaaaa agctcccggg agcttgtata tccattttcg gatctgatca 8220 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 8280 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 8340 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 8400 cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt ggctggccac 8460 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 8520 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 8580 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 8640 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 8700 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 8760 caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 8820 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 8880 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 8940 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 9000 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga gcgggactct ggggttcgaa 9060 atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc 9120 tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc 9180 ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt 9240 tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 9300 agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatacc gtcgacctct 9360 agctagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 9420 acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 9480 gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 9540 tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 9600 cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 9660 gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 9720 aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 9780 gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 9840 aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 9900 gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 9960 ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 10020 cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 10080 ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 10140 actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 10200 tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 10260 gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 10320 ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 10380 cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 10440 ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 10500 tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 10560 agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 10620 gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 10680 ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 10740 gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 10800 cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 10860 acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 10920 cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 10980 cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 11040 ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 11100 tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 11160 atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 11220 tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 11280 actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 11340 aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 11400 ctcatactct tcctttttca ttattattga agcatttatc agggttattg tctcatgagc 11460 ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 11520 cgaaaagtgc cacctgacgt c 11541 <210> 457 <211> 2667 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 <400> 457 atggaacctt ttaaatatat atgccattac tggggaaaat cctcaaaaag cttgacgaaa 60 ggaaatgata ttcatctgtt aatttatcat tgccttgatg ttgctgctgt tgcagattgc 120 tggtgggatc aatcagtcgt actgcaaaat actttttgcc gaaatgaaat gctatcaaaa 180 cagagggtga aggcctggct gttatttttc attgctcttc atgatattgg aaagtttgat 240 atacgattcc aatataaatc agcagaaagt tggctgaaat taaatcctgc aacgccatca 300 cttaatggtc catcaacaca aatgtgccgt aaatttaatc atggtgcagc cggtctgtat 360 tggtttaacc aggattcact ttcagagcaa tctctcgggg attttttcag tttttttgat 420 gccgctcctc atccttatga gtcctggttt ccatgggtag aggccgttac aggacatcat 480 ggttttatat tacattccca ggatcaagat aagtcgcgtt gggaaatgcc agcttctctg 540 gcatcttatg ctgcgcaaga taaacaggct cgtgaggagt ggatatctgt actggaagca 600 ttatttttaa cgccagcggg gttatctata aacgatatac cacctgattg ttcatcactg 660 ttagcaggtt tttgctcgct tgctgactgg ttaggctcct ggactacaac gaataccttt 720 ctgtttaatg aggatgcgcc ttccgacata aatgctctga gaacgtattt ccaggaccga 780 cagcaggatg cgagccgggt attggagttg agtggacttg tatcaaataa gcgatgttat 840 gaaggtgttc atgcactact ggacaatggc tatcaaccca gacaattaca ggtgttagtt 900 gatgctcttc cagtagctcc cgggctgacg gtaatagagg cacctacagg ctccggtaaa 960 acggaaacag cgctggccta tgcttggaaa cttattgatc aacaaattgc ggatagtgtt 1020 atttttgccc tcccaacaca agctaccgcg aatgctatgc ttacgagaat ggaagcgagc 1080 gcgagccact tattttcatc cccaaatctt attcttgctc atggcaattc acggtttaac 1140 cacctctttc aatcaataaa atcacgcgcg attactgaac aggggcaaga agaagcgtgg 1200 gttcagtgtt gtcagtggtt gtcacaaagc aataagaaag tgtttcttgg gcaaatcggc 1260 gtttgcacga ttgatcaggt gttgatatcg gtattgccag ttaaacaccg ctttatccgt 1320 ggtttgggaa ttggtcgaag tgttttaatt gttgatgaag ttcatgctta cgacacctat 1380 atgaacggct tgctggaggc agtgctcaag gctcaggctg atgtgggagg gagtgttatt 1440 cttctttccg caaccctacc aatgaaacaa aaacagaaac ttctggatac ttatggtctg 1500 catacagatc cagtggaaaa taactccgca tatccactca ttaactggcg aggtgtgaat 1560 ggtgcgcaac gttttgatct gctagctcat ccagaacaac tcccgccccg cttttcgatt 1620 cagccagaac ctatttgttt agctgacatg ttacctgacc ttacgatgtt agagcgaatg 1680 atcgcagcgg caaacgcggg tgcacaggtc tgtcttattt gcaatttggt tgacgttgca 1740 caagtatgct accaacggct aaaggagcta aataacacgc aagtagatat agatttgttt 1800 catgcgcgct ttacgctgaa cgatcgtcgt gaaaaagaga atcgagttat tagcaatttc 1860 ggcaaaaatg ggaagcgaaa tgttggacgg atacttgtcg caacccaggt cgtggaacaa 1920 tcactcgacg ttgattttga ttggttaatt actcagcatt gtcctgcaga tttgcttttc 1980 caacgattgg gccgtttaca tcgccatcat cgcaaatatc gtcccgctgg ttttgagatt 2040 cctgttgcca ccattttgct gcctgatggc gagggttacg gacgacatga gcatatttat 2100 agcaacgtta gagtcatgtg gcggacgcag caacatattg aggagcttaa tggagcatcc 2160 ttatttttcc ctgatgctta ccggcaatgg ctggatagca tttacgatga tgcggaaatg 2220 gatgagccag aatgggtcgg caatggcatg gataaatttg aaagcgccga gtgtgaaaaa 2280 aggttcaagg ctcgcaaggt cctgcagtgg gctgaagaat atagcttgca ggataacgat 2340 gaaaccattc ttgcggtaac gagggatggg gaaatgagcc tgccattatt gccttatgta 2400 caaacgtctt caggtaaaca actgctcgat ggccaggtct acgaggacct aagtcatgaa 2460 cagcagtatg aggcgcttgc acttaatcgc gtcaatgtac ccttcacctg gaaacgtagt 2520 ttttctgaag tagtagatga agatgggtta ctttggctgg aagggaaaca gaatctggat 2580 ggatgggtct ggcagggtaa cagtattgtt attacctata caggggatga agggatgacc 2640 agagtcatcc ctgcaaatcc caaataa 2667 <210> 458 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 <400> 458 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 459 <211> 3828 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-Cas3 <400> 459 atgcaccatc accatcacca tggaaaaatc gaagaaggta aactggtaat ctggattaac 60 ggcgataaag gctataacgg tctcgctgaa gtcggtaaga aattcgagaa agataccgga 120 attaaagtca ccgttgagca tccggataaa ctggaagaga aattcccaca ggttgcggca 180 actggcgatg gccctgacat tatcttctgg gcacacgacc gctttggtgg ctacgctcaa 240 tctggcctgt tggctgaaat caccccggac aaagcgttcc aggacaagct gtatccgttt 300 acctgggatg ccgtacgtta caacggcaag ctgattgctt acccgatcgc tgttgaagcg 360 ttatcgctga tttataacaa agatctgctg ccgaacccgc caaaaacctg ggaagagatc 420 ccggcgctgg ataaagaact gaaagcgaaa ggtaagagcg cgctgatgtt caacctgcaa 480 gaaccgtact tcacctggcc gctgattgct gctgacgggg gttatgcgtt caagtatgaa 540 aacggcaagt acgacattaa agacgtgggc gtggataacg ctggcgcgaa agcgggtctg 600 accttcctgg ttgacctgat taaaaacaaa cacatgaatg cagacaccga ttactccatc 660 gcagaagctg cctttaataa aggcgaaaca gcgatgacca tcaacggccc gtgggcatgg 720 tccaacatcg acaccagcaa agtgaattat ggtgtaacgg tactgccgac cttcaagggt 780 caaccatcca aaccgttcgt tggcgtgctg agcgcaggta ttaacgccgc cagtccgaac 840 aaagagctgg caaaagagtt cctcgaaaac tatctgctga ctgatgaagg tctggaagcg 900 gttaataaag acaaaccgct gggtgccgta gcgctgaagt cttacgagga agagttggcg 960 aaagatccac gtattgccgc cactatggaa aacgcccaga aaggtgaaat catgccgaac 1020 atcccgcaga tgtccgcttt ctggtatgcc gtgcgtactg cggtgatcaa cgccgccagc 1080 ggtcgtcaga ctgtcgatga agccctgaaa gacgcgcaga ctaatgggat cgaggaaaac 1140 ctgtacttcc aatccaatgc aatggaacct tttaaatata tatgccatta ctggggaaaa 1200 tcctcaaaaa gcttgacgaa aggaaatgat attcatctgt taatttatca ttgccttgat 1260 gttgctgctg ttgcagattg ctggtgggat caatcagtcg tactgcaaaa tactttttgc 1320 cgaaatgaaa tgctatcaaa acagagggtg aaggcctggc tgttattttt cattgctctt 1380 catgatattg gaaagtttga tatacgattc caatataaat cagcagaaag ttggctgaaa 1440 ttaaatcctg caacgccatc acttaatggt ccatcaacac aaatgtgccg taaatttaat 1500 catggtgcag ccggtctgta ttggtttaac caggattcac tttcagagca atctctcggg 1560 gattttttca gtttttttga tgccgctcct catccttatg agtcctggtt tccatgggta 1620 gaggccgtta caggacatca tggttttata ttacattccc aggatcaaga taagtcgcgt 1680 tgggaaatgc cagcttctct ggcatcttat gctgcgcaag ataaacaggc tcgtgaggag 1740 tggatatctg tactggaagc attattttta acgccagcgg ggttatctat aaacgatata 1800 ccacctgatt gttcatcact gttagcaggt ttttgctcgc ttgctgactg gttaggctcc 1860 tggactacaa cgaatacctt tctgtttaat gaggatgcgc cttccgacat aaatgctctg 1920 agaacgtatt tccaggaccg acagcaggat gcgagccggg tattggagtt gagtggactt 1980 gtatcaaata agcgatgtta tgaaggtgtt catgcactac tggacaatgg ctatcaaccc 2040 agacaattac aggtgttagt tgatgctctt ccagtagctc ccgggctgac ggtaatagag 2100 gcacctacag gctccggtaa aacggaaaca gcgctggcct atgcttggaa acttattgat 2160 caacaaattg cggatagtgt tatttttgcc ctcccaacac aagctaccgc gaatgctatg 2220 cttacgagaa tggaagcgag cgcgagccac ttattttcat ccccaaatct tattcttgct 2280 catggcaatt cacggtttaa ccacctcttt caatcaataa aatcacgcgc gattactgaa 2340 caggggcaag aagaagcgtg ggttcagtgt tgtcagtggt tgtcacaaag caataagaaa 2400 gtgtttcttg ggcaaatcgg cgtttgcacg attgatcagg tgttgatatc ggtattgcca 2460 gttaaacacc gctttatccg tggtttggga attggtcgaa gtgttttaat tgttgatgaa 2520 gttcatgctt acgacaccta tatgaacggc ttgctggagg cagtgctcaa ggctcaggct 2580 gatgtgggag ggagtgttat tcttctttcc gcaaccctac caatgaaaca aaaacagaaa 2640 cttctggata cttatggtct gcatacagat ccagtggaaa ataactccgc atatccactc 2700 attaactggc gaggtgtgaa tggtgcgcaa cgttttgatc tgctagctca tccagaacaa 2760 ctcccgcccc gcttttcgat tcagccagaa cctatttgtt tagctgacat gttacctgac 2820 cttacgatgt tagagcgaat gatcgcagcg gcaaacgcgg gtgcacaggt ctgtcttatt 2880 tgcaatttgg ttgacgttgc acaagtatgc taccaacggc taaaggagct aaataacacg 2940 caagtagata tagatttgtt tcatgcgcgc tttacgctga acgatcgtcg tgaaaaagag 3000 aatcgagtta ttagcaattt cggcaaaaat gggaagcgaa atgttggacg gatacttgtc 3060 gcaacccagg tcgtggaaca atcactcgac gttgattttg attggttaat tactcagcat 3120 tgtcctgcag atttgctttt ccaacgattg ggccgtttac atcgccatca tcgcaaatat 3180 cgtcccgctg gttttgagat tcctgttgcc accattttgc tgcctgatgg cgagggttac 3240 ggacgacatg agcatattta tagcaacgtt agagtcatgt ggcggacgca gcaacatatt 3300 gaggagctta atggagcatc cttatttttc cctgatgctt accggcaatg gctggatagc 3360 atttacgatg atgcggaaat ggatgagcca gaatgggtcg gcaatggcat ggataaattt 3420 gaaagcgccg agtgtgaaaa aaggttcaag gctcgcaagg tcctgcagtg ggctgaagaa 3480 tatagcttgc aggataacga tgaaaccatt cttgcggtaa cgagggatgg ggaaatgagc 3540 ctgccattat tgccttatgt acaaacgtct tcaggtaaac aactgctcga tggccaggtc 3600 tacgaggacc taagtcatga acagcagtat gaggcgcttg cacttaatcg cgtcaatgta 3660 cccttcacct ggaaacgtag tttttctgaa gtagtagatg aagatgggtt actttggctg 3720 gaagggaaac agaatctgga tggatgggtc tggcagggta acagtattgt tattacctat 3780 acaggggatg aagggatgac cagagtcatc cctgcaaatc ccaaataa 3828 <210> 460 <211> 1275 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-Cas3 <400> 460 Met His His His His His His Gly Lys Ile Glu Glu Gly Lys Leu Val 1 5 10 15 Ile Trp Ile Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly 20 25 30 Lys Lys Phe Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro 35 40 45 Asp Lys Leu Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly 50 55 60 Pro Asp Ile Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln 65 70 75 80 Ser Gly Leu Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys 85 90 95 Leu Tyr Pro Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile 100 105 110 Ala Tyr Pro Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp 115 120 125 Leu Leu Pro Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp 130 135 140 Lys Glu Leu Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln 145 150 155 160 Glu Pro Tyr Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala 165 170 175 Phe Lys Tyr Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp 180 185 190 Asn Ala Gly Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys 195 200 205 Asn Lys His Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala 210 215 220 Phe Asn Lys Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp 225 230 235 240 Ser Asn Ile Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro 245 250 255 Thr Phe Lys Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala 260 265 270 Gly Ile Asn Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu 275 280 285 Glu Asn Tyr Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp 290 295 300 Lys Pro Leu Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala 305 310 315 320 Lys Asp Pro Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu 325 330 335 Ile Met Pro Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg 340 345 350 Thr Ala Val Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala 355 360 365 Leu Lys Asp Ala Gln Thr Asn Gly Ile Glu Glu Asn Leu Tyr Phe Gln 370 375 380 Ser Asn Ala Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys 385 390 395 400 Ser Ser Lys Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr 405 410 415 His Cys Leu Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser 420 425 430 Val Val Leu Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln 435 440 445 Arg Val Lys Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly 450 455 460 Lys Phe Asp Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys 465 470 475 480 Leu Asn Pro Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys 485 490 495 Arg Lys Phe Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp 500 505 510 Ser Leu Ser Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala 515 520 525 Ala Pro His Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr 530 535 540 Gly His His Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg 545 550 555 560 Trp Glu Met Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln 565 570 575 Ala Arg Glu Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro 580 585 590 Ala Gly Leu Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu 595 600 605 Ala Gly Phe Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr 610 615 620 Asn Thr Phe Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu 625 630 635 640 Arg Thr Tyr Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu 645 650 655 Leu Ser Gly Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala 660 665 670 Leu Leu Asp Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp 675 680 685 Ala Leu Pro Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly 690 695 700 Ser Gly Lys Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp 705 710 715 720 Gln Gln Ile Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr 725 730 735 Ala Asn Ala Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe 740 745 750 Ser Ser Pro Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His 755 760 765 Leu Phe Gln Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu 770 775 780 Glu Ala Trp Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys 785 790 795 800 Val Phe Leu Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile 805 810 815 Ser Val Leu Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly 820 825 830 Arg Ser Val Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met 835 840 845 Asn Gly Leu Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly 850 855 860 Ser Val Ile Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys 865 870 875 880 Leu Leu Asp Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser 885 890 895 Ala Tyr Pro Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe 900 905 910 Asp Leu Leu Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln 915 920 925 Pro Glu Pro Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu 930 935 940 Glu Arg Met Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile 945 950 955 960 Cys Asn Leu Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu 965 970 975 Leu Asn Asn Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr 980 985 990 Leu Asn Asp Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly 995 1000 1005 Lys Asn Gly Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln 1010 1015 1020 Val Val Glu Gln Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr 1025 1030 1035 Gln His Cys Pro Ala Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu 1040 1045 1050 His Arg His His Arg Lys Tyr Arg Pro Ala Gly Phe Glu Ile Pro 1055 1060 1065 Val Ala Thr Ile Leu Leu Pro Asp Gly Glu Gly Tyr Gly Arg His 1070 1075 1080 Glu His Ile Tyr Ser Asn Val Arg Val Met Trp Arg Thr Gln Gln 1085 1090 1095 His Ile Glu Glu Leu Asn Gly Ala Ser Leu Phe Phe Pro Asp Ala 1100 1105 1110 Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp Asp Ala Glu Met Asp 1115 1120 1125 Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys Phe Glu Ser Ala 1130 1135 1140 Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu Gln Trp Ala 1145 1150 1155 Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu Ala Val 1160 1165 1170 Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val Gln 1175 1180 1185 Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 1190 1195 1200 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val 1205 1210 1215 Asn Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp 1220 1225 1230 Glu Asp Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly 1235 1240 1245 Trp Val Trp Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp 1250 1255 1260 Glu Gly Met Thr Arg Val Ile Pro Ala Asn Pro Lys 1265 1270 1275 <210> 461 <211> 9125 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: His6-MBP-TEV-Cas3 <400> 461 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaact agtaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatgt 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaactaa ggaggtccgc tatgcaccat caccatcacc atggaaaaat 5100 cgaagaaggt aaactggtaa tctggattaa cggcgataaa ggctataacg gtctcgctga 5160 agtcggtaag aaattcgaga aagataccgg aattaaagtc accgttgagc atccggataa 5220 actggaagag aaattcccac aggttgcggc aactggcgat ggccctgaca ttatcttctg 5280 ggcacacgac cgctttggtg gctacgctca atctggcctg ttggctgaaa tcaccccgga 5340 caaagcgttc caggacaagc tgtatccgtt tacctgggat gccgtacgtt acaacggcaa 5400 gctgattgct tacccgatcg ctgttgaagc gttatcgctg atttataaca aagatctgct 5460 gccgaacccg ccaaaaacct gggaagagat cccggcgctg gataaagaac tgaaagcgaa 5520 aggtaagagc gcgctgatgt tcaacctgca agaaccgtac ttcacctggc cgctgattgc 5580 tgctgacggg ggttatgcgt tcaagtatga aaacggcaag tacgacatta aagacgtggg 5640 cgtggataac gctggcgcga aagcgggtct gaccttcctg gttgacctga ttaaaaacaa 5700 acacatgaat gcagacaccg attactccat cgcagaagct gcctttaata aaggcgaaac 5760 agcgatgacc atcaacggcc cgtgggcatg gtccaacatc gacaccagca aagtgaatta 5820 tggtgtaacg gtactgccga ccttcaaggg tcaaccatcc aaaccgttcg ttggcgtgct 5880 gagcgcaggt attaacgccg ccagtccgaa caaagagctg gcaaaagagt tcctcgaaaa 5940 ctatctgctg actgatgaag gtctggaagc ggttaataaa gacaaaccgc tgggtgccgt 6000 agcgctgaag tcttacgagg aagagttggc gaaagatcca cgtattgccg ccactatgga 6060 aaacgcccag aaaggtgaaa tcatgccgaa catcccgcag atgtccgctt tctggtatgc 6120 cgtgcgtact gcggtgatca acgccgccag cggtcgtcag actgtcgatg aagccctgaa 6180 agacgcgcag actaatggga tcgaggaaaa cctgtacttc caatccaatg caatggaacc 6240 ttttaaatat atatgccatt actggggaaa atcctcaaaa agcttgacga aaggaaatga 6300 tattcatctg ttaatttatc attgccttga tgttgctgct gttgcagatt gctggtggga 6360 tcaatcagtc gtactgcaaa atactttttg ccgaaatgaa atgctatcaa aacagagggt 6420 gaaggcctgg ctgttatttt tcattgctct tcatgatatt ggaaagtttg atatacgatt 6480 ccaatataaa tcagcagaaa gttggctgaa attaaatcct gcaacgccat cacttaatgg 6540 tccatcaaca caaatgtgcc gtaaatttaa tcatggtgca gccggtctgt attggtttaa 6600 ccaggattca ctttcagagc aatctctcgg ggattttttc agtttttttg atgccgctcc 6660 tcatccttat gagtcctggt ttccatgggt agaggccgtt acaggacatc atggttttat 6720 attacattcc caggatcaag ataagtcgcg ttgggaaatg ccagcttctc tggcatctta 6780 tgctgcgcaa gataaacagg ctcgtgagga gtggatatct gtactggaag cattattttt 6840 aacgccagcg gggttatcta taaacgatat accacctgat tgttcatcac tgttagcagg 6900 tttttgctcg cttgctgact ggttaggctc ctggactaca acgaatacct ttctgtttaa 6960 tgaggatgcg ccttccgaca taaatgctct gagaacgtat ttccaggacc gacagcagga 7020 tgcgagccgg gtattggagt tgagtggact tgtatcaaat aagcgatgtt atgaaggtgt 7080 tcatgcacta ctggacaatg gctatcaacc cagacaatta caggtgttag ttgatgctct 7140 tccagtagct cccgggctga cggtaataga ggcacctaca ggctccggta aaacggaaac 7200 agcgctggcc tatgcttgga aacttattga tcaacaaatt gcggatagtg ttatttttgc 7260 cctcccaaca caagctaccg cgaatgctat gcttacgaga atggaagcga gcgcgagcca 7320 cttattttca tccccaaatc ttattcttgc tcatggcaat tcacggttta accacctctt 7380 tcaatcaata aaatcacgcg cgattactga acaggggcaa gaagaagcgt gggttcagtg 7440 ttgtcagtgg ttgtcacaaa gcaataagaa agtgtttctt gggcaaatcg gcgtttgcac 7500 gattgatcag gtgttgatat cggtattgcc agttaaacac cgctttatcc gtggtttggg 7560 aattggtcga agtgttttaa ttgttgatga agttcatgct tacgacacct atatgaacgg 7620 cttgctggag gcagtgctca aggctcaggc tgatgtggga gggagtgtta ttcttctttc 7680 cgcaacccta ccaatgaaac aaaaacagaa acttctggat acttatggtc tgcatacaga 7740 tccagtggaa aataactccg catatccact cattaactgg cgaggtgtga atggtgcgca 7800 acgttttgat ctgctagctc atccagaaca actcccgccc cgcttttcga ttcagccaga 7860 acctatttgt ttagctgaca tgttacctga ccttacgatg ttagagcgaa tgatcgcagc 7920 ggcaaacgcg ggtgcacagg tctgtcttat ttgcaatttg gttgacgttg cacaagtatg 7980 ctaccaacgg ctaaaggagc taaataacac gcaagtagat atagatttgt ttcatgcgcg 8040 ctttacgctg aacgatcgtc gtgaaaaaga gaatcgagtt attagcaatt tcggcaaaaa 8100 tgggaagcga aatgttggac ggatacttgt cgcaacccag gtcgtggaac aatcactcga 8160 cgttgatttt gattggttaa ttactcagca ttgtcctgca gatttgcttt tccaacgatt 8220 gggccgttta catcgccatc atcgcaaata tcgtcccgct ggttttgaga ttcctgttgc 8280 caccattttg ctgcctgatg gcgagggtta cggacgacat gagcatattt atagcaacgt 8340 tagagtcatg tggcggacgc agcaacatat tgaggagctt aatggagcat ccttattttt 8400 ccctgatgct taccggcaat ggctggatag catttacgat gatgcggaaa tggatgagcc 8460 agaatgggtc ggcaatggca tggataaatt tgaaagcgcc gagtgtgaaa aaaggttcaa 8520 ggctcgcaag gtcctgcagt gggctgaaga atatagcttg caggataacg atgaaaccat 8580 tcttgcggta acgagggatg gggaaatgag cctgccatta ttgccttatg tacaaacgtc 8640 ttcaggtaaa caactgctcg atggccaggt ctacgaggac ctaagtcatg aacagcagta 8700 tgaggcgctt gcacttaatc gcgtcaatgt acccttcacc tggaaacgta gtttttctga 8760 agtagtagat gaagatgggt tactttggct ggaagggaaa cagaatctgg atggatgggt 8820 ctggcagggt aacagtattg ttattaccta tacaggggat gaagggatga ccagagtcat 8880 ccctgcaaat cccaaataat aataacattg gaagtggata acggatccga attcgagcgc 8940 cgtcgacaag cttgcggccg cactcgagca ccaccaccac caccactgag atccggctgc 9000 taacaaagcc cgaaaggaag ctgagttggc tgctgccacc gctgagcaat aactagcata 9060 accccttggg gcctctaaac gggtcttgag gggttttttg ctgaaaggag gaactatatc 9120 cggat 9125 <210> 462 <211> 2667 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3, human codon optimized <400> 462 atggagcctt ttaaatatat ttgtcattac tggggtaaga gttccaagag cctgacaaaa 60 ggcaatgata tacatctttt gatctatcac tgtctcgacg tcgcagcggt agcggattgc 120 tggtgggatc aaagtgtcgt gctccagaac acgttttgtc gaaacgaaat gctcagcaag 180 cagcgggtaa aagcatggct ccttttcttt attgctctcc acgacatagg caaattcgac 240 attaggttcc agtacaaatc tgcagagagt tggttgaaat tgaacccggc cacccctagc 300 ctgaacggcc cttcaactca gatgtgcagg aaatttaacc atggagccgc tgggttgtat 360 tggtttaatc aggacagttt gtcagagcaa agtctggggg atttcttctc cttttttgac 420 gccgcgcctc atccttacga gagctggttt ccatgggtcg aggccgtcac agggcaccat 480 ggctttattc ttcactctca ggaccaagac aaatctcgat gggaaatgcc tgccagtctg 540 gcgtcttacg ccgcgcagga taagcaagca cgagaagaat ggatttccgt cttggaggcg 600 ctgtttctca cacccgccgg gctctctatc aacgacatac cccccgattg ctctagtctg 660 cttgccggtt tttgctccct tgccgattgg cttggttcat ggacgaccac caatacgttt 720 ttgttcaatg aagatgcacc atctgatata aatgcattga ggacgtattt tcaagacaga 780 cagcaagatg cctccagagt tttggagctt tctggacttg tatcaaataa gagatgctac 840 gaaggagtgc atgctctgct ggacaacggc taccagccac gacaacttca agttctcgtt 900 gatgccctcc cggtggctcc ggggttgacc gtcatagagg cgcctactgg atcagggaag 960 accgagacag ccttggccta tgcgtggaaa ctgatagatc aacagattgc cgactcagtg 1020 atcttcgcgc tgccaactca ggcaacagcc aacgcgatgc tgacacgcat ggaggccagc 1080 gcaagtcacc ttttctctag tccaaatctg atactggccc atggtaattc taggtttaac 1140 catctgtttc agtccatcaa gtctagggcg ataactgagc aaggacagga agaagcctgg 1200 gttcaatgct gccagtggct tagccagagt aacaagaaag tattcttggg acagattggt 1260 gtctgcacaa tagaccaagt actcatctca gttttgcctg ttaagcaccg attcatacga 1320 ggacttggaa tcgggcgcag tgtcctcata gtagatgagg tgcatgctta cgacacctac 1380 atgaacggtt tgctcgaggc ggtgctcaaa gcacaagctg atgtcggagg tagcgtgatc 1440 cttctcagcg ctacgcttcc tatgaaacag aagcagaagt tgctcgatac ctatggtctg 1500 catacggatc ctgtggaaaa taatagtgcc taccccctca taaactggag gggagtaaat 1560 ggtgcacaga ggtttgacct tcttgctcac cctgagcagc ttcctccccg gttttccata 1620 cagccggagc cgatttgtct tgccgacatg cttccagatc tcacaatgct cgaacggatg 1680 atcgcggccg ctaatgccgg cgcacaagtc tgtctcatct gtaaccttgt cgatgtagcg 1740 caggtttgtt accaacgact caaagaactg aataatacac aagtagacat agatctgttc 1800 catgctcgct ttacactcaa tgacagaagg gaaaaagaaa atcgggtcat ctcaaatttt 1860 ggtaagaacg gaaaacgaaa cgttggccga atcctcgtcg caacccaggt agtggagcag 1920 tccctcgatg tggactttga ctggcttatt acacagcact gccctgctga cctcctgttc 1980 cagcgacttg gcagattgca tagacatcac cggaaatatc ggcctgcagg ttttgagata 2040 ccagtcgcaa ctattcttct ccccgacggg gaagggtacg ggcgacacga gcacatctat 2100 agcaacgtac gggtaatgtg gcggacgcaa caacacatcg aggaacttaa cggagcatcc 2160 ctgtttttcc ccgatgccta tagacaatgg ctcgacagta tttatgatga cgccgaaatg 2220 gacgaacccg agtgggtcgg aaatggtatg gataaatttg aatccgcaga atgtgaaaaa 2280 cggttcaaag cacggaaggt cctccagtgg gctgaggagt attcattgca ggataacgac 2340 gaaaccatct tggctgtcac tagagacggc gaaatgtccc ttccactgct tccttatgtt 2400 caaacctctt ctgggaaaca gcttcttgat ggccaggtat atgaggacct gtcccacgaa 2460 caacagtacg aggcacttgc cttgaaccgc gttaatgtac ctttcacttg gaaacgatca 2520 ttttcagagg tcgtagatga agatgggctc ctttggctgg aaggcaaaca aaacctggat 2580 ggatgggtat ggcagggaaa ctctattgta ataacataca ctggcgatga gggtatgacg 2640 agggttatac cggcgaatcc gaaataa 2667 <210> 463 <211> 2697 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3-NLS <400> 463 atggagcctt ttaaatatat ttgtcattac tggggtaaga gttccaagag cctgacaaaa 60 ggcaatgata tacatctttt gatctatcac tgtctcgacg tcgcagcggt agcggattgc 120 tggtgggatc aaagtgtcgt gctccagaac acgttttgtc gaaacgaaat gctcagcaag 180 cagcgggtaa aagcatggct ccttttcttt attgctctcc acgacatagg caaattcgac 240 attaggttcc agtacaaatc tgcagagagt tggttgaaat tgaacccggc cacccctagc 300 ctgaacggcc cttcaactca gatgtgcagg aaatttaacc atggagccgc tgggttgtat 360 tggtttaatc aggacagttt gtcagagcaa agtctggggg atttcttctc cttttttgac 420 gccgcgcctc atccttacga gagctggttt ccatgggtcg aggccgtcac agggcaccat 480 ggctttattc ttcactctca ggaccaagac aaatctcgat gggaaatgcc tgccagtctg 540 gcgtcttacg ccgcgcagga taagcaagca cgagaagaat ggatttccgt cttggaggcg 600 ctgtttctca cacccgccgg gctctctatc aacgacatac cccccgattg ctctagtctg 660 cttgccggtt tttgctccct tgccgattgg cttggttcat ggacgaccac caatacgttt 720 ttgttcaatg aagatgcacc atctgatata aatgcattga ggacgtattt tcaagacaga 780 cagcaagatg cctccagagt tttggagctt tctggacttg tatcaaataa gagatgctac 840 gaaggagtgc atgctctgct ggacaacggc taccagccac gacaacttca agttctcgtt 900 gatgccctcc cggtggctcc ggggttgacc gtcatagagg cgcctactgg atcagggaag 960 accgagacag ccttggccta tgcgtggaaa ctgatagatc aacagattgc cgactcagtg 1020 atcttcgcgc tgccaactca ggcaacagcc aacgcgatgc tgacacgcat ggaggccagc 1080 gcaagtcacc ttttctctag tccaaatctg atactggccc atggtaattc taggtttaac 1140 catctgtttc agtccatcaa gtctagggcg ataactgagc aaggacagga agaagcctgg 1200 gttcaatgct gccagtggct tagccagagt aacaagaaag tattcttggg acagattggt 1260 gtctgcacaa tagaccaagt actcatctca gttttgcctg ttaagcaccg attcatacga 1320 ggacttggaa tcgggcgcag tgtcctcata gtagatgagg tgcatgctta cgacacctac 1380 atgaacggtt tgctcgaggc ggtgctcaaa gcacaagctg atgtcggagg tagcgtgatc 1440 cttctcagcg ctacgcttcc tatgaaacag aagcagaagt tgctcgatac ctatggtctg 1500 catacggatc ctgtggaaaa taatagtgcc taccccctca taaactggag gggagtaaat 1560 ggtgcacaga ggtttgacct tcttgctcac cctgagcagc ttcctccccg gttttccata 1620 cagccggagc cgatttgtct tgccgacatg cttccagatc tcacaatgct cgaacggatg 1680 atcgcggccg ctaatgccgg cgcacaagtc tgtctcatct gtaaccttgt cgatgtagcg 1740 caggtttgtt accaacgact caaagaactg aataatacac aagtagacat agatctgttc 1800 catgctcgct ttacactcaa tgacagaagg gaaaaagaaa atcgggtcat ctcaaatttt 1860 ggtaagaacg gaaaacgaaa cgttggccga atcctcgtcg caacccaggt agtggagcag 1920 tccctcgatg tggactttga ctggcttatt acacagcact gccctgctga cctcctgttc 1980 cagcgacttg gcagattgca tagacatcac cggaaatatc ggcctgcagg ttttgagata 2040 ccagtcgcaa ctattcttct ccccgacggg gaagggtacg ggcgacacga gcacatctat 2100 agcaacgtac gggtaatgtg gcggacgcaa caacacatcg aggaacttaa cggagcatcc 2160 ctgtttttcc ccgatgccta tagacaatgg ctcgacagta tttatgatga cgccgaaatg 2220 gacgaacccg agtgggtcgg aaatggtatg gataaatttg aatccgcaga atgtgaaaaa 2280 cggttcaaag cacggaaggt cctccagtgg gctgaggagt attcattgca ggataacgac 2340 gaaaccatct tggctgtcac tagagacggc gaaatgtccc ttccactgct tccttatgtt 2400 caaacctctt ctgggaaaca gcttcttgat ggccaggtat atgaggacct gtcccacgaa 2460 caacagtacg aggcacttgc cttgaaccgc gttaatgtac ctttcacttg gaaacgatca 2520 ttttcagagg tcgtagatga agatgggctc ctttggctgg aaggcaaaca aaacctggat 2580 ggatgggtat ggcagggaaa ctctattgta ataacataca ctggcgatga gggtatgacg 2640 agggttatac cggcgaatcc gaaatccggg tcacccaaaa agaagagaaa agtataa 2697 <210> 464 <211> 898 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3-NLS <400> 464 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys Ser Gly Ser Pro Lys Lys Lys Arg 885 890 895 Lys Val <210> 465 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3-NLS <400> 465 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc caccatggag ccttttaaat atatttgtca 960 ttactggggt aagagttcca agagcctgac aaaaggcaat gatatacatc ttttgatcta 1020 tcactgtctc gacgtcgcag cggtagcgga ttgctggtgg gatcaaagtg tcgtgctcca 1080 gaacacgttt tgtcgaaacg aaatgctcag caagcagcgg gtaaaagcat ggctcctttt 1140 ctttattgct ctccacgaca taggcaaatt cgacattagg ttccagtaca aatctgcaga 1200 gagttggttg aaattgaacc cggccacccc tagcctgaac ggcccttcaa ctcagatgtg 1260 caggaaattt aaccatggag ccgctgggtt gtattggttt aatcaggaca gtttgtcaga 1320 gcaaagtctg ggggatttct tctccttttt tgacgccgcg cctcatcctt acgagagctg 1380 gtttccatgg gtcgaggccg tcacagggca ccatggcttt attcttcact ctcaggacca 1440 agacaaatct cgatgggaaa tgcctgccag tctggcgtct tacgccgcgc aggataagca 1500 agcacgagaa gaatggattt ccgtcttgga ggcgctgttt ctcacacccg ccgggctctc 1560 tatcaacgac ataccccccg attgctctag tctgcttgcc ggtttttgct cccttgccga 1620 ttggcttggt tcatggacga ccaccaatac gtttttgttc aatgaagatg caccatctga 1680 tataaatgca ttgaggacgt attttcaaga cagacagcaa gatgcctcca gagttttgga 1740 gctttctgga cttgtatcaa ataagagatg ctacgaagga gtgcatgctc tgctggacaa 1800 cggctaccag ccacgacaac ttcaagttct cgttgatgcc ctcccggtgg ctccggggtt 1860 gaccgtcata gaggcgccta ctggatcagg gaagaccgag acagccttgg cctatgcgtg 1920 gaaactgata gatcaacaga ttgccgactc agtgatcttc gcgctgccaa ctcaggcaac 1980 agccaacgcg atgctgacac gcatggaggc cagcgcaagt caccttttct ctagtccaaa 2040 tctgatactg gcccatggta attctaggtt taaccatctg tttcagtcca tcaagtctag 2100 ggcgataact gagcaaggac aggaagaagc ctgggttcaa tgctgccagt ggcttagcca 2160 gagtaacaag aaagtattct tgggacagat tggtgtctgc acaatagacc aagtactcat 2220 ctcagttttg cctgttaagc accgattcat acgaggactt ggaatcgggc gcagtgtcct 2280 catagtagat gaggtgcatg cttacgacac ctacatgaac ggtttgctcg aggcggtgct 2340 caaagcacaa gctgatgtcg gaggtagcgt gatccttctc agcgctacgc ttcctatgaa 2400 acagaagcag aagttgctcg atacctatgg tctgcatacg gatcctgtgg aaaataatag 2460 tgcctacccc ctcataaact ggaggggagt aaatggtgca cagaggtttg accttcttgc 2520 tcaccctgag cagcttcctc cccggttttc catacagccg gagccgattt gtcttgccga 2580 catgcttcca gatctcacaa tgctcgaacg gatgatcgcg gccgctaatg ccggcgcaca 2640 agtctgtctc atctgtaacc ttgtcgatgt agcgcaggtt tgttaccaac gactcaaaga 2700 actgaataat acacaagtag acatagatct gttccatgct cgctttacac tcaatgacag 2760 aagggaaaaa gaaaatcggg tcatctcaaa ttttggtaag aacggaaaac gaaacgttgg 2820 ccgaatcctc gtcgcaaccc aggtagtgga gcagtccctc gatgtggact ttgactggct 2880 tattacacag cactgccctg ctgacctcct gttccagcga cttggcagat tgcatagaca 2940 tcaccggaaa tatcggcctg caggttttga gataccagtc gcaactattc ttctccccga 3000 cggggaaggg tacgggcgac acgagcacat ctatagcaac gtacgggtaa tgtggcggac 3060 gcaacaacac atcgaggaac ttaacggagc atccctgttt ttccccgatg cctatagaca 3120 atggctcgac agtatttatg atgacgccga aatggacgaa cccgagtggg tcggaaatgg 3180 tatggataaa tttgaatccg cagaatgtga aaaacggttc aaagcacgga aggtcctcca 3240 gtgggctgag gagtattcat tgcaggataa cgacgaaacc atcttggctg tcactagaga 3300 cggcgaaatg tcccttccac tgcttcctta tgttcaaacc tcttctggga aacagcttct 3360 tgatggccag gtatatgagg acctgtccca cgaacaacag tacgaggcac ttgccttgaa 3420 ccgcgttaat gtacctttca cttggaaacg atcattttca gaggtcgtag atgaagatgg 3480 gctcctttgg ctggaaggca aacaaaacct ggatggatgg gtatggcagg gaaactctat 3540 tgtaataaca tacactggcg atgagggtat gacgagggtt ataccggcga atccgaaatc 3600 cgggtcaccc aaaaagaaga gaaaagtata ataacattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 466 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Forward oligo, J3 target sequence <400> 466 atcatcctcc tgacaatttt gacagcccac atggcattcc acttatcact ggcatcttta 60 aaagccagga cggtc 75 <210> 467 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Reverse oligo, J3 target sequence <400> 467 gaccgtcctg gcttttaaag atgccagtga taagtggaat gccatgtggg ctgtcaaaat 60 tgtcaggagg atgat 75 <210> 468 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: target strand J3 <400> 468 cgccgagctc gaattctttt gacagcccac atggcattcc acttatcact ggcatggatc 60 ctggctgtgg tgatg 75 <210> 469 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: non target strand J3 <400> 469 catcaccaca gccaggatcc atgccagtga taagtggaat gccatgtggg ctgtcaaaag 60 aattcgagct cggcg 75 <210> 470 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: target strand CCR5 Site <400> 470 cgccgagctc gaattctttt taggtacctg gctgtcgtcc atgctgtgtt tgcatggatc 60 ctggctgtgg tgatg 75 <210> 471 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: non target strand CCR5 <400> 471 catcaccaca gccaggatcc atgcaaacac agcatggacg acagccaggt acctaaaaag 60 aattcgagct cggcg 75 <210> 472 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: target strand J3 <400> 472 cgccgagctc gaattctttt gacagcccac atggcattcc acttatcact ggcatggatc 60 ctggctgtgg tgatg 75 <210> 473 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: non target strand J3 <400> 473 catcaccaca gccaggatcc atgccagtga taagtggaat gccatgtggg ctgtcaaaag 60 aattcgagct cggcg 75 <210> 474 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: target strand CCR5 Site <400> 474 cgccgagctc gaattctttt taggtacctg gctgtcgtcc atgctgtgtt tgcatggatc 60 ctggctgtgg tgatg 75 <210> 475 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Forward primer to amplify Hsa07 dual-target from human genomic DNA <400> 475 cactctttcc ctacacgacg ctcttccgat ctttcctccc taacctccac ct 52 <210> 476 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Reverse primer to amplify Hsa07 dual-target from human genomic DNA <400> 476 ggagttcaga cgtgtgctct tccgatctta aagagcccaa ccagatgc 48 <210> 477 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Forward oligo, J3 target sequence for cloning into pACYC-Duet1 <400> 477 gatccatgcc agtgataagt ggaatgccat gtgggctgtc aaaag 45 <210> 478 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Reverse oligo, J3 target sequence for cloning into pACYC-Duet1 <400> 478 aattcttttg acagcccaca tggcattcca cttatcactg gcatg 45 <210> 479 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Forward oligo, J3-15bp-L3 target sequences for cloning into pACYC-Duet1 <400> 479 aattcttttg acagcccaca tggcattcca cttatcactg gcatcctagg cctctcgaga 60 tgagtggcag atatagcctg gtggttcagg cggcgcatgc 100 <210> 480 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Reverse oligo, J3-15bp-L3 target sequences for cloning into pACYC-Duet1 <400> 480 tcagcatgcg ccgcctgaac caccaggcta tatctgccac tcatctcgag aggcctagga 60 tgccagtgat aagtggaatg ccatgtgggc tgtcaaaag 99 <210> 481 <211> 4068 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3 target sequence in pACYC-Duet1 <400> 481 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccat gccagtgata agtggaatgc catgtgggct gtcaaaagaa ttcgagctcg 180 gcgcgcctgc aggtcgacaa gcttgcggcc gcataatgct taagtcgaac agaaagtaat 240 cgtattgtac acggccgcat aatcgaaatt aatacgactc actatagggg aattgtgagc 300 ggataacaat tccccatctt agtatattag ttaagtataa gaaggagata tacatatggc 360 agatctcaat tggatatcgg ccggccacgc gatcgctgac gtcggtaccc tcgagtctgg 420 taaagaaacc gctgctgcga aatttgaacg ccagcacatg gactcgtcta ctagcgcagc 480 ttaattaacc taggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 540 taaacgggtc ttgaggggtt ttttgctgaa acctcaggca tttgagaagc acacggtcac 600 actgcttccg gtagtcaata aaccggtaaa ccagcaatag acataagcgg ctatttaacg 660 accctgccct gaaccgacga ccgggtcgaa tttgctttcg aatttctgcc attcatccgc 720 ttattatcac ttattcaggc gtagcaccag gcgtttaagg gcaccaataa ctgccttaaa 780 aaaattacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 840 cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 900 tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 960 tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca 1020 tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 1080 gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa 1140 acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca 1200 gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa 1260 tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg 1320 taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa 1380 aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg atttttttct 1440 ccattttagc ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg 1500 atcttatttc attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc 1560 gccaaaagtt ggcccagggc ttcccggtat caacagggac accaggattt atttattctg 1620 cgaagtgatc ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca 1680 acttactgat ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc 1740 agctgtccct cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga 1800 catcagcgct agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg 1860 aagtgcttca tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata 1920 caggatatat tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg 1980 agcggaaatg gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa 2040 cagggaagtg agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag 2100 catcacgaaa tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac 2160 caggcgtttc ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg 2220 gtgtcattcc gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg 2280 taggcagttc gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc 2340 gccttatccg gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg 2400 gcagcagcca ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg 2460 ctaaactgaa aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa 2520 agagttggta gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc 2580 agagcaagag attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat 2640 aaaatatttc tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc 2700 catacgatat aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg 2760 actgggttga aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa 2820 cttacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 2880 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt 2940 ggtttttctt ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg 3000 agagagttgc agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat 3060 ggtggttaac ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga 3120 gatgtccgca ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat 3180 ctgatcgttg gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt 3240 ttgttgaaaa ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg 3300 attgcgagtg agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa 3360 tgggcccgct aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag 3420 tcgcgtaccg tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc 3480 aagaaataac gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc 3540 cagcggatag ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc 3600 tttacaggct tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg 3660 atcggcgcga gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga 3720 ggtggcaacg ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg 3780 aatgtaattc agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg 3840 gctggcctgg ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac 3900 atcgtataac gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta 3960 tcatgccata ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc 4020 ccttatgtca gcattgcata ttgtcagacg actcctgcat taggaaat 4068 <210> 482 <211> 3769 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-15bp-L3 target sequences in pACYC-Duet1 <400> 482 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcttttga cagcccacat ggcattccac ttatcactgg catcctaggc 180 ctctcgagat gagtggcaga tatagcctgg tggttcaggc ggcgcatgct gagcaataac 240 tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg aaacctcagg 300 catttgagaa gcacacggtc acactgcttc cggtagtcaa taaaccggta aaccagcaat 360 agacataagc ggctatttaa cgaccctgcc ctgaaccgac gaccgggtcg aatttgcttt 420 cgaatttctg ccattcatcc gcttattatc acttattcag gcgtagcacc aggcgtttaa 480 gggcaccaat aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt 540 tgtaattcat taagcattct gccgacatgg aagccatcac agacggcatg atgaacctga 600 atcgccagcg gcatcagcac cttgtcgcct tgcgtataat atttgcccat agtgaaaacg 660 ggggcgaaga agttgtccat attggccacg tttaaatcaa aactggtgaa actcacccag 720 ggattggctg agacgaaaaa catattctca ataaaccctt tagggaaata ggccaggttt 780 tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg 840 tattcactcc agagcgatga aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg 900 tgaacactat cccatatcac cagctcaccg tctttcattg ccatacggaa ctccggatga 960 gcattcatca ggcgggcaag aatgtgaata aaggccggat aaaacttgtg cttatttttc 1020 tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg tctggttata ggtacattga 1080 gcaactgact gaaatgcctc aaaatgttct ttacgatgcc attgggatat atcaacggtg 1140 gtatatccag tgattttttt ctccatttta gcttccttag ctcctgaaaa tctcgataac 1200 tcaaaaaata cgcccggtag tgatcttatt tcattatggt gaaagttgga acctcttacg 1260 tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg gcttcccggt atcaacaggg 1320 acaccaggat ttatttattc tgcgaagtga tcttccgtca caggtattta ttcggcgcaa 1380 agtgcgtcgg gtgatgctgc caacttactg atttagtgta tgatggtgtt tttgaggtgc 1440 tccagtggct tctgtttcta tcagctgtcc ctcctgttca gctactgacg gggtggtgcg 1500 taacggcaaa agcaccgccg gacatcagcg ctagcggagt gtatactggc ttactatgtt 1560 ggcactgatg agggtgtcag tgaagtgctt catgtggcag gagaaaaaag gctgcaccgg 1620 tgcgtcagca gaatatgtga tacaggatat attccgcttc ctcgctcact gactcgctac 1680 gctcggtcgt tcgactgcgg cgagcggaaa tggcttacga acggggcgga gatttcctgg 1740 aagatgccag gaagatactt aacagggaag tgagagggcc gcggcaaagc cgtttttcca 1800 taggctccgc ccccctgaca agcatcacga aatctgacgc tcaaatcagt ggtggcgaaa 1860 cccgacagga ctataaagat accaggcgtt tcccctggcg gctccctcgt gcgctctcct 1920 gttcctgcct ttcggtttac cggtgtcatt ccgctgttat ggccgcgttt gtctcattcc 1980 acgcctgaca ctcagttccg ggtaggcagt tcgctccaag ctggactgta tgcacgaacc 2040 ccccgttcag tccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccgga 2100 aagacatgca aaagcaccac tggcagcagc cactggtaat tgatttagag gagttagtct 2160 tgaagtcatg cgccggttaa ggctaaactg aaaggacaag ttttggtgac tgcgctcctc 2220 caagccagtt acctcggttc aaagagttgg tagctcagag aaccttcgaa aaaccgccct 2280 gcaaggcggt tttttcgttt tcagagcaag agattacgcg cagaccaaaa cgatctcaag 2340 aagatcatct tattaatcag ataaaatatt tctagatttc agtgcaattt atctcttcaa 2400 atgtagcacc tgaagtcagc cccatacgat ataagttgta attctcatgt tagtcatgcc 2460 ccgcgcccac cggaaggagc tgactgggtt gaaggctctc aagggcatcg gtcgagatcc 2520 cggtgcctaa tgagtgagct aacttacatt aattgcgttg cgctcactgc ccgctttcca 2580 gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 2640 tttgcgtatt gggcgccagg gtggtttttc ttttcaccag tgagacgggc aacagctgat 2700 tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg gtttgcccca 2760 gcaggcgaaa atcctgtttg atggtggtta acggcgggat ataacatgag ctgtcttcgg 2820 tatcgtcgta tcccactacc gagatgtccg caccaacgcg cagcccggac tcggtaatgg 2880 cgcgcattgc gcccagcgcc atctgatcgt tggcaaccag catcgcagtg ggaacgatgc 2940 cctcattcag catttgcatg gtttgttgaa aaccggacat ggcactccag tcgccttccc 3000 gttccgctat cggctgaatt tgattgcgag tgagatattt atgccagcca gccagacgca 3060 gacgcgccga gacagaactt aatgggcccg ctaacagcgc gatttgctgg tgacccaatg 3120 cgaccagatg ctccacgccc agtcgcgtac cgtcttcatg ggagaaaata atactgttga 3180 tgggtgtctg gtcagagaca tcaagaaata acgccggaac attagtgcag gcagcttcca 3240 cagcaatggc atcctggtca tccagcggat agttaatgat cagcccactg acgcgttgcg 3300 cgagaagatt gtgcaccgcc gctttacagg cttcgacgcc gcttcgttct accatcgaca 3360 ccaccacgct ggcacccagt tgatcggcgc gagatttaat cgccgcgaca atttgcgacg 3420 gcgcgtgcag ggccagactg gaggtggcaa cgccaatcag caacgactgt ttgcccgcca 3480 gttgttgtgc cacgcggttg ggaatgtaat tcagctccgc catcgccgct tccacttttt 3540 cccgcgtttt cgcagaaacg tggctggcct ggttcaccac gcgggaaacg gtctgataag 3600 agacaccggc atactctgcg acatcgtata acgttactgg tttcacattc accaccctga 3660 attgactctc ttccgggcgc tatcatgcca taccgcgaaa ggttttgcgc cattcgatgg 3720 tgtccgggat ctcgacgctc tcccttatgc gactcctgca ttaggaaat 3769 <210> 483 <211> 3784 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-30bp-L3 target sequences in pACYC-Duet1 <400> 483 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcttttga cagcccacat ggcattccac ttatcactgg catcctagcc 180 cttccactct ttcgaaactc gagatgagtg gcagatatag cctggtggtt caggcggcgc 240 atgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 300 tgctgaaacc tcaggcattt gagaagcaca cggtcacact gcttccggta gtcaataaac 360 cggtaaacca gcaatagaca taagcggcta tttaacgacc ctgccctgaa ccgacgaccg 420 ggtcgaattt gctttcgaat ttctgccatt catccgctta ttatcactta ttcaggcgta 480 gcaccaggcg tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac 540 tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg 600 gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 660 cccatagtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 720 gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 780 aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 840 cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 900 acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 960 cggaactccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 1020 ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 1080 ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 1140 gatatatcaa cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct 1200 gaaaatctcg ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag 1260 ttggaacctc ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc 1320 ccggtatcaa cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt 1380 atttattcgg cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg 1440 gtgtttttga ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac 1500 tgacggggtg gtgcgtaacg gcaaaagcac cgccggacat cagcgctagc ggagtgtata 1560 ctggcttact atgttggcac tgatgagggt gtcagtgaag tgcttcatgt ggcaggagaa 1620 aaaaggctgc accggtgcgt cagcagaata tgtgatacag gatatattcc gcttcctcgc 1680 tcactgactc gctacgctcg gtcgttcgac tgcggcgagc ggaaatggct tacgaacggg 1740 gcggagattt cctggaagat gccaggaaga tacttaacag ggaagtgaga gggccgcggc 1800 aaagccgttt ttccataggc tccgcccccc tgacaagcat cacgaaatct gacgctcaaa 1860 tcagtggtgg cgaaacccga caggactata aagataccag gcgtttcccc tggcggctcc 1920 ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 1980 cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 2040 ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 2100 tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 2160 tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 2220 gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 2280 tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 2340 caaaacgatc tcaagaagat catcttatta atcagataaa atatttctag atttcagtgc 2400 aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgtaattct 2460 catgttagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg 2520 catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg cgttgcgctc 2580 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 2640 cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc accagtgaga 2700 cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc aagcggtcca 2760 cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc gggatataac 2820 atgagctgtc ttcggtatcg tcgtatccca ctaccgagat gtccgcacca acgcgcagcc 2880 cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca accagcatcg 2940 cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg gacatggcac 3000 tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga tatttatgcc 3060 agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac agcgcgattt 3120 gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct tcatgggaga 3180 aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc ggaacattag 3240 tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta atgatcagcc 3300 cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg acgccgcttc 3360 gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat ttaatcgccg 3420 cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca atcagcaacg 3480 actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc tccgccatcg 3540 ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc accacgcggg 3600 aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt actggtttca 3660 cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg cgaaaggttt 3720 tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc ctgcattagg 3780 aaat 3784 <210> 484 <211> 5815 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, multi-target plasmid <400> 484 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcgagctc tctaggtacc tggctgtcgt ccatgctgtg tttgcatcct 180 aggcctctcg agcctaggcc tctcgagatg tgtgatcact tgggtggtgg ctgtgtttgc 240 gtgcttgaca gcccacatgg cattccactt atcactggca tcctagccct tccactcttt 300 cgaaactcga gatgagtggc agatatagcc tggtggttca ggcggcgcct gggcctgaaa 360 ggcctccagc tctgcctgcc cgcttactgc ctcagcttcc ctgccccaca aagggcctga 420 ggtgctgcct gggcatgtgt aaaggtgtcc aggcaaagcc actgaggtcc gggtgacagt 480 gcttcggcag gctgacagcc aggtgactga agtctgtgcg gcaacctaca tgatggggaa 540 tgagttgtgt gaattatggt ggtgctacaa acaagctcat ctttggaact ggcactctgc 600 ttgctgtcca gccaagtacg taagtagtgg catgtgtcag gtggattctg tatacaatta 660 tgtgtctgcc ggtccaaatg ccttcttcta taggccatgt ttttatttct cttccaaaag 720 agactccaga gccatccttg ggaagagtgc tgagatcact gtgggaattc aggaaacaca 780 cctcttgtct ttggaaaggg cacaagactt tctgtgattg caagtaagtg tttctagcca 840 tccttgattt tgatcagcca aggcaggatc ccaggagaca gagcagtagc cactttgagt 900 gaatttccca ggaggtgctc ctgccaaggc ccataccttc aaggaaaatt aaggcaaata 960 gaaaagactg tgtaacacca atgcaggcaa atcaaccttt ggggatggga ctacgctcac 1020 tgtgaagcca agtaagttgt gttcttcttt gcctaggcct tcagggacat caccaggttg 1080 tagaagttga caggcagtgc catgggggca acagccaaaa taggggggta atgatgtagg 1140 ggccaagcag tgcccagctg ggggtcaata gtttctgtca catcagctcc actttcagtg 1200 aaagcatcac ttgggattaa tatggggatg cagcattatg atgtgggtca aggaattaag 1260 ttagggaatg gcgaagccga aatgatcttt tcaagttaaa ttttatgcct tttatttctt 1320 aaacaaatgt atgattacat caaggcttca aaaatactca catggctatg ttttagcccc 1380 aacagagcca gaatgtgaaa agcaatttca gccttatttt attcccatca attgagaaac 1440 cattatgaag aagagagtcc atatttcaat ttccaagagc tgaggcaagg caaggctgct 1500 gcagcctccc ctggctgtgc acattccctc ctgctcccca gagactgcct ccgccatccc 1560 acagatgatg gatcttcagt gggttctctt gggctctagg tcccaaaagg ccacactggt 1620 gtgcctggcc acaggcttct accccgacca cgtggagctg agctggtggg tgaatgggaa 1680 ggaggtgcac agtggggtca gcacagaccc gcagctgtgc tccctcgctc cttcctctgc 1740 attgcccctc ttctccctct ccaaacagag ggaactctcc tacccccaag gaggtgaaag 1800 ctgctaccac ctctgtgccc ccccggcaat gccaacatat ctgggatcaa agctatctat 1860 ataaagtcct tgattctgtg tgggttcaaa cacatttcaa agcttcagga tcctgaaagg 1920 ttttgctcta cttcctgaag acctgaacac cgccctgcag gtcgacaagc ttgcggccgc 1980 ataatgctta agtcgaacag aaagtaatcg tattgtacac ggccgcataa tcgaaattaa 2040 tacgactcac tataggggaa ttgtgagcgg ataacaattc cccatcttag tatattagtt 2100 aagtataaga aggagatata catatggcag atctcaattg gatatcggcc ggccacgcga 2160 tcgctgacgt cggtaccctc gagtctggta aagaaaccgc tgctgcgaaa tttgaacgcc 2220 agcacatgga ctcgtctact agcgcagctt aattaaccta ggctgctgcc accgctgagc 2280 aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgctgaaac 2340 ctcaggcatt tgagaagcac acggtcacac tgcttccggt agtcaataaa ccggtaaacc 2400 agcaatagac ataagcggct atttaacgac cctgccctga accgacgacc gggtcgaatt 2460 tgctttcgaa tttctgccat tcatccgctt attatcactt attcaggcgt agcaccaggc 2520 gtttaagggc accaataact gccttaaaaa aattacgccc cgccctgcca ctcatcgcag 2580 tactgttgta attcattaag cattctgccg acatggaagc catcacagac ggcatgatga 2640 acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatagtg 2700 aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc 2760 acccagggat tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc 2820 aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg 2880 tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa 2940 caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc 3000 ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta 3060 tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta 3120 cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca 3180 acggtggtat atccagtgat ttttttctcc attttagctt ccttagctcc tgaaaatctc 3240 gataactcaa aaaatacgcc cggtagtgat cttatttcat tatggtgaaa gttggaacct 3300 cttacgtgcc gatcaacgtc tcattttcgc caaaagttgg cccagggctt cccggtatca 3360 acagggacac caggatttat ttattctgcg aagtgatctt ccgtcacagg tatttattcg 3420 gcgcaaagtg cgtcgggtga tgctgccaac ttactgattt agtgtatgat ggtgtttttg 3480 aggtgctcca gtggcttctg tttctatcag ctgtccctcc tgttcagcta ctgacggggt 3540 ggtgcgtaac ggcaaaagca ccgccggaca tcagcgctag cggagtgtat actggcttac 3600 tatgttggca ctgatgaggg tgtcagtgaa gtgcttcatg tggcaggaga aaaaaggctg 3660 caccggtgcg tcagcagaat atgtgataca ggatatattc cgcttcctcg ctcactgact 3720 cgctacgctc ggtcgttcga ctgcggcgag cggaaatggc ttacgaacgg ggcggagatt 3780 tcctggaaga tgccaggaag atacttaaca gggaagtgag agggccgcgg caaagccgtt 3840 tttccatagg ctccgccccc ctgacaagca tcacgaaatc tgacgctcaa atcagtggtg 3900 gcgaaacccg acaggactat aaagatacca ggcgtttccc ctggcggctc cctcgtgcgc 3960 tctcctgttc ctgcctttcg gtttaccggt gtcattccgc tgttatggcc gcgtttgtct 4020 cattccacgc ctgacactca gttccgggta ggcagttcgc tccaagctgg actgtatgca 4080 cgaacccccc gttcagtccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 4140 cccggaaaga catgcaaaag caccactggc agcagccact ggtaattgat ttagaggagt 4200 tagtcttgaa gtcatgcgcc ggttaaggct aaactgaaag gacaagtttt ggtgactgcg 4260 ctcctccaag ccagttacct cggttcaaag agttggtagc tcagagaacc ttcgaaaaac 4320 cgccctgcaa ggcggttttt tcgttttcag agcaagagat tacgcgcaga ccaaaacgat 4380 ctcaagaaga tcatcttatt aatcagataa aatatttcta gatttcagtg caatttatct 4440 cttcaaatgt agcacctgaa gtcagcccca tacgatataa gttgtaattc tcatgttagt 4500 catgccccgc gcccaccgga aggagctgac tgggttgaag gctctcaagg gcatcggtcg 4560 agatcccggt gcctaatgag tgagctaact tacattaatt gcgttgcgct cactgcccgc 4620 tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 4680 aggcggtttg cgtattgggc gccagggtgg tttttctttt caccagtgag acgggcaaca 4740 gctgattgcc cttcaccgcc tggccctgag agagttgcag caagcggtcc acgctggttt 4800 gccccagcag gcgaaaatcc tgtttgatgg tggttaacgg cgggatataa catgagctgt 4860 cttcggtatc gtcgtatccc actaccgaga tgtccgcacc aacgcgcagc ccggactcgg 4920 taatggcgcg cattgcgccc agcgccatct gatcgttggc aaccagcatc gcagtgggaa 4980 cgatgccctc attcagcatt tgcatggttt gttgaaaacc ggacatggca ctccagtcgc 5040 cttcccgttc cgctatcggc tgaatttgat tgcgagtgag atatttatgc cagccagcca 5100 gacgcagacg cgccgagaca gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac 5160 ccaatgcgac cagatgctcc acgcccagtc gcgtaccgtc ttcatgggag aaaataatac 5220 tgttgatggg tgtctggtca gagacatcaa gaaataacgc cggaacatta gtgcaggcag 5280 cttccacagc aatggcatcc tggtcatcca gcggatagtt aatgatcagc ccactgacgc 5340 gttgcgcgag aagattgtgc accgccgctt tacaggcttc gacgccgctt cgttctacca 5400 tcgacaccac cacgctggca cccagttgat cggcgcgaga tttaatcgcc gcgacaattt 5460 gcgacggcgc gtgcagggcc agactggagg tggcaacgcc aatcagcaac gactgtttgc 5520 ccgccagttg ttgtgccacg cggttgggaa tgtaattcag ctccgccatc gccgcttcca 5580 ctttttcccg cgttttcgca gaaacgtggc tggcctggtt caccacgcgg gaaacggtct 5640 gataagagac accggcatac tctgcgacat cgtataacgt tactggtttc acattcacca 5700 ccctgaattg actctcttcc gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt 5760 cgatggtgtc cgggatctcg acgctctccc ttatgcgact cctgcattag gaaat 5815 <210> 485 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa01 <400> 485 gggcctgaaa ggcctccagc tctgcctgcc cgcttactgc ctcagcttcc ctgccccaca 60 aagggcctga ggtgctgcct gggcatgtgt aaagg 95 <210> 486 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa02 <400> 486 caggcaaagc cactgaggtc cgggtgacag tgcttcggca ggctgacagc caggtgactg 60 aagtctgtgc ggcaacctac atgatgggga atgag 95 <210> 487 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa03 <400> 487 gtgaattatg gtggtgctac aaacaagctc atctttggaa ctggcactct gcttgctgtc 60 cagccaagta cgtaagtagt ggcatgtgtc aggtggattc 100 <210> 488 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa04 <400> 488 tacaattatg tgtctgccgg tccaaatgcc ttcttctata ggccatgttt ttatttctct 60 tccaaaagag actccagagc catccttggg aagagtgctg 100 <210> 489 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa05 <400> 489 cactgtggga attcaggaaa cacacctctt gtctttggaa agggcacaag actttctgtg 60 attgcaagta agtgtttcta gccatccttg attttgatca 100 <210> 490 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa06 <400> 490 aggcaggatc ccaggagaca gagcagtagc cactttgagt gaatttccca ggaggtgctc 60 ctgccaaggc ccataccttc aaggaaaatt aaggcaaata 100 <210> 491 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa07 <400> 491 agactgtgta acaccaatgc aggcaaatca acctttgggg atgggactac gctcactgtg 60 aagccaagta agttgtgttc ttctttgcct aggccttcag 100 <210> 492 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa08 <400> 492 atcaccaggt tgtagaagtt gacaggcagt gccatggggg caacagccaa aatagggggg 60 taatgatgta ggggccaagc agtgcccagc tgggggtcaa 100 <210> 493 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa09 <400> 493 ttctgtcaca tcagctccac tttcagtgaa agcatcactt gggattaata tggggatgca 60 gcattatgat gtgggtcaag gaattaagtt agggaatggc 100 <210> 494 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa10 <400> 494 ccgaaatgat cttttcaagt taaattttat gccttttatt tcttaaacaa atgtatgatt 60 acatcaaggc ttcaaaaata ctcacatggc tatgttttag 100 <210> 495 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa11 <400> 495 tgctccctcg ctccttcctc tgcattgccc ctcttctccc tctccaaaca gagggaactc 60 tcctaccccc aaggaggtga aagctgctac cacctctgtg cccccccggc aatgc 115 <210> 496 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa12 <400> 496 aacagagcca gaatgtgaaa agcaatttca gccttatttt attcccatca attgagaaac 60 cattatgaag aagagagtcc atatttcaat ttccaagagc tgagg 105 <210> 497 <211> 110 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa13 <400> 497 gcaaggctgc tgcagcctcc cctggctgtg cacattccct cctgctcccc agagactgcc 60 tccgccatcc cacagatgat ggatcttcag tgggttctct tgggctctag 110 <210> 498 <211> 110 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa14 <400> 498 caaaaggcca cactggtgtg cctggccaca ggcttctacc ccgaccacgt ggagctgagc 60 tggtgggtga atgggaagga ggtgcacagt ggggtcagca cagacccgca 110 <210> 499 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa15 <400> 499 tgctccctcg ctccttcctc tgcattgccc ctcttctccc tctccaaaca gagggaactc 60 tcctaccccc aaggaggtga aagctgctac cacctctgtg cccccccggc aatgc 115 <210> 500 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target Hsa16 <400> 500 atatctggga tcaaagctat ctatataaag tccttgattc tgtgtgggtt caaacacatt 60 tcaaagcttc aggatcctga aaggttttgc tctacttcct gaagacctga acacc 115 <210> 501 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: sgRNA-J3 spacer sequence <400> 501 gugauaagug gaaugccaug u 21 <210> 502 <211> 4008 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, pACYC-Duet1 non-target plasmid <400> 502 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcgagctc ggcgcgcctg caggtcgaca agcttgcggc cgcataatgc 180 ttaagtcgaa cagaaagtaa tcgtattgta cacggccgca taatcgaaat taatacgact 240 cactataggg gaattgtgag cggataacaa ttccccatct tagtatatta gttaagtata 300 agaaggagat atacatatgg cagatctcaa ttggatatcg gccggccacg cgatcgctga 360 cgtcggtacc ctcgagtctg gtaaagaaac cgctgctgcg aaatttgaac gccagcacat 420 ggactcgtct actagcgcag cttaattaac ctaggctgct gccaccgctg agcaataact 480 agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgctga aacctcaggc 540 atttgagaag cacacggtca cactgcttcc ggtagtcaat aaaccggtaa accagcaata 600 gacataagcg gctatttaac gaccctgccc tgaaccgacg accgggtcga atttgctttc 660 gaatttctgc cattcatccg cttattatca cttattcagg cgtagcacca ggcgtttaag 720 ggcaccaata actgccttaa aaaaattacg ccccgccctg ccactcatcg cagtactgtt 780 gtaattcatt aagcattctg ccgacatgga agccatcaca gacggcatga tgaacctgaa 840 tcgccagcgg catcagcacc ttgtcgcctt gcgtataata tttgcccata gtgaaaacgg 900 gggcgaagaa gttgtccata ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg 960 gattggctga gacgaaaaac atattctcaa taaacccttt agggaaatag gccaggtttt 1020 caccgtaaca cgccacatct tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt 1080 attcactcca gagcgatgaa aacgtttcag tttgctcatg gaaaacggtg taacaagggt 1140 gaacactatc ccatatcacc agctcaccgt ctttcattgc catacggaac tccggatgag 1200 cattcatcag gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct 1260 ttacggtctt taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag 1320 caactgactg aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg 1380 tatatccagt gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact 1440 caaaaaatac gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt 1500 gccgatcaac gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga 1560 caccaggatt tatttattct gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa 1620 gtgcgtcggg tgatgctgcc aacttactga tttagtgtat gatggtgttt ttgaggtgct 1680 ccagtggctt ctgtttctat cagctgtccc tcctgttcag ctactgacgg ggtggtgcgt 1740 aacggcaaaa gcaccgccgg acatcagcgc tagcggagtg tatactggct tactatgttg 1800 gcactgatga gggtgtcagt gaagtgcttc atgtggcagg agaaaaaagg ctgcaccggt 1860 gcgtcagcag aatatgtgat acaggatata ttccgcttcc tcgctcactg actcgctacg 1920 ctcggtcgtt cgactgcggc gagcggaaat ggcttacgaa cggggcggag atttcctgga 1980 agatgccagg aagatactta acagggaagt gagagggccg cggcaaagcc gtttttccat 2040 aggctccgcc cccctgacaa gcatcacgaa atctgacgct caaatcagtg gtggcgaaac 2100 ccgacaggac tataaagata ccaggcgttt cccctggcgg ctccctcgtg cgctctcctg 2160 ttcctgcctt tcggtttacc ggtgtcattc cgctgttatg gccgcgtttg tctcattcca 2220 cgcctgacac tcagttccgg gtaggcagtt cgctccaagc tggactgtat gcacgaaccc 2280 cccgttcagt ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggaa 2340 agacatgcaa aagcaccact ggcagcagcc actggtaatt gatttagagg agttagtctt 2400 gaagtcatgc gccggttaag gctaaactga aaggacaagt tttggtgact gcgctcctcc 2460 aagccagtta cctcggttca aagagttggt agctcagaga accttcgaaa aaccgccctg 2520 caaggcggtt ttttcgtttt cagagcaaga gattacgcgc agaccaaaac gatctcaaga 2580 agatcatctt attaatcaga taaaatattt ctagatttca gtgcaattta tctcttcaaa 2640 tgtagcacct gaagtcagcc ccatacgata taagttgtaa ttctcatgtt agtcatgccc 2700 cgcgcccacc ggaaggagct gactgggttg aaggctctca agggcatcgg tcgagatccc 2760 ggtgcctaat gagtgagcta acttacatta attgcgttgc gctcactgcc cgctttccag 2820 tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 2880 ttgcgtattg ggcgccaggg tggtttttct tttcaccagt gagacgggca acagctgatt 2940 gcccttcacc gcctggccct gagagagttg cagcaagcgg tccacgctgg tttgccccag 3000 caggcgaaaa tcctgtttga tggtggttaa cggcgggata taacatgagc tgtcttcggt 3060 atcgtcgtat cccactaccg agatgtccgc accaacgcgc agcccggact cggtaatggc 3120 gcgcattgcg cccagcgcca tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc 3180 ctcattcagc atttgcatgg tttgttgaaa accggacatg gcactccagt cgccttcccg 3240 ttccgctatc ggctgaattt gattgcgagt gagatattta tgccagccag ccagacgcag 3300 acgcgccgag acagaactta atgggcccgc taacagcgcg atttgctggt gacccaatgc 3360 gaccagatgc tccacgccca gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat 3420 gggtgtctgg tcagagacat caagaaataa cgccggaaca ttagtgcagg cagcttccac 3480 agcaatggca tcctggtcat ccagcggata gttaatgatc agcccactga cgcgttgcgc 3540 gagaagattg tgcaccgccg ctttacaggc ttcgacgccg cttcgttcta ccatcgacac 3600 caccacgctg gcacccagtt gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg 3660 cgcgtgcagg gccagactgg aggtggcaac gccaatcagc aacgactgtt tgcccgccag 3720 ttgttgtgcc acgcggttgg gaatgtaatt cagctccgcc atcgccgctt ccactttttc 3780 ccgcgttttc gcagaaacgt ggctggcctg gttcaccacg cgggaaacgg tctgataaga 3840 gacaccggca tactctgcga catcgtataa cgttactggt ttcacattca ccaccctgaa 3900 ttgactctct tccgggcgct atcatgccat accgcgaaag gttttgcgcc attcgatggt 3960 gtccgggatc tcgacgctct cccttatgcg actcctgcat taggaaat 4008 <210> 503 <211> 3784 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-30bp-L3 target plasmid, J3 PAM mutant <400> 503 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcttttga cagcccacat ggcattccac ttatcactgg cggcctagcc 180 cttccactct ttcgaaactc gagatgagtg gcagatatag cctggtggtt caggcggcgc 240 atgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 300 tgctgaaacc tcaggcattt gagaagcaca cggtcacact gcttccggta gtcaataaac 360 cggtaaacca gcaatagaca taagcggcta tttaacgacc ctgccctgaa ccgacgaccg 420 ggtcgaattt gctttcgaat ttctgccatt catccgctta ttatcactta ttcaggcgta 480 gcaccaggcg tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac 540 tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg 600 gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 660 cccatagtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 720 gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 780 aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 840 cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 900 acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 960 cggaactccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 1020 ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 1080 ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 1140 gatatatcaa cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct 1200 gaaaatctcg ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag 1260 ttggaacctc ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc 1320 ccggtatcaa cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt 1380 atttattcgg cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg 1440 gtgtttttga ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac 1500 tgacggggtg gtgcgtaacg gcaaaagcac cgccggacat cagcgctagc ggagtgtata 1560 ctggcttact atgttggcac tgatgagggt gtcagtgaag tgcttcatgt ggcaggagaa 1620 aaaaggctgc accggtgcgt cagcagaata tgtgatacag gatatattcc gcttcctcgc 1680 tcactgactc gctacgctcg gtcgttcgac tgcggcgagc ggaaatggct tacgaacggg 1740 gcggagattt cctggaagat gccaggaaga tacttaacag ggaagtgaga gggccgcggc 1800 aaagccgttt ttccataggc tccgcccccc tgacaagcat cacgaaatct gacgctcaaa 1860 tcagtggtgg cgaaacccga caggactata aagataccag gcgtttcccc tggcggctcc 1920 ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 1980 cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 2040 ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 2100 tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 2160 tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 2220 gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 2280 tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 2340 caaaacgatc tcaagaagat catcttatta atcagataaa atatttctag atttcagtgc 2400 aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgtaattct 2460 catgttagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg 2520 catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg cgttgcgctc 2580 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 2640 cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc accagtgaga 2700 cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc aagcggtcca 2760 cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc gggatataac 2820 atgagctgtc ttcggtatcg tcgtatccca ctaccgagat gtccgcacca acgcgcagcc 2880 cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca accagcatcg 2940 cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg gacatggcac 3000 tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga tatttatgcc 3060 agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac agcgcgattt 3120 gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct tcatgggaga 3180 aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc ggaacattag 3240 tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta atgatcagcc 3300 cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg acgccgcttc 3360 gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat ttaatcgccg 3420 cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca atcagcaacg 3480 actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc tccgccatcg 3540 ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc accacgcggg 3600 aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt actggtttca 3660 cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg cgaaaggttt 3720 tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc ctgcattagg 3780 aaat 3784 <210> 504 <211> 3784 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-30bp-L3 target plasmid, L3 PAM mutant <400> 504 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcttttga cagcccacat ggcattccac ttatcactgg catcctagcc 180 cttccactct ttcgaaactc gagccgagtg gcagatatag cctggtggtt caggcggcgc 240 atgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 300 tgctgaaacc tcaggcattt gagaagcaca cggtcacact gcttccggta gtcaataaac 360 cggtaaacca gcaatagaca taagcggcta tttaacgacc ctgccctgaa ccgacgaccg 420 ggtcgaattt gctttcgaat ttctgccatt catccgctta ttatcactta ttcaggcgta 480 gcaccaggcg tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac 540 tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg 600 gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 660 cccatagtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 720 gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 780 aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 840 cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 900 acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 960 cggaactccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 1020 ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 1080 ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 1140 gatatatcaa cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct 1200 gaaaatctcg ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag 1260 ttggaacctc ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc 1320 ccggtatcaa cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt 1380 atttattcgg cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg 1440 gtgtttttga ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac 1500 tgacggggtg gtgcgtaacg gcaaaagcac cgccggacat cagcgctagc ggagtgtata 1560 ctggcttact atgttggcac tgatgagggt gtcagtgaag tgcttcatgt ggcaggagaa 1620 aaaaggctgc accggtgcgt cagcagaata tgtgatacag gatatattcc gcttcctcgc 1680 tcactgactc gctacgctcg gtcgttcgac tgcggcgagc ggaaatggct tacgaacggg 1740 gcggagattt cctggaagat gccaggaaga tacttaacag ggaagtgaga gggccgcggc 1800 aaagccgttt ttccataggc tccgcccccc tgacaagcat cacgaaatct gacgctcaaa 1860 tcagtggtgg cgaaacccga caggactata aagataccag gcgtttcccc tggcggctcc 1920 ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 1980 cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 2040 ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 2100 tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 2160 tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 2220 gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 2280 tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 2340 caaaacgatc tcaagaagat catcttatta atcagataaa atatttctag atttcagtgc 2400 aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgtaattct 2460 catgttagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg 2520 catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg cgttgcgctc 2580 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 2640 cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc accagtgaga 2700 cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc aagcggtcca 2760 cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc gggatataac 2820 atgagctgtc ttcggtatcg tcgtatccca ctaccgagat gtccgcacca acgcgcagcc 2880 cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca accagcatcg 2940 cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg gacatggcac 3000 tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga tatttatgcc 3060 agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac agcgcgattt 3120 gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct tcatgggaga 3180 aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc ggaacattag 3240 tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta atgatcagcc 3300 cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg acgccgcttc 3360 gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat ttaatcgccg 3420 cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca atcagcaacg 3480 actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc tccgccatcg 3540 ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc accacgcggg 3600 aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt actggtttca 3660 cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg cgaaaggttt 3720 tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc ctgcattagg 3780 aaat 3784 <210> 505 <211> 3784 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-30bp-L3 target plasmid, J3/L3 PAM mutants <400> 505 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcttttga cagcccacat ggcattccac ttatcactgg cggcctagcc 180 cttccactct ttcgaaactc gagccgagtg gcagatatag cctggtggtt caggcggcgc 240 atgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 300 tgctgaaacc tcaggcattt gagaagcaca cggtcacact gcttccggta gtcaataaac 360 cggtaaacca gcaatagaca taagcggcta tttaacgacc ctgccctgaa ccgacgaccg 420 ggtcgaattt gctttcgaat ttctgccatt catccgctta ttatcactta ttcaggcgta 480 gcaccaggcg tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac 540 tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg 600 gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 660 cccatagtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 720 gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 780 aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 840 cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 900 acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 960 cggaactccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 1020 ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 1080 ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 1140 gatatatcaa cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct 1200 gaaaatctcg ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag 1260 ttggaacctc ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc 1320 ccggtatcaa cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt 1380 atttattcgg cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg 1440 gtgtttttga ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac 1500 tgacggggtg gtgcgtaacg gcaaaagcac cgccggacat cagcgctagc ggagtgtata 1560 ctggcttact atgttggcac tgatgagggt gtcagtgaag tgcttcatgt ggcaggagaa 1620 aaaaggctgc accggtgcgt cagcagaata tgtgatacag gatatattcc gcttcctcgc 1680 tcactgactc gctacgctcg gtcgttcgac tgcggcgagc ggaaatggct tacgaacggg 1740 gcggagattt cctggaagat gccaggaaga tacttaacag ggaagtgaga gggccgcggc 1800 aaagccgttt ttccataggc tccgcccccc tgacaagcat cacgaaatct gacgctcaaa 1860 tcagtggtgg cgaaacccga caggactata aagataccag gcgtttcccc tggcggctcc 1920 ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 1980 cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 2040 ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 2100 tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 2160 tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 2220 gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 2280 tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 2340 caaaacgatc tcaagaagat catcttatta atcagataaa atatttctag atttcagtgc 2400 aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgtaattct 2460 catgttagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg 2520 catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg cgttgcgctc 2580 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 2640 cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc accagtgaga 2700 cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc aagcggtcca 2760 cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc gggatataac 2820 atgagctgtc ttcggtatcg tcgtatccca ctaccgagat gtccgcacca acgcgcagcc 2880 cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca accagcatcg 2940 cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg gacatggcac 3000 tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga tatttatgcc 3060 agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac agcgcgattt 3120 gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct tcatgggaga 3180 aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc ggaacattag 3240 tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta atgatcagcc 3300 cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg acgccgcttc 3360 gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat ttaatcgccg 3420 cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca atcagcaacg 3480 actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc tccgccatcg 3540 ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc accacgcggg 3600 aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt actggtttca 3660 cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg cgaaaggttt 3720 tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc ctgcattagg 3780 aaat 3784 <210> 506 <211> 3784 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-30bp-L3 target plasmid, J3 spacer mutant <400> 506 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcttttga cagcccacat ggcattccac ttatgtgacc catcctagcc 180 cttccactct ttcgaaactc gagatgagtg gcagatatag cctggtggtt caggcggcgc 240 atgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 300 tgctgaaacc tcaggcattt gagaagcaca cggtcacact gcttccggta gtcaataaac 360 cggtaaacca gcaatagaca taagcggcta tttaacgacc ctgccctgaa ccgacgaccg 420 ggtcgaattt gctttcgaat ttctgccatt catccgctta ttatcactta ttcaggcgta 480 gcaccaggcg tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac 540 tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg 600 gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 660 cccatagtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 720 gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 780 aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 840 cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 900 acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 960 cggaactccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 1020 ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 1080 ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 1140 gatatatcaa cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct 1200 gaaaatctcg ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag 1260 ttggaacctc ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc 1320 ccggtatcaa cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt 1380 atttattcgg cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg 1440 gtgtttttga ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac 1500 tgacggggtg gtgcgtaacg gcaaaagcac cgccggacat cagcgctagc ggagtgtata 1560 ctggcttact atgttggcac tgatgagggt gtcagtgaag tgcttcatgt ggcaggagaa 1620 aaaaggctgc accggtgcgt cagcagaata tgtgatacag gatatattcc gcttcctcgc 1680 tcactgactc gctacgctcg gtcgttcgac tgcggcgagc ggaaatggct tacgaacggg 1740 gcggagattt cctggaagat gccaggaaga tacttaacag ggaagtgaga gggccgcggc 1800 aaagccgttt ttccataggc tccgcccccc tgacaagcat cacgaaatct gacgctcaaa 1860 tcagtggtgg cgaaacccga caggactata aagataccag gcgtttcccc tggcggctcc 1920 ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 1980 cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 2040 ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 2100 tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 2160 tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 2220 gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 2280 tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 2340 caaaacgatc tcaagaagat catcttatta atcagataaa atatttctag atttcagtgc 2400 aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgtaattct 2460 catgttagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg 2520 catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg cgttgcgctc 2580 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 2640 cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc accagtgaga 2700 cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc aagcggtcca 2760 cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc gggatataac 2820 atgagctgtc ttcggtatcg tcgtatccca ctaccgagat gtccgcacca acgcgcagcc 2880 cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca accagcatcg 2940 cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg gacatggcac 3000 tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga tatttatgcc 3060 agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac agcgcgattt 3120 gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct tcatgggaga 3180 aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc ggaacattag 3240 tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta atgatcagcc 3300 cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg acgccgcttc 3360 gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat ttaatcgccg 3420 cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca atcagcaacg 3480 actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc tccgccatcg 3540 ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc accacgcggg 3600 aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt actggtttca 3660 cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg cgaaaggttt 3720 tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc ctgcattagg 3780 aaat 3784 <210> 507 <211> 3784 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-30bp-L3 target plasmid, L3 spacer mutants <400> 507 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcttttga cagcccacat ggcattccac ttatcactgg catcctagcc 180 cttccactct ttcgaaactc gagatgtcac cgagatatag cctggtggtt caggcggcgc 240 atgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 300 tgctgaaacc tcaggcattt gagaagcaca cggtcacact gcttccggta gtcaataaac 360 cggtaaacca gcaatagaca taagcggcta tttaacgacc ctgccctgaa ccgacgaccg 420 ggtcgaattt gctttcgaat ttctgccatt catccgctta ttatcactta ttcaggcgta 480 gcaccaggcg tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac 540 tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg 600 gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 660 cccatagtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 720 gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 780 aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 840 cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 900 acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 960 cggaactccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 1020 ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 1080 ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 1140 gatatatcaa cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct 1200 gaaaatctcg ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag 1260 ttggaacctc ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc 1320 ccggtatcaa cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt 1380 atttattcgg cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg 1440 gtgtttttga ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac 1500 tgacggggtg gtgcgtaacg gcaaaagcac cgccggacat cagcgctagc ggagtgtata 1560 ctggcttact atgttggcac tgatgagggt gtcagtgaag tgcttcatgt ggcaggagaa 1620 aaaaggctgc accggtgcgt cagcagaata tgtgatacag gatatattcc gcttcctcgc 1680 tcactgactc gctacgctcg gtcgttcgac tgcggcgagc ggaaatggct tacgaacggg 1740 gcggagattt cctggaagat gccaggaaga tacttaacag ggaagtgaga gggccgcggc 1800 aaagccgttt ttccataggc tccgcccccc tgacaagcat cacgaaatct gacgctcaaa 1860 tcagtggtgg cgaaacccga caggactata aagataccag gcgtttcccc tggcggctcc 1920 ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 1980 cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 2040 ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 2100 tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 2160 tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 2220 gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 2280 tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 2340 caaaacgatc tcaagaagat catcttatta atcagataaa atatttctag atttcagtgc 2400 aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgtaattct 2460 catgttagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg 2520 catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg cgttgcgctc 2580 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 2640 cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc accagtgaga 2700 cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc aagcggtcca 2760 cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc gggatataac 2820 atgagctgtc ttcggtatcg tcgtatccca ctaccgagat gtccgcacca acgcgcagcc 2880 cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca accagcatcg 2940 cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg gacatggcac 3000 tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga tatttatgcc 3060 agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac agcgcgattt 3120 gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct tcatgggaga 3180 aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc ggaacattag 3240 tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta atgatcagcc 3300 cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg acgccgcttc 3360 gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat ttaatcgccg 3420 cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca atcagcaacg 3480 actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc tccgccatcg 3540 ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc accacgcggg 3600 aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt actggtttca 3660 cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg cgaaaggttt 3720 tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc ctgcattagg 3780 aaat 3784 <210> 508 <211> 3784 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-30bp-L3 target plasmid, J3/L3 spacer mutants <400> 508 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccga attcttttga cagcccacat ggcattccac ttatgtgacc catcctagcc 180 cttccactct ttcgaaactc gagatgtcac cgagatatag cctggtggtt caggcggcgc 240 atgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 300 tgctgaaacc tcaggcattt gagaagcaca cggtcacact gcttccggta gtcaataaac 360 cggtaaacca gcaatagaca taagcggcta tttaacgacc ctgccctgaa ccgacgaccg 420 ggtcgaattt gctttcgaat ttctgccatt catccgctta ttatcactta ttcaggcgta 480 gcaccaggcg tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac 540 tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg 600 gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 660 cccatagtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 720 gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 780 aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 840 cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 900 acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 960 cggaactccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 1020 ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 1080 ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 1140 gatatatcaa cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct 1200 gaaaatctcg ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag 1260 ttggaacctc ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc 1320 ccggtatcaa cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt 1380 atttattcgg cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg 1440 gtgtttttga ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac 1500 tgacggggtg gtgcgtaacg gcaaaagcac cgccggacat cagcgctagc ggagtgtata 1560 ctggcttact atgttggcac tgatgagggt gtcagtgaag tgcttcatgt ggcaggagaa 1620 aaaaggctgc accggtgcgt cagcagaata tgtgatacag gatatattcc gcttcctcgc 1680 tcactgactc gctacgctcg gtcgttcgac tgcggcgagc ggaaatggct tacgaacggg 1740 gcggagattt cctggaagat gccaggaaga tacttaacag ggaagtgaga gggccgcggc 1800 aaagccgttt ttccataggc tccgcccccc tgacaagcat cacgaaatct gacgctcaaa 1860 tcagtggtgg cgaaacccga caggactata aagataccag gcgtttcccc tggcggctcc 1920 ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 1980 cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 2040 ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 2100 tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 2160 tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 2220 gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 2280 tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 2340 caaaacgatc tcaagaagat catcttatta atcagataaa atatttctag atttcagtgc 2400 aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgtaattct 2460 catgttagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg 2520 catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg cgttgcgctc 2580 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 2640 cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc accagtgaga 2700 cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc aagcggtcca 2760 cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc gggatataac 2820 atgagctgtc ttcggtatcg tcgtatccca ctaccgagat gtccgcacca acgcgcagcc 2880 cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca accagcatcg 2940 cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg gacatggcac 3000 tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga tatttatgcc 3060 agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac agcgcgattt 3120 gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct tcatgggaga 3180 aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc ggaacattag 3240 tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta atgatcagcc 3300 cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg acgccgcttc 3360 gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat ttaatcgccg 3420 cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca atcagcaacg 3480 actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc tccgccatcg 3540 ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc accacgcggg 3600 aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt actggtttca 3660 cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg cgaaaggttt 3720 tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc ctgcattagg 3780 aaat 3784 <210> 509 <211> 4068 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, J3-only target plasmid <400> 509 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccat gccagtgata agtggaatgc catgtgggct gtcaaaagaa ttcgagctcg 180 gcgcgcctgc aggtcgacaa gcttgcggcc gcataatgct taagtcgaac agaaagtaat 240 cgtattgtac acggccgcat aatcgaaatt aatacgactc actatagggg aattgtgagc 300 ggataacaat tccccatctt agtatattag ttaagtataa gaaggagata tacatatggc 360 agatctcaat tggatatcgg ccggccacgc gatcgctgac gtcggtaccc tcgagtctgg 420 taaagaaacc gctgctgcga aatttgaacg ccagcacatg gactcgtcta ctagcgcagc 480 ttaattaacc taggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 540 taaacgggtc ttgaggggtt ttttgctgaa acctcaggca tttgagaagc acacggtcac 600 actgcttccg gtagtcaata aaccggtaaa ccagcaatag acataagcgg ctatttaacg 660 accctgccct gaaccgacga ccgggtcgaa tttgctttcg aatttctgcc attcatccgc 720 ttattatcac ttattcaggc gtagcaccag gcgtttaagg gcaccaataa ctgccttaaa 780 aaaattacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 840 cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 900 tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 960 tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca 1020 tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 1080 gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa 1140 acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca 1200 gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa 1260 tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg 1320 taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa 1380 aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg atttttttct 1440 ccattttagc ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg 1500 atcttatttc attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc 1560 gccaaaagtt ggcccagggc ttcccggtat caacagggac accaggattt atttattctg 1620 cgaagtgatc ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca 1680 acttactgat ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc 1740 agctgtccct cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga 1800 catcagcgct agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg 1860 aagtgcttca tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata 1920 caggatatat tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg 1980 agcggaaatg gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa 2040 cagggaagtg agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag 2100 catcacgaaa tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac 2160 caggcgtttc ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg 2220 gtgtcattcc gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg 2280 taggcagttc gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc 2340 gccttatccg gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg 2400 gcagcagcca ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg 2460 ctaaactgaa aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa 2520 agagttggta gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc 2580 agagcaagag attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat 2640 aaaatatttc tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc 2700 catacgatat aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg 2760 actgggttga aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa 2820 cttacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 2880 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt 2940 ggtttttctt ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg 3000 agagagttgc agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat 3060 ggtggttaac ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga 3120 gatgtccgca ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat 3180 ctgatcgttg gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt 3240 ttgttgaaaa ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg 3300 attgcgagtg agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa 3360 tgggcccgct aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag 3420 tcgcgtaccg tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc 3480 aagaaataac gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc 3540 cagcggatag ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc 3600 tttacaggct tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg 3660 atcggcgcga gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga 3720 ggtggcaacg ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg 3780 aatgtaattc agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg 3840 gctggcctgg ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac 3900 atcgtataac gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta 3960 tcatgccata ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc 4020 ccttatgtca gcattgcata ttgtcagacg actcctgcat taggaaat 4068 <210> 510 <211> 4047 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Complete vector sequence, L3-only target plasmid <400> 510 taatacgact cactataggg gaattgtgag cggataacaa ttcccctgta gaaataattt 60 tgtttaactt taataaggag atataccatg ggcagcagcc atcaccatca tcaccacagc 120 caggatccat gcgccgcctg aaccaccagg ctatatctgc cactcatgaa ttcgagctcg 180 gcgcgcctgc aggtcgacaa gcttgcggcc gcataatgct taagtcgaac agaaagtaat 240 cgtattgtac acggccgcat aatcgaaatt aatacgactc actatagggg aattgtgagc 300 ggataacaat tccccatctt agtatattag ttaagtataa gaaggagata tacatatggc 360 agatctcaat tggatatcgg ccggccacgc gatcgctgac gtcggtaccc tcgagtctgg 420 taaagaaacc gctgctgcga aatttgaacg ccagcacatg gactcgtcta ctagcgcagc 480 ttaattaacc taggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 540 taaacgggtc ttgaggggtt ttttgctgaa acctcaggca tttgagaagc acacggtcac 600 actgcttccg gtagtcaata aaccggtaaa ccagcaatag acataagcgg ctatttaacg 660 accctgccct gaaccgacga ccgggtcgaa tttgctttcg aatttctgcc attcatccgc 720 ttattatcac ttattcaggc gtagcaccag gcgtttaagg gcaccaataa ctgccttaaa 780 aaaattacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 840 cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 900 tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 960 tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca 1020 tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 1080 gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa 1140 acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca 1200 gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa 1260 tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg 1320 taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa 1380 aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg atttttttct 1440 ccattttagc ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg 1500 atcttatttc attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc 1560 gccaaaagtt ggcccagggc ttcccggtat caacagggac accaggattt atttattctg 1620 cgaagtgatc ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca 1680 acttactgat ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc 1740 agctgtccct cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga 1800 catcagcgct agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg 1860 aagtgcttca tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata 1920 caggatatat tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg 1980 agcggaaatg gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa 2040 cagggaagtg agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag 2100 catcacgaaa tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac 2160 caggcgtttc ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg 2220 gtgtcattcc gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg 2280 taggcagttc gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc 2340 gccttatccg gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg 2400 gcagcagcca ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg 2460 ctaaactgaa aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa 2520 agagttggta gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc 2580 agagcaagag attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat 2640 aaaatatttc tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc 2700 catacgatat aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg 2760 actgggttga aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa 2820 cttacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 2880 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt 2940 ggtttttctt ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg 3000 agagagttgc agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat 3060 ggtggttaac ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga 3120 gatgtccgca ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat 3180 ctgatcgttg gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt 3240 ttgttgaaaa ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg 3300 attgcgagtg agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa 3360 tgggcccgct aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag 3420 tcgcgtaccg tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc 3480 aagaaataac gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc 3540 cagcggatag ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc 3600 tttacaggct tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg 3660 atcggcgcga gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga 3720 ggtggcaacg ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg 3780 aatgtaattc agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg 3840 gctggcctgg ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac 3900 atcgtataac gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta 3960 tcatgccata ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc 4020 ccttatgcga ctcctgcatt aggaaat 4047 <210> 511 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa01-1 <400> 511 auaaaccgcg ggcaggcaga gcuggaggcc uuucaggccc gaguuccccg cgccagcggg 60 g 61 <210> 512 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa01-2 <400> 512 auaaaccggg ccugaggugc ugccugggca uguguaaagg gaguuccccg cgccagcggg 60 g 61 <210> 513 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa02-1 <400> 513 auaaaccgca cugucacccg gaccucagug gcuuugccug gaguuccccg cgccagcggg 60 g 61 <210> 514 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa02-2 <400> 514 auaaaccguc ugugcggcaa ccuacaugau ggggaaugag gaguuccccg cgccagcggg 60 g 61 <210> 515 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa03-1 <400> 515 auaaaccgau gagcuuguuu guagcaccac cauaauucac gaguuccccg cgccagcggg 60 g 61 <210> 516 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa03-2 <400> 516 auaaaccgua cguaaguagu ggcauguguc agguggauuc gaguuccccg cgccagcggg 60 g 61 <210> 517 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa04-1 <400> 517 auaaaccgaa ggcauuugga ccggcagaca cauaauugua gaguuccccg cgccagcggg 60 g 61 <210> 518 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa04-2 <400> 518 auaaaccgag acuccagagc cauccuuggg aagagugcug gaguuccccg cgccagcggg 60 g 61 <210> 519 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa05-1 <400> 519 auaaaccgac aagaggugug uuuccugaau ucccacagug gaguuccccg cgccagcggg 60 g 61 <210> 520 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa05-2 <400> 520 auaaaccgua aguguuucua gccauccuug auuuugauca gaguuccccg cgccagcggg 60 g 61 <210> 521 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa06-1 <400> 521 auaaaccgug gcuacugcuc ugucuccugg gauccugccu gaguuccccg cgccagcggg 60 g 61 <210> 522 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa06-2 <400> 522 auaaaccggc ccauaccuuc aaggaaaauu aaggcaaaua gaguuccccg cgccagcggg 60 g 61 <210> 523 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa07-1 <400> 523 auaaaccggu ugauuugccu gcauuggugu uacacagucu gaguuccccg cgccagcggg 60 g 61 <210> 524 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa07-2 <400> 524 auaaaccgua aguuguguuc uucuuugccu aggccuucag gaguuccccg cgccagcggg 60 g 61 <210> 525 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa08-1 <400> 525 auaaaccggc acugccuguc aacuucuaca accuggugau gaguuccccg cgccagcggg 60 g 61 <210> 526 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa08-2 <400> 526 auaaaccgua ggggccaagc agugcccagc ugggggucaa gaguuccccg cgccagcggg 60 g 61 <210> 527 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa09-1 <400> 527 auaaaccgcu uucacugaaa guggagcuga ugugacagaa gaguuccccg cgccagcggg 60 g 61 <210> 528 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa09-2 <400> 528 auaaaccgau gugggucaag gaauuaaguu agggaauggc gaguuccccg cgccagcggg 60 g 61 <210> 529 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa10-1 <400> 529 auaaaccggc auaaaauuua acuugaaaag aucauuucgg gaguuccccg cgccagcggg 60 g 61 <210> 530 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa10-2 <400> 530 auaaaccggc uucaaaaaua cucacauggc uauguuuuag gaguuccccg cgccagcggg 60 g 61 <210> 531 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa11-1 <400> 531 auaaaccgag gggcaaugca gaggaaggag cgagggagca gaguuccccg cgccagcggg 60 g 61 <210> 532 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa11-2 <400> 532 auaaaccgga ggugaaagcu gcuaccaccu cugugccccc gaguuccccg cgccagcggg 60 g 61 <210> 533 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa12-1 <400> 533 auaaaccggc ugaaauugcu uuucacauuc uggcucuguu gaguuccccg cgccagcggg 60 g 61 <210> 534 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa12-2 <400> 534 auaaaccgag aguccauauu ucaauuucca agagcugagg gaguuccccg cgccagcggg 60 g 61 <210> 535 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa13-1 <400> 535 auaaaccgug cacagccagg ggaggcugca gcagccuugc gaguuccccg cgccagcggg 60 g 61 <210> 536 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa13-2 <400> 536 auaaaccgau ggaucuucag uggguucucu ugggcucuag gaguuccccg cgccagcggg 60 g 61 <210> 537 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa14-1 <400> 537 auaaaccgcc uguggccagg cacaccagug uggccuuuug gaguuccccg cgccagcggg 60 g 61 <210> 538 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa14-2 <400> 538 auaaaccgga ggugcacagu ggggucagca cagacccgca gaguuccccg cgccagcggg 60 g 61 <210> 539 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa15-1 <400> 539 auaaaccgag gggcaaugca gaggaaggag cgagggagca gaguuccccg cgccagcggg 60 g 61 <210> 540 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa15-2 <400> 540 auaaaccgcu gcuaccaccu cugugccccc ccggcaaugc gaguuccccg cgccagcggg 60 g 61 <210> 541 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa16-1 <400> 541 auaaaccgga cuuuauauag auagcuuuga ucccagauau gaguuccccg cgccagcggg 60 g 61 <210> 542 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: crRNA sequence, target Hsa16-2 <400> 542 auaaaccggu uuugcucuac uuccugaaga ccugaacacc gaguuccccg cgccagcggg 60 g 61 <210> 543 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo A <400> 543 accgatgagc ttgtttgtag caccaccata attcacgagt tccccgcgcc agcggggata 60 aaccgtacgt aagtagtggc atgtgtcagg tggattc 97 <210> 544 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo B <400> 544 actcgaatcc acctgacaca tgccactact tacgtacggt ttatccccgc tggcgcgggg 60 aactcgtgaa ttatggtggt gctacaaaca agctcat 97 <210> 545 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo C <400> 545 accgaaggca tttggaccgg cagacacata attgtagagt tccccgcgcc agcggggata 60 aaccgagact ccagagccat ccttgggaag agtgctg 97 <210> 546 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo D <400> 546 actccagcac tcttcccaag gatggctctg gagtctcggt ttatccccgc tggcgcgggg 60 aactctacaa ttatgtgtct gccggtccaa atgcctt 97 <210> 547 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo E <400> 547 accgacaaga ggtgtgtttc ctgaattccc acagtggagt tccccgcgcc agcggggata 60 aaccgtaagt gtttctagcc atccttgatt ttgatca 97 <210> 548 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo F <400> 548 actctgatca aaatcaagga tggctagaaa cacttacggt ttatccccgc tggcgcgggg 60 aactccactg tgggaattca ggaaacacac ctcttgt 97 <210> 549 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo G <400> 549 accgtggcta ctgctctgtc tcctgggatc ctgcctgagt tccccgcgcc agcggggata 60 aaccggccca taccttcaag gaaaattaag gcaaata 97 <210> 550 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo H <400> 550 actctatttg ccttaatttt ccttgaaggt atgggccggt ttatccccgc tggcgcgggg 60 aactcaggca ggatcccagg agacagagca gtagcca 97 <210> 551 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo I <400> 551 accggttgat ttgcctgcat tggtgttaca cagtctgagt tccccgcgcc agcggggata 60 aaccgtaagt tgtgttcttc tttgcctagg ccttcag 97 <210> 552 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo J <400> 552 actcctgaag gcctaggcaa agaagaacac aacttacggt ttatccccgc tggcgcgggg 60 aactcagact gtgtaacacc aatgcaggca aatcaac 97 <210> 553 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo K <400> 553 accggcactg cctgtcaact tctacaacct ggtgatgagt tccccgcgcc agcggggata 60 aaccgtaggg gccaagcagt gcccagctgg gggtcaa 97 <210> 554 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo L <400> 554 actcttgacc cccagctggg cactgcttgg cccctacggt ttatccccgc tggcgcgggg 60 aactcatcac caggttgtag aagttgacag gcagtgc 97 <210> 555 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo M <400> 555 accgctttca ctgaaagtgg agctgatgtg acagaagagt tccccgcgcc agcggggata 60 aaccgatgtg ggtcaaggaa ttaagttagg gaatggc 97 <210> 556 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo N <400> 556 actcgccatt ccctaactta attccttgac ccacatcggt ttatccccgc tggcgcgggg 60 aactcttctg tcacatcagc tccactttca gtgaaag 97 <210> 557 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo O <400> 557 accggcataa aatttaactt gaaaagatca tttcgggagt tccccgcgcc agcggggata 60 aaccggcttc aaaaatactc acatggctat gttttag 97 <210> 558 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo P <400> 558 actcctaaaa catagccatg tgagtatttt tgaagccggt ttatccccgc tggcgcgggg 60 aactcccgaa atgatctttt caagttaaat tttatgc 97 <210> 559 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo Q <400> 559 cactctttcc ctacacgacg ctcttccgat ctagcctgga aagacacaaa gc 52 <210> 560 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo R <400> 560 ggagttcaga cgtgtgctct tccgatctca gccatccttt ccacctaa 48 <210> 561 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo S <400> 561 cactctttcc ctacacgacg ctcttccgat ctatgctgca ggctttatgc tt 52 <210> 562 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo T <400> 562 ggagttcaga cgtgtgctct tccgatcttt aggcctgcct gacttctc 48 <210> 563 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo U <400> 563 cactctttcc ctacacgacg ctcttccgat ctgggaagaa gaccaacaag agg 53 <210> 564 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo V <400> 564 ggagttcaga cgtgtgctct tccgatcttt caagggaaga agccattg 48 <210> 565 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo W <400> 565 cactctttcc ctacacgacg ctcttccgat ctaaggcagg aattggatga aa 52 <210> 566 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo X <400> 566 ggagttcaga cgtgtgctct tccgatctaa cctgagatga ctgcccat 48 <210> 567 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo Y <400> 567 cactctttcc ctacacgacg ctcttccgat ctttcctccc taacctccac ct 52 <210> 568 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo Z <400> 568 ggagttcaga cgtgtgctct tccgatctta aagagcccaa ccagatgc 48 <210> 569 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo A2 <400> 569 cactctttcc ctacacgacg ctcttccgat ctgtctcagc cttagccctg tg 52 <210> 570 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo B2 <400> 570 ggagttcaga cgtgtgctct tccgatctcc cactgcaagt acaagggt 48 <210> 571 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo C2 <400> 571 cactctttcc ctacacgacg ctcttccgat ctggatgcgg aacccaaatt a 51 <210> 572 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo D2 <400> 572 ggagttcaga cgtgtgctct tccgatctta gtcttctccc tcgctccc 48 <210> 573 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo E2 <400> 573 cactctttcc ctacacgacg ctcttccgat cttgcagcat tatgatgtgg gt 52 <210> 574 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo F2 <400> 574 ggagttcaga cgtgtgctct tccgatctca acctttagca tcactggct 49 <210> 575 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo G2 <220> <221> misc_feature <222> (25)..(32) <223> n is a, c, g, or t <400> 575 caagcagaag acggcatacg agatnnnnnn nngtgactgg agttcagacg tgtgctc 57 <210> 576 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Oligo H2 <220> <221> misc_feature <222> (30)..(37) <223> n is a, c, g, or t <400> 576 aatgatacgg cgaccaccga gatctacacn nnnnnnnaca ctctttccct acacgacg 58 <210> 577 <211> 210 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NSL-Cas6 <400> 577 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Met Tyr Leu Ser Lys 1 5 10 15 Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu Tyr Gln Leu His Gln 20 25 30 Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp Ala Ala Arg Asp Phe 35 40 45 Leu Phe His Val Glu Lys Arg Asn Thr Pro Glu Gly Cys His Val Leu 50 55 60 Leu Gln Ser Ala Gln Met Pro Val Ser Thr Ala Val Ala Thr Val Ile 65 70 75 80 Lys Thr Lys Gln Val Glu Phe Gln Leu Gln Val Gly Val Pro Leu Tyr 85 90 95 Phe Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile Leu Asp Asn Gln Lys 100 105 110 Arg Leu Asp Ser Lys Gly Asn Ile Lys Arg Cys Arg Val Pro Leu Ile 115 120 125 Lys Glu Ala Glu Gln Ile Ala Trp Leu Gln Arg Lys Leu Gly Asn Ala 130 135 140 Ala Arg Val Glu Asp Val His Pro Ile Ser Glu Arg Pro Gln Tyr Phe 145 150 155 160 Ser Gly Asp Gly Lys Ser Gly Lys Ile Gln Thr Val Cys Phe Glu Gly 165 170 175 Val Leu Thr Ile Asn Asp Ala Pro Ala Leu Ile Asp Leu Val Gln Gln 180 185 190 Gly Ile Gly Pro Ala Lys Ser Met Gly Cys Gly Leu Leu Ser Leu Ala 195 200 205 Pro Leu 210 <210> 578 <211> 366 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: cpCas7 V1 <400> 578 Met Lys Asp Gly Phe Leu Gln Pro Ser Ile Gln Ala Phe Asn Gln Tyr 1 5 10 15 Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu Asn Gly Ala Ala Ala Gln 20 25 30 Phe Ser Leu Ser Asp Val Asp Pro Ile Thr Ala Gln Val Lys Gln Met 35 40 45 Pro Thr Leu Glu Gln Leu Lys Ser Trp Val Arg Asn Asn Gly Glu Ala 50 55 60 Gly Ser Met Ser Asn Phe Ile Asn Ile His Val Leu Ile Ser His Ser 65 70 75 80 Pro Ser Cys Leu Asn Arg Asp Asp Met Asn Met Gln Lys Asp Ala Ile 85 90 95 Phe Gly Gly Lys Arg Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg 100 105 110 Ala Met Arg Lys Ser Gly Tyr Tyr Ala Gln Asn Ile Gly Glu Ser Ser 115 120 125 Leu Arg Thr Ile His Leu Ala Gln Leu Arg Asp Val Leu Arg Gln Lys 130 135 140 Leu Gly Glu Arg Phe Asp Gln Lys Ile Ile Asp Lys Thr Leu Ala Leu 145 150 155 160 Leu Ser Gly Lys Ser Val Asp Glu Ala Glu Lys Ile Ser Ala Asp Ala 165 170 175 Val Thr Pro Trp Val Val Gly Glu Ile Ala Trp Phe Cys Glu Gln Val 180 185 190 Ala Lys Ala Glu Ala Asp Asn Leu Asp Asp Lys Lys Leu Leu Lys Val 195 200 205 Leu Lys Glu Asp Ile Ala Ala Ile Arg Val Asn Leu Gln Gln Gly Val 210 215 220 Asp Ile Ala Leu Ser Gly Arg Met Ala Thr Ser Gly Met Met Thr Glu 225 230 235 240 Leu Gly Lys Val Asp Gly Ala Met Ser Ile Ala His Ala Ile Thr Thr 245 250 255 His Gln Val Asp Ser Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu 260 265 270 Gln Glu Gln Gly Ser Ala His Leu Gly Thr Gln Glu Phe Ser Ser Gly 275 280 285 Val Phe Tyr Arg Tyr Ala Asn Ile Asn Leu Ala Gln Leu Gln Glu Asn 290 295 300 Leu Gly Gly Ala Ser Arg Glu Gln Ala Leu Glu Ile Ala Thr His Val 305 310 315 320 Val His Met Leu Ala Thr Glu Val Pro Gly Ala Lys Gln Arg Thr Tyr 325 330 335 Ala Ala Phe Asn Pro Ala Asp Met Val Met Val Asn Phe Ser Asp Met 340 345 350 Pro Leu Ser Met Ala Asn Ala Phe Glu Lys Ala Val Lys Ala 355 360 365 <210> 579 <211> 366 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: cpCas7 V2 <400> 579 Met Asp Pro Ile Thr Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln 1 5 10 15 Leu Lys Ser Trp Val Arg Asn Asn Gly Glu Ala Gly Ser Met Ser Asn 20 25 30 Phe Ile Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn 35 40 45 Arg Asp Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg 50 55 60 Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser 65 70 75 80 Gly Tyr Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His 85 90 95 Leu Ala Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe 100 105 110 Asp Gln Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser 115 120 125 Val Asp Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val 130 135 140 Val Gly Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala 145 150 155 160 Asp Asn Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile 165 170 175 Ala Ala Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser 180 185 190 Gly Arg Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp 195 200 205 Gly Ala Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser 210 215 220 Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser 225 230 235 240 Ala His Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr 245 250 255 Ala Asn Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser 260 265 270 Arg Glu Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala 275 280 285 Thr Glu Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro 290 295 300 Ala Asp Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala 305 310 315 320 Asn Ala Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro 325 330 335 Ser Ile Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr 340 345 350 Gly Leu Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val 355 360 365 <210> 580 <211> 583 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Fok1 <400> 580 Met Phe Leu Ser Met Val Ser Lys Ile Arg Thr Phe Gly Trp Val Gln 1 5 10 15 Asn Pro Gly Lys Phe Glu Asn Leu Lys Arg Val Val Gln Val Phe Asp 20 25 30 Arg Asn Ser Lys Val His Asn Glu Val Lys Asn Ile Lys Ile Pro Thr 35 40 45 Leu Val Lys Glu Ser Lys Ile Gln Lys Glu Leu Val Ala Ile Met Asn 50 55 60 Gln His Asp Leu Ile Tyr Thr Tyr Lys Glu Leu Val Gly Thr Gly Thr 65 70 75 80 Ser Ile Arg Ser Glu Ala Pro Cys Asp Ala Ile Ile Gln Ala Thr Ile 85 90 95 Ala Asp Gln Gly Asn Lys Lys Gly Tyr Ile Asp Asn Trp Ser Ser Asp 100 105 110 Gly Phe Leu Arg Trp Ala His Ala Leu Gly Phe Ile Glu Tyr Ile Asn 115 120 125 Lys Ser Asp Ser Phe Val Ile Thr Asp Val Gly Leu Ala Tyr Ser Lys 130 135 140 Ser Ala Asp Gly Ser Ala Ile Glu Lys Glu Ile Leu Ile Glu Ala Ile 145 150 155 160 Ser Ser Tyr Pro Pro Ala Ile Arg Ile Leu Thr Leu Leu Glu Asp Gly 165 170 175 Gln His Leu Thr Lys Phe Asp Leu Gly Lys Asn Leu Gly Phe Ser Gly 180 185 190 Glu Ser Gly Phe Thr Ser Leu Pro Glu Gly Ile Leu Leu Asp Thr Leu 195 200 205 Ala Asn Ala Met Pro Lys Asp Lys Gly Glu Ile Arg Asn Asn Trp Glu 210 215 220 Gly Ser Ser Asp Lys Tyr Ala Arg Met Ile Gly Gly Trp Leu Asp Lys 225 230 235 240 Leu Gly Leu Val Lys Gln Gly Lys Lys Glu Phe Ile Ile Pro Thr Leu 245 250 255 Gly Lys Pro Asp Asn Lys Glu Phe Ile Ser His Ala Phe Lys Ile Thr 260 265 270 Gly Glu Gly Leu Lys Val Leu Arg Arg Ala Lys Gly Ser Thr Lys Phe 275 280 285 Thr Arg Val Pro Lys Arg Val Tyr Trp Glu Met Leu Ala Thr Asn Leu 290 295 300 Thr Asp Lys Glu Tyr Val Arg Thr Arg Arg Ala Leu Ile Leu Glu Ile 305 310 315 320 Leu Ile Lys Ala Gly Ser Leu Lys Ile Glu Gln Ile Gln Asp Asn Leu 325 330 335 Lys Lys Leu Gly Phe Asp Glu Val Ile Glu Thr Ile Glu Asn Asp Ile 340 345 350 Lys Gly Leu Ile Asn Thr Gly Ile Phe Ile Glu Ile Lys Gly Arg Phe 355 360 365 Tyr Gln Leu Lys Asp His Ile Leu Gln Phe Val Ile Pro Asn Arg Gly 370 375 380 Val Thr Lys Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu 385 390 395 400 Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile 405 410 415 Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val 420 425 430 Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly 435 440 445 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 450 455 460 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn 465 470 475 480 Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn 485 490 495 Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr 500 505 510 Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe 515 520 525 Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn 530 535 540 Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu 545 550 555 560 Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe 565 570 575 Asn Asn Gly Glu Ile Asn Phe 580 <210> 581 <211> 196 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Fok1 sharkey <400> 581 Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His 1 5 10 15 Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala 20 25 30 Arg Asn Pro Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe 35 40 45 Phe Met Lys Val Tyr Gly Tyr Arg Gly Glu His Leu Gly Gly Ser Arg 50 55 60 Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly 65 70 75 80 Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile 85 90 95 Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg 100 105 110 Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser 115 120 125 Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn 130 135 140 Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly 145 150 155 160 Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys 165 170 175 Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly 180 185 190 Glu Ile Asn Phe 195 <210> 582 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 582 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly 20 25 30 <210> 583 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Hexahistidine tag <400> 583 His His His His His His 1 5 <210> 584 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: MBP <400> 584 Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys Gly 1 5 10 15 Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr Gly 20 25 30 Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe Pro 35 40 45 Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala His 50 55 60 Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile Thr 65 70 75 80 Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp Ala 85 90 95 Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu Ala 100 105 110 Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys Thr 115 120 125 Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly Lys 130 135 140 Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro Leu 145 150 155 160 Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys Tyr 165 170 175 Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly Leu 180 185 190 Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp Thr 195 200 205 Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala Met 210 215 220 Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys Val 225 230 235 240 Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser Lys 245 250 255 Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro Asn 260 265 270 Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp Glu 275 280 285 Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala Leu 290 295 300 Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala Thr 305 310 315 320 Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln Met 325 330 335 Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala Ser 340 345 350 Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn 355 360 365 <210> 585 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: TEV <400> 585 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 586 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLS <400> 586 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 587 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: NLS-Fok1_Linker-Cas8 <400> 587 Ser Asn Met Pro Lys Lys Lys Arg Lys Val Gln Leu Val Lys Ser Glu 1 5 10 15 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 20 25 30 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Pro Thr Gln Asp 35 40 45 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 50 55 60 Tyr Arg Gly Glu His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 65 70 75 80 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 85 90 95 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 100 105 110 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 115 120 125 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 130 135 140 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 145 150 155 160 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 165 170 175 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 180 185 190 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ser Gly 195 200 205 Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Gly 210 215 220 Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly Met Asn Leu Leu 225 230 235 240 Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly Gly Lys Val Gln 245 250 255 Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp Gln Trp Arg Leu 260 265 270 Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu Ala Leu Leu Val 275 280 285 Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg 290 295 300 His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile 305 310 315 320 Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe 325 330 335 Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys 340 345 350 Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln 355 360 365 Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala Leu 370 375 380 Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe Lys Ser 385 390 395 400 Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg Gly Ile Asp 405 410 415 Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu Pro Arg Leu Gln 420 425 430 Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln Pro Thr Trp Ile 435 440 445 Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser Ser Ile Gly Phe 450 455 460 Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu Leu Cys Asp Pro 465 470 475 480 Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu Ser Asn Leu Arg 485 490 495 Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr Val Asn Gly Leu 500 505 510 Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val Lys Lys Gly Glu 515 520 525 Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr 530 535 540 Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly 545 550 555 560 Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln 565 570 575 Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser 580 585 590 Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln 595 600 605 Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly Tyr 610 615 620 Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly Phe Lys 625 630 635 640 Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu Thr Ala Glu 645 650 655 Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro Asp Val Leu Ala 660 665 670 Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala Asp Leu Arg Asp 675 680 685 Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln Ser Val Ala Pro 690 695 700 Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala Leu Ala Arg Ala 705 710 715 720 Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln Gly Gly Pro Ser 725 730 735 Asn Gly <210> 588 <211> 330 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: CasB-CasB <400> 588 Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln 1 5 10 15 Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp 20 25 30 Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly 35 40 45 Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys 50 55 60 Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu 65 70 75 80 Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg 85 90 95 Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala 100 105 110 Asp Met Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu 115 120 125 Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu 130 135 140 Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala 145 150 155 160 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ala Asp Glu Ile Asp 165 170 175 Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys 180 185 190 Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro 195 200 205 Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His 210 215 220 Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn 225 230 235 240 Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser 245 250 255 Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile 260 265 270 Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg 275 280 285 Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala 290 295 300 Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu 305 310 315 320 Asp Phe Val Leu Thr Thr Asn Lys Asn Ala 325 330 <210> 589 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 589 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 1 5 10 <210> 590 <211> 229 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: rAPOBEC1 <400> 590 Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg 1 5 10 15 Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu 20 25 30 Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His 35 40 45 Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val 50 55 60 Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr 65 70 75 80 Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys 85 90 95 Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu 100 105 110 Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg 115 120 125 Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met 130 135 140 Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser 145 150 155 160 Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg 165 170 175 Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys 180 185 190 Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile 195 200 205 Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp 210 215 220 Ala Thr Gly Leu Lys 225 <210> 591 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 591 Gly Gly Ser Gly Gly Ser Gly Gly Ser 1 5 <210> 592 <211> 568 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: rAPOBEC1_CasB-CasB <400> 592 Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg 1 5 10 15 Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu 20 25 30 Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His 35 40 45 Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val 50 55 60 Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr 65 70 75 80 Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys 85 90 95 Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu 100 105 110 Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg 115 120 125 Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met 130 135 140 Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser 145 150 155 160 Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg 165 170 175 Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys 180 185 190 Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile 195 200 205 Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp 210 215 220 Ala Thr Gly Leu Lys Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ala 225 230 235 240 Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp 245 250 255 Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu 260 265 270 Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu 275 280 285 Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser 290 295 300 Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr 305 310 315 320 Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn 325 330 335 Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met 340 345 350 Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp 355 360 365 Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln 370 375 380 Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala Ser Gly 385 390 395 400 Gly Ser Gly Gly Ser Gly Gly Ser Met Ala Asp Glu Ile Asp Ala Met 405 410 415 Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln 420 425 430 Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe 435 440 445 Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln 450 455 460 Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile 465 470 475 480 Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly 485 490 495 Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln 500 505 510 Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu 515 520 525 Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met 530 535 540 Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe 545 550 555 560 Val Leu Thr Thr Asn Lys Asn Ala 565 <210> 593 <211> 731 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas8_rAPOBEC1 <400> 593 Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly 1 5 10 15 Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp 20 25 30 Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 35 40 45 Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp 50 55 60 Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe 65 70 75 80 Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala 85 90 95 Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr 100 105 110 Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala 115 120 125 Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val 165 170 175 Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 180 185 190 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln 195 200 205 Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser 210 215 220 Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu 245 250 255 Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr 260 265 270 Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val 275 280 285 Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala 290 295 300 Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln 305 310 315 320 Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn 325 330 335 Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn 355 360 365 Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val 370 375 380 Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala 385 390 395 400 Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His 405 410 415 Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 420 425 430 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 435 440 445 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln 450 455 460 Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala 465 470 475 480 Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln 485 490 495 Gly Gly Pro Ser Asn Gly Met Ser Ser Glu Thr Gly Pro Val Ala Val 500 505 510 Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe 515 520 525 Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile 530 535 540 Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr 545 550 555 560 Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg 565 570 575 Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp 580 585 590 Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg 595 600 605 Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His 610 615 620 Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly 625 630 635 640 Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg 645 650 655 Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr 660 665 670 Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile 675 680 685 Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln 690 695 700 Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu 705 710 715 720 Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys 725 730 <210> 594 <211> 700 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas8_AID <400> 594 Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly 1 5 10 15 Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp 20 25 30 Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 35 40 45 Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp 50 55 60 Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe 65 70 75 80 Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala 85 90 95 Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr 100 105 110 Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala 115 120 125 Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val 165 170 175 Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 180 185 190 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln 195 200 205 Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser 210 215 220 Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu 245 250 255 Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr 260 265 270 Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val 275 280 285 Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala 290 295 300 Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln 305 310 315 320 Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn 325 330 335 Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn 355 360 365 Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val 370 375 380 Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala 385 390 395 400 Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His 405 410 415 Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 420 425 430 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 435 440 445 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln 450 455 460 Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala 465 470 475 480 Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln 485 490 495 Gly Gly Pro Ser Asn Gly Met Asp Ser Leu Leu Met Asn Arg Arg Lys 500 505 510 Phe Leu Tyr Gln Phe Lys Asn Val Arg Trp Ala Lys Gly Arg Arg Glu 515 520 525 Thr Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser Phe 530 535 540 Ser Leu Asp Phe Gly Tyr Leu Arg Asn Lys Asn Gly Cys His Val Glu 545 550 555 560 Leu Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg 565 570 575 Cys Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys 580 585 590 Ala Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu 595 600 605 Arg Ile Phe Thr Ala Arg Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu 610 615 620 Pro Glu Gly Leu Arg Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile 625 630 635 640 Met Thr Phe Lys Asp Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn 645 650 655 His Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val 660 665 670 Arg Leu Ser Arg Gln Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val 675 680 685 Asp Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu 690 695 700 <210> 595 <211> 710 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas8_PmCDA1 <400> 595 Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly 1 5 10 15 Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp 20 25 30 Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 35 40 45 Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp 50 55 60 Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe 65 70 75 80 Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala 85 90 95 Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr 100 105 110 Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala 115 120 125 Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val 165 170 175 Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 180 185 190 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln 195 200 205 Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser 210 215 220 Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu 245 250 255 Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr 260 265 270 Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val 275 280 285 Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala 290 295 300 Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln 305 310 315 320 Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn 325 330 335 Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn 355 360 365 Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val 370 375 380 Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala 385 390 395 400 Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His 405 410 415 Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 420 425 430 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 435 440 445 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln 450 455 460 Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala 465 470 475 480 Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln 485 490 495 Gly Gly Pro Ser Asn Gly Met Thr Asp Ala Glu Tyr Val Arg Ile His 500 505 510 Glu Lys Leu Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys 515 520 525 Lys Ser Val Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg 530 535 540 Gly Glu Arg Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln 545 550 555 560 Ser Gly Thr Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile Arg Lys 565 570 575 Val Glu Glu Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp 580 585 590 Tyr Ser Ser Trp Ser Pro Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu 595 600 605 Trp Tyr Asn Gln Glu Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp 610 615 620 Ala Cys Lys Leu Tyr Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu 625 630 635 640 Trp Asn Leu Arg Asp Asn Gly Val Gly Leu Asn Val Met Val Ser Glu 645 650 655 His Tyr Gln Cys Cys Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln 660 665 670 Leu Asn Glu Asn Arg Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys 675 680 685 Arg Arg Ser Glu Leu Ser Ile Met Ile Gln Val Lys Ile Leu His Thr 690 695 700 Thr Lys Ser Pro Ala Val 705 710 <210> 596 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas8_Human APOBEC1 <400> 596 Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly 1 5 10 15 Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp 20 25 30 Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 35 40 45 Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp 50 55 60 Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe 65 70 75 80 Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala 85 90 95 Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr 100 105 110 Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala 115 120 125 Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val 165 170 175 Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 180 185 190 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln 195 200 205 Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser 210 215 220 Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu 245 250 255 Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr 260 265 270 Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val 275 280 285 Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala 290 295 300 Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln 305 310 315 320 Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn 325 330 335 Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn 355 360 365 Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val 370 375 380 Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala 385 390 395 400 Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His 405 410 415 Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 420 425 430 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 435 440 445 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln 450 455 460 Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala 465 470 475 480 Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln 485 490 495 Gly Gly Pro Ser Asn Gly Met Thr Ser Glu Lys Gly Pro Ser Thr Gly 500 505 510 Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro Trp Glu Phe Asp Val Phe 515 520 525 Tyr Asp Pro Arg Glu Leu Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile 530 535 540 Lys Trp Gly Met Ser Arg Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr 545 550 555 560 Thr Asn His Val Glu Val Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg 565 570 575 Asp Phe His Pro Ser Met Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp 580 585 590 Ser Pro Cys Trp Glu Cys Ser Gln Ala Ile Arg Glu Phe Leu Ser Arg 595 600 605 His Pro Gly Val Thr Leu Val Ile Tyr Val Ala Arg Leu Phe Trp His 610 615 620 Met Asp Gln Gln Asn Arg Gln Gly Leu Arg Asp Leu Val Asn Ser Gly 625 630 635 640 Val Thr Ile Gln Ile Met Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg 645 650 655 Asn Phe Val Asn Tyr Pro Pro Gly Asp Glu Ala His Trp Pro Gln Tyr 660 665 670 Pro Pro Leu Trp Met Met Leu Tyr Ala Leu Glu Leu His Cys Ile Ile 675 680 685 Leu Ser Leu Pro Pro Cys Leu Lys Ile Ser Arg Arg Trp Gln Asn His 690 695 700 Leu Thr Phe Phe Arg Leu His Leu Gln Asn Cys His Tyr Gln Thr Ile 705 710 715 720 Pro Pro His Ile Leu Leu Ala Thr Gly Leu Ile His Pro Ser Val Ala 725 730 735 Trp Arg <210> 597 <211> 875 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas8_APOBEC3F <400> 597 Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly 1 5 10 15 Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp 20 25 30 Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 35 40 45 Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp 50 55 60 Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe 65 70 75 80 Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala 85 90 95 Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr 100 105 110 Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala 115 120 125 Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val 165 170 175 Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 180 185 190 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln 195 200 205 Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser 210 215 220 Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu 245 250 255 Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr 260 265 270 Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val 275 280 285 Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala 290 295 300 Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln 305 310 315 320 Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn 325 330 335 Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn 355 360 365 Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val 370 375 380 Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala 385 390 395 400 Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His 405 410 415 Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 420 425 430 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 435 440 445 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln 450 455 460 Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala 465 470 475 480 Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln 485 490 495 Gly Gly Pro Ser Asn Gly Met Lys Pro His Phe Arg Asn Thr Val Glu 500 505 510 Arg Met Tyr Arg Asp Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile 515 520 525 Leu Ser Arg Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys 530 535 540 Gly Pro Ser Arg Pro Arg Leu Asp Ala Lys Ile Phe Arg Gly Gln Val 545 550 555 560 Tyr Ser Gln Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe 565 570 575 Cys Gly Asn Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe 580 585 590 Val Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe 595 600 605 Leu Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu 610 615 620 Tyr Tyr Tyr Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser 625 630 635 640 Gln Ala Gly Ala Arg Val Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr 645 650 655 Cys Trp Glu Asn Phe Val Tyr Ser Glu Gly Gln Pro Phe Met Pro Trp 660 665 670 Tyr Lys Phe Asp Asp Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu 675 680 685 Ile Leu Arg Asn Pro Met Glu Ala Met Tyr Pro His Ile Phe Tyr Phe 690 695 700 His Phe Lys Asn Leu Arg Lys Ala Tyr Gly Arg Asn Glu Ser Trp Leu 705 710 715 720 Cys Phe Thr Met Glu Val Val Lys His His Ser Pro Val Ser Trp Lys 725 730 735 Arg Gly Val Phe Arg Asn Gln Val Asp Pro Glu Thr His Cys His Ala 740 745 750 Glu Arg Cys Phe Leu Ser Trp Phe Cys Asp Asp Ile Leu Ser Pro Asn 755 760 765 Thr Asn Tyr Glu Val Thr Trp Tyr Thr Ser Trp Ser Pro Cys Pro Glu 770 775 780 Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser Asn Val Asn 785 790 795 800 Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Trp Asp Thr Asp Tyr 805 810 815 Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Ala Ser Val Glu Ile 820 825 830 Met Gly Tyr Lys Asp Phe Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn 835 840 845 Asp Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu 850 855 860 Phe Leu Asp Ser Lys Leu Gln Glu Ile Leu Glu 865 870 875 <210> 598 <211> 886 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas8_APOBEC3G <400> 598 Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly 1 5 10 15 Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp 20 25 30 Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 35 40 45 Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp 50 55 60 Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe 65 70 75 80 Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala 85 90 95 Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr 100 105 110 Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala 115 120 125 Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr 130 135 140 Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly 145 150 155 160 Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val 165 170 175 Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 180 185 190 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln 195 200 205 Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser 210 215 220 Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu 225 230 235 240 Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu 245 250 255 Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr 260 265 270 Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val 275 280 285 Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala 290 295 300 Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln 305 310 315 320 Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn 325 330 335 Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn 340 345 350 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn 355 360 365 Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val 370 375 380 Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala 385 390 395 400 Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His 405 410 415 Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 420 425 430 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 435 440 445 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln 450 455 460 Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala 465 470 475 480 Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln 485 490 495 Gly Gly Pro Ser Asn Gly Met Lys Pro His Phe Arg Asn Thr Val Glu 500 505 510 Arg Met Tyr Arg Asp Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile 515 520 525 Leu Ser Arg Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys 530 535 540 Gly Pro Ser Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val 545 550 555 560 Tyr Ser Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe 565 570 575 Ser Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp 580 585 590 Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala Thr 595 600 605 Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val Ala Arg 610 615 620 Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu 625 630 635 640 Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys Ile Met Asn Tyr 645 650 655 Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu 660 665 670 Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His 675 680 685 Ile Met Leu Gly Glu Ile Leu Arg His Ser Met Asp Pro Pro Thr Phe 690 695 700 Thr Phe Asn Phe Asn Asn Glu Pro Trp Val Arg Gly Arg His Glu Thr 705 710 715 720 Tyr Leu Cys Tyr Glu Val Glu Arg Met His Asn Asp Thr Trp Val Leu 725 730 735 Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn Gln Ala Pro His Lys His 740 745 750 Gly Phe Leu Glu Gly Arg His Ala Glu Leu Cys Phe Leu Asp Val Ile 755 760 765 Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe 770 775 780 Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Met Ala Lys Phe 785 790 795 800 Ile Ser Lys Asn Lys His Val Ser Leu Cys Ile Phe Thr Ala Arg Ile 805 810 815 Tyr Asp Asp Gln Gly Arg Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu 820 825 830 Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr Ser Glu Phe Lys His Cys 835 840 845 Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp Asp 850 855 860 Gly Leu Asp Glu His Ser Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile 865 870 875 880 Leu Gln Asn Gln Glu Asn 885 <210> 599 <211> 157 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: PvuIIHIFIT46G <400> 599 Met Ser His Pro Asp Leu Asn Lys Leu Leu Glu Leu Trp Pro His Ile 1 5 10 15 Gln Glu Tyr Gln Asp Leu Ala Leu Lys His Gly Ile Asn Asp Ile Phe 20 25 30 Gln Asp Asn Gly Gly Lys Leu Leu Gln Val Leu Leu Ile Gly Gly Leu 35 40 45 Thr Val Leu Pro Gly Arg Glu Gly Asn Asp Ala Val Asp Asn Ala Gly 50 55 60 Gln Glu Tyr Glu Leu Lys Ser Ile Asn Ile Asp Leu Thr Lys Gly Phe 65 70 75 80 Ser Thr His His His Met Asn Pro Val Ile Ile Ala Lys Tyr Arg Gln 85 90 95 Val Pro Trp Ile Phe Ala Ile Tyr Arg Gly Ile Ala Ile Glu Ala Ile 100 105 110 Tyr Arg Leu Glu Pro Lys Asp Leu Glu Phe Tyr Tyr Asp Lys Trp Glu 115 120 125 Arg Lys Trp Tyr Ser Asp Gly His Lys Asp Ile Asn Asn Pro Lys Ile 130 135 140 Pro Val Lys Tyr Val Met Glu His Gly Thr Lys Ile Tyr 145 150 155 <210> 600 <211> 316 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: PvuIIsinglechainT46G <400> 600 Ser His Pro Asp Leu Asn Lys Leu Leu Glu Leu Trp Pro His Ile Gln 1 5 10 15 Glu Tyr Gln Asp Leu Ala Leu Lys His Gly Ile Asn Asp Ile Phe Gln 20 25 30 Asp Asn Gly Gly Lys Leu Leu Gln Val Leu Leu Ile Gly Gly Leu Thr 35 40 45 Val Leu Pro Gly Arg Glu Gly Asn Asp Ala Val Asp Asn Ala Gly Gln 50 55 60 Glu Tyr Glu Leu Lys Ser Ile Asn Ile Asp Leu Thr Lys Gly Phe Ser 65 70 75 80 Thr His His His Met Asn Pro Val Ile Ile Ala Lys Tyr Arg Gln Val 85 90 95 Pro Trp Ile Phe Ala Ile Tyr Arg Gly Ile Ala Ile Glu Ala Ile Tyr 100 105 110 Arg Leu Glu Pro Lys Asp Leu Glu Phe Tyr Tyr Asp Lys Trp Glu Arg 115 120 125 Lys Trp Tyr Ser Asp Gly His Lys Asp Ile Asn Asn Pro Lys Ile Pro 130 135 140 Val Lys Tyr Val Met Glu His Gly Thr Lys Ile Tyr Gly Ser Gly Gly 145 150 155 160 Ser His Pro Asp Leu Asn Lys Leu Leu Glu Leu Trp Pro His Ile Gln 165 170 175 Glu Tyr Gln Asp Leu Ala Leu Lys His Gly Ile Asn Asp Ile Phe Gln 180 185 190 Asp Asn Gly Gly Lys Leu Leu Gln Val Leu Leu Ile Gly Gly Leu Thr 195 200 205 Val Leu Pro Gly Arg Glu Gly Asn Asp Ala Val Asp Asn Ala Gly Gln 210 215 220 Glu Tyr Glu Leu Lys Ser Ile Asn Ile Asp Leu Thr Lys Gly Phe Ser 225 230 235 240 Thr His His His Met Asn Pro Val Ile Ile Ala Lys Tyr Arg Gln Val 245 250 255 Pro Trp Ile Phe Ala Ile Tyr Arg Gly Ile Ala Ile Glu Ala Ile Tyr 260 265 270 Arg Leu Glu Pro Lys Asp Leu Glu Phe Tyr Tyr Asp Lys Trp Glu Arg 275 280 285 Lys Trp Tyr Ser Asp Gly His Lys Asp Ile Asn Asn Pro Lys Ile Pro 290 295 300 Val Lys Tyr Val Met Glu His Gly Thr Lys Ile Tyr 305 310 315 <210> 601 <211> 169 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: I-TevI1-169Q158R <400> 601 Met Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys Val 1 5 10 15 Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His Phe 20 25 30 Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg Ser 35 40 45 Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu Ile 50 55 60 Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile Lys 65 70 75 80 Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr Phe 85 90 95 Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys Lys 100 105 110 Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp Gly 115 120 125 Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp Asn 130 135 140 Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr Ser 145 150 155 160 Ala Tyr Thr Cys Ser Lys Cys Arg Asn 165 <210> 602 <211> 169 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: I-TevI1-169 <400> 602 Met Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys Val 1 5 10 15 Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His Phe 20 25 30 Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg Ser 35 40 45 Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu Ile 50 55 60 Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile Lys 65 70 75 80 Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr Phe 85 90 95 Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys Lys 100 105 110 Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp Gly 115 120 125 Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp Asn 130 135 140 Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr Ser 145 150 155 160 Ala Tyr Thr Cys Ser Lys Cys Arg Asn 165 <210> 603 <211> 238 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: BcnI singlechain <400> 603 Met Lys Ile Trp Ser Lys Glu Glu Val Val Asn Lys Leu His Glu Ile 1 5 10 15 Lys Asn Lys Gly Tyr Leu Ser Val Pro Thr Asp Met Phe Arg Thr Asp 20 25 30 Asp Gly Val Val Gly Gln Ile Leu Glu Arg Gln Phe Gly Val Gln Glu 35 40 45 Asn Asn Ile Thr Leu Gly Asp Leu Gly Glu Phe Glu Leu Lys Gly Met 50 55 60 Arg Asn Arg Lys Ala Lys Ser Asn Leu Thr Leu Phe His Lys Lys Pro 65 70 75 80 Val Ala Gly Gln Thr Val Ile Gln Ile Phe Asn Arg Phe Gly Tyr Val 85 90 95 Lys Pro Ser Ser Arg Asn Pro Glu Val Met Lys Lys Lys Leu Phe Thr 100 105 110 Thr Ile Lys Gly Gly Arg Leu Asn Asn Leu Gly Leu Thr Leu Asn Ala 115 120 125 Lys His Ala Ser Glu Ile Asn Leu Tyr Tyr Gln Asp Glu Tyr Leu Ser 130 135 140 Thr Trp Asp Leu Asn Leu Ser Lys Ile Glu Lys Leu Val Leu Val Phe 145 150 155 160 Ala Glu Thr Ile Gly Arg Ala Asn Ser Pro Glu Glu Gln Phe His Phe 165 170 175 Thr Lys Ala Tyr Met Leu Thr Glu Ile Asn Asp Ile Thr Ser Leu Ile 180 185 190 Asn Asp Gly Val Leu Val Met Asp Leu Cys Ile Asp Gln Asp Leu Ser 195 200 205 Lys Ser Lys Gly Pro His Asp Arg Gly Pro His Leu Arg Ile Pro Ile 210 215 220 Ser Lys Leu Asp Lys Leu Tyr Arg Asn Ile Glu Arg Leu Leu 225 230 235 <210> 604 <211> 249 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: MvaI singlechain <400> 604 Met Lys Ser Met Ser Glu Tyr Leu Asn Leu Leu Lys Glu Ala Ile Gln 1 5 10 15 Asn Val Val Asp Gly Gly Trp His Glu Thr Lys Arg Lys Gly Asn Thr 20 25 30 Gly Ile Gly Lys Thr Phe Glu Asp Leu Leu Glu Lys Glu Glu Asp Asn 35 40 45 Leu Asp Ala Pro Asp Phe His Asp Ile Glu Ile Lys Thr His Glu Thr 50 55 60 Ala Ala Lys Ser Leu Leu Thr Leu Phe Thr Lys Ser Pro Thr Asn Pro 65 70 75 80 Arg Gly Ala Asn Thr Met Leu Arg Asn Arg Tyr Gly Lys Lys Asp Glu 85 90 95 Tyr Gly Asn Asn Ile Leu His Gln Thr Val Ser Gly Asn Arg Lys Thr 100 105 110 Asn Ser Asn Ser Tyr Asn Tyr Asp Phe Lys Ile Asp Ile Asp Trp Glu 115 120 125 Ser Gln Val Val Arg Leu Glu Val Phe Asp Lys Gln Asp Ile Met Ile 130 135 140 Asp Asn Ser Val Tyr Trp Ser Phe Asp Ser Leu Gln Asn Gln Leu Asp 145 150 155 160 Lys Lys Leu Lys Tyr Ile Ala Val Ile Ser Ala Glu Ser Lys Ile Glu 165 170 175 Asn Glu Lys Lys Tyr Tyr Lys Tyr Asn Ser Ala Asn Leu Phe Thr Asp 180 185 190 Leu Thr Val Gln Ser Leu Cys Arg Gly Ile Glu Asn Gly Asp Ile Lys 195 200 205 Val Asp Ile Arg Ile Gly Ala Tyr His Ser Gly Lys Lys Lys Gly Lys 210 215 220 Thr His Asp His Gly Thr Ala Phe Arg Ile Asn Met Glu Lys Leu Leu 225 230 235 240 Glu Tyr Gly Glu Val Lys Val Ile Val 245 <210> 605 <211> 260 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: DNaseI <400> 605 Leu Lys Ile Ala Ala Phe Asn Ile Gln Thr Phe Gly Glu Thr Lys Met 1 5 10 15 Ser Asn Ala Thr Leu Val Ser Tyr Ile Val Gln Ile Leu Ser Arg Tyr 20 25 30 Asp Ile Ala Leu Val Gln Glu Val Arg Asp Ser His Leu Thr Ala Val 35 40 45 Gly Lys Leu Leu Asp Asn Leu Asn Gln Asp Ala Pro Asp Thr Tyr His 50 55 60 Tyr Val Val Ser Glu Pro Leu Gly Arg Asn Ser Tyr Lys Glu Arg Tyr 65 70 75 80 Leu Phe Val Tyr Arg Pro Asp Gln Val Ser Ala Val Asp Ser Tyr Tyr 85 90 95 Tyr Asp Asp Gly Cys Glu Pro Cys Gly Asn Asp Thr Phe Asn Arg Glu 100 105 110 Pro Ala Ile Val Arg Phe Phe Ser Arg Phe Thr Glu Val Arg Glu Phe 115 120 125 Ala Ile Val Pro Leu His Ala Ala Pro Gly Asp Ala Val Ala Glu Ile 130 135 140 Asp Ala Leu Tyr Asp Val Tyr Leu Asp Val Gln Glu Lys Trp Gly Leu 145 150 155 160 Glu Asp Val Met Leu Met Gly Asp Phe Asn Ala Gly Cys Ser Tyr Val 165 170 175 Arg Pro Ser Gln Trp Ser Ser Ile Arg Leu Trp Thr Ser Pro Thr Phe 180 185 190 Gln Trp Leu Ile Pro Asp Ser Ala Asp Thr Thr Ala Thr Pro Thr His 195 200 205 Cys Ala Tyr Asp Arg Ile Val Val Ala Gly Met Leu Leu Arg Gly Ala 210 215 220 Val Val Pro Asp Ser Ala Leu Pro Phe Asn Phe Gln Ala Ala Tyr Gly 225 230 235 240 Leu Ser Asp Gln Leu Ala Gln Ala Ile Ser Asp His Tyr Pro Val Glu 245 250 255 Val Met Leu Lys 260 <210> 606 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 <400> 606 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 607 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: S1Aspergillus <400> 607 Trp Gly Asn Leu Gly His Glu Thr Val Ala Tyr Ile Ala Gln Ser Phe 1 5 10 15 Val Ala Ser Ser Thr Glu Ser Phe Cys Gln Asn Ile Leu Gly Asp Asp 20 25 30 Ser Thr Ser Tyr Leu Ala Asn Val Ala Thr Trp Ala Asp Thr Tyr Lys 35 40 45 Tyr Thr Asp Ala Gly Glu Phe Ser Lys Pro Tyr His Phe Ile Asp Ala 50 55 60 Gln Asp Asn Pro Pro Gln Ser Cys Gly Val Asp Tyr Asp Arg Asp Cys 65 70 75 80 Gly Ser Ala Gly Cys Ser Ile Ser Ala Ile Gln Asn Tyr Thr Asn Ile 85 90 95 Leu Leu Glu Ser Pro Asn Gly Ser Glu Ala Leu Asn Ala Leu Lys Phe 100 105 110 Val Val His Ile Ile Gly Asp Ile His Gln Pro Leu His Asp Glu Asn 115 120 125 Leu Glu Ala Gly Gly Asn Gly Ile Asp Val Thr Tyr Asp Gly Glu Thr 130 135 140 Thr Asn Leu His His Ile Trp Asp Thr Asn Met Pro Glu Glu Ala Ala 145 150 155 160 Gly Gly Tyr Ser Leu Ser Val Ala Lys Thr Tyr Ala Asp Leu Leu Thr 165 170 175 Glu Arg Ile Lys Thr Gly Thr Tyr Ser Ser Lys Lys Asp Ser Trp Thr 180 185 190 Asp Gly Ile Asp Ile Lys Asp Pro Val Ser Thr Ser Met Ile Trp Ala 195 200 205 Ala Asp Ala Asn Thr Tyr Val Cys Ser Thr Val Leu Asp Asp Gly Leu 210 215 220 Ala Tyr Ile Asn Ser Thr Asp Leu Ser Gly Glu Tyr Tyr Asp Lys Ser 225 230 235 240 Gln Pro Val Phe Glu Glu Leu Ile Ala Lys Ala Gly Tyr Arg Leu Ala 245 250 255 Ala Trp Leu Asp Leu Ile Ala Ser Gln Pro Ser 260 265 <210> 608 <211> 568 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: rAPOBEC1 <400> 608 Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg 1 5 10 15 Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu 20 25 30 Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His 35 40 45 Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val 50 55 60 Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr 65 70 75 80 Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys 85 90 95 Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu 100 105 110 Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg 115 120 125 Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met 130 135 140 Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser 145 150 155 160 Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg 165 170 175 Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys 180 185 190 Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile 195 200 205 Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp 210 215 220 Ala Thr Gly Leu Lys Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ala 225 230 235 240 Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp 245 250 255 Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu 260 265 270 Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu 275 280 285 Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser 290 295 300 Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr 305 310 315 320 Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn 325 330 335 Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met 340 345 350 Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp 355 360 365 Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln 370 375 380 Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala Ser Gly 385 390 395 400 Gly Ser Gly Gly Ser Gly Gly Ser Met Ala Asp Glu Ile Asp Ala Met 405 410 415 Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln 420 425 430 Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe 435 440 445 Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln 450 455 460 Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile 465 470 475 480 Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly 485 490 495 Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln 500 505 510 Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu 515 520 525 Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met 530 535 540 Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe 545 550 555 560 Val Leu Thr Thr Asn Lys Asn Ala 565 <210> 609 <211> 537 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: AID <400> 609 Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln 1 5 10 15 Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp 20 25 30 Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly 35 40 45 Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys 50 55 60 Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu 65 70 75 80 Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg 85 90 95 Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala 100 105 110 Asp Met Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu 115 120 125 Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu 130 135 140 Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala 145 150 155 160 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ala Asp Glu Ile Asp 165 170 175 Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys 180 185 190 Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro 195 200 205 Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His 210 215 220 Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn 225 230 235 240 Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser 245 250 255 Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile 260 265 270 Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg 275 280 285 Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala 290 295 300 Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu 305 310 315 320 Asp Phe Val Leu Thr Thr Asn Lys Asn Ala Gly Gly Ser Gly Gly Ser 325 330 335 Gly Gly Ser Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr 340 345 350 Gln Phe Lys Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu 355 360 365 Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp 370 375 380 Phe Gly Tyr Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe 385 390 395 400 Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg 405 410 415 Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His 420 425 430 Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe 435 440 445 Thr Ala Arg Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly 450 455 460 Leu Arg Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe 465 470 475 480 Lys Asp Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg 485 490 495 Thr Phe Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser 500 505 510 Arg Gln Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu 515 520 525 Arg Asp Ala Phe Arg Thr Leu Gly Leu 530 535 <210> 610 <211> 547 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: CPmCDA1 <400> 610 Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln 1 5 10 15 Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp 20 25 30 Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly 35 40 45 Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys 50 55 60 Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu 65 70 75 80 Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg 85 90 95 Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala 100 105 110 Asp Met Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu 115 120 125 Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu 130 135 140 Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala 145 150 155 160 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ala Asp Glu Ile Asp 165 170 175 Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys 180 185 190 Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro 195 200 205 Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His 210 215 220 Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn 225 230 235 240 Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser 245 250 255 Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile 260 265 270 Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg 275 280 285 Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala 290 295 300 Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu 305 310 315 320 Asp Phe Val Leu Thr Thr Asn Lys Asn Ala Gly Gly Ser Gly Gly Ser 325 330 335 Gly Gly Ser Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu 340 345 350 Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val 355 360 365 Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg 370 375 380 Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr 385 390 395 400 Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu 405 410 415 Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser 420 425 430 Trp Ser Pro Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn 435 440 445 Gln Glu Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys 450 455 460 Leu Tyr Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu 465 470 475 480 Arg Asp Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln 485 490 495 Cys Cys Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu 500 505 510 Asn Arg Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser 515 520 525 Glu Leu Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser 530 535 540 Pro Ala Val 545 <210> 611 <211> 575 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Human APOBEC1 <400> 611 Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg 1 5 10 15 Arg Ile Glu Pro Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu 20 25 30 Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg 35 40 45 Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val 50 55 60 Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Asp Phe His Pro Ser Met 65 70 75 80 Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys 85 90 95 Ser Gln Ala Ile Arg Glu Phe Leu Ser Arg His Pro Gly Val Thr Leu 100 105 110 Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Gln Asn Arg 115 120 125 Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met 130 135 140 Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro 145 150 155 160 Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met 165 170 175 Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys 180 185 190 Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Thr Phe Phe Arg Leu 195 200 205 His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu 210 215 220 Ala Thr Gly Leu Ile His Pro Ser Val Ala Trp Arg Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Gly Ser Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 245 250 255 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 260 265 270 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 275 280 285 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 290 295 300 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 305 310 315 320 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 325 330 335 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 340 345 350 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 355 360 365 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 370 375 380 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 385 390 395 400 Thr Asn Lys Asn Ala Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met 405 410 415 Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu 420 425 430 Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu 435 440 445 Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp 450 455 460 Glu Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu 465 470 475 480 Ser Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln 485 490 495 Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile 500 505 510 Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp 515 520 525 Met Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp 530 535 540 Trp Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg 545 550 555 560 Gln Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala 565 570 575 <210> 612 <211> 712 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Human APOBEC3F <400> 612 Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr 1 5 10 15 Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr 20 25 30 Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Arg 35 40 45 Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Gln Pro Glu His 50 55 60 His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro 65 70 75 80 Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro Cys 85 90 95 Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu His Pro Asn 100 105 110 Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu Arg 115 120 125 Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg Val 130 135 140 Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe Val 145 150 155 160 Tyr Ser Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn 165 170 175 Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met 180 185 190 Glu Ala Met Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Arg 195 200 205 Lys Ala Tyr Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val 210 215 220 Val Lys His His Ser Pro Val Ser Trp Lys Arg Gly Val Phe Arg Asn 225 230 235 240 Gln Val Asp Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser 245 250 255 Trp Phe Cys Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr 260 265 270 Trp Tyr Thr Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala 275 280 285 Glu Phe Leu Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala 290 295 300 Arg Leu Tyr Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Arg Ser 305 310 315 320 Leu Ser Gln Glu Gly Ala Ser Val Glu Ile Met Gly Tyr Lys Asp Phe 325 330 335 Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn Asp Asp Glu Pro Phe Lys 340 345 350 Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu Phe Leu Asp Ser Lys Leu 355 360 365 Gln Glu Ile Leu Glu Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ala 370 375 380 Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp 385 390 395 400 Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu 405 410 415 Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu 420 425 430 Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser 435 440 445 Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr 450 455 460 Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn 465 470 475 480 Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met 485 490 495 Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp 500 505 510 Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln 515 520 525 Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala Ser Gly 530 535 540 Gly Ser Gly Gly Ser Gly Gly Ser Met Ala Asp Glu Ile Asp Ala Met 545 550 555 560 Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln 565 570 575 Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe 580 585 590 Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln 595 600 605 Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile 610 615 620 Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly 625 630 635 640 Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln 645 650 655 Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu 660 665 670 Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met 675 680 685 Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe 690 695 700 Val Leu Thr Thr Asn Lys Asn Ala 705 710 <210> 613 <211> 723 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: APOBEC3G <400> 613 Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr 1 5 10 15 Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr 20 25 30 Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro 35 40 45 Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr 50 55 60 His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu 65 70 75 80 His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro 85 90 95 Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro 100 105 110 Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp 115 120 125 Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly 130 135 140 Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys 145 150 155 160 Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn 165 170 175 Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile 180 185 190 Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn 195 200 205 Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val 210 215 220 Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly 225 230 235 240 Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg 245 250 255 His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp 260 265 270 Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys 275 280 285 Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His 290 295 300 Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg 305 310 315 320 Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser 325 330 335 Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp 340 345 350 His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser 355 360 365 Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn 370 375 380 Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ala Asp Glu Ile Asp Ala 385 390 395 400 Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala 405 410 415 Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala 420 425 430 Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln 435 440 445 Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val 450 455 460 Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu 465 470 475 480 Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe 485 490 495 Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg 500 505 510 Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg 515 520 525 Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp 530 535 540 Phe Val Leu Thr Thr Asn Lys Asn Ala Ser Gly Gly Ser Gly Gly Ser 545 550 555 560 Gly Gly Ser Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala 565 570 575 Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser 580 585 590 Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln 595 600 605 Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met 610 615 620 Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys 625 630 635 640 Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn 645 650 655 Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp 660 665 670 Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu 675 680 685 Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly 690 695 700 Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn 705 710 715 720 Lys Asn Ala <210> 614 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: VP16 <400> 614 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 1 5 10 <210> 615 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: VP64 <400> 615 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 1 5 10 15 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 20 25 30 Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp 35 40 45 Met Leu 50 <210> 616 <211> 366 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: cpCas7 V2 <400> 616 Met Asp Pro Ile Thr Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln 1 5 10 15 Leu Lys Ser Trp Val Arg Asn Asn Gly Glu Ala Gly Ser Met Ser Asn 20 25 30 Phe Ile Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn 35 40 45 Arg Asp Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg 50 55 60 Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser 65 70 75 80 Gly Tyr Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His 85 90 95 Leu Ala Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe 100 105 110 Asp Gln Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser 115 120 125 Val Asp Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val 130 135 140 Val Gly Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala 145 150 155 160 Asp Asn Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile 165 170 175 Ala Ala Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser 180 185 190 Gly Arg Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp 195 200 205 Gly Ala Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser 210 215 220 Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser 225 230 235 240 Ala His Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr 245 250 255 Ala Asn Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser 260 265 270 Arg Glu Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala 275 280 285 Thr Glu Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro 290 295 300 Ala Asp Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala 305 310 315 320 Asn Ala Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro 325 330 335 Ser Ile Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr 340 345 350 Gly Leu Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val 355 360 365 <210> 617 <211> 92 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: tracrRNA (RNA) <400> 617 agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60 gugcuuaagu ucacugccgu auaggcagcu uu 92 <210> 618 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: tracrRNA (DNA) <400> 618 agcatagcaa gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg 60 gtgcttaagt tcactgccgt ataggcagct tt 92 <210> 619 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic: CXCR4 targeting spacer (RNA) <400> 619 gaaccagcgg uuaccaugga guuuuagagc uaugcu 36 <210> 620 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CXCR4 targeting spacer (DNA) <400> 620 gaaccagcgg ttaccatgga gttttagagc tatgct 36 <210> 621 <211> 918 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(918) <223> Cas1 <400> 621 atgacctggc ttccccttaa tcccattcca ctcaaagatc gcgtctccat gatctttctg 60 caatatgggc agatcgatgt aatagatggc gcgtttgtac ttatcgacaa gacagggatc 120 cgcactcata ttcctgttgg ctcggttgcc tgcatcatgc tggaacctgg tacacgggtt 180 tcgcatgcag ctgtacgcct ggctgcgcaa gttggaacat tgttggtatg ggtgggggaa 240 gcgggcgttc gtgtttatgc ttctggtcag cctggaggtg cgcgttcaga taagctgctc 300 tatcaggcaa aacttgctct ggatgaagat ttgcgtctga aggtcgtacg taaaatgttt 360 gaacttcggt ttggagaacc tgcgcctgcc cggcgctccg tagagcaact cagaggtata 420 gaaggcagtc gcgtgcgggc aacctacgca cttctggcga agcaatacgg cgtgacatgg 480 aatggacgtc gctacgatcc gaaagactgg gaaaagggcg atacgatcaa ccaatgcatt 540 agcgctgcaa cttcctgttt atacggcgta actgaagcgg cgatacttgc agctggttat 600 gcaccagcta ttgggtttgt gcatacagga aagcctcttt cctttgttta cgatattgca 660 gacatcatta aatttgacac tgttgtaccg aaagcttttg agatagcgcg tcgtaaccct 720 ggtgagccgg accgggaagt ccgtttggcg tgcagggata tttttcgcag tagtaaaaca 780 ttagccaaat tgattccgct tatagaggac gtgcttgccg ctggagaaat acaaccgccg 840 gccccacctg aagatgcaca gcctgttgcc attccgcttc ctgtttcact gggagatgca 900 ggccatcgga gtagctga 918 <210> 622 <211> 1092 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(1092) <223> Cas7 <400> 622 atgtctaact ttatcaatat tcatgttctg atctctcaca gcccttcatg tctgaaccgc 60 gacgatatga acatgcagaa agacgctatt ttcggcggca aaagacgagt aagaatttca 120 agtcaaagcc ttaaacgtgc gatgcgtaaa agtggttatt acgcacaaaa tattggtgaa 180 tccagtctca gaaccattca tcttgcacaa ttacgtgatg ttcttcggca aaaacttggt 240 gaacgttttg accaaaaaat catcgataag acattagcgc tgctctccgg taaatcagtt 300 gatgaagccg aaaagatttc tgccgatgcg gttactccct gggttgtggg agaaatagcc 360 tggttctgtg agcaggttgc aaaagcagag gctgataatc tggatgataa aaagctgctc 420 aaagttctta aggaagatat tgccgccata cgtgtgaatt tacagcaggg tgttgatatt 480 gcgcttagtg gaagaatggc aaccagcggc atgatgactg agttgggaaa agttgatggt 540 gcaatgtcca ttgcgcatgc gatcactact catcaggttg attctgatat tgactggttc 600 accgctgtag atgatttaca ggaacaaggt tctgcacatc tgggaactca ggaattttca 660 tcgggtgttt tttatcgtta tgccaacatt aacctcgctc aacttcagga aaatttaggt 720 ggtgcctcca gggagcaggc tctggaaatt gcaacccatg ttgttcatat gctggcaaca 780 gaggtccctg gagcaaaaca gcgtacttat gccgctttta accctgcgga tatggtaatg 840 gttaatttct ccgatatgcc actttctatg gcaaatgctt ttgaaaaagc ggttaaagcg 900 aaagatggct ttttgcaacc gtctatacag gcgtttaatc aatattggga tcgcgttgcc 960 aatggatatg gtctgaacgg agctgctgcg caattcagct tatctgatgt agacccaatt 1020 actgctcaag ttaaacaaat gcctacttta gaacagttaa aatcctgggt tcgtaataat 1080 ggcgaggcgt ga 1092 <210> 623 <211> 675 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(675) <223> Cas5 <400> 623 atgcgtagct atctgattct gcgtctggca ggtccgatgc aggcatgggg tcagccgaca 60 tttgaaggta cacgtccgac aggtcgtttt ccgacacgta gtggtctgct gggtctgctg 120 ggtgcatgtc tgggtattca gcgtgatgat accagcagtc tgcaggcact gagcgaaagc 180 gtgcagtttg cagttcgttg tgatgaactg attctggatg atcgtcgtgt tagcgtgacc 240 ggtctgcgtg attatcatac cgttctgggt gcacgtgaag attatcgtgg tctgaaaagc 300 catgaaacca ttcagacctg gcgtgaatat ctgtgtgatg caagttttac cgttgcactg 360 tggctgaccc cgcatgcaac aatggttatt agcgaactgg aaaaagcagt tctgaaaccg 420 cgttataccc cgtatctggg tcgtcgtagc tgtccgctga cccatccgct gtttctgggt 480 acatgtcagg caagcgatcc gcagaaagca ctgctgaatt atgaaccggt tggtggtgat 540 atttatagcg aagaaagcgt taccggtcat catctgaaat ttaccgcacg tgatgaaccg 600 atgattaccc tgccgcgtca gtttgcaagc cgtgaatggt atgttattaa aggtggtatg 660 gatgttagcc agtaa 675 <210> 624 <211> 2667 <212> DNA <213> Escherichia coli K-12 MG1655 <220> <221> misc_feature <222> (1)..(2667) <223> Cas3 <400> 624 atggaacctt ttaaatatat atgccattac tggggaaaat cctcaaaaag cttgacgaaa 60 ggaaatgata ttcatctgtt aatttatcat tgccttgatg ttgctgctgt tgcagattgc 120 tggtgggatc aatcagtcgt actgcaaaat actttttgcc gaaatgaaat gctatcaaaa 180 cagagggtga aggcctggct gttatttttc attgctcttc atgatattgg aaagtttgat 240 atacgattcc aatataaatc agcagaaagt tggctgaaat taaatcctgc aacgccatca 300 cttaatggtc catcaacaca aatgtgccgt aaatttaatc atggtgcagc cggtctgtat 360 tggtttaacc aggattcact ttcagagcaa tctctcgggg attttttcag tttttttgat 420 gccgctcctc atccttatga gtcctggttt ccatgggtag aggccgttac aggacatcat 480 ggttttatct tacattccca ggatcaagat aagtcgcgtt gggaaatgcc agcttctctg 540 gcatcttatg ctgcgcaaga taaacaggct cgtgaggagt ggatatctgt actggaagca 600 ttatttttaa cgccagcggg gttatctata aacgatatac cacctgattg ttcatcactg 660 ttagcaggtt tttgctcgct tgctgactgg ttaggctcct ggactacaac gaataccttt 720 ctgtttaatg aggatgcgcc ttccgacata aatgctctga gaacgtattt ccaggaccga 780 cagcaggatg cgagccgggt attggagttg agtggacttg tatcaaataa gcgatgttat 840 gaaggtgttc atgcactact ggacaatggc tatcaaccca gacaattaca ggtgttagtt 900 gatgctcttc cagtagctcc cgggctgacg gtaatagagg cacctacagg ctccggtaaa 960 acggaaacag cgctggccta tgcttggaaa cttattgatc aacaaattgc ggatagtgtt 1020 atttttgccc tcccaacaca agctaccgcg aatgctatgc ttacgagaat ggaagcgagc 1080 gcgagccact tattttcatc cccaaatctt attcttgctc atggcaattc acggtttaac 1140 cacctctttc aatcaataaa atcacgcgcg attactgaac aggggcaaga agaagcgtgg 1200 gttcagtgtt gtcagtggtt gtcacaaagc aataagaaag tgtttcttgg gcaaatcggc 1260 gtttgcacga ttgatcaggt gttgatatcg gtattgccag ttaaacaccg ctttatccgt 1320 ggtttgggaa ttggtcgaag tgttttaatt gttgatgaag ttcatgctta cgacacctat 1380 atgaacggct tgctggaggc agtgctcaag gctcaggctg atgtgggagg gagtgttatt 1440 cttctttccg caaccctacc aatgaaacaa aaacagaaac ttctggatac ttatggtctg 1500 catacagatc cagtggaaaa taactccgca tatccactca ttaactggcg aggtgtgaat 1560 ggtgcgcaac gttttgatct gctagctcat ccagaacaac tcccgccccg cttttcgatt 1620 cagccagaac ctatttattt agctgacatg ttacctgacc ttacgatgtt agagcgaatg 1680 atcgcagcgg caaacgcggg tgcacaggtc tgtcttattt gcaatttggt tgacgttgca 1740 caagtatgct accaacggct aaaggagcta aataacacgc aagtagatat agatttgttt 1800 catgcgcgct ttacgctgaa cgatcgtcgt gaaaaagaga atcgagttat tagcaatttc 1860 ggcaaaaatg ggaagcgaaa tgttggacgg atacttgtcg caacccaggt cgtggaacaa 1920 tcactcgacg ttgattttga ttggttaatt actcagcatt gtcctgcaga tttgcttttc 1980 caacgattgg gccgtttaca tcgccatcat cgcaaatatc gtcccgctgg ttttgagatt 2040 cctgttgcca ccattttgct gcctgatggc gagggttacg gacgacatga gcatatttat 2100 agcaacgtta gagtcatgtg gcggacgcag caacatattg aggagcttaa tggagcatcc 2160 ttatttttcc ctgatgctta ccggcaatgg ctggatagca tttacgatga tgcggaaatg 2220 gatgagccag aatgggtcgg caatggcatg gataaatttg aaagcgccga gtgtgaaaaa 2280 aggttcaagg ctcgcaaggt cctgcagtgg gctgaagaat atagcttgca ggataacgat 2340 gaaaccattc ttgcggtaac gagggatggg gaaatgagcc tgccattatt gccttatgta 2400 caaacgtctt caggtaaaca actgctcgat ggccaggtct acgaggacct aagtcatgaa 2460 cagcagtatg aggcgcttgc acttaatcgc gtcaatgtac ccttcacctg gaaacgtagt 2520 ttttctgaag tagtagatga agatgggtta ctttggctgg aagggaaaca gaatctggat 2580 ggatgggtct ggcagggtaa cagtattgtt attacctata caggggatga agggatgacc 2640 agagtcatcc ctgcaaatcc caaataa 2667 <210> 625 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa129F <400> 625 accggcagca ggaagcgtgg atgctggcct ccctgtgagt tccccgcgcc agcggggata 60 aaccgcaaag tcaaggagca tggaatcccg gcccctc 97 <210> 626 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa130F <400> 626 accggtgctt gacatcatta tgagctgagc attgctgagt tccccgcgcc agcggggata 60 aaccggcttc ctgtgtctaa tgaccctgac aacccat 97 <210> 627 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa131F <400> 627 accggtaggc cttgggtggc cgatggcctc acagtggagt tccccgcgcc agcggggata 60 aaccggagaa gaagttcagt tcagtgacag gtgagcc 97 <210> 628 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa132F <400> 628 accgacttgt ctgtgttgca cagctaggtg aggcccgagt tccccgcgcc agcggggata 60 aaccggcatc accttaccat cagagcagtg cagtgct 97 <210> 629 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa133F <400> 629 accggagggc tgagagaggg acaagtcgga accattgagt tccccgcgcc agcggggata 60 aaccggggat gcttccgcct ttccggggct gctggcc 97 <210> 630 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa134F <400> 630 accgagctga gcattgctga gctcggaaat cacctggagt tccccgcgcc agcggggata 60 aaccggccag ttttatgaat ggcttcctgt gtctaat 97 <210> 631 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa135F <400> 631 accgtctact tccataggga attgcaacca cagtatgagt tccccgcgcc agcggggata 60 aaccggtcct gatcacttat gtaagtaact ccattgt 97 <210> 632 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa136F <400> 632 accgtgacat gcccctggat gtcctcctcc acacaggagt tccccgcgcc agcggggata 60 aaccgcatgt acacccctaa gatgcccatc gcgcagc 97 <210> 633 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa137F <400> 633 accggccatg gaagacatgc aggatcttgg tgaggtgagt tccccgcgcc agcggggata 60 aaccgatgag tggcgacctg ctggagctgg tgagcca 97 <210> 634 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa138F <400> 634 accgaaggcc atggaagaca tgcaggatct tggtgagagt tccccgcgcc agcggggata 60 aaccgagtgg cgacctgctg gagctggtga gccaccc 97 <210> 635 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa139F <400> 635 accgagggcc atcagcacct ttcacactca ccccccgagt tccccgcgcc agcggggata 60 aaccgcccct gggggctccc tgattaatgg aggctta 97 <210> 636 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa140F <400> 636 accgctgaac agaaggtctc aggaagctcc aggaaggagt tccccgcgcc agcggggata 60 aaccgcatgc aagaaagatg actgtcccag cgagtgg 97 <210> 637 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa141F <400> 637 accgtggatc agtctctgcc tcaactcggc cagggtgagt tccccgcgcc agcggggata 60 aaccgaggcc tggttccctg aggaccagcg ggtactg 97 <210> 638 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa142F <400> 638 accgcctggc acggaacaag agctcaataa aagtcagagt tccccgcgcc agcggggata 60 aaccggaggc aggattcttc ccatggatag gggaggg 97 <210> 639 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa143F <400> 639 accgtgacat gcccctggat gtcctcctcc acacaggagt tccccgcgcc agcggggata 60 aaccgtacac ccctaagatg cccatcgcgc agccctg 97 <210> 640 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa144F <400> 640 accgtttctc tgagaattca gtgcatgcac atacaagagt tccccgcgcc agcggggata 60 aaccggttca aacaagctca agagctagaa gaaggag 97 <210> 641 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa145F <400> 641 accggagggc tgagagaggg acaagtcgga accattgagt tccccgcgcc agcggggata 60 aaccgcttcc gcctttccgg ggctgctggc ctggccc 97 <210> 642 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa146F <400> 642 accgtgtacc ctgccgggta gtggagcggg ttggctgagt tccccgcgcc agcggggata 60 aaccgaaacc tggaaccaga gggggcgtgc ctgccaa 97 <210> 643 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa147F <400> 643 accgattctg tatagcaacg cgtaccatct aagaccgagt tccccgcgcc agcggggata 60 aaccgccaag taagtgctga tttgttctca ttcaact 97 <210> 644 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa148F <400> 644 accgctgaac agaaggtctc aggaagctcc aggaaggagt tccccgcgcc agcggggata 60 aaccgcaaga aagatgactg tcccagcgag tggcttc 97 <210> 645 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa149F <400> 645 accggaagac atgcaggatc ttggtgaggt atccccgagt tccccgcgcc agcggggata 60 aaccgatgag tggcgacctg ctggagctgg tgagcca 97 <210> 646 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa150F <400> 646 accggcagca ggaagcgtgg atgctggcct ccctgtgagt tccccgcgcc agcggggata 60 aaccggagca tggaatcccg gcccctcagg agcaggt 97 <210> 647 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa151F <400> 647 accgaactgg actgtactgt cagcggagcc cgagttgagt tccccgcgcc agcggggata 60 aaccggaggg agacggattt ctttccttgc tcagcaa 97 <210> 648 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa152F <400> 648 accggcaact tggcctcgac tggaagtttc tctgaggagt tccccgcgcc agcggggata 60 aaccgaagga gctgctgtgt cagaggagcc ctcgtaa 97 <210> 649 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa153F <400> 649 accggctagc accagctcct cgtagtcgcc gtcctcgagt tccccgcgcc agcggggata 60 aaccgcaccc gagcacggaa ccacagccac cttccac 97 <210> 650 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa154F <400> 650 accgctggca cccttggcca cgccggcatc ccggccgagt tccccgcgcc agcggggata 60 aaccgggaag ggcacggtta gcggcaccct cataggt 97 <210> 651 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa155F <400> 651 accggggctg tcactggagc tcctgggagg cctgcggagt tccccgcgcc agcggggata 60 aaccgggctg gggctgagct ttaaaatggt tccgact 97 <210> 652 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa156F <400> 652 accgggtggg gggtaagctg aatggaatct ctctcggagt tccccgcgcc agcggggata 60 aaccgtgaga ggggctgatg gaagctgata ggcagga 97 <210> 653 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa157F <400> 653 accgacatgc aggatcttgg tgaggtatcc ccggcggagt tccccgcgcc agcggggata 60 aaccgatgag tggcgacctg ctggagctgg tgagcca 97 <210> 654 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa158F <400> 654 accgtttgtc cctgcagccc ctaccgcccc ctccccgagt tccccgcgcc agcggggata 60 aaccggccct catctccagc taactgtgga gaagccc 97 <210> 655 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa159F <400> 655 accgagctga gcattgctga gctcggaaat cacctggagt tccccgcgcc agcggggata 60 aaccgaatgg cttcctgtgt ctaatgaccc tgacaac 97 <210> 656 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa160F <400> 656 accgactgtt tcattcatct ctctggaaag caggtggagt tccccgcgcc agcggggata 60 aaccgcccag cacggtgcaa gcttgtaacc gctttaa 97 <210> 657 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa161F <400> 657 accgcgtgga tgctggcctc cctgtggccc acgcacgagt tccccgcgcc agcggggata 60 aaccgtcaag gagcatggaa tcccggcccc tcaggag 97 <210> 658 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa162F <400> 658 accgctgaac agaaggtctc aggaagctcc aggaaggagt tccccgcgcc agcggggata 60 aaccgatgac tgtcccagcg agtggcttct ctcagac 97 <210> 659 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa163F <400> 659 accggcagct gaattcccct tgagacccac cgctaagagt tccccgcgcc agcggggata 60 aaccggcatc tttagtgatc caaggtaaga aaccctg 97 <210> 660 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa164F <400> 660 accgggtgtg tgtggagtgg ggagggggaa ataaatgagt tccccgcgcc agcggggata 60 aaccggacgt ccgcgtgttt tctctttcag ttagctg 97 <210> 661 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa165F <400> 661 accgagctga gcattgctga gctcggaaat cacctggagt tccccgcgcc agcggggata 60 aaccggcttc ctgtgtctaa tgaccctgac aacccat 97 <210> 662 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa166F <400> 662 accgtgacat gcccctggat gtcctcctcc acacaggagt tccccgcgcc agcggggata 60 aaccgatgcc catcgcgcag ccctgcaaca tttttga 97 <210> 663 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa167F <400> 663 accgaagagg ttgctacaac ctgacagcct gacagagagt tccccgcgcc agcggggata 60 aaccgggttt atgcgtgtcc acagtacacc ctccctc 97 <210> 664 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa168F <400> 664 accggtagcc cggggtgagt ggcatttcat gagggggagt tccccgcgcc agcggggata 60 aaccgtaaaa tttgagagga agacaatatt aatctgt 97 <210> 665 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa169F <400> 665 accgttcagg agcagggcgc gtgaaggggc gcgcgggagt tccccgcgcc agcggggata 60 aaccggcgcc gccggcgtgg accgcgcacg gcctcta 97 <210> 666 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa170F <400> 666 accgctggtg tctaggagat acacctccac caggctgagt tccccgcgcc agcggggata 60 aaccggtcac cgacttcgag aatgtgcccg aggagga 97 <210> 667 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa171F <400> 667 accgactgtc acacttgctg gcctgctcga cgaacagagt tccccgcgcc agcggggata 60 aaccgccggc gtggccaagg gtgccagcat gcgcagc 97 <210> 668 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa172F <400> 668 accggctccc cgcaggccac ctttgggtgt tgctaggagt tccccgcgcc agcggggata 60 aaccgcactg tctcagccaa cccgctccac tacccgg 97 <210> 669 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa173F <400> 669 accgcaggat cttggtgagg tatccccggc gggcaggagt tccccgcgcc agcggggata 60 aaccgagtgg cgacctgctg gagctggtga gccaccc 97 <210> 670 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa174F <400> 670 accgctcagc cccagccctt gaccctcccc agacacgagt tccccgcgcc agcggggata 60 aaccggcctg gcacgagggg atggggatgc ttccgcc 97 <210> 671 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa175F <400> 671 accgagctca ataaaagtca ttctgcccac ggacatgagt tccccgcgcc agcggggata 60 aaccggaggc aggattcttc ccatggatag gggaggg 97 <210> 672 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa176F <400> 672 accgccattc ataaaactgg ccatggtgct tgacatgagt tccccgcgcc agcggggata 60 aaccgtgcca agccaaagga acaaccctgg ttgttga 97 <210> 673 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa177F <400> 673 accgctggcc tccctgtggc ccacgcactg gttggggagt tccccgcgcc agcggggata 60 aaccgtcaag gagcatggaa tcccggcccc tcaggag 97 <210> 674 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa178F <400> 674 accgctgcta agtgctcctc tgcctgctgt cacatcgagt tccccgcgcc agcggggata 60 aaccggaatg ctgccgtcgg gcaactcctg gcacact 97 <210> 675 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa179F <400> 675 accgatctgt aaggaatcat ctggctgtag aagaatgagt tccccgcgcc agcggggata 60 aaccgccacc aatgccttgg gatacgactc tgtctcc 97 <210> 676 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa180F <400> 676 accgcagcct ggaagcccct gctcaccctg ccccacgagt tccccgcgcc agcggggata 60 aaccgctcag agccctgctg cccacaacag agcactg 97 <210> 677 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa181F <400> 677 accgcctggc acggaacaag agctcaataa aagtcagagt tccccgcgcc agcggggata 60 aaccggatag gggagggggc ggtaggggct gcaggga 97 <210> 678 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa182F <400> 678 accggaaagt tcctgtggag ctgagactgt tttcacgagt tccccgcgcc agcggggata 60 aaccgagata ctgagaatgg ctggaccact cacagca 97 <210> 679 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa183F <400> 679 accgctccag gaagctgcca tcagccatgc gctgctgagt tccccgcgcc agcggggata 60 aaccgcatgc aagaaagatg actgtcccag cgagtgg 97 <210> 680 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa184F <400> 680 accgaggtgc tggccgtcct tctcccaggt gatgaggagt tccccgcgcc agcggggata 60 aaccgatcca ccgcctcaag ccctcggatg caggcgt 97 <210> 681 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa185F <400> 681 accgcgtgga tgctggcctc cctgtggccc acgcacgagt tccccgcgcc agcggggata 60 aaccggaatc ccggcccctc aggagcaggt gaagagg 97 <210> 682 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa186F <400> 682 accgagggcc atcagcacct ttcacactca ccccccgagt tccccgcgcc agcggggata 60 aaccggaggc ttagctttct ggatggcatc tagccag 97 <210> 683 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa187F <400> 683 accgtgctcc tctgcctgct gtcacatcca gtactggagt tccccgcgcc agcggggata 60 aaccgcatgg aatgctgccg tcgggcaact cctggca 97 <210> 684 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa188F <400> 684 accgcccctg gatgtcctcc tccacacagg aaactggagt tccccgcgcc agcggggata 60 aaccgcccat cgcgcagccc tgcaacattt ttgactg 97 <210> 685 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa189F <400> 685 accgctctgg gcaaagacag aggagtcctc ctcgatgagt tccccgcgcc agcggggata 60 aaccgaatac cagccccccg gtaagacccc catctgt 97 <210> 686 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa190F <400> 686 accgaggagc ccagccgggt gaagtaagaa gaggctgagt tccccgcgcc agcggggata 60 aaccgctcgg tgagtgatgg cagaacgatg cctgcag 97 <210> 687 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa191F <400> 687 accgcccccc ccacacgagg aggagcacgc ggtccagagt tccccgcgcc agcggggata 60 aaccgtcact tcagtggaag agtggaaatg catgtac 97 <210> 688 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa192F <400> 688 accgactgtt tcattcatct ctctggaaag caggtggagt tccccgcgcc agcggggata 60 aaccgcttgt aaccgcttta attgcccccc agcctgg 97 <210> 689 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa193F <400> 689 accggaatct ctctcggagc aggcagccag ccaatcgagt tccccgcgcc agcggggata 60 aaccgtgaga ggggctgatg gaagctgata ggcagga 97 <210> 690 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa194F <400> 690 accgtgctcc tctgcctgct gtcacatcca gtactggagt tccccgcgcc agcggggata 60 aaccggaatg ctgccgtcgg gcaactcctg gcacact 97 <210> 691 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa195F <400> 691 accgtttctc tgagaattca gtgcatgcac atacaagagt tccccgcgcc agcggggata 60 aaccgaagga gctgctgtgt cagaggagcc ctcgtaa 97 <210> 692 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa196F <400> 692 accgaatcct ggagcgacag aaaagaaata tagaccgagt tccccgcgcc agcggggata 60 aaccgtgggt ttctacactt gcaatgccac caatgcc 97 <210> 693 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa197F <400> 693 accgactgtc acacttgctg gcctgctcga cgaacagagt tccccgcgcc agcggggata 60 aaccgggtgc cagcatgcgc agcctgcgcg tgctcaa 97 <210> 694 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa198F <400> 694 accgcctgca ggcatcgttc tgccatcact caccgagagt tccccgcgcc agcggggata 60 aaccgcttct aaggcatggt cgggggagag ggccaac 97 <210> 695 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa199F <400> 695 accgcaaaac aggtctagaa aagttggctg taaaaagagt tccccgcgcc agcggggata 60 aaccggtgac tttttaaaat aaaaacaaac aaacgtt 97 <210> 696 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa200F <400> 696 accgctccag gaagctgcca tcagccatgc gctgctgagt tccccgcgcc agcggggata 60 aaccgaaaga tgactgtccc agcgagtggc ttctctc 97 <210> 697 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa201F <400> 697 accgctggcc tccctgtggc ccacgcactg gttggggagt tccccgcgcc agcggggata 60 aaccggaatc ccggcccctc aggagcaggt gaagagg 97 <210> 698 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa202F <400> 698 accgtcactg tgcactggaa agagattgca agagaggagt tccccgcgcc agcggggata 60 aaccgcacac aggaggctgt agcccaaaaa caaagcc 97 <210> 699 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa203F <400> 699 accgacgtct ctggtctgta ggccgacccc acatgtgagt tccccgcgcc agcggggata 60 aaccgagctg tgtcgccagc ccaagcccag cacggtg 97 <210> 700 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa204F <400> 700 accgctgcca tcagccatgc gctgcttgca aagaacgagt tccccgcgcc agcggggata 60 aaccgcatgc aagaaagatg actgtcccag cgagtgg 97 <210> 701 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa205F <400> 701 accgaggctt ggcttcagag ccagcccaat ctgcgtgagt tccccgcgcc agcggggata 60 aaccggggaa cacagaccag gaagctcggt gagtgat 97 <210> 702 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa206F <400> 702 accgtcctcc tccacacagg aaactgcccg gctctggagt tccccgcgcc agcggggata 60 aaccgcccat cgcgcagccc tgcaacattt ttgactg 97 <210> 703 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa207F <400> 703 accgctccag gaagctgcca tcagccatgc gctgctgagt tccccgcgcc agcggggata 60 aaccgatgac tgtcccagcg agtggcttct ctcagac 97 <210> 704 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa208F <400> 704 accgaacact cagtgtcccg ctggccaggg ccaccggagt tccccgcgcc agcggggata 60 aaccggagaa gaagttcagt tcagtgacag gtgagcc 97 <210> 705 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa209F <400> 705 accgctcagc cccagccctt gaccctcccc agacacgagt tccccgcgcc agcggggata 60 aaccggggat gcttccgcct ttccggggct gctggcc 97 <210> 706 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa210F <400> 706 accgttccat gcctgcaggc atcgttctgc catcacgagt tccccgcgcc agcggggata 60 aaccggtcgg gggagagggc caacaactgt ccctcct 97 <210> 707 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa211F <400> 707 accgctgaat ggaatctctc tcggagcagg cagccagagt tccccgcgcc agcggggata 60 aaccggaagc tgataggcag gactggagtg ttagcac 97 <210> 708 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa212F <400> 708 accggaaagt tcctgtggag ctgagactgt tttcacgagt tccccgcgcc agcggggata 60 aaccggctgg accactcaca gcagatttca ttgtcaa 97 <210> 709 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa213F <400> 709 accggggcgc gcggaatcct ggctgggagc tgggaggagt tccccgcgcc agcggggata 60 aaccggcgcc gccggcgtgg accgcgcacg gcctcta 97 <210> 710 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa214F <400> 710 accgacagag gagtcctcct cgatgtagtc gacatggagt tccccgcgcc agcggggata 60 aaccgaatac cagccccccg gtaagacccc catctgt 97 <210> 711 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa215F <400> 711 accgagctca ataaaagtca ttctgcccac ggacatgagt tccccgcgcc agcggggata 60 aaccggatag gggagggggc ggtaggggct gcaggga 97 <210> 712 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa216F <400> 712 accgcctgca ggcatcgttc tgccatcact caccgagagt tccccgcgcc agcggggata 60 aaccggcatg gtcgggggag agggccaaca actgtcc 97 <210> 713 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa217F <400> 713 accgaggagc ccagccgggt gaagtaagaa gaggctgagt tccccgcgcc agcggggata 60 aaccggcaga acgatgcctg caggcatgga acttttt 97 <210> 714 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa218F <400> 714 accgctgaat ggaatctctc tcggagcagg cagccagagt tccccgcgcc agcggggata 60 aaccgctgat aggcaggact ggagtgttag caccagt 97 <210> 715 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa219F <400> 715 accgctgcca tcagccatgc gctgcttgca aagaacgagt tccccgcgcc agcggggata 60 aaccgaaaga tgactgtccc agcgagtggc ttctctc 97 <210> 716 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa220F <400> 716 accgcccccc accacgaagt gcagcttcct ctgcctgagt tccccgcgcc agcggggata 60 aaccgcccct catcacctgg gagaaggacg gccagca 97 <210> 717 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa221F <400> 717 accgactgtc acacttgctg gcctgctcga cgaacagagt tccccgcgcc agcggggata 60 aaccgcgcag cctgcgcgtg ctcaactgcc aagggaa 97 <210> 718 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa222F <400> 718 accgctcagc cccagccctt gaccctcccc agacacgagt tccccgcgcc agcggggata 60 aaccgcttcc gcctttccgg ggctgctggc ctggccc 97 <210> 719 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa223F <400> 719 accgcatctc cgccaggcca gtgaatcagg cctggggagt tccccgcgcc agcggggata 60 aaccgcaagc agacatttat cttttgggtc tgtcctc 97 <210> 720 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa224F <400> 720 accggacgaa aaagaaaggc gagcgagcag cagagcgagt tccccgcgcc agcggggata 60 aaccgtctga ttagcaggag cctgattggc tggctgc 97 <210> 721 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa129R <400> 721 actcgagggg ccgggattcc atgctccttg actttgcggt ttatccccgc tggcgcgggg 60 aactcacagg gaggccagca tccacgcttc ctgctgc 97 <210> 722 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa130R <400> 722 actcatgggt tgtcagggtc attagacaca ggaagccggt ttatccccgc tggcgcgggg 60 aactcagcaa tgctcagctc ataatgatgt caagcac 97 <210> 723 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa131R <400> 723 actcggctca cctgtcactg aactgaactt cttctccggt ttatccccgc tggcgcgggg 60 aactccactg tgaggccatc ggccacccaa ggcctac 97 <210> 724 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa132R <400> 724 actcagcact gcactgctct gatggtaagg tgatgccggt ttatccccgc tggcgcgggg 60 aactcgggcc tcacctagct gtgcaacaca gacaagt 97 <210> 725 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa133R <400> 725 actcggccag cagccccgga aaggcggaag catccccggt ttatccccgc tggcgcgggg 60 aactcaatgg ttccgacttg tccctctctc agccctc 97 <210> 726 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa134R <400> 726 actcattaga cacaggaagc cattcataaa actggccggt ttatccccgc tggcgcgggg 60 aactccaggt gatttccgag ctcagcaatg ctcagct 97 <210> 727 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa135R <400> 727 actcacaatg gagttactta cataagtgat caggaccggt ttatccccgc tggcgcgggg 60 aactcatact gtggttgcaa ttccctatgg aagtaga 97 <210> 728 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa136R <400> 728 actcgctgcg cgatgggcat cttaggggtg tacatgcggt ttatccccgc tggcgcgggg 60 aactcctgtg tggaggagga catccagggg catgtca 97 <210> 729 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa137R <400> 729 actctggctc accagctcca gcaggtcgcc actcatcggt ttatccccgc tggcgcgggg 60 aactcacctc accaagatcc tgcatgtctt ccatggc 97 <210> 730 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa138R <400> 730 actcgggtgg ctcaccagct ccagcaggtc gccactcggt ttatccccgc tggcgcgggg 60 aactctcacc aagatcctgc atgtcttcca tggcctt 97 <210> 731 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa139R <400> 731 actctaagcc tccattaatc agggagcccc caggggcggt ttatccccgc tggcgcgggg 60 aactcggggg gtgagtgtga aaggtgctga tggccct 97 <210> 732 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa140R <400> 732 actcccactc gctgggacag tcatctttct tgcatgcggt ttatccccgc tggcgcgggg 60 aactccttcc tggagcttcc tgagaccttc tgttcag 97 <210> 733 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa141R <400> 733 actccagtac ccgctggtcc tcagggaacc aggcctcggt ttatccccgc tggcgcgggg 60 aactcaccct ggccgagttg aggcagagac tgatcca 97 <210> 734 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa142R <400> 734 actcccctcc cctatccatg ggaagaatcc tgcctccggt ttatccccgc tggcgcgggg 60 aactctgact tttattgagc tcttgttccg tgccagg 97 <210> 735 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa143R <400> 735 actccagggc tgcgcgatgg gcatcttagg ggtgtacggt ttatccccgc tggcgcgggg 60 aactcctgtg tggaggagga catccagggg catgtca 97 <210> 736 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa144R <400> 736 actcctcctt cttctagctc ttgagcttgt ttgaaccggt ttatccccgc tggcgcgggg 60 aactcttgta tgtgcatgca ctgaattctc agagaaa 97 <210> 737 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa145R <400> 737 actcgggcca ggccagcagc cccggaaagg cggaagcggt ttatccccgc tggcgcgggg 60 aactcaatgg ttccgacttg tccctctctc agccctc 97 <210> 738 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa146R <400> 738 actcttggca ggcacgcccc ctctggttcc aggtttcggt ttatccccgc tggcgcgggg 60 aactcagcca acccgctcca ctacccggca gggtaca 97 <210> 739 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa147R <400> 739 actcagttga atgagaacaa atcagcactt acttggcggt ttatccccgc tggcgcgggg 60 aactcggtct tagatggtac gcgttgctat acagaat 97 <210> 740 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa148R <400> 740 actcgaagcc actcgctggg acagtcatct ttcttgcggt ttatccccgc tggcgcgggg 60 aactccttcc tggagcttcc tgagaccttc tgttcag 97 <210> 741 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa149R <400> 741 actctggctc accagctcca gcaggtcgcc actcatcggt ttatccccgc tggcgcgggg 60 aactcgggga tacctcacca agatcctgca tgtcttc 97 <210> 742 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa150R <400> 742 actcacctgc tcctgagggg ccgggattcc atgctccggt ttatccccgc tggcgcgggg 60 aactcacagg gaggccagca tccacgcttc ctgctgc 97 <210> 743 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa151R <400> 743 actcttgctg agcaaggaaa gaaatccgtc tccctccggt ttatccccgc tggcgcgggg 60 aactcaactc gggctccgct gacagtacag tccagtt 97 <210> 744 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa152R <400> 744 actcttacga gggctcctct gacacagcag ctccttcggt ttatccccgc tggcgcgggg 60 aactcctcag agaaacttcc agtcgaggcc aagttgc 97 <210> 745 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa153R <400> 745 actcgtggaa ggtggctgtg gttccgtgct cgggtgcggt ttatccccgc tggcgcgggg 60 aactcgagga cggcgactac gaggagctgg tgctagc 97 <210> 746 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa154R <400> 746 actcacctat gagggtgccg ctaaccgtgc ccttcccggt ttatccccgc tggcgcgggg 60 aactcggccg ggatgccggc gtggccaagg gtgccag 97 <210> 747 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa155R <400> 747 actcagtcgg aaccatttta aagctcagcc ccagcccggt ttatccccgc tggcgcgggg 60 aactccgcag gcctcccagg agctccagtg acagccc 97 <210> 748 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa156R <400> 748 actctcctgc ctatcagctt ccatcagccc ctctcacggt ttatccccgc tggcgcgggg 60 aactccgaga gagattccat tcagcttacc ccccacc 97 <210> 749 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa157R <400> 749 actctggctc accagctcca gcaggtcgcc actcatcggt ttatccccgc tggcgcgggg 60 aactccgccg gggatacctc accaagatcc tgcatgt 97 <210> 750 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa158R <400> 750 actcgggctt ctccacagtt agctggagat gagggccggt ttatccccgc tggcgcgggg 60 aactcgggga gggggcggta ggggctgcag ggacaaa 97 <210> 751 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa159R <400> 751 actcgttgtc agggtcatta gacacaggaa gccattcggt ttatccccgc tggcgcgggg 60 aactccaggt gatttccgag ctcagcaatg ctcagct 97 <210> 752 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa160R <400> 752 actcttaaag cggttacaag cttgcaccgt gctgggcggt ttatccccgc tggcgcgggg 60 aactccacct gctttccaga gagatgaatg aaacagt 97 <210> 753 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa161R <400> 753 actcctcctg aggggccggg attccatgct ccttgacggt ttatccccgc tggcgcgggg 60 aactcgtgcg tgggccacag ggaggccagc atccacg 97 <210> 754 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa162R <400> 754 actcgtctga gagaagccac tcgctgggac agtcatcggt ttatccccgc tggcgcgggg 60 aactccttcc tggagcttcc tgagaccttc tgttcag 97 <210> 755 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa163R <400> 755 actccagggt ttcttacctt ggatcactaa agatgccggt ttatccccgc tggcgcgggg 60 aactcttagc ggtgggtctc aaggggaatt cagctgc 97 <210> 756 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa164R <400> 756 actccagcta actgaaagag aaaacacgcg gacgtccggt ttatccccgc tggcgcgggg 60 aactcattta tttccccctc cccactccac acacacc 97 <210> 757 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa165R <400> 757 actcatgggt tgtcagggtc attagacaca ggaagccggt ttatccccgc tggcgcgggg 60 aactccaggt gatttccgag ctcagcaatg ctcagct 97 <210> 758 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa166R <400> 758 actctcaaaa atgttgcagg gctgcgcgat gggcatcggt ttatccccgc tggcgcgggg 60 aactcctgtg tggaggagga catccagggg catgtca 97 <210> 759 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa167R <400> 759 actcgaggga gggtgtactg tggacacgca taaacccggt ttatccccgc tggcgcgggg 60 aactctctgt caggctgtca ggttgtagca acctctt 97 <210> 760 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa168R <400> 760 actcacagat taatattgtc ttcctctcaa attttacggt ttatccccgc tggcgcgggg 60 aactccccct catgaaatgc cactcacccc gggctac 97 <210> 761 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa169R <400> 761 actctagagg ccgtgcgcgg tccacgccgg cggcgccggt ttatccccgc tggcgcgggg 60 aactcccgcg cgccccttca cgcgccctgc tcctgaa 97 <210> 762 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa170R <400> 762 actctcctcc tcgggcacat tctcgaagtc ggtgaccggt ttatccccgc tggcgcgggg 60 aactcagcct ggtggaggtg tatctcctag acaccag 97 <210> 763 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa171R <400> 763 actcgctgcg catgctggca cccttggcca cgccggcggt ttatccccgc tggcgcgggg 60 aactctgttc gtcgagcagg ccagcaagtg tgacagt 97 <210> 764 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa172R <400> 764 actcccgggt agtggagcgg gttggctgag acagtgcggt ttatccccgc tggcgcgggg 60 aactcctagc aacacccaaa ggtggcctgc ggggagc 97 <210> 765 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa173R <400> 765 actcgggtgg ctcaccagct ccagcaggtc gccactcggt ttatccccgc tggcgcgggg 60 aactcctgcc cgccggggat acctcaccaa gatcctg 97 <210> 766 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa174R <400> 766 actcggcgga agcatcccca tcccctcgtg ccaggccggt ttatccccgc tggcgcgggg 60 aactcgtgtc tggggagggt caagggctgg ggctgag 97 <210> 767 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa175R <400> 767 actcccctcc cctatccatg ggaagaatcc tgcctccggt ttatccccgc tggcgcgggg 60 aactcatgtc cgtgggcaga atgactttta ttgagct 97 <210> 768 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa176R <400> 768 actctcaaca accagggttg ttcctttggc ttggcacggt ttatccccgc tggcgcgggg 60 aactcatgtc aagcaccatg gccagtttta tgaatgg 97 <210> 769 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa177R <400> 769 actcctcctg aggggccggg attccatgct ccttgacggt ttatccccgc tggcgcgggg 60 aactccccaa ccagtgcgtg ggccacaggg aggccag 97 <210> 770 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa178R <400> 770 actcagtgtg ccaggagttg cccgacggca gcattccggt ttatccccgc tggcgcgggg 60 aactcgatgt gacagcaggc agaggagcac ttagcag 97 <210> 771 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa179R <400> 771 actcggagac agagtcgtat cccaaggcat tggtggcggt ttatccccgc tggcgcgggg 60 aactcattct tctacagcca gatgattcct tacagat 97 <210> 772 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa180R <400> 772 actccagtgc tctgttgtgg gcagcagggc tctgagcggt ttatccccgc tggcgcgggg 60 aactcgtggg gcagggtgag caggggcttc caggctg 97 <210> 773 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa181R <400> 773 actctccctg cagcccctac cgccccctcc cctatccggt ttatccccgc tggcgcgggg 60 aactctgact tttattgagc tcttgttccg tgccagg 97 <210> 774 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa182R <400> 774 actctgctgt gagtggtcca gccattctca gtatctcggt ttatccccgc tggcgcgggg 60 aactcgtgaa aacagtctca gctccacagg aactttc 97 <210> 775 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa183R <400> 775 actcccactc gctgggacag tcatctttct tgcatgcggt ttatccccgc tggcgcgggg 60 aactcagcag cgcatggctg atggcagctt cctggag 97 <210> 776 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa184R <400> 776 actcacgcct gcatccgagg gcttgaggcg gtggatcggt ttatccccgc tggcgcgggg 60 aactcctcat cacctgggag aaggacggcc agcacct 97 <210> 777 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa185R <400> 777 actccctctt cacctgctcc tgaggggccg ggattccggt ttatccccgc tggcgcgggg 60 aactcgtgcg tgggccacag ggaggccagc atccacg 97 <210> 778 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa186R <400> 778 actcctggct agatgccatc cagaaagcta agcctccggt ttatccccgc tggcgcgggg 60 aactcggggg gtgagtgtga aaggtgctga tggccct 97 <210> 779 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa187R <400> 779 actctgccag gagttgcccg acggcagcat tccatgcggt ttatccccgc tggcgcgggg 60 aactccagta ctggatgtga cagcaggcag aggagca 97 <210> 780 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa188R <400> 780 actccagtca aaaatgttgc agggctgcgc gatgggcggt ttatccccgc tggcgcgggg 60 aactccagtt tcctgtgtgg aggaggacat ccagggg 97 <210> 781 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa189R <400> 781 actcacagat gggggtctta ccggggggct ggtattcggt ttatccccgc tggcgcgggg 60 aactcatcga ggaggactcc tctgtctttg cccagag 97 <210> 782 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa190R <400> 782 actcctgcag gcatcgttct gccatcactc accgagcggt ttatccccgc tggcgcgggg 60 aactcagcct cttcttactt cacccggctg ggctcct 97 <210> 783 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa191R <400> 783 actcgtacat gcatttccac tcttccactg aagtgacggt ttatccccgc tggcgcgggg 60 aactctggac cgcgtgctcc tcctcgtgtg ggggggg 97 <210> 784 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa192R <400> 784 actcccaggc tggggggcaa ttaaagcggt tacaagcggt ttatccccgc tggcgcgggg 60 aactccacct gctttccaga gagatgaatg aaacagt 97 <210> 785 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa193R <400> 785 actctcctgc ctatcagctt ccatcagccc ctctcacggt ttatccccgc tggcgcgggg 60 aactcgattg gctggctgcc tgctccgaga gagattc 97 <210> 786 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa194R <400> 786 actcagtgtg ccaggagttg cccgacggca gcattccggt ttatccccgc tggcgcgggg 60 aactccagta ctggatgtga cagcaggcag aggagca 97 <210> 787 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa195R <400> 787 actcttacga gggctcctct gacacagcag ctccttcggt ttatccccgc tggcgcgggg 60 aactcttgta tgtgcatgca ctgaattctc agagaaa 97 <210> 788 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa196R <400> 788 actcggcatt ggtggcattg caagtgtaga aacccacggt ttatccccgc tggcgcgggg 60 aactcggtct atatttcttt tctgtcgctc caggatt 97 <210> 789 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa197R <400> 789 actcttgagc acgcgcaggc tgcgcatgct ggcacccggt ttatccccgc tggcgcgggg 60 aactctgttc gtcgagcagg ccagcaagtg tgacagt 97 <210> 790 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa198R <400> 790 actcgttggc cctctccccc gaccatgcct tagaagcggt ttatccccgc tggcgcgggg 60 aactctcggt gagtgatggc agaacgatgc ctgcagg 97 <210> 791 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa199R <400> 791 actcaacgtt tgtttgtttt tattttaaaa agtcaccggt ttatccccgc tggcgcgggg 60 aactcttttt acagccaact tttctagacc tgttttg 97 <210> 792 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa200R <400> 792 actcgagaga agccactcgc tgggacagtc atctttcggt ttatccccgc tggcgcgggg 60 aactcagcag cgcatggctg atggcagctt cctggag 97 <210> 793 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa201R <400> 793 actccctctt cacctgctcc tgaggggccg ggattccggt ttatccccgc tggcgcgggg 60 aactccccaa ccagtgcgtg ggccacaggg aggccag 97 <210> 794 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa202R <400> 794 actcggcttt gtttttgggc tacagcctcc tgtgtgcggt ttatccccgc tggcgcgggg 60 aactcctctc ttgcaatctc tttccagtgc acagtga 97 <210> 795 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa203R <400> 795 actccaccgt gctgggcttg ggctggcgac acagctcggt ttatccccgc tggcgcgggg 60 aactcacatg tggggtcggc ctacagacca gagacgt 97 <210> 796 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa204R <400> 796 actcccactc gctgggacag tcatctttct tgcatgcggt ttatccccgc tggcgcgggg 60 aactcgttct ttgcaagcag cgcatggctg atggcag 97 <210> 797 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa205R <400> 797 actcatcact caccgagctt cctggtctgt gttccccggt ttatccccgc tggcgcgggg 60 aactcacgca gattgggctg gctctgaagc caagcct 97 <210> 798 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa206R <400> 798 actccagtca aaaatgttgc agggctgcgc gatgggcggt ttatccccgc tggcgcgggg 60 aactccagag ccgggcagtt tcctgtgtgg aggagga 97 <210> 799 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa207R <400> 799 actcgtctga gagaagccac tcgctgggac agtcatcggt ttatccccgc tggcgcgggg 60 aactcagcag cgcatggctg atggcagctt cctggag 97 <210> 800 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa208R <400> 800 actcggctca cctgtcactg aactgaactt cttctccggt ttatccccgc tggcgcgggg 60 aactccggtg gccctggcca gcgggacact gagtgtt 97 <210> 801 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa209R <400> 801 actcggccag cagccccgga aaggcggaag catccccggt ttatccccgc tggcgcgggg 60 aactcgtgtc tggggagggt caagggctgg ggctgag 97 <210> 802 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa210R <400> 802 actcaggagg gacagttgtt ggccctctcc cccgaccggt ttatccccgc tggcgcgggg 60 aactcgtgat ggcagaacga tgcctgcagg catggaa 97 <210> 803 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa211R <400> 803 actcgtgcta acactccagt cctgcctatc agcttccggt ttatccccgc tggcgcgggg 60 aactctggct gcctgctccg agagagattc cattcag 97 <210> 804 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa212R <400> 804 actcttgaca atgaaatctg ctgtgagtgg tccagccggt ttatccccgc tggcgcgggg 60 aactcgtgaa aacagtctca gctccacagg aactttc 97 <210> 805 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa213R <400> 805 actctagagg ccgtgcgcgg tccacgccgg cggcgccggt ttatccccgc tggcgcgggg 60 aactcctccc agctcccagc caggattccg cgcgccc 97 <210> 806 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa214R <400> 806 actcacagat gggggtctta ccggggggct ggtattcggt ttatccccgc tggcgcgggg 60 aactccatgt cgactacatc gaggaggact cctctgt 97 <210> 807 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa215R <400> 807 actctccctg cagcccctac cgccccctcc cctatccggt ttatccccgc tggcgcgggg 60 aactcatgtc cgtgggcaga atgactttta ttgagct 97 <210> 808 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa216R <400> 808 actcggacag ttgttggccc tctcccccga ccatgccggt ttatccccgc tggcgcgggg 60 aactctcggt gagtgatggc agaacgatgc ctgcagg 97 <210> 809 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa217R <400> 809 actcaaaaag ttccatgcct gcaggcatcg ttctgccggt ttatccccgc tggcgcgggg 60 aactcagcct cttcttactt cacccggctg ggctcct 97 <210> 810 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa218R <400> 810 actcactggt gctaacactc cagtcctgcc tatcagcggt ttatccccgc tggcgcgggg 60 aactctggct gcctgctccg agagagattc cattcag 97 <210> 811 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa219R <400> 811 actcgagaga agccactcgc tgggacagtc atctttcggt ttatccccgc tggcgcgggg 60 aactcgttct ttgcaagcag cgcatggctg atggcag 97 <210> 812 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa220R <400> 812 actctgctgg ccgtccttct cccaggtgat gaggggcggt ttatccccgc tggcgcgggg 60 aactcaggca gaggaagctg cacttcgtgg tgggggg 97 <210> 813 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa221R <400> 813 actcttccct tggcagttga gcacgcgcag gctgcgcggt ttatccccgc tggcgcgggg 60 aactctgttc gtcgagcagg ccagcaagtg tgacagt 97 <210> 814 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa222R <400> 814 actcgggcca ggccagcagc cccggaaagg cggaagcggt ttatccccgc tggcgcgggg 60 aactcgtgtc tggggagggt caagggctgg ggctgag 97 <210> 815 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa223R <400> 815 actcgaggac agacccaaaa gataaatgtc tgcttgcggt ttatccccgc tggcgcgggg 60 aactccccag gcctgattca ctggcctggc ggagatg 97 <210> 816 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa224R <400> 816 actcgcagcc agccaatcag gctcctgcta atcagacggt ttatccccgc tggcgcgggg 60 aactcgctct gctgctcgct cgcctttctt tttcgtc 97 <210> 817 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 817 Gly Gly Gly Gly Ser 1 5 <210> 818 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 818 Thr Gly Pro Gly Ala Ala Ala Arg 1 5 <210> 819 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 819 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly 1 5 10 <210> 820 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 820 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly Ser 1 5 10 15 <210> 821 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 821 Ala Asp Pro Thr Asn Arg Ala Lys Gly Leu Glu Ala Val Ser Val Ala 1 5 10 15 Ser <210> 822 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 822 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Gly Gly Ser Gly 20 <210> 823 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 823 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly 20 25 30 Ser Ser Gly Gly Ser Gly Ser Ser 35 40 <210> 824 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Linker <400> 824 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly 20 25 30 Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly Ser Gly Ser Ser Gly Gly 35 40 45 Ser Gly 50 <210> 825 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa129_F_ilmn (Illumina) <400> 825 cactctttcc ctacacgacg ctcttccgat ctgaccttgg cacccacaag 50 <210> 826 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa130_F_ilmn (Illumina) <400> 826 cactctttcc ctacacgacg ctcttccgat cttgctctgg tttcatgttt gg 52 <210> 827 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa131_F_ilmn (Illumina) <400> 827 cactctttcc ctacacgacg ctcttccgat ctccagcagc tctcagcctc 50 <210> 828 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa132_F_ilmn (Illumina) <400> 828 cactctttcc ctacacgacg ctcttccgat ctctccaccc ttgacttggc ta 52 <210> 829 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa133_F_ilmn (Illumina) <400> 829 cactctttcc ctacacgacg ctcttccgat ctcaggagct ccagtgacag c 51 <210> 830 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa134_F_ilmn (Illumina) <400> 830 cactctttcc ctacacgacg ctcttccgat cttgctctgg tttcatgttt gg 52 <210> 831 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa135_F_ilmn (Illumina) <400> 831 cactctttcc ctacacgacg ctcttccgat cttttaaggt atggaagtca gtgcc 55 <210> 832 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa136_F_ilmn (Illumina) <400> 832 cactctttcc ctacacgacg ctcttccgat ctttgcttct gtaggtggga gg 52 <210> 833 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa137_F_ilmn (Illumina) <400> 833 cactctttcc ctacacgacg ctcttccgat ctgtggtgct gaaggaggag ac 52 <210> 834 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa138_F_ilmn (Illumina) <400> 834 cactctttcc ctacacgacg ctcttccgat ctgtggtgct gaaggaggag ac 52 <210> 835 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa139_F_ilmn (Illumina) <400> 835 cactctttcc ctacacgacg ctcttccgat cttcaatcct caggtctcca cc 52 <210> 836 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa140_F_ilmn (Illumina) <400> 836 cactctttcc ctacacgacg ctcttccgat ctccagtgtt ccagaacgtg tg 52 <210> 837 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa141_F_ilmn (Illumina) <400> 837 cactctttcc ctacacgacg ctcttccgat ctccatcttt caccattcac cc 52 <210> 838 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa142_F_ilmn (Illumina) <400> 838 cactctttcc ctacacgacg ctcttccgat ctgggcattt caccattcaa ac 52 <210> 839 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa143_F_ilmn (Illumina) <400> 839 cactctttcc ctacacgacg ctcttccgat ctttgcttct gtaggtggga gg 52 <210> 840 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa144_F_ilmn (Illumina) <400> 840 cactctttcc ctacacgacg ctcttccgat ctgaggcagc aatttaccca aa 52 <210> 841 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa145_F_ilmn (Illumina) <400> 841 cactctttcc ctacacgacg ctcttccgat ctcaggagct ccagtgacag c 51 <210> 842 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa146_F_ilmn (Illumina) <400> 842 cactctttcc ctacacgacg ctcttccgat cttgtgctag caacacccaa ag 52 <210> 843 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa147_F_ilmn (Illumina) <400> 843 cactctttcc ctacacgacg ctcttccgat cttgttcact caagtgccaa gc 52 <210> 844 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa148_F_ilmn (Illumina) <400> 844 cactctttcc ctacacgacg ctcttccgat ctccagtgtt ccagaacgtg tg 52 <210> 845 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa149_F_ilmn (Illumina) <400> 845 cactctttcc ctacacgacg ctcttccgat ctgtggtgct gaaggaggag ac 52 <210> 846 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa150_F_ilmn (Illumina) <400> 846 cactctttcc ctacacgacg ctcttccgat ctgaccttgg cacccacaag 50 <210> 847 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa151_F_ilmn (Illumina) <400> 847 cactctttcc ctacacgacg ctcttccgat ctagcaccgc actgtcacat ta 52 <210> 848 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa152_F_ilmn (Illumina) <400> 848 cactctttcc ctacacgacg ctcttccgat ctaatcccag attggttcta acctc 55 <210> 849 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa153_F_ilmn (Illumina) <400> 849 cactctttcc ctacacgacg ctcttccgat ctgacagcaa cctctcccct g 51 <210> 850 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa154_F_ilmn (Illumina) <400> 850 cactctttcc ctacacgacg ctcttccgat ctagtgtgac agtcatggca cc 52 <210> 851 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa155_F_ilmn (Illumina) <400> 851 cactctttcc ctacacgacg ctcttccgat ctgtcagcac tacaggcagc ac 52 <210> 852 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa156_F_ilmn (Illumina) <400> 852 cactctttcc ctacacgacg ctcttccgat cttctgtcct cctggctttg tt 52 <210> 853 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa157_F_ilmn (Illumina) <400> 853 cactctttcc ctacacgacg ctcttccgat ctgtggtgct gaaggaggag ac 52 <210> 854 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa158_F_ilmn (Illumina) <400> 854 cactctttcc ctacacgacg ctcttccgat cttcaatcct caggtctcca cc 52 <210> 855 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa159_F_ilmn (Illumina) <400> 855 cactctttcc ctacacgacg ctcttccgat cttgctctgg tttcatgttt gg 52 <210> 856 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa160_F_ilmn (Illumina) <400> 856 cactctttcc ctacacgacg ctcttccgat cttcggccta cagaccagag ac 52 <210> 857 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa161_F_ilmn (Illumina) <400> 857 cactctttcc ctacacgacg ctcttccgat ctgaccttgg cacccacaag 50 <210> 858 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa162_F_ilmn (Illumina) <400> 858 cactctttcc ctacacgacg ctcttccgat ctccagtgtt ccagaacgtg tg 52 <210> 859 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa163_F_ilmn (Illumina) <400> 859 cactctttcc ctacacgacg ctcttccgat ctactgacgc atcacatctt gg 52 <210> 860 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa164_F_ilmn (Illumina) <400> 860 cactctttcc ctacacgacg ctcttccgat ctatctcgct gctgtggaac tt 52 <210> 861 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa165_F_ilmn (Illumina) <400> 861 cactctttcc ctacacgacg ctcttccgat cttgctctgg tttcatgttt gg 52 <210> 862 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa166_F_ilmn (Illumina) <400> 862 cactctttcc ctacacgacg ctcttccgat ctttgcttct gtaggtggga gg 52 <210> 863 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa167_F_ilmn (Illumina) <400> 863 cactctttcc ctacacgacg ctcttccgat cttaggacct ttgctgctcc ac 52 <210> 864 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa168_F_ilmn (Illumina) <400> 864 cactctttcc ctacacgacg ctcttccgat ctaatcctca ttaagccgag ca 52 <210> 865 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa169_F_ilmn (Illumina) <400> 865 cactctttcc ctacacgacg ctcttccgat ctgtctgagc ctggaggagt ga 52 <210> 866 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa170_F_ilmn (Illumina) <400> 866 cactctttcc ctacacgacg ctcttccgat ctacaaatgt cgccttggaa ag 52 <210> 867 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa171_F_ilmn (Illumina) <400> 867 cactctttcc ctacacgacg ctcttccgat ctgggtcttt ctcatgtggt cc 52 <210> 868 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa172_F_ilmn (Illumina) <400> 868 cactctttcc ctacacgacg ctcttccgat ctactctgct ctatgccagg ct 52 <210> 869 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa173_F_ilmn (Illumina) <400> 869 cactctttcc ctacacgacg ctcttccgat ctgtggtgct gaaggaggag ac 52 <210> 870 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa174_F_ilmn (Illumina) <400> 870 cactctttcc ctacacgacg ctcttccgat ctcaggagct ccagtgacag c 51 <210> 871 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa175_F_ilmn (Illumina) <400> 871 cactctttcc ctacacgacg ctcttccgat ctgggcattt caccattcaa ac 52 <210> 872 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa176_F_ilmn (Illumina) <400> 872 cactctttcc ctacacgacg ctcttccgat ctagaagcag gtgatttccg ag 52 <210> 873 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa177_F_ilmn (Illumina) <400> 873 cactctttcc ctacacgacg ctcttccgat ctgaccttgg cacccacaag 50 <210> 874 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa178_F_ilmn (Illumina) <400> 874 cactctttcc ctacacgacg ctcttccgat ctgctgatag gcaggactgg ag 52 <210> 875 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa179_F_ilmn (Illumina) <400> 875 cactctttcc ctacacgacg ctcttccgat ctacaccctg aggttccttc ct 52 <210> 876 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa180_F_ilmn (Illumina) <400> 876 cactctttcc ctacacgacg ctcttccgat ctaggcacac aacattgcag aa 52 <210> 877 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa181_F_ilmn (Illumina) <400> 877 cactctttcc ctacacgacg ctcttccgat ctgggcattt caccattcaa ac 52 <210> 878 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa182_F_ilmn (Illumina) <400> 878 cactctttcc ctacacgacg ctcttccgat ctatgaaatg tgcttgcctg tg 52 <210> 879 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa183_F_ilmn (Illumina) <400> 879 cactctttcc ctacacgacg ctcttccgat ctccagtgtt ccagaacgtg tg 52 <210> 880 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa184_F_ilmn (Illumina) <400> 880 cactctttcc ctacacgacg ctcttccgat ctcatacaga ctcgcaggca ga 52 <210> 881 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa185_F_ilmn (Illumina) <400> 881 cactctttcc ctacacgacg ctcttccgat ctgaccttgg cacccacaag 50 <210> 882 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa186_F_ilmn (Illumina) <400> 882 cactctttcc ctacacgacg ctcttccgat cttcaatcct caggtctcca cc 52 <210> 883 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa187_F_ilmn (Illumina) <400> 883 cactctttcc ctacacgacg ctcttccgat ctgctgatag gcaggactgg ag 52 <210> 884 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa188_F_ilmn (Illumina) <400> 884 cactctttcc ctacacgacg ctcttccgat ctttgcttct gtaggtggga gg 52 <210> 885 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa189_F_ilmn (Illumina) <400> 885 cactctttcc ctacacgacg ctcttccgat ctcttctgca ggccttgaag tt 52 <210> 886 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa190_F_ilmn (Illumina) <400> 886 cactctttcc ctacacgacg ctcttccgat ctgcaggaac tgagccagaa ac 52 <210> 887 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa191_F_ilmn (Illumina) <400> 887 cactctttcc ctacacgacg ctcttccgat ctttgcttct gtaggtggga gg 52 <210> 888 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa192_F_ilmn (Illumina) <400> 888 cactctttcc ctacacgacg ctcttccgat cttcggccta cagaccagag ac 52 <210> 889 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa193_F_ilmn (Illumina) <400> 889 cactctttcc ctacacgacg ctcttccgat cttctgtcct cctggctttg tt 52 <210> 890 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa194_F_ilmn (Illumina) <400> 890 cactctttcc ctacacgacg ctcttccgat ctgctgatag gcaggactgg ag 52 <210> 891 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa195_F_ilmn (Illumina) <400> 891 cactctttcc ctacacgacg ctcttccgat ctaatcccag attggttcta acctc 55 <210> 892 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa196_F_ilmn (Illumina) <400> 892 cactctttcc ctacacgacg ctcttccgat ctacaccctg aggttccttc ct 52 <210> 893 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa197_F_ilmn (Illumina) <400> 893 cactctttcc ctacacgacg ctcttccgat ctcatgtggt ccttgtgttc gt 52 <210> 894 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa198_F_ilmn (Illumina) <400> 894 cactctttcc ctacacgacg ctcttccgat ctggtaacag tgaggctggg aa 52 <210> 895 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa199_F_ilmn (Illumina) <400> 895 cactctttcc ctacacgacg ctcttccgat ctggtctgtc ctctctgttg cc 52 <210> 896 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa200_F_ilmn (Illumina) <400> 896 cactctttcc ctacacgacg ctcttccgat ctccagtgtt ccagaacgtg tg 52 <210> 897 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa201_F_ilmn (Illumina) <400> 897 cactctttcc ctacacgacg ctcttccgat ctgaccttgg cacccacaag 50 <210> 898 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa202_F_ilmn (Illumina) <400> 898 cactctttcc ctacacgacg ctcttccgat ctcaaggctt tgcctacgag tc 52 <210> 899 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa203_F_ilmn (Illumina) <400> 899 cactctttcc ctacacgacg ctcttccgat ctggaaattg gcaagtggag tc 52 <210> 900 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa204_F_ilmn (Illumina) <400> 900 cactctttcc ctacacgacg ctcttccgat ctccagtgtt ccagaacgtg tg 52 <210> 901 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa205_F_ilmn (Illumina) <400> 901 cactctttcc ctacacgacg ctcttccgat ctgcaggaac tgagccagaa ac 52 <210> 902 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa206_F_ilmn (Illumina) <400> 902 cactctttcc ctacacgacg ctcttccgat ctttgcttct gtaggtggga gg 52 <210> 903 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa207_F_ilmn (Illumina) <400> 903 cactctttcc ctacacgacg ctcttccgat ctccagtgtt ccagaacgtg tg 52 <210> 904 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa208_F_ilmn (Illumina) <400> 904 cactctttcc ctacacgacg ctcttccgat ctccagcagc tctcagcctc 50 <210> 905 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa209_F_ilmn (Illumina) <400> 905 cactctttcc ctacacgacg ctcttccgat ctcaggagct ccagtgacag c 51 <210> 906 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa210_F_ilmn (Illumina) <400> 906 cactctttcc ctacacgacg ctcttccgat ctggtaacag tgaggctggg aa 52 <210> 907 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa211_F_ilmn (Illumina) <400> 907 cactctttcc ctacacgacg ctcttccgat cttctgtcct cctggctttg tt 52 <210> 908 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa212_F_ilmn (Illumina) <400> 908 cactctttcc ctacacgacg ctcttccgat ctatgaaatg tgcttgcctg tg 52 <210> 909 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa213_F_ilmn (Illumina) <400> 909 cactctttcc ctacacgacg ctcttccgat ctgtctgagc ctggaggagt ga 52 <210> 910 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa214_F_ilmn (Illumina) <400> 910 cactctttcc ctacacgacg ctcttccgat ctcttctgca ggccttgaag tt 52 <210> 911 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa215_F_ilmn (Illumina) <400> 911 cactctttcc ctacacgacg ctcttccgat ctgggcattt caccattcaa ac 52 <210> 912 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa216_F_ilmn (Illumina) <400> 912 cactctttcc ctacacgacg ctcttccgat ctggtaacag tgaggctggg aa 52 <210> 913 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa217_F_ilmn (Illumina) <400> 913 cactctttcc ctacacgacg ctcttccgat ctgcaggaac tgagccagaa ac 52 <210> 914 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa218_F_ilmn (Illumina) <400> 914 cactctttcc ctacacgacg ctcttccgat cttctgtcct cctggctttg tt 52 <210> 915 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa219_F_ilmn (Illumina) <400> 915 cactctttcc ctacacgacg ctcttccgat ctccagtgtt ccagaacgtg tg 52 <210> 916 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa220_F_ilmn (Illumina) <400> 916 cactctttcc ctacacgacg ctcttccgat ctccgccagg aaggtctaca ta 52 <210> 917 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa221_F_ilmn (Illumina) <400> 917 cactctttcc ctacacgacg ctcttccgat ctcatgtggt ccttgtgttc gt 52 <210> 918 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa222_F_ilmn (Illumina) <400> 918 cactctttcc ctacacgacg ctcttccgat ctcaggagct ccagtgacag c 51 <210> 919 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa223_F_ilmn (Illumina) <400> 919 cactctttcc ctacacgacg ctcttccgat ctggtaacag tgaggctggg aa 52 <210> 920 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa224_F_ilmn (Illumina) <400> 920 cactctttcc ctacacgacg ctcttccgat ctatttccct tctcgctctg ct 52 <210> 921 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa129_R_ilmn (Illumina) <400> 921 ggagttcaga cgtgtgctct tccgatctgt ggtggcacaa actgacac 48 <210> 922 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa130_R_ilmn (Illumina) <400> 922 ggagttcaga cgtgtgctct tccgatctca accagggttg ttcctttg 48 <210> 923 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa131_R_ilmn (Illumina) <400> 923 ggagttcaga cgtgtgctct tccgatctgt gtgacttggg ccagatgt 48 <210> 924 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa132_R_ilmn (Illumina) <400> 924 ggagttcaga cgtgtgctct tccgatctac tcagcaccat ctttccgt 48 <210> 925 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa133_R_ilmn (Illumina) <400> 925 ggagttcaga cgtgtgctct tccgatctgg cacccagagt gagtgagt 48 <210> 926 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa134_R_ilmn (Illumina) <400> 926 ggagttcaga cgtgtgctct tccgatctca accagggttg ttcctttg 48 <210> 927 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa135_R_ilmn (Illumina) <400> 927 ggagttcaga cgtgtgctct tccgatctga ctacaattcc caattcccaa 50 <210> 928 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa136_R_ilmn (Illumina) <400> 928 ggagttcaga cgtgtgctct tccgatctga aggcacagtt accggaga 48 <210> 929 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa137_R_ilmn (Illumina) <400> 929 ggagttcaga cgtgtgctct tccgatctag caatgggcct actaagca 48 <210> 930 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa138_R_ilmn (Illumina) <400> 930 ggagttcaga cgtgtgctct tccgatctag caatgggcct actaagca 48 <210> 931 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa139_R_ilmn (Illumina) <400> 931 ggagttcaga cgtgtgctct tccgatctct gtctccagcc tctggcta 48 <210> 932 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa140_R_ilmn (Illumina) <400> 932 ggagttcaga cgtgtgctct tccgatcttt cattctcttc ggaggaaca 49 <210> 933 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa141_R_ilmn (Illumina) <400> 933 ggagttcaga cgtgtgctct tccgatctac cctgccatcc tgcttac 47 <210> 934 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa142_R_ilmn (Illumina) <400> 934 ggagttcaga cgtgtgctct tccgatctag cacctttcac actcaccc 48 <210> 935 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa143_R_ilmn (Illumina) <400> 935 ggagttcaga cgtgtgctct tccgatctga aggcacagtt accggaga 48 <210> 936 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa144_R_ilmn (Illumina) <400> 936 ggagttcaga cgtgtgctct tccgatctta cgagggctcc tctgacac 48 <210> 937 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa145_R_ilmn (Illumina) <400> 937 ggagttcaga cgtgtgctct tccgatctgg cacccagagt gagtgagt 48 <210> 938 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa146_R_ilmn (Illumina) <400> 938 ggagttcaga cgtgtgctct tccgatctgt ttctggctca gttcctgc 48 <210> 939 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa147_R_ilmn (Illumina) <400> 939 ggagttcaga cgtgtgctct tccgatctca aagacattga aaccctctgg 50 <210> 940 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa148_R_ilmn (Illumina) <400> 940 ggagttcaga cgtgtgctct tccgatcttt cattctcttc ggaggaaca 49 <210> 941 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa149_R_ilmn (Illumina) <400> 941 ggagttcaga cgtgtgctct tccgatctag caatgggcct actaagca 48 <210> 942 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa150_R_ilmn (Illumina) <400> 942 ggagttcaga cgtgtgctct tccgatctgt ggtggcacaa actgacac 48 <210> 943 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa151_R_ilmn (Illumina) <400> 943 ggagttcaga cgtgtgctct tccgatcttt tcctcacaga agccaaca 48 <210> 944 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa152_R_ilmn (Illumina) <400> 944 ggagttcaga cgtgtgctct tccgatctcc atgaaagcta caaccagtga 50 <210> 945 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa153_R_ilmn (Illumina) <400> 945 ggagttcaga cgtgtgctct tccgatctat ccctacaccc gcacct 46 <210> 946 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa154_R_ilmn (Illumina) <400> 946 ggagttcaga cgtgtgctct tccgatctga tggagagaga ccagcgtc 48 <210> 947 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa155_R_ilmn (Illumina) <400> 947 ggagttcaga cgtgtgctct tccgatctca tggagggctg agagagg 47 <210> 948 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa156_R_ilmn (Illumina) <400> 948 ggagttcaga cgtgtgctct tccgatctcg gaatcagaat cggacact 48 <210> 949 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa157_R_ilmn (Illumina) <400> 949 ggagttcaga cgtgtgctct tccgatctag caatgggcct actaagca 48 <210> 950 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa158_R_ilmn (Illumina) <400> 950 ggagttcaga cgtgtgctct tccgatcttc cagaaagcta agcctcca 48 <210> 951 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa159_R_ilmn (Illumina) <400> 951 ggagttcaga cgtgtgctct tccgatctca accagggttg ttcctttg 48 <210> 952 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa160_R_ilmn (Illumina) <400> 952 ggagttcaga cgtgtgctct tccgatctcc actctgagag agcatccc 48 <210> 953 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa161_R_ilmn (Illumina) <400> 953 ggagttcaga cgtgtgctct tccgatctgt ggtggcacaa actgacac 48 <210> 954 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa162_R_ilmn (Illumina) <400> 954 ggagttcaga cgtgtgctct tccgatcttt cattctcttc ggaggaaca 49 <210> 955 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa163_R_ilmn (Illumina) <400> 955 ggagttcaga cgtgtgctct tccgatctat tcccaagtgg gctttctt 48 <210> 956 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa164_R_ilmn (Illumina) <400> 956 ggagttcaga cgtgtgctct tccgatcttt tcctttccca acatcctg 48 <210> 957 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa165_R_ilmn (Illumina) <400> 957 ggagttcaga cgtgtgctct tccgatctca accagggttg ttcctttg 48 <210> 958 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa166_R_ilmn (Illumina) <400> 958 ggagttcaga cgtgtgctct tccgatctga aggcacagtt accggaga 48 <210> 959 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa167_R_ilmn (Illumina) <400> 959 ggagttcaga cgtgtgctct tccgatctaa tactacatgc cggaggacc 49 <210> 960 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa168_R_ilmn (Illumina) <400> 960 ggagttcaga cgtgtgctct tccgatctcc tgtccacagc tcactaggt 49 <210> 961 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa169_R_ilmn (Illumina) <400> 961 ggagttcaga cgtgtgctct tccgatctgt cctggcgagg agaccta 47 <210> 962 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa170_R_ilmn (Illumina) <400> 962 ggagttcaga cgtgtgctct tccgatctcg tgcttacctg tctgtgga 48 <210> 963 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa171_R_ilmn (Illumina) <400> 963 ggagttcaga cgtgtgctct tccgatctga tggagagaga ccagcgtc 48 <210> 964 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa172_R_ilmn (Illumina) <400> 964 ggagttcaga cgtgtgctct tccgatctgt ttctggctca gttcctgc 48 <210> 965 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa173_R_ilmn (Illumina) <400> 965 ggagttcaga cgtgtgctct tccgatctag caatgggcct actaagca 48 <210> 966 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa174_R_ilmn (Illumina) <400> 966 ggagttcaga cgtgtgctct tccgatctgg cacccagagt gagtgagt 48 <210> 967 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa175_R_ilmn (Illumina) <400> 967 ggagttcaga cgtgtgctct tccgatctag cacctttcac actcaccc 48 <210> 968 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa176_R_ilmn (Illumina) <400> 968 ggagttcaga cgtgtgctct tccgatcttt ggcataaacc actgatgc 48 <210> 969 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa177_R_ilmn (Illumina) <400> 969 ggagttcaga cgtgtgctct tccgatctgt ggtggcacaa actgacac 48 <210> 970 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa178_R_ilmn (Illumina) <400> 970 ggagttcaga cgtgtgctct tccgatctgc atttaccagg agcaggaa 48 <210> 971 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa179_R_ilmn (Illumina) <400> 971 ggagttcaga cgtgtgctct tccgatctta atgtgacggc aatggaga 48 <210> 972 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa180_R_ilmn (Illumina) <400> 972 ggagttcaga cgtgtgctct tccgatctac aggcaggacg ttgactct 48 <210> 973 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa181_R_ilmn (Illumina) <400> 973 ggagttcaga cgtgtgctct tccgatctag cacctttcac actcaccc 48 <210> 974 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa182_R_ilmn (Illumina) <400> 974 ggagttcaga cgtgtgctct tccgatctag ggctcacctt gacaatga 48 <210> 975 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa183_R_ilmn (Illumina) <400> 975 ggagttcaga cgtgtgctct tccgatcttt cattctcttc ggaggaaca 49 <210> 976 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa184_R_ilmn (Illumina) <400> 976 ggagttcaga cgtgtgctct tccgatctgc tgagcaggtg tagacgc 47 <210> 977 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa185_R_ilmn (Illumina) <400> 977 ggagttcaga cgtgtgctct tccgatctgt ggtggcacaa actgacac 48 <210> 978 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa186_R_ilmn (Illumina) <400> 978 ggagttcaga cgtgtgctct tccgatctct gtctccagcc tctggcta 48 <210> 979 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa187_R_ilmn (Illumina) <400> 979 ggagttcaga cgtgtgctct tccgatctgc atttaccagg agcaggaa 48 <210> 980 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa188_R_ilmn (Illumina) <400> 980 ggagttcaga cgtgtgctct tccgatctga aggcacagtt accggaga 48 <210> 981 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa189_R_ilmn (Illumina) <400> 981 ggagttcaga cgtgtgctct tccgatctat ggattcagct cagatggg 48 <210> 982 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa190_R_ilmn (Illumina) <400> 982 ggagttcaga cgtgtgctct tccgatctga atcaggcctg ggtgataa 48 <210> 983 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa191_R_ilmn (Illumina) <400> 983 ggagttcaga cgtgtgctct tccgatctga aggcacagtt accggaga 48 <210> 984 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa192_R_ilmn (Illumina) <400> 984 ggagttcaga cgtgtgctct tccgatctcc actctgagag agcatccc 48 <210> 985 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa193_R_ilmn (Illumina) <400> 985 ggagttcaga cgtgtgctct tccgatctcg gaatcagaat cggacact 48 <210> 986 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa194_R_ilmn (Illumina) <400> 986 ggagttcaga cgtgtgctct tccgatctgc atttaccagg agcaggaa 48 <210> 987 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa195_R_ilmn (Illumina) <400> 987 ggagttcaga cgtgtgctct tccgatctcc atgaaagcta caaccagtga 50 <210> 988 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa196_R_ilmn (Illumina) <400> 988 ggagttcaga cgtgtgctct tccgatctta atgtgacggc aatggaga 48 <210> 989 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa197_R_ilmn (Illumina) <400> 989 ggagttcaga cgtgtgctct tccgatctga tggagagaga ccagcgtc 48 <210> 990 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa198_R_ilmn (Illumina) <400> 990 ggagttcaga cgtgtgctct tccgatctgc aacagagagg acagaccc 48 <210> 991 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa199_R_ilmn (Illumina) <400> 991 ggagttcaga cgtgtgctct tccgatctgc atcaccctag gcagtca 47 <210> 992 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa200_R_ilmn (Illumina) <400> 992 ggagttcaga cgtgtgctct tccgatcttt cattctcttc ggaggaaca 49 <210> 993 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa201_R_ilmn (Illumina) <400> 993 ggagttcaga cgtgtgctct tccgatctgt ggtggcacaa actgacac 48 <210> 994 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa202_R_ilmn (Illumina) <400> 994 ggagttcaga cgtgtgctct tccgatctga gtgggtacga tgcattcc 48 <210> 995 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa203_R_ilmn (Illumina) <400> 995 ggagttcaga cgtgtgctct tccgatctgg gcaattaaag cggttaca 48 <210> 996 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa204_R_ilmn (Illumina) <400> 996 ggagttcaga cgtgtgctct tccgatcttt cattctcttc ggaggaaca 49 <210> 997 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa205_R_ilmn (Illumina) <400> 997 ggagttcaga cgtgtgctct tccgatctga atcaggcctg ggtgataa 48 <210> 998 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa206_R_ilmn (Illumina) <400> 998 ggagttcaga cgtgtgctct tccgatctga aggcacagtt accggaga 48 <210> 999 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa207_R_ilmn (Illumina) <400> 999 ggagttcaga cgtgtgctct tccgatcttt cattctcttc ggaggaaca 49 <210> 1000 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa208_R_ilmn (Illumina) <400> 1000 ggagttcaga cgtgtgctct tccgatctcc ctcccaagac caggttag 48 <210> 1001 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa209_R_ilmn (Illumina) <400> 1001 ggagttcaga cgtgtgctct tccgatctgg cacccagagt gagtgagt 48 <210> 1002 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa210_R_ilmn (Illumina) <400> 1002 ggagttcaga cgtgtgctct tccgatctgc aacagagagg acagaccc 48 <210> 1003 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa211_R_ilmn (Illumina) <400> 1003 ggagttcaga cgtgtgctct tccgatctcg gaatcagaat cggacact 48 <210> 1004 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa212_R_ilmn (Illumina) <400> 1004 ggagttcaga cgtgtgctct tccgatctag ggctcacctt gacaatga 48 <210> 1005 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa213_R_ilmn (Illumina) <400> 1005 ggagttcaga cgtgtgctct tccgatctga ggagacctag aggccgtg 48 <210> 1006 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa214_R_ilmn (Illumina) <400> 1006 ggagttcaga cgtgtgctct tccgatctat ggattcagct cagatggg 48 <210> 1007 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa215_R_ilmn (Illumina) <400> 1007 ggagttcaga cgtgtgctct tccgatctag cacctttcac actcaccc 48 <210> 1008 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa216_R_ilmn (Illumina) <400> 1008 ggagttcaga cgtgtgctct tccgatctgc aacagagagg acagaccc 48 <210> 1009 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa217_R_ilmn (Illumina) <400> 1009 ggagttcaga cgtgtgctct tccgatctga atcaggcctg ggtgataa 48 <210> 1010 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa218_R_ilmn (Illumina) <400> 1010 ggagttcaga cgtgtgctct tccgatctcg gaatcagaat cggacact 48 <210> 1011 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa219_R_ilmn (Illumina) <400> 1011 ggagttcaga cgtgtgctct tccgatcttt cattctcttc ggaggaaca 49 <210> 1012 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa220_R_ilmn (Illumina) <400> 1012 ggagttcaga cgtgtgctct tccgatctgc ggtggatctt gagatagc 48 <210> 1013 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa221_R_ilmn (Illumina) <400> 1013 ggagttcaga cgtgtgctct tccgatctga tggagagaga ccagcgtc 48 <210> 1014 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa222_R_ilmn (Illumina) <400> 1014 ggagttcaga cgtgtgctct tccgatctgg cacccagagt gagtgagt 48 <210> 1015 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa223_R_ilmn (Illumina) <400> 1015 ggagttcaga cgtgtgctct tccgatctgc aacagagagg acagaccc 48 <210> 1016 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa224_R_ilmn (Illumina) <400> 1016 ggagttcaga cgtgtgctct tccgatctct ccagtcctgc ctatcagc 48 <210> 1017 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa33F <400> 1017 accgagcgtt tcctcacgtc acagtatgtc tctggcgagt tccccgcgcc agcggggata 60 aaccgtacta aaaatgtact gacctcctat taatgcc 97 <210> 1018 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa36F <400> 1018 accgcctcat tcgctgccaa cctagccagc ccagaagagt tccccgcgcc agcggggata 60 aaccgtcgac agccacagac ttgtctggcg gagtttc 97 <210> 1019 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa37F <400> 1019 accgtctgtg gctgtcgaca tgctaagtga gggcctgagt tccccgcgcc agcggggata 60 aaccgtagtc tcaagtttgt tcaaagctgg actcctc 97 <210> 1020 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa38F <400> 1020 accgttggct gttatgagga cttcacagct ggtgtcgagt tccccgcgcc agcggggata 60 aaccgggagg aaggactcct ccactggaga actgata 97 <210> 1021 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa39F <400> 1021 accgaggtaa tgcgtcggcc cgggactaca tctcccgagt tccccgcgcc agcggggata 60 aaccgacggc aactcggtta agtcttcccc caccgcc 97 <210> 1022 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa40F <400> 1022 accgatgcgg tagtcgctgc agctagctgc ccacctgagt tccccgcgcc agcggggata 60 aaccggggag gcggggtaag ggaagtaggt ggaagat 97 <210> 1023 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa42F <400> 1023 accggcagga ggaggtggag agagagtggg ggaaaagagt tccccgcgcc agcggggata 60 aaccgatgaa aaggcagtca ggtcttcagt agccaaa 97 <210> 1024 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa43F <400> 1024 accgatgagt ctaggttaca ttcagtgcaa aaaaccgagt tccccgcgcc agcggggata 60 aaccggtaag tttttaaaat atatatctac catgtat 97 <210> 1025 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa44F <400> 1025 accgctttcc ttggagccaa atttaaaacc tctgccgagt tccccgcgcc agcggggata 60 aaccgctagg gcctcggtga tggaaatcca cttgtgc 97 <210> 1026 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa45F <400> 1026 accgcatgac ggacaagtac aggctgcacc tgtcaggagt tccccgcgcc agcggggata 60 aaccgaccaa tccattgccc acaatgccag ttaagaa 97 <210> 1027 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa46F <400> 1027 accgacaagt tttgggtctc agcgcaggcc tcagttgagt tccccgcgcc agcggggata 60 aaccgaggtc tgtccagatg ctaagaccag gtacttc 97 <210> 1028 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa47F <400> 1028 accggtaatg tgtggggagc gggcgtcgga aggaccgagt tccccgcgcc agcggggata 60 aaccgcacga aggggttggg ggatgctggg ggtccgg 97 <210> 1029 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa48F <400> 1029 accgcggcgg ctgagggtga cccagaaccg ggtcccgagt tccccgcgcc agcggggata 60 aaccgaaggc cagttgtatg gaccgtgtgg tggtggt 97 <210> 1030 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa49F <400> 1030 accgtatatc tgcaaattta ataaatcaag agggaagagt tccccgcgcc agcggggata 60 aaccgacaaa tcacaaactg gtgtgaatag agccagc 97 <210> 1031 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa51F <400> 1031 accgaagact aagaggtagt ttctgaactt ctccccgagt tccccgcgcc agcggggata 60 aaccgctgtt ctattttcca gcaagaggct cccgagc 97 <210> 1032 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa52F <400> 1032 accggactga agaccaagca acctggaaag aagtcggagt tccccgcgcc agcggggata 60 aaccgtgtct gcaggagagc aaaacaaact tagccgt 97 <210> 1033 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa53F <400> 1033 accgttggcc tctctttgga tccaataggc atttttgagt tccccgcgcc agcggggata 60 aaccgcaggt attgacaaat tttatataac tttataa 97 <210> 1034 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa56F <400> 1034 accgaaacta caacacctag tacccttgga agtaccgagt tccccgcgcc agcggggata 60 aaccgttccc tgggtaggta actctggggt agcagta 97 <210> 1035 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa58F <400> 1035 accgggatgg catgggagac aaggtactcc tccagggagt tccccgcgcc agcggggata 60 aaccggcctt aacagaaatc tcggattctc tcctggg 97 <210> 1036 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa59F <400> 1036 accgattgga attatcttct agctcttgtc gaagatgagt tccccgcgcc agcggggata 60 aaccgaaggt atcaagactg tgacttttaa ttgtagt 97 <210> 1037 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa60F <400> 1037 accgatgatt ggaattatct tctagctctt gtcgaagagt tccccgcgcc agcggggata 60 aaccggtatc aagactgtga cttttaattg tagttta 97 <210> 1038 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa62F <400> 1038 accgggaaca gattttgtgc aaaactctgc agaaacgagt tccccgcgcc agcggggata 60 aaccgcagtt ccaaggtcag taaattactg aaaggta 97 <210> 1039 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa63F <400> 1039 accggaatcc agcttcttcc aatttcttca catcgtgagt tccccgcgcc agcggggata 60 aaccggagct aataaatatt aagggaatta gtgaagc 97 <210> 1040 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa67F <400> 1040 accgccagag gcccggcacc cccgcacagg cgcctcgagt tccccgcgcc agcggggata 60 aaccgaagga gcaattcctc ttctgcccgc ttggctg 97 <210> 1041 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa68F <400> 1041 accggaaggg tcgctctttg cagcttcttt gaattcgagt tccccgcgcc agcggggata 60 aaccgagctg atgtcaatgc tatggactgc acaaaag 97 <210> 1042 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa69F <400> 1042 accgaacaaa atcctctatg tctgtagaca actcttgagt tccccgcgcc agcggggata 60 aaccgcaagg taagccagcg actgctagat ttttttt 97 <210> 1043 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa72F <400> 1043 accgccagtg gcactggggg gtgccgcctc ggggcagagt tccccgcgcc agcggggata 60 aaccggccag gcccaggcga ctggcggcca ggtgtcc 97 <210> 1044 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa74F <400> 1044 accgggctac agaaaccgtg ccaaaagact tctacagagt tccccgcgcc agcggggata 60 aaccgttcag gagagttatt ttcctttttt gcaaaat 97 <210> 1045 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa77F <400> 1045 accggatttc ctaaaggaat ttaacaacaa gaccatgagt tccccgcgcc agcggggata 60 aaccggttcc tctgtctgat ggacttattc aatgttt 97 <210> 1046 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa78F <400> 1046 accgacggtg gaaacgttct ctactacgaa gtgatggagt tccccgcgcc agcggggata 60 aaccgaaatc agtaacatgg aagtctcaaa tatttca 97 <210> 1047 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa82F <400> 1047 accgaattat gagatatgga aacagacgca tttttagagt tccccgcgcc agcggggata 60 aaccgtgcca ccaggtaaat atcaatttat ttctttt 97 <210> 1048 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa84F <400> 1048 accgtctttt taactctctc ctgtagaatc ttacatgagt tccccgcgcc agcggggata 60 aaccgaagat atacaaaaag aaacagttta ttgctta 97 <210> 1049 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa87F <400> 1049 accggcttct ctgattttgg taggctagaa atacgtgagt tccccgcgcc agcggggata 60 aaccgaagag cagcatcttg aatctcatac agactgc 97 <210> 1050 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa88F <400> 1050 accgatgctg ctcttcatct ctcttattta ccactggagt tccccgcgcc agcggggata 60 aaccgcaggc aatatctgga acttctccag tggcttc 97 <210> 1051 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa89F <400> 1051 accgtttttc caaatcctgt taaagtataa aacagagagt tccccgcgcc agcggggata 60 aaccgaccac attggaaagt caatgccaaa tgtccta 97 <210> 1052 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa92F <400> 1052 accggcagca gtcagtgggc agtggcccct tgcagcgagt tccccgcgcc agcggggata 60 aaccgcactc tgactgcctg gtatgtgcct ctgcttt 97 <210> 1053 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa94F <400> 1053 accgcgtgga tgctggcctc cctgtggccc acgcacgagt tccccgcgcc agcggggata 60 aaccgtcaag gagcatggaa tcccggcccc tcaggag 97 <210> 1054 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa96F <400> 1054 accgcaaaca ccgcatctgg gagaggaaag cagaaggagt tccccgcgcc agcggggata 60 aaccgccctg ttgatgcagg acactcgccg caggctc 97 <210> 1055 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa97F <400> 1055 accgccctgc ccactactct cttaatgctg acaacagagt tccccgcgcc agcggggata 60 aaccgcagag gtgggagcag tgcccattgc tggaagc 97 <210> 1056 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa98F <400> 1056 accgtgcttc cagcaatggg cactgctccc acctctgagt tccccgcgcc agcggggata 60 aaccgacgag gatgtccatc acataatcca aatggcc 97 <210> 1057 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa99F <400> 1057 accgactgct cagggctatc ctctcagagt gacattgagt tccccgcgcc agcggggata 60 aaccgctgct tcaccttaaa taacaaaaac agaggtt 97 <210> 1058 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa100F <400> 1058 accggacaaa gttggttctt cagaatcatt ctgtgagagt tccccgcgcc agcggggata 60 aaccgttcta gaaatgaaac atgttctaat aatacag 97 <210> 1059 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa101F <400> 1059 accgagctag ttaaggacaa agttggttct tcagaagagt tccccgcgcc agcggggata 60 aaccgaaaca tgttctaata atacagtaat ctctcag 97 <210> 1060 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa103F <400> 1060 accgaaaacc caatagagta ggttctttga tcttttgagt tccccgcgcc agcggggata 60 aaccggaatc tttggacaaa gtgaaaaacc tttttga 97 <210> 1061 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa104F <400> 1061 accgattcct ttgcaatttt aacttttttc ccgctagagt tccccgcgcc agcggggata 60 aaccgagcaa ggtactagtg aaatcaccag ttttagc 97 <210> 1062 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa105F <400> 1062 accgttttga gattttcagt ttgtctacat aaattagagt tccccgcgcc agcggggata 60 aaccgaaaat gtagaaaaag aaacagcaaa aagtcct 97 <210> 1063 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa106F <400> 1063 accgtctgac tcacagaagt ttttctacta caacttgagt tccccgcgcc agcggggata 60 aaccggaata tttgatggtc aaccagaaag aataaat 97 <210> 1064 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa107F <400> 1064 accgcagatg aatttaccac attatatgaa aagcctgagt tccccgcgcc agcggggata 60 aaccgtttcc attttagaaa gttccttaca caaagtt 97 <210> 1065 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa108F <400> 1065 accgtttcag ttttaccaat ttccattttt acgtttgagt tccccgcgcc agcggggata 60 aaccgtttgt tctacttact ccaaagattc agaaaac 97 <210> 1066 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa109F <400> 1066 accgtgtggc atgacttggc agtttagaat ctgtcagagt tccccgcgcc agcggggata 60 aaccggtttt gtcaaattca agaattggaa aaagaag 97 <210> 1067 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa112F <400> 1067 accgttatgc aattcttctg gtttctgatc aaagaagagt tccccgcgcc agcggggata 60 aaccgaaaga acaaaatgga cattctaagt tatgagg 97 <210> 1068 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa120F <400> 1068 accggaatga tttccacaga ggtgaggcca ggggccgagt tccccgcgcc agcggggata 60 aaccgccatg gacttctatg atccagcaag gtaggtt 97 <210> 1069 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa122F <400> 1069 accgaagaat cttctctgaa cctacaagag aggaaagagt tccccgcgcc agcggggata 60 aaccgagatg atgaggtgag ttggcagcag gtctttg 97 <210> 1070 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa123F <400> 1070 accgtgacgg gctattaccg ggtgaactac gacgaagagt tccccgcgcc agcggggata 60 aaccgtgctg aagagatcgt tctgggctgt ggagagg 97 <210> 1071 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa124F <400> 1071 accgtctaag tcatccaaag catgaatcag ggaggagagt tccccgcgcc agcggggata 60 aaccgagcta atcctcaagt cggcgtggct tttcctc 97 <210> 1072 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa126F <400> 1072 accgtcttag accccagcca cagggatatt tccctggagt tccccgcgcc agcggggata 60 aaccgttcct tcgtcatcct tgtaatccat cagggtc 97 <210> 1073 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa128F <400> 1073 accggtaaat atgagggaaa tgtctttcta tgaagagagt tccccgcgcc agcggggata 60 aaccgctgtg ttctcatgtc aaaaacatgg aactttc 97 <210> 1074 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa33R <400> 1074 actcggcatt aataggaggt cagtacattt ttagtacggt ttatccccgc tggcgcgggg 60 aactcgccag agacatactg tgacgtgagg aaacgct 97 <210> 1075 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa36R <400> 1075 actcgaaact ccgccagaca agtctgtggc tgtcgacggt ttatccccgc tggcgcgggg 60 aactcttctg ggctggctag gttggcagcg aatgagg 97 <210> 1076 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa37R <400> 1076 actcgaggag tccagctttg aacaaacttg agactacggt ttatccccgc tggcgcgggg 60 aactcaggcc ctcacttagc atgtcgacag ccacaga 97 <210> 1077 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa38R <400> 1077 actctatcag ttctccagtg gaggagtcct tcctcccggt ttatccccgc tggcgcgggg 60 aactcgacac cagctgtgaa gtcctcataa cagccaa 97 <210> 1078 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa39R <400> 1078 actcggcggt gggggaagac ttaaccgagt tgccgtcggt ttatccccgc tggcgcgggg 60 aactcgggag atgtagtccc gggccgacgc attacct 97 <210> 1079 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa40R <400> 1079 actcatcttc cacctacttc ccttaccccg cctccccggt ttatccccgc tggcgcgggg 60 aactcaggtg ggcagctagc tgcagcgact accgcat 97 <210> 1080 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa42R <400> 1080 actctttggc tactgaagac ctgactgcct tttcatcggt ttatccccgc tggcgcgggg 60 aactcttttc ccccactctc tctccacctc ctcctgc 97 <210> 1081 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa43R <400> 1081 actcatacat ggtagatata tattttaaaa acttaccggt ttatccccgc tggcgcgggg 60 aactcggttt tttgcactga atgtaaccta gactcat 97 <210> 1082 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa44R <400> 1082 actcgcacaa gtggatttcc atcaccgagg ccctagcggt ttatccccgc tggcgcgggg 60 aactcggcag aggttttaaa tttggctcca aggaaag 97 <210> 1083 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa45R <400> 1083 actcttctta actggcattg tgggcaatgg attggtcggt ttatccccgc tggcgcgggg 60 aactcctgac aggtgcagcc tgtacttgtc cgtcatg 97 <210> 1084 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa46R <400> 1084 actcgaagta cctggtctta gcatctggac agacctcggt ttatccccgc tggcgcgggg 60 aactcaactg aggcctgcgc tgagacccaa aacttgt 97 <210> 1085 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa47R <400> 1085 actcccggac ccccagcatc ccccaacccc ttcgtgcggt ttatccccgc tggcgcgggg 60 aactcggtcc ttccgacgcc cgctccccac acattac 97 <210> 1086 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa48R <400> 1086 actcaccacc accacacggt ccatacaact ggccttcggt ttatccccgc tggcgcgggg 60 aactcgggac ccggttctgg gtcaccctca gccgccg 97 <210> 1087 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa49R <400> 1087 actcgctggc tctattcaca ccagtttgtg atttgtcggt ttatccccgc tggcgcgggg 60 aactcttccc tcttgattta ttaaatttgc agatata 97 <210> 1088 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa51R <400> 1088 actcgctcgg gagcctcttg ctggaaaata gaacagcggt ttatccccgc tggcgcgggg 60 aactcgggga gaagttcaga aactacctct tagtctt 97 <210> 1089 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa52R <400> 1089 actcacggct aagtttgttt tgctctcctg cagacacggt ttatccccgc tggcgcgggg 60 aactccgact tctttccagg ttgcttggtc ttcagtc 97 <210> 1090 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa53R <400> 1090 actcttataa agttatataa aatttgtcaa tacctgcggt ttatccccgc tggcgcgggg 60 aactcaaaaa tgcctattgg atccaaagag aggccaa 97 <210> 1091 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa56R <400> 1091 actctactgc taccccagag ttacctaccc agggaacggt ttatccccgc tggcgcgggg 60 aactcggtac ttccaagggt actaggtgtt gtagttt 97 <210> 1092 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa58R <400> 1092 actccccagg agagaatccg agatttctgt taaggccggt ttatccccgc tggcgcgggg 60 aactccctgg aggagtacct tgtctcccat gccatcc 97 <210> 1093 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa59R <400> 1093 actcactaca attaaaagtc acagtcttga taccttcggt ttatccccgc tggcgcgggg 60 aactcatctt cgacaagagc tagaagataa ttccaat 97 <210> 1094 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa60R <400> 1094 actctaaact acaattaaaa gtcacagtct tgataccggt ttatccccgc tggcgcgggg 60 aactcttcga caagagctag aagataattc caatcat 97 <210> 1095 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa62R <400> 1095 actctacctt tcagtaattt actgaccttg gaactgcggt ttatccccgc tggcgcgggg 60 aactcgtttc tgcagagttt tgcacaaaat ctgttcc 97 <210> 1096 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa63R <400> 1096 actcgcttca ctaattccct taatatttat tagctccggt ttatccccgc tggcgcgggg 60 aactcacgat gtgaagaaat tggaagaagc tggattc 97 <210> 1097 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa67R <400> 1097 actccagcca agcgggcaga agaggaattg ctccttcggt ttatccccgc tggcgcgggg 60 aactcgaggc gcctgtgcgg gggtgccggg cctctgg 97 <210> 1098 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa68R <400> 1098 actccttttg tgcagtccat agcattgaca tcagctcggt ttatccccgc tggcgcgggg 60 aactcgaatt caaagaagct gcaaagagcg acccttc 97 <210> 1099 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa69R <400> 1099 actcaaaaaa aatctagcag tcgctggctt accttgcggt ttatccccgc tggcgcgggg 60 aactcaagag ttgtctacag acatagagga ttttgtt 97 <210> 1100 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa72R <400> 1100 actcggacac ctggccgcca gtcgcctggg cctggccggt ttatccccgc tggcgcgggg 60 aactctgccc cgaggcggca ccccccagtg ccactgg 97 <210> 1101 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa74R <400> 1101 actcattttg caaaaaagga aaataactct cctgaacggt ttatccccgc tggcgcgggg 60 aactctgtag aagtcttttg gcacggtttc tgtagcc 97 <210> 1102 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa77R <400> 1102 actcaaacat tgaataagtc catcagacag aggaaccggt ttatccccgc tggcgcgggg 60 aactcatggt cttgttgtta aattccttta ggaaatc 97 <210> 1103 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa78R <400> 1103 actctgaaat atttgagact tccatgttac tgatttcggt ttatccccgc tggcgcgggg 60 aactccatca cttcgtagta gagaacgttt ccaccgt 97 <210> 1104 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa82R <400> 1104 actcaaaaga aataaattga tatttacctg gtggcacggt ttatccccgc tggcgcgggg 60 aactctaaaa atgcgtctgt ttccatatct cataatt 97 <210> 1105 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa84R <400> 1105 actctaagca ataaactgtt tctttttgta tatcttcggt ttatccccgc tggcgcgggg 60 aactcatgta agattctaca ggagagagtt aaaaaga 97 <210> 1106 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa87R <400> 1106 actcgcagtc tgtatgagat tcaagatgct gctcttcggt ttatccccgc tggcgcgggg 60 aactcacgta tttctagcct accaaaatca gagaagc 97 <210> 1107 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa88R <400> 1107 actcgaagcc actggagaag ttccagatat tgcctgcggt ttatccccgc tggcgcgggg 60 aactccagtg gtaaataaga gagatgaaga gcagcat 97 <210> 1108 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa89R <400> 1108 actctaggac atttggcatt gactttccaa tgtggtcggt ttatccccgc tggcgcgggg 60 aactctctgt tttatacttt aacaggattt ggaaaaa 97 <210> 1109 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa92R <400> 1109 actcaaagca gaggcacata ccaggcagtc agagtgcggt ttatccccgc tggcgcgggg 60 aactcgctgc aaggggccac tgcccactga ctgctgc 97 <210> 1110 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa94R <400> 1110 actcctcctg aggggccggg attccatgct ccttgacggt ttatccccgc tggcgcgggg 60 aactcgtgcg tgggccacag ggaggccagc atccacg 97 <210> 1111 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa96R <400> 1111 actcgagcct gcggcgagtg tcctgcatca acagggcggt ttatccccgc tggcgcgggg 60 aactccttct gctttcctct cccagatgcg gtgtttg 97 <210> 1112 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa97R <400> 1112 actcgcttcc agcaatgggc actgctccca cctctgcggt ttatccccgc tggcgcgggg 60 aactctgttg tcagcattaa gagagtagtg ggcaggg 97 <210> 1113 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa98R <400> 1113 actcggccat ttggattatg tgatggacat cctcgtcggt ttatccccgc tggcgcgggg 60 aactcagagg tgggagcagt gcccattgct ggaagca 97 <210> 1114 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa99R <400> 1114 actcaacctc tgtttttgtt atttaaggtg aagcagcggt ttatccccgc tggcgcgggg 60 aactcaatgt cactctgaga ggatagccct gagcagt 97 <210> 1115 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa100R <400> 1115 actcctgtat tattagaaca tgtttcattt ctagaacggt ttatccccgc tggcgcgggg 60 aactctcaca gaatgattct gaagaaccaa ctttgtc 97 <210> 1116 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa101R <400> 1116 actcctgaga gattactgta ttattagaac atgtttcggt ttatccccgc tggcgcgggg 60 aactcttctg aagaaccaac tttgtcctta actagct 97 <210> 1117 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa103R <400> 1117 actctcaaaa aggtttttca ctttgtccaa agattccggt ttatccccgc tggcgcgggg 60 aactcaaaag atcaaagaac ctactctatt gggtttt 97 <210> 1118 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa104R <400> 1118 actcgctaaa actggtgatt tcactagtac cttgctcggt ttatccccgc tggcgcgggg 60 aactctagcg ggaaaaaagt taaaattgca aaggaat 97 <210> 1119 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa105R <400> 1119 actcaggact ttttgctgtt tctttttcta cattttcggt ttatccccgc tggcgcgggg 60 aactctaatt tatgtagaca aactgaaaat ctcaaaa 97 <210> 1120 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa106R <400> 1120 actcatttat tctttctggt tgaccatcaa atattccggt ttatccccgc tggcgcgggg 60 aactcaagtt gtagtagaaa aacttctgtg agtcaga 97 <210> 1121 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa107R <400> 1121 actcaacttt gtgtaaggaa ctttctaaaa tggaaacggt ttatccccgc tggcgcgggg 60 aactcaggct tttcatataa tgtggtaaat tcatctg 97 <210> 1122 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa108R <400> 1122 actcgttttc tgaatctttg gagtaagtag aacaaacggt ttatccccgc tggcgcgggg 60 aactcaaacg taaaaatgga aattggtaaa actgaaa 97 <210> 1123 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa109R <400> 1123 actccttctt tttccaattc ttgaatttga caaaaccggt ttatccccgc tggcgcgggg 60 aactctgaca gattctaaac tgccaagtca tgccaca 97 <210> 1124 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa112R <400> 1124 actccctcat aacttagaat gtccattttg ttctttcggt ttatccccgc tggcgcgggg 60 aactcttctt tgatcagaaa ccagaagaat tgcataa 97 <210> 1125 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa120R <400> 1125 actcaaccta ccttgctgga tcatagaagt ccatggcggt ttatccccgc tggcgcgggg 60 aactcggccc ctggcctcac ctctgtggaa atcattc 97 <210> 1126 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa122R <400> 1126 actccaaaga cctgctgcca actcacctca tcatctcggt ttatccccgc tggcgcgggg 60 aactctttcc tctcttgtag gttcagagaa gattctt 97 <210> 1127 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa123R <400> 1127 actccctctc cacagcccag aacgatctct tcagcacggt ttatccccgc tggcgcgggg 60 aactcttcgt cgtagttcac ccggtaatag cccgtca 97 <210> 1128 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa124R <400> 1128 actcgaggaa aagccacgcc gacttgagga ttagctcggt ttatccccgc tggcgcgggg 60 aactctcctc cctgattcat gctttggatg acttaga 97 <210> 1129 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa126R <400> 1129 actcgaccct gatggattac aaggatgacg aaggaacggt ttatccccgc tggcgcgggg 60 aactccaggg aaatatccct gtggctgggg tctaaga 97 <210> 1130 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa128R <400> 1130 actcgaaagt tccatgtttt tgacatgaga acacagcggt ttatccccgc tggcgcgggg 60 aactctcttc atagaaagac atttccctca tatttac 97 <210> 1131 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa33F_ilmn (Illumina) <400> 1131 cactctttcc ctacacgacg ctcttccgat ctccagtcat gaacgtctcc g 51 <210> 1132 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa36F_ilmn (Illumina) <400> 1132 cactctttcc ctacacgacg ctcttccgat ctgaagagcc ctgccgagag 50 <210> 1133 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa37F_ilmn (Illumina) <400> 1133 cactctttcc ctacacgacg ctcttccgat ctctaggttg gcagcgaatg ag 52 <210> 1134 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa38F_ilmn (Illumina) <400> 1134 cactctttcc ctacacgacg ctcttccgat ctcagcctat gagcttcctg gt 52 <210> 1135 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa39F_ilmn (Illumina) <400> 1135 cactctttcc ctacacgacg ctcttccgat ctaatagtcc agctgcgatg gt 52 <210> 1136 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa40F_ilmn (Illumina) <400> 1136 cactctttcc ctacacgacg ctcttccgat ctcgcaagtt tccttctctg ga 52 <210> 1137 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa42F_ilmn (Illumina) <400> 1137 cactctttcc ctacacgacg ctcttccgat ctcttcagca ctgcagccac 50 <210> 1138 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa43F_ilmn (Illumina) <400> 1138 cactctttcc ctacacgacg ctcttccgat ctccactgtt tcatgtggca tc 52 <210> 1139 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa44F_ilmn (Illumina) <400> 1139 cactctttcc ctacacgacg ctcttccgat ctgatgaatg tccacctcgc tt 52 <210> 1140 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa45F_ilmn (Illumina) <400> 1140 cactctttcc ctacacgacg ctcttccgat cttcccaaag taccagtttg cc 52 <210> 1141 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa46F_ilmn (Illumina) <400> 1141 cactctttcc ctacacgacg ctcttccgat cttttggaca cacgaaggca ta 52 <210> 1142 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa47F_ilmn (Illumina) <400> 1142 cactctttcc ctacacgacg ctcttccgat ctctcagcca tctccttctc gt 52 <210> 1143 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa48F_ilmn (Illumina) <400> 1143 cactctttcc ctacacgacg ctcttccgat ctagtgccgc tatggggacc t 51 <210> 1144 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa49F_ilmn (Illumina) <400> 1144 cactctttcc ctacacgacg ctcttccgat ctcaccttta ttcctttgtc taacaatct 59 <210> 1145 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa51F_ilmn (Illumina) <400> 1145 cactctttcc ctacacgacg ctcttccgat ctagactctt gggatgacgc ac 52 <210> 1146 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa52F_ilmn (Illumina) <400> 1146 cactctttcc ctacacgacg ctcttccgat ctcaagctct ggtaggcagc tc 52 <210> 1147 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa53F_ilmn (Illumina) <400> 1147 cactctttcc ctacacgacg ctcttccgat ctaatgcatc cctgtgtaag tgc 53 <210> 1148 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa56F_ilmn (Illumina) <400> 1148 cactctttcc ctacacgacg ctcttccgat ctccatgttg agacacaggg tg 52 <210> 1149 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa58F_ilmn (Illumina) <400> 1149 cactctttcc ctacacgacg ctcttccgat ctaggtctct ctggtgctgg aa 52 <210> 1150 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa59F_ilmn (Illumina) <400> 1150 cactctttcc ctacacgacg ctcttccgat cttgaggcac tgaagatgga ga 52 <210> 1151 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa60F_ilmn (Illumina) <400> 1151 cactctttcc ctacacgacg ctcttccgat cttgaggcac tgaagatgga ga 52 <210> 1152 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa62F_ilmn (Illumina) <400> 1152 cactctttcc ctacacgacg ctcttccgat cttttgccct gaattcctta catac 55 <210> 1153 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa63F_ilmn (Illumina) <400> 1153 cactctttcc ctacacgacg ctcttccgat ctcttcattt gcagcagtgt gg 52 <210> 1154 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa67F_ilmn (Illumina) <400> 1154 cactctttcc ctacacgacg ctcttccgat ctcccaactc acctcatcac ct 52 <210> 1155 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa68F_ilmn (Illumina) <400> 1155 cactctttcc ctacacgacg ctcttccgat ctaaatgaat gaggatggcc tg 52 <210> 1156 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa69F_ilmn (Illumina) <400> 1156 cactctttcc ctacacgacg ctcttccgat ctggcttgct ttcagtttgg ag 52 <210> 1157 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa72F_ilmn (Illumina) <400> 1157 cactctttcc ctacacgacg ctcttccgat ctcctgactt gggtacgtgc tt 52 <210> 1158 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa74F_ilmn (Illumina) <400> 1158 cactctttcc ctacacgacg ctcttccgat ctcaaggaag gattttcggg tt 52 <210> 1159 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa77F_ilmn (Illumina) <400> 1159 cactctttcc ctacacgacg ctcttccgat cttcaggtca tgcgtggaca 50 <210> 1160 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa78F_ilmn (Illumina) <400> 1160 cactctttcc ctacacgacg ctcttccgat ctcatacgct atgtgacacg gg 52 <210> 1161 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa82F_ilmn (Illumina) <400> 1161 cactctttcc ctacacgacg ctcttccgat ctgcacaaac aatgaggtgc at 52 <210> 1162 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa84F_ilmn (Illumina) <400> 1162 cactctttcc ctacacgacg ctcttccgat ctcaattgga atcctaactt tccttg 56 <210> 1163 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa87F_ilmn (Illumina) <400> 1163 cactctttcc ctacacgacg ctcttccgat cttgcatatt tcttcatgtg acca 54 <210> 1164 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa88F_ilmn (Illumina) <400> 1164 cactctttcc ctacacgacg ctcttccgat ctctttgcca cgtatttcta gcct 54 <210> 1165 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa89F_ilmn (Illumina) <400> 1165 cactctttcc ctacacgacg ctcttccgat ctttctatga gaaaggttgt gagaataata 60 <210> 1166 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa92F_ilmn (Illumina) <400> 1166 cactctttcc ctacacgacg ctcttccgat ctagtgacgc gcactgtctg t 51 <210> 1167 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa94F_ilmn (Illumina) <400> 1167 cactctttcc ctacacgacg ctcttccgat ctgaccttgg cacccacaag 50 <210> 1168 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa96F_ilmn (Illumina) <400> 1168 cactctttcc ctacacgacg ctcttccgat ctccagtgga taatgaatgc aca 53 <210> 1169 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa97F_ilmn (Illumina) <400> 1169 cactctttcc ctacacgacg ctcttccgat cttagcttgc tttggaggga aa 52 <210> 1170 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa98F_ilmn (Illumina) <400> 1170 cactctttcc ctacacgacg ctcttccgat ctaagagagt agtgggcagg gc 52 <210> 1171 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa99F_ilmn (Illumina) <400> 1171 cactctttcc ctacacgacg ctcttccgat ctaatgcaaa ggacaccaca ca 52 <210> 1172 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa100F_ilmn (Illumina) <400> 1172 cactctttcc ctacacgacg ctcttccgat ctggtttatt gcattcttct gtgaaa 56 <210> 1173 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa101F_ilmn (Illumina) <400> 1173 cactctttcc ctacacgacg ctcttccgat ctggtttatt gcattcttct gtgaaa 56 <210> 1174 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa103F_ilmn (Illumina) <400> 1174 cactctttcc ctacacgacg ctcttccgat ctagtgacct tccagggaca ac 52 <210> 1175 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa104F_ilmn (Illumina) <400> 1175 cactctttcc ctacacgacg ctcttccgat ctagtgacct tccagggaca ac 52 <210> 1176 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa105F_ilmn (Illumina) <400> 1176 cactctttcc ctacacgacg ctcttccgat cttgtggtgc cacctaagct ct 52 <210> 1177 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa106F_ilmn (Illumina) <400> 1177 cactctttcc ctacacgacg ctcttccgat ctttcagtca ttgaaaattc agcc 54 <210> 1178 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa107F_ilmn (Illumina) <400> 1178 cactctttcc ctacacgacg ctcttccgat ctcgaacatt cagaccagct ca 52 <210> 1179 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa108F_ilmn (Illumina) <400> 1179 cactctttcc ctacacgacg ctcttccgat ctagtgtcac ttgttgagaa cattcat 57 <210> 1180 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa109F_ilmn (Illumina) <400> 1180 cactctttcc ctacacgacg ctcttccgat cttttgaaac agaagcagta gaaattg 57 <210> 1181 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa112F_ilmn (Illumina) <400> 1181 cactctttcc ctacacgacg ctcttccgat ctttagtgtc gccaaagagt cattta 56 <210> 1182 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa120F_ilmn (Illumina) <400> 1182 cactctttcc ctacacgacg ctcttccgat ctcccatcct gaaaccaaga ag 52 <210> 1183 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa122F_ilmn (Illumina) <400> 1183 cactctttcc ctacacgacg ctcttccgat cttggaattt cttggcaatg tg 52 <210> 1184 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa123F_ilmn (Illumina) <400> 1184 cactctttcc ctacacgacg ctcttccgat ctcaccgagt ggtctctctg c 51 <210> 1185 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa124F_ilmn (Illumina) <400> 1185 cactctttcc ctacacgacg ctcttccgat cttccatctt tcttaccagg cag 53 <210> 1186 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa126F_ilmn (Illumina) <400> 1186 cactctttcc ctacacgacg ctcttccgat ctcaagggtt cttctcaacc ca 52 <210> 1187 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa128F_ilmn (Illumina) <400> 1187 cactctttcc ctacacgacg ctcttccgat ctcctggaag aaaccttggt ga 52 <210> 1188 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa33R_ilmn (Illumina) <400> 1188 ggagttcaga cgtgtgctct tccgatctaa ggcccagaat tcagcata 48 <210> 1189 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa36R_ilmn (Illumina) <400> 1189 ggagttcaga cgtgtgctct tccgatctac ttaagtgggc accaggag 48 <210> 1190 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa37R_ilmn (Illumina) <400> 1190 ggagttcaga cgtgtgctct tccgatctga caaatctcca gctgctcc 48 <210> 1191 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa38R_ilmn (Illumina) <400> 1191 ggagttcaga cgtgtgctct tccgatctat agcagtttcc atggtgcc 48 <210> 1192 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa39R_ilmn (Illumina) <400> 1192 ggagttcaga cgtgtgctct tccgatctgc gagagtatcg tctgagcc 48 <210> 1193 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa40R_ilmn (Illumina) <400> 1193 ggagttcaga cgtgtgctct tccgatcttt ctggaaagct cctcggta 48 <210> 1194 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa42R_ilmn (Illumina) <400> 1194 ggagttcaga cgtgtgctct tccgatcttg tccactgaag taggtgcaaa 50 <210> 1195 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa43R_ilmn (Illumina) <400> 1195 ggagttcaga cgtgtgctct tccgatcttt ggtaaaaggg caacaatg 48 <210> 1196 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa44R_ilmn (Illumina) <400> 1196 ggagttcaga cgtgtgctct tccgatctat tgggatcagc atcgactc 48 <210> 1197 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa45R_ilmn (Illumina) <400> 1197 ggagttcaga cgtgtgctct tccgatctct gcccaccatc tactccat 48 <210> 1198 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa46R_ilmn (Illumina) <400> 1198 ggagttcaga cgtgtgctct tccgatctct aactgccctg gagacctg 48 <210> 1199 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa47R_ilmn (Illumina) <400> 1199 ggagttcaga cgtgtgctct tccgatctct ccctcccacc ttctcc 46 <210> 1200 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa48R_ilmn (Illumina) <400> 1200 ggagttcaga cgtgtgctct tccgatctgt agccgtaggg ggctaca 47 <210> 1201 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa49R_ilmn (Illumina) <400> 1201 ggagttcaga cgtgtgctct tccgatctga ccctgccact tacatgc 47 <210> 1202 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa51R_ilmn (Illumina) <400> 1202 ggagttcaga cgtgtgctct tccgatctca actctgactg ggtcacca 48 <210> 1203 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa52R_ilmn (Illumina) <400> 1203 ggagttcaga cgtgtgctct tccgatcttg cttcccaaga gtttgctt 48 <210> 1204 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa53R_ilmn (Illumina) <400> 1204 ggagttcaga cgtgtgctct tccgatctgg ttctaagcaa cactgtgacg 50 <210> 1205 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa56R_ilmn (Illumina) <400> 1205 ggagttcaga cgtgtgctct tccgatcttt cttcctcctc gtttccct 48 <210> 1206 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa58R_ilmn (Illumina) <400> 1206 ggagttcaga cgtgtgctct tccgatctgc ttagccacct cagcaatc 48 <210> 1207 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa59R_ilmn (Illumina) <400> 1207 ggagttcaga cgtgtgctct tccgatcttc aagtttacaa gagggaatac tgaa 54 <210> 1208 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa60R_ilmn (Illumina) <400> 1208 ggagttcaga cgtgtgctct tccgatcttc aagtttacaa gagggaatac tgaa 54 <210> 1209 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa62R_ilmn (Illumina) <400> 1209 ggagttcaga cgtgtgctct tccgatctcc attctactca tccacagcc 49 <210> 1210 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa63R_ilmn (Illumina) <400> 1210 ggagttcaga cgtgtgctct tccgatctat tcccactaat gcctccct 48 <210> 1211 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa67R_ilmn (Illumina) <400> 1211 ggagttcaga cgtgtgctct tccgatcttg agtcctacct cgtgcctc 48 <210> 1212 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa68R_ilmn (Illumina) <400> 1212 ggagttcaga cgtgtgctct tccgatctgc tgcagactga atggaaca 48 <210> 1213 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa69R_ilmn (Illumina) <400> 1213 ggagttcaga cgtgtgctct tccgatcttc tagcctgggc aacagagt 48 <210> 1214 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa72R_ilmn (Illumina) <400> 1214 ggagttcaga cgtgtgctct tccgatctca cgaggagaac cctgagag 48 <210> 1215 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa74R_ilmn (Illumina) <400> 1215 ggagttcaga cgtgtgctct tccgatctgg gtttctcttg gtttctttga 50 <210> 1216 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa77R_ilmn (Illumina) <400> 1216 ggagttcaga cgtgtgctct tccgatcttt ggcaacatgt ggattcat 48 <210> 1217 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa78R_ilmn (Illumina) <400> 1217 ggagttcaga cgtgtgctct tccgatcttg gctaccttgg aaactttga 49 <210> 1218 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa82R_ilmn (Illumina) <400> 1218 ggagttcaga cgtgtgctct tccgatctag ccctgttctc tcaccaga 48 <210> 1219 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa84R_ilmn (Illumina) <400> 1219 ggagttcaga cgtgtgctct tccgatctaa acttcagttt catcatcatc attt 54 <210> 1220 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa87R_ilmn (Illumina) <400> 1220 ggagttcaga cgtgtgctct tccgatcttt gcctgcttta ctgcaaga 48 <210> 1221 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa88R_ilmn (Illumina) <400> 1221 ggagttcaga cgtgtgctct tccgatcttt gcattgaaag tctctttagg tg 52 <210> 1222 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa89R_ilmn (Illumina) <400> 1222 ggagttcaga cgtgtgctct tccgatcttc ttcttcagag gtatctacaa ctgttt 56 <210> 1223 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa92R_ilmn (Illumina) <400> 1223 ggagttcaga cgtgtgctct tccgatcttg gctttcactg tgctgttt 48 <210> 1224 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa94R_ilmn (Illumina) <400> 1224 ggagttcaga cgtgtgctct tccgatctgt ggtggcacaa actgacac 48 <210> 1225 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa96R_ilmn (Illumina) <400> 1225 ggagttcaga cgtgtgctct tccgatcttg tagtaggagg accgggtg 48 <210> 1226 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa97R_ilmn (Illumina) <400> 1226 ggagttcaga cgtgtgctct tccgatctct cgacagtcag ggtggaat 48 <210> 1227 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa98R_ilmn (Illumina) <400> 1227 ggagttcaga cgtgtgctct tccgatcttc tactggacgg actggagc 48 <210> 1228 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa99R_ilmn (Illumina) <400> 1228 ggagttcaga cgtgtgctct tccgatctaa tccagtcctg ccaatgag 48 <210> 1229 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa100R_ilmn (Illumina) <400> 1229 ggagttcaga cgtgtgctct tccgatctgg catgacagag aatcagctt 49 <210> 1230 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa101R_ilmn (Illumina) <400> 1230 ggagttcaga cgtgtgctct tccgatctgg catgacagag aatcagctt 49 <210> 1231 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa103R_ilmn (Illumina) <400> 1231 ggagttcaga cgtgtgctct tccgatcttt tagggtcttt gcccattg 48 <210> 1232 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa104R_ilmn (Illumina) <400> 1232 ggagttcaga cgtgtgctct tccgatcttt tagggtcttt gcccattg 48 <210> 1233 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa105R_ilmn (Illumina) <400> 1233 ggagttcaga cgtgtgctct tccgatcttc aagtaatgaa gtctgactca caga 54 <210> 1234 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa106R_ilmn (Illumina) <400> 1234 ggagttcaga cgtgtgctct tccgatcttg tcattttcag ctatagtact gtttga 56 <210> 1235 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa107R_ilmn (Illumina) <400> 1235 ggagttcaga cgtgtgctct tccgatctaa tcaaattcct ctaacactcc ctt 53 <210> 1236 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa108R_ilmn (Illumina) <400> 1236 ggagttcaga cgtgtgctct tccgatctga atgtgtggca tgacttgg 48 <210> 1237 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa109R_ilmn (Illumina) <400> 1237 ggagttcaga cgtgtgctct tccgatcttt ggcaacacga aaggtaaa 48 <210> 1238 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa112R_ilmn (Illumina) <400> 1238 ggagttcaga cgtgtgctct tccgatctgt tgtccctgga aggtcact 48 <210> 1239 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa120R_ilmn (Illumina) <400> 1239 ggagttcaga cgtgtgctct tccgatctcc caaattctgc ctcatcat 48 <210> 1240 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa122R_ilmn (Illumina) <400> 1240 ggagttcaga cgtgtgctct tccgatctcc caaacaactt gctttcatag a 51 <210> 1241 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa123R_ilmn (Illumina) <400> 1241 ggagttcaga cgtgtgctct tccgatctag cttgagggtg aggtggt 47 <210> 1242 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa124R_ilmn (Illumina) <400> 1242 ggagttcaga cgtgtgctct tccgatctca ttaacagctg agaaacactg ct 52 <210> 1243 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa126R_ilmn (Illumina) <400> 1243 ggagttcaga cgtgtgctct tccgatctga gaggcacgag aacacaca 48 <210> 1244 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa128R_ilmn (Illumina) <400> 1244 ggagttcaga cgtgtgctct tccgatctca ggtgtgtagc ttggagtttg 50 <210> 1245 <211> 5610 <212> DNA <213> Oceanicola sp. HL-35 <400> 1245 atgggcccca agaagaagag aaaggtaggc tccggcatga ccacatttct gcagttccac 60 gtgctgacca catatccccc ttctaaccct aatagggacg atcagggccg gccaaagcag 120 gcaaacctgg gaggagcacc aaggctgcgg ctgagctccc agtctatcaa gagggcaatg 180 agggagagcc ctgcattcca gcagggcctg gatggacaca tcggcacacg gaccaagaga 240 ctgggcgagg agatcaggga ggagctggca aagagggagg gcgtgagcac cgatcaggcc 300 ctggacgtgg catctaaggt ggcagccatc ttcagcaagc tggaggcccc cggcaaggac 360 aaggtgcaga agcctctgac cacaaccctg gcctttgtga gcccagatga gtgggcactg 420 gcaagagacc tggcatccag gatgctggca ggagaggaga tgcccaagga taaggagctg 480 aagcgcctgg tgctgcggag agcagatgga gcagtggaca tcgcaatgtt cggaaggatg 540 ctggcagacg agccaggata taacagggag gcagcagtgc aggtgagcca cgcaatcaca 600 acccacagag ccatcgccga ggacgattgg tactctgccg tggacgatct gaataagagg 660 gaggatagcg gcgcaggaca cctgggagag cacggatttg gctccggcgt gtactatctg 720 tacgcctgcg tgaacgtgga tctgctggtg gagaatctgg caggcgaccg cgccctggca 780 gcaaggggcc tggaggccct ggcaaaggcc ctggcaacag caaccccaag aggcaagcag 840 aactctcacg cccaccaccc cagggcaatc tatgtgaggg cagagagggg accacagcag 900 cctagggacc tgaccggcgc cttcttttct gccgtggatc tgaagagcaa tgacatcgag 960 cggacatcca tcatcgccct ggagagaacc gccgagcaga tcgatagggc atacggagca 1020 gcatgcgacg atacagccgt gatggacgtg aaggagggaa acggcaccct ggcagagatc 1080 gcagccttca gcggcgcatc tgtgagcgcc aatgcaggct ccggcgaggg aaggggctct 1140 ctgctgacat gtggcgatgt ggaggagaac cctggacctc cgaaaaaaaa gcggaaagtg 1200 ggctctggca tgagcgacag gaagcaggtc atcggcacat ggtggagaac caggatcggc 1260 gccagaaact ccaccgcagc aagggccctg gcagcacggc tgaatagagg agagggagtg 1320 gatgtgctgg cagagagggc cgtgtttgag ctgggaaggg acctgggctt cctgaagcag 1380 ccaaagcgcc tggtgctgct ggtgcgggtg ctggcagccg tgagggagga taggggaggc 1440 gccctgcctc tgaggctggg ccagggcgac cctccacccc tgagcccact gcggtttcag 1500 agactgctga gggcagaagg agaggagctg acaaccctgc tgaggcgcgc cctgccaatg 1560 gtgacacgca cctgcgacgt gggcgccctg ggagcagacc tgctggattg gtccgactct 1620 acacgcgcaa gatgggcctt tgcctatttc ggcgccaccc ctccagccag aatcaacaat 1680 agcaggccaa cacccgagac ccccgccctg tccgatcagg agacagagga gggcagcggc 1740 gagggaagag gctccctgct gacctgtggc gacgtggagg agaaccctgg acctccaaag 1800 aagaaaagaa aagtcggctc cggcatggca ctgtggcctc ggtctctgcc attcctggcc 1860 cggagatacc tgccaatgcg ggagcacctg gtgtttacac tggccgccgc cgtggcctcc 1920 atgggagagc tggcaggaca cgagaggagg ggcacctggt cttggcccgg cagatctagc 1980 gtgctgggcc tgtgcgcagc cgccctgggc atccggcggg acggcgattt ctccgccctg 2040 gacggactgg gactggcagt ggccgtgttt gatacaggag agccactgag ggacttccac 2100 accgccgtgt ccatcccatc ctctgtggcc aagaggccac agtctcgggc agatgccctg 2160 cgcatcgacg caggccggag caactccaca atcaccctgc gcgattacag ggtgggcgtg 2220 ctgtatggag tggccctgtg gggcgacgga ctgcctaccg tggccgagaa tctggtggag 2280 gccctgcagc gcccaacatt caccctgtac ctgggccgga agagctgtcc actggcagca 2340 ccactggcac cccgcgtgct gacagcccca gatgcagcag ccgccctgac agacggaatg 2400 accctgccac catggagagc aggagcaagg gcaggccaga tcgcaaccga ggaggagctg 2460 cctgcaccaa gaacagagac cagacacgat aggccaacag acaggaccgc ctggcacttt 2520 gcaccaaggg ccgtgcggct ggtgccttgc gatatcgccc caagaacagc aggacaggtg 2580 gcagcaggct ctggcgaggg caggggcagc ctgctgactt gcggcgacgt ggaagaaaac 2640 cctggacctc ctaaaaagaa acgaaaggta ggctccggca tgacactgtg gctgagccgg 2700 gtgcggatcg caagaggagc agacctggat accctgaggc cactgctgga ccccagcgcc 2760 ctgcacccag cagcaatgga ccccaagatg ctgggctccc agacagacgc ccaccacaga 2820 ctgatctgga ccctgtttgc cgattccaga gacaggcgcc gggacttcct gtggagggca 2880 gagggcgccg gcaagtttac actgctgagc ctgagacccc ctaccgcctc cagggtgttt 2940 gaggcccctg aggtgaaggc cttcagccca gatctgctgc caggcgacag gctggccttc 3000 gccctgcggg ccaacgccac ccgcgatcgg gccggctccg ccaagggcag aagggtggac 3060 gtggtcatgc acgccctgca caatgtgcca cccgaggata gggcagcagc aaggatgaca 3120 ctggcacagg atgcagcaag cgactggctg accggacagg gagccagagc aggattcgtg 3180 cccgaggagg tgacagcagg cgactactcc gtggccgccc tgccttctca caccggccgg 3240 agaaagggcc agccacagta tggcatcctg gatctgacag gcgtgctgag agtgaccgac 3300 cctgcagcct ttctggcaag gctgggacag ggatttggaa gagcaagggg attcggatgc 3360 ggactgatgc tgatcagaag ggcaggcagc ggcgaaggca ggggctccct gctgacttgt 3420 ggcgacgtgg aagaaaaccc tggacctccc aagaaaaaga ggaaagtggg tggcagccag 3480 ctggtgaagt ccgagctgga ggagaagaag tccgagctgc gccacaagct gaagtacgtg 3540 ccccacgagt atatcgagct gatcgagatc gccagaaatc ctacccagga tagaatcctg 3600 gagatgaaag tgatggagtt ctttatgaag gtgtacggct atcgcggcga gcacctggga 3660 ggctctcgga agccagacgg agccatctac acagtgggca gccctatcga ttatggcgtg 3720 atcgtggaca ccaaggccta cagcggcggc tataatctgc ccatcggcca ggccgacgag 3780 atgcagagat acgtggagga gaaccagaca aggaataagc acatcaaccc aaatgagtgg 3840 tggaaggtgt atcccagctc cgtgaccgag ttcaagtttc tgttcgtgtc tggccacttc 3900 aagggcaact acaaggccca gctgacacgg ctgaatcaca tcaccaactg caatggagcc 3960 gtgctgagcg tggaggagct gctgatcggc ggcgagatga tcaaggcagg cacactgacc 4020 ctggaggagg tgcgccggaa gtttaacaat ggcgagatca acttctctgc tagcgagaca 4080 cctggcacct ccgagtctgc caccccagag tccggcggct ctggctctag cggcggctct 4140 ggctcctccg gaggaatgac agtgagcctg aatctgatca ccgatcgctg gattcccgtg 4200 ctggacacaa ccggaacacg gcacaccatc gcaccttggg agatggccga cagctccttt 4260 gtggccccag attggcccag acctgacctg aacaccgcct gtctggagct gctgatcgga 4320 ctggtgcgcc tggccgatcc ccctgcacac cccgacgatt gggaggacag gcaggcccct 4380 gacgcagata ggctgaggga tagactggca ccttttgccc cagccttcaa tctgctgggc 4440 gacggcccac gcttcatgca ggagatggga ggactggtgg gcgatgtgcg ggcaacagac 4500 gtgctgttta tcgattccgg cggcgacgga ggcgccctga ccgtgagaga gggcaggtac 4560 ccaaacctgg acctgccaac agcagcaatg gcactgtatg caatgcagac ccaggcacct 4620 agcggcggaa gaggaaatct gacatccctg aggggaggag gaccaatgac cgtgctggtg 4680 gaccccggag gaggaatgtg gcctctgatc tgggcaaacg tgcccgacgg caagccagtg 4740 gtgcctaatg tgctgccttg gatgagaagg acagtgacca gcgagaccgg cgtgaggttc 4800 tttccacacc agggcgatgc cgccgaggtg ttctttggaa tgccacgccg gctgtggctg 4860 gaggcacgca acgactccgt gacaggcgtg atccagcggc cctctggcac caagtatgtg 4920 ggctggcgcc acccactgac accctactat aggcagaagg caggcgatac cccactgccc 4980 gtgaggccta gggcaggcgt gttcggatac aggcactggc tgggaatcgc agcagagcag 5040 ggctctgacc tgagggagag accagcaacc gtggaggcct gggagagccg cggactgggc 5100 agaagggccg atatcatcgt ggccggctgg gccatggaga atatgaaggc aagggactat 5160 atctggtccc gggcacctct ggtgacactg ccagaggaga gagccgcctt tctgagggat 5220 atgatcgagg ccgccgacct gctgtctgcc gccctgaggg gcgccctggc caccctgctg 5280 ggcgagggcg agggcagaga ggccgccagg gaggcctttt acgtgagaac acaggccgcc 5340 ttcgagggct gggtgagctg tctggatacc atcgccctgg acgcagcagc aaggggatgg 5400 ctggccgata tgcggaaggt ggccctggag atcttcgagg tgctggccct gccaggactg 5460 gcagacagaa ccatcctggt gcagcaggag atcgtggcag cacacagggg actgacaggc 5520 agcttctccg gctacggcaa gctgggcacc aaggcctttg gcgtgctgaa cctgcctgtg 5580 ccaacacgga agaaggaggc cgccacctga 5610 <210> 1246 <211> 5736 <212> DNA <213> Pseudomonas sp. S-6-2 <400> 1246 atgggcccca agaagaagag aaaggtaggc tccggcatga cacgctttgt gcagctgcac 60 ctgctgacct cttatccccc tgccaacctg aatagggacg atctgggaaa ccctaagaca 120 gcaaggctgg gaggagtgga gagactgagg gtgagctccc agtctctgaa gcgcgcctgg 180 cggacaagcg agctgtttca gcagcagctg gcaggaacca tcggaaccag aacaaagagg 240 ctgggcatcg aggtgttcga ggccctgctg ggagcaggag tgaccgagaa gcaggcaagg 300 gagtgggcag gacagatcgc aaaggtgtac ggagccgcca agaaggataa ccccctggag 360 atcgagcagc tggtgcacat cgcccctgag gagagggcca gcctggacca gctggtggcc 420 acactggcag cagagaagag aggaccaacc gacgaggagc tggatgccct gctgcaccac 480 cagacagccg tggacatcgc catgtttggc aggatgctgg ccagcaagac ccagttcaat 540 ggagaggcag cagtgcaggt ggcacacgca atcggagtgc acgcctccgc catcgaggac 600 gattacttca ccgccgtgga cgatctgaac cgcaatgatc caggagcagc acacatcgga 660 gagtccggct ttgccgccgc cgtgttctac cagtatatct gcatcgaccg ggatctgctg 720 aagagaaacc tgggcggcga cgaggtgctg acacagaagg ccctgcgcgc cctgaccgag 780 gccgccctga aggtcggccc cagcggcaag cagaattcct ttgcctctag ggcctttgcc 840 cacttcgccc tggccgagaa gggcacagat cagccacgct ccctgtctct ggccttcgtg 900 aagccagtgg caggaaccga ctacgcaggc gatgccgtgg ccgccctgca gcaggtgagg 960 gacaacatgg ataaggtgta tggcgtgtgc gccgagtccc gctgtcagtt taatgtgctg 1020 acaggagagg gctctgtggc agacctgctg gatttcgtgg cagcagaggg ctccggcgag 1080 ggaaggggct ctctgctgac ctgcggcgac gtggaggaga accctggacc tccgaaaaaa 1140 aagcggaaag tgggctccgg catgaagcca aggaagcctc ggctgaatga ggcccagcag 1200 agatgggtga gggattggtg gagggccctg cagccaaggg cagagggcga cgagccaatc 1260 cctggagagc tgagcgtgat gggaagggga gagagggcac agctgcggag atgtaccgac 1320 gccgatgagc tgctgacaca gtccgccacc ctgctgctgg cacacaggct ggtggccctg 1380 aacggagaga gaggaccact gcccgataat agcctgtcct atgagaggat ggcatgggtg 1440 gcaggcgtgc tggcaaacgt gaaggacgat ctgagagatg gcaagtccct ggccacccac 1500 ctgggacagg cagcagacgc agagaggcct ccaatgtctg agctgcgctt tcgggccatg 1560 cagagaggca cagccatgca ggagctgttc ctgcactgga ggcgcgccct gcagctggca 1620 ggaggcaaga ccgacgtggc acacctggca gacgatctgc tgagctggca gatcgagcag 1680 ggacagtctg ccgcacaggc cagcaatggc gtgaagtttc actgggccta cgactactat 1740 ctgtctgcca gagatagggc cgccgccaag gagccagagt tcaacaagga gatcagcaaa 1800 ggctccggcg aaggaagggg cagcctgctg acatgcggcg atgtggagga gaaccctgga 1860 cctccaaaga agaaaagaaa agtcggcagc ggcatgaccg actacctgct gctgaggctg 1920 tatggaccac tggcatcctg gggagagatc gcagtgggag agtctaggca cagcgccgtg 1980 cagccttctc gcagcgccct gctgggactg ctgggagccg ccctgggcat cgagagacac 2040 gacgatgcag cacagcaggc cctggtggat ggataccggt tcgccatcaa gctggagtgt 2100 atcggctctc ccctgagaga ctatcacacc gtgcaagtgg gagtgccacc aaggaagttc 2160 cagtttagaa gccggagaca ggagctggca gcagacaagg tggatacaat cctgtccacc 2220 agagagtata ggtgcgattc tctggccctg gtggcagtgg aggccctgcc aggagcaccc 2280 gtggacctgg ccagcctggc agaggccctg cgcaagccaa ggtttgccct gtacctggga 2340 aggaagagct gtccactggc cctgcctctg tccccaaaga tcctggccgc ctctagcgtg 2400 cgcgaggtgt tcgataacct ggagctgcct tctctgctgg gcctgctgga caggtaccag 2460 cctgagcagg cctggccaag cagacaggat cagcaggccc tgaggccagg agtggcaagg 2520 tactattggg aggacggaat gacagcagga atggcacctt cttttgaggc ccagaggcac 2580 gatcagccac tgagcaggcg ccggtggcag ttcgcaccaa gaagggagtg ggtggccctg 2640 aacgatggag gacagtccgg ctctggcgag ggaaggggct ccctgctgac ttgtggcgac 2700 gtggaggaga accctggacc tcctaaaaag aaacgaaagg taggctccgg catgtctcac 2760 tacttcagcc tggtgaggct gatcggctcc cctaggcacg acgcctggct gagggatctg 2820 agcagacacg gagaggccta cagggaccac gccctgatct ggagactgtt ccctggcgac 2880 ggagcagcaa gggatttcgt gtttcgccgg ctggaggatg agaagtcctt ttatgtggtg 2940 tctgccaggc cacctcaggc agacgcagga ctgttccaca tccagtccaa ggcctactct 3000 ccagagctgg cagagggcga ctgggtgagg ttcgatctgc gcgccaaccc cacagtgtct 3060 gtgagaaggg agaatggcag aagccagagg cacgatgtgc tgatgcacgc caagcagctg 3120 gccagcaccg agaagtccgc cctgcccgag cggctggagg cagcaggaag agagtggctg 3180 aaggacaggg cagagcggtg gggcctggac ctgagaaccg attccctgat gcagaacggc 3240 tacagacagc agaggctgaa gcgcaagggc aagcacatcg ccttttctac actggactat 3300 cagggcatcg cccaggtgac cgatcccgag cagctgcgcc gggccctgct ggacggagtg 3360 ggacactcca agggattcgg atgcggactg ctgctggtga agcgggtgga tggcagcggc 3420 gagggaagag gctccctgct gacatgtggc gacgtggaag aaaaccctgg acctcccaag 3480 aaaaagagga aagtgggtgg cagccagctg gtgaagtccg agctggagga gaagaagagc 3540 gagctgcgcc acaagctgaa gtacgtgccc cacgagtata tcgagctgat cgagatcgcc 3600 aggaatccta cccaggatcg catcctggag atgaaagtga tggagttctt tatgaaggtg 3660 tacggctata ggggagagca cctgggaggc agccgcaagc ctgacggcgc catctacaca 3720 gtgggctccc caatcgacta tggcgtgatc gtggatacca aggcctacag cggcggctat 3780 aacctgccaa tcggacaggc agacgagatg cagcggtacg tggaggagaa ccagacaaga 3840 aataagcaca tcaacccaaa tgagtggtgg aaggtgtatc cctcctctgt gaccgagttc 3900 aagtttctgt tcgtgtccgg ccactttaag ggcaactaca aggcccagct gacacggctg 3960 aatcacatca ccaactgtaa tggcgccgtg ctgtctgtgg aggagctgct gatcggcggc 4020 gagatgatca aggccggcac cctgacactg gaggaggtga gaaggaagtt taacaatggc 4080 gagatcaatt tctctgctag cgagacacct ggcacctccg agtctgccac cccagagtcc 4140 ggcggctctg gctctagcgg cggctctggc tcctccggag gaatggacct gctgtctgat 4200 acatggctgc agtgcaggca cagggacggc accctgaagc ctatcgccat cggccagatc 4260 ggcctggagg actgtctgga gctggtggca cctcggcccg acttccgggg cgccctgtac 4320 cagttcctga tcggcctgct gcagacagcc tatgccccag aggacctgca ggagtggaga 4380 gatagatacg ccaaccctcc aaccgccgac gatctggccg aggtgtttgc cccttatagg 4440 gatgccttcc agctggagaa ctccggccca acattcatgc aggacctgac cctgccagac 4500 gatgtgaatc agctgcccgt gctggagctg ctgatcgacg caggctcctc tagcaaccag 4560 tactttaata agccagcagt ggagcacgga atgtgcgagg gctgtttcac acaggccctg 4620 ctgaccatgc agctgaatgc accatccggc ggaaggggca tcagaacatc tctgagggga 4680 ggaggacctc tgaccacact gctggtgcca gccgagcaga acgccaccct gtggcagaag 4740 ctgtggctga atgtgctgcc cctggacgcc ctggatcacc cacctatcaa gatgctgtct 4800 gatgtgctgc catggctggc accaacccgg acaagcgacg ataagcaggg ccaggacaca 4860 ccacccgagt ctgtgcaccc actgcaggcc tactggagca tgcctaggcg gatcagactg 4920 gacgcagcca ccctggacca gggcgattgc gccgtgtgcg gagcacagaa cgtgaagcgc 4980 atccggcact acagaacaag gcacggcggc accaattata ccggcacatg gacccacccc 5040 ctgacccctt attctctgga tagcaagggc gagaagcctc cactgagcat caagggccgg 5100 caggcaggaa ggggatacag ggactggctg ggactggtgc tgggaaacga ggaccaccag 5160 cctgatgccg cccaggtggt gaggcacttc acagccaagc tgggcaagcc atccgtgcgc 5220 ctgtggtgct ttggcttcga catgagcaat atgaaggccc tgtgctggta cgattccctg 5280 ctgccagtgc acggagtggc ccctgacgtg cagaggaagt ttacccgcag cgtgaagcag 5340 gtgctggact ctgccaacga tatggccagc gtgctgcaca agcaggtgaa ggccgcctgg 5400 ttcagaaggc ccggcgacgc aggacaggag cctgcagtga cacagtcttt ttggcagggc 5460 agcgagaccg ccttctatca ggtgctggag cagctgtcca agctggactt tgattctgcc 5520 gcagagctgg cagcaatcta cagagcatgg ctgcaggcaa cccgccggct ggtgctgagc 5580 ctgttcgatc actgggtgct gtccggccct ctggaggaca tggatatgca gcgggtggtg 5640 aaggcaagag cagacctggc caaggagctg aacacaggca aggcccagaa gccactgtgg 5700 accatcgtga atcagcacct gaaggagcag gcctga 5736 <210> 1247 <211> 5709 <212> DNA <213> Salmonella enterica subsp. enterica serovar Muenster strain <400> 1247 atgggcccca agaagaagag aaaggtaggc tctggcatga tcatgaccac cttcatccag 60 ctgcacctgc tgaccgcata cgcacctgcc aacctgaata gagacgagag cggcaggcca 120 aagacagcct tcatgggagg agtggagcgg ctgagagtga gctcccagag cctgaagaga 180 gcctggaggg tgtccgagac ctttgaggcc gccatggatg gcttcatggg caagagaaca 240 cggagaatcg gcgtggacta cgtgtatagg cctatgaagg atgccggcat cgaggagaag 300 atcgccaagt ctagctccga gctgatcgcc aagcagttcg gcaagctgaa gagcgacaag 360 gatgccaagc cagagaagaa cctggagatc gagcagatcg tgcacgtgag caatcacgag 420 atctccctga tcaagcagct ggtggacacc ctgatcgccg ataagaggga gccaaacgac 480 gaggaggtgg agctgctgcg caaggagcag cggtccgtgg atatggccct gtttggccgc 540 atgctggcct ctagccccga gttcaatgtg gaggcagcat gccaggtgtc tcacgccctg 600 ggcgtgagcg ccgtgaccgt ggagtccgac ttctttacag ccgtggacga tctgaacaat 660 aaggaggagg atgcaggctc cggccacatg ggagagcagg gatttgcctc tgccctgttc 720 tacacctacg tgtgcatcag ccgcgacctg ctggtggaga acctgggagg caatgaggag 780 ctggccaagc ggacaatcgc cgccctgacc gagacagccc tgaccgtgag ccctacaggc 840 aagcagaaca gctttgcctc ccgcgcatac gcaacctatg ccctggcaga agtgggacag 900 aagcagccac gctccctggc agcagccttc tttcagcccg tgcgggacac cgatcagatc 960 cctgccgcca tcacacgcct gaagcagcag cgggcctctt ttgacaacgt gtacggcaat 1020 tgcgccgacg attataggga gctgaacgtg caggagggaa ccggctccct ggcagagctg 1080 ctggccttcg tgtctcaggg cagcggcgag ggaagaggct ctctgctgac atgcggcgat 1140 gtggaggaga accctggacc tccgaaaaaa aagcggaaag tgggctctgg catgctgaac 1200 agcaataccg ccgtgctgtg cagaatcctg caccctgacg cccagaaggc cctgctggat 1260 tggttcgcca cactgagcga gcggtacgag cggaaggacg gcaagcgcgt gaacggaaga 1320 gcatggaggg cagagctgaa gaggatggca ccaccctacg gcgtgatgat ctgtgaggga 1380 cacgacgccc tgagacaggc cctgctgaag cacatgaggc tgcagcctct ggatgagatg 1440 gcactggccc tgttcgtgag cgtggcagtg cacatcaagt ctcacaaggc caacatcagc 1500 ttcgccgcac agctgggaga gaagctgaag ggctccaccc catgcgtgtc tgtgctgcgc 1560 tttgagcggc tgcagaaggc cagcgacccc gagaccttct gtcagctgct gatccaggcc 1620 gtgaagatca ggggcacaga gggcgtgaat gtgctgtccc tggccgatgg catcttcctg 1680 tggatggagg agtggcagag gcgcgagaac caccagccag agtttcgcaa ccccttcgag 1740 aggaatcgca tccggtgggc caatgagtac ctgtctacca gccgcggcaa gggctccggc 1800 gagggaaggg gctctctgct gacctgtggc gacgtggagg agaaccctgg acctccaaag 1860 aagaaaagaa aagtcggctc tggcatgaag gagtacctgg tgtttcagct gtatgcacct 1920 ctggcaagct ggggagagga ggcctccggc gagatcagac actctgccac cgtgccaaca 1980 aggtccgccc tgctgggact gctggcagcc gccctgggca tccggcggga tgaggaggcc 2040 agactgaaca atttcaatag gcactaccac ctggcagtgc acgccctggc atcccaggac 2100 agatggctga gggattatca caccgtgtct gccccccgcg agaacaagaa gaatcggtac 2160 tataccagga gggacgagct gacactggcc cctgatgaag tgggcacact gatctctcag 2220 cgcgagtacc ggtgcgacgg ctattggcac gtggcaatca gcgccacccc cgatgcacct 2280 cactccctgt ctgagctgcg ggaggccctg ctgacaccac acttccccct gtacctgggc 2340 agaaagagct gtccactggc cctgcctctg gcagcaaggc tgatgaccgg cacactgaag 2400 gaggtgttta cccacgcagt ggaggagatc agcgccgcag agctgtccgg cttcacactg 2460 agagagggca tctgctattg ggacgatcct gacgaggagt ccctggtgtg gcagcagaag 2520 cagcacagca acaatcagcc agtgtccaga cagaggtggc agtttggcgg ctacaccagg 2580 ttcaacggac cactgcagga gaggacaggc tctggcgagg gaaggggcag cctgctgacc 2640 tgtggcgatg tggaagaaaa ccctggacct cctaaaaaga aacgaaaggt aggctctggc 2700 atgtatctga gcagaatcca gctgaggttt aacaatctga gacccgagat gctggccaag 2760 tggaactccg ccaggcctta cgcctctcac cagtggctgt ggcagctgtt ccctgagcag 2820 gagctgagac agttcctgtt tagggaggag gcccacggcg gcttctttat gctgagcgcc 2880 atcccacccc tgtcccagca ctctctgttt ctgatcgaga ccaagccttt caacccacag 2940 ctgacaaatg gcctggagct ggactttcag ctgagagcca accccgtgat cacccgcaat 3000 ggcaagcggt ccgatgtgat gatgaacgcc aagcaccagg ccaaggccaa tggcgtggag 3060 aaggagcggt ggtgggagct gcagcagcag gcagcacagg cctggctgga gcagcagggc 3120 cagcagcacg gctttagact gatcgcccca gagcccgacg atttcgccat gtgggcaggc 3180 gacgagtaca gcgagctgca ggcacactgc ggatgcgtgc aggcctatca gcagcacaga 3240 ttcgtgagga aggatcagca gaagccaatc accttttcct ctgtggactt ctccggcgcc 3300 ctgtgcatca cagatgccgc cctgtttaag caggccctgt tctccggcct gggcaagtct 3360 aaggccctgg gctgcggcat gctgatggtg aagaggaaga gaggcagcgg cgaaggaaga 3420 ggctccctgc tgacttgcgg cgacgtggaa gaaaaccctg gacctcccaa gaaaaagagg 3480 aaagtgggtg gcagccagct ggtgaagtcc gagctggagg agaagaagag cgagctgcgc 3540 cacaagctga agtacgtgcc acacgagtat atcgagctga tcgagatcgc cagaaatccc 3600 acccaggaca gaatcctgga gatgaaagtg atggagttct ttatgaaggt gtacggctat 3660 aggggagagc acctgggagg cagccggaag ccagatggag ccatctacac cgtgggctcc 3720 cccatcgact atggcgtgat cgtggataca aaggcctaca gcggcggcta taacctgcct 3780 atcggccagg ccgacgagat gcagagatac gtggaggaga accagaccag gaataagcac 3840 atcaacccaa atgagtggtg gaaggtgtat cccagctccg tgacagagtt caagtttctg 3900 ttcgtgtccg gccacttcaa gggcaactac aaggcccagc tgacccggct gaatcacatc 3960 acaaactgca atggcgccgt gctgtctgtg gaggagctgc tgatcggcgg cgagatgatc 4020 aaggcaggca ccctgacact ggaggaggtg cggagaaagt ttaacaatgg cgagatcaat 4080 ttctctgcta gcgagacacc tggcacctcc gagtctgcca ccccagagtc cggcggctct 4140 ggctctagcg gcggctctgg ctcctccgga ggaatggacc tgaccaaaga gaagtggctg 4200 cctgtgatct tttctaacgg cgagaagaca agaatcagcc tgagggacct gctggataat 4260 cgcatccagg acctggccta tcctcggcca gatttccagg gagcagcatg gcagatgctg 4320 atcggcatcc tgcagtgtac cgtggcccca gaggacaagg aggagtgggc cgatatctgg 4380 cacgagtcta tcgagtttga gcagtgggag aaggccctga acacaatcag cctggccctg 4440 cagttcggcg agcagaagcc ctcttttctg cagagcttcg accctctgga ttccgagtac 4500 ggctctatcg caggactgct ggtggacgca ccaggaggca acgccctgaa gctgaataag 4560 gatcactttg tgaagagagg caacgtggag cagatctgcc cacactgtgc agcaatcgcc 4620 ctgttcgcca tccagaccaa tagccctgca ggaggagcag gctatagggt gggaatgagg 4680 ggaggaggac cactgaccac actggtggtg cctcaggagg aggacaagta cccactgtgg 4740 aagaagctgt ggctgaacgt gctgccacag gaggagcccc ctaatgtgac ccagcaccca 4800 ctgatctttc cctggctggc ccctaccaag acatccgaga aggccggcaa cgtggtgaca 4860 cctgataatg cccacccact gcaggcctac tggggaatgc caaggaggat cgagctggac 4920 ttcacccaca cagtggcagg aatctgcgac ctgtgcggag agcaccacga gtccctgctg 4980 ctgcagatgc gctctaagaa ctacggcgtg cagtatgact cttggctgca cccctttagc 5040 ccttataggc aggccctgaa ggacccctcc gccccatggc tggccttcaa gggacagcca 5100 ggaggactgt cttacaagga ctggctgggc ctgatgctga acagggagga taagtttaat 5160 aagatgcagc cagcaaaggt ggtgcgcgca gcaggccagc ggaataagat gagcctgtgg 5220 tgcttcgcct gggacatgga taaggccaag gtgcgctgtt ggtaccagca cagaatcccc 5280 ctgatctccg tgtctcacga ggagcagttc ctggccgtgc tgaacatcgt gctggtgctg 5340 gccagcgagt ccctgtctct gctgcggaat gccctgaaga gcgccaagtt tgactgccct 5400 aaggaggcca agatggactt ttccatggtg gatatcgcct tctggcagga gaccgagcct 5460 gccttcagaa cactgcagga ggccctggca gtggacccac tgagacagga tacccagaca 5520 aggcacgccg tgagccagtg ggaggcagag ctggcccact atctgtttca cgtgttcgac 5580 cgcgatgccc tgaccaaccc tgattgtcca gacgatatcc tgcagagaca gctgacagca 5640 aggcaggacc tggcaagctc ctacaggaag cacaaggccc ggaaggatgt gctggccctg 5700 gtggagtga 5709 <210> 1248 <211> 5457 <212> DNA <213> Atlantibacter hermannii NBRC 105704 <400> 1248 atgggcccca agaagaagag aaaggtaggc agcggcatga acaacttcat caacttccac 60 gtgctgatct ctcacagccc atcctgcctg aaccgggacg atatgaatat gcagaaggat 120 gccgtgttcg gcggcaagcg gagagtgaga atcagctccc agtccctgaa gagagccatg 180 aggaagtctg actactatgc aaggcacatc ggagcatcta gcctgcgcac aatccacctg 240 gaggagctga gagatgtgct gaggcagaag ctgtcccctc gctttgagct gccaatcatc 300 gacaagaccc tgtccctgct gtctggcaag acaatcgacg atgccgagaa gatcaacggc 360 gacgcagtga ccccatgggt gctgggagag gtggagtggt tctgtgagca ggtcatgaag 420 gccgaggccg agcagctgga cgataagaag ctgctgaaga tgctgaagga cgatatcgcc 480 gccatgagga ccaatctgca gcagggagtg gatgtggccc tgagcggcag gatggccaca 540 tctggcctga tgagcgagct gggcaaggtg gacggagcaa tgtccatcgc acacgccatc 600 accacacaca ccgtggactc tgatatcgac tggtttacag ccgtggacga tctgcaggat 660 ctgggctccg cccacctggg aacccaggag ttttcctctg gcgtgttcta cagatatgcc 720 tccctgaaca tcgcccagct gcaggagaat ctgggaggcg tgtctcgcga gcaggtgctg 780 gagatcgcag cacacctggc acacatgctg gcaaccgagg tgccaggagc aaagcagcac 840 acatttgccg ccttcaaccc cgccgatatg gtcatgatca acttcagcga cttcccactg 900 tccctggcca acgcctttga gagccccatc aaggccaagg acggctacct gctgccttcc 960 atcaacgcct tcaatgagta ctggcagcgg atcgccaagg gatatggact gaccggacca 1020 gcagcacagt tcatgctggc agaggccagc atggcaggag gaaacgtggt gtccgtggag 1080 accctggagc agctgaagaa gtggatctgc cacgatggag aggccagccg gggctccggc 1140 gagggaagag gcagcctgct gacatgtggc gacgtggagg agaaccctgg acctccgaaa 1200 aaaaagcgga aagtgggctc tggcatgagc accgagatcg atgccatggc cctgtataac 1260 gcctggcagc agctggacaa tggcagctcc gcccagctga ggcgcgtgag cgagcctgat 1320 gagctgaggg agatcccagc cttttaccgc ctggtgcagc cattcggctg ggagaacccc 1380 gccaataagc gccctctgct gcggatggtg ttttgcctgt ccgccggcaa ggacgtgatc 1440 caccacaagg agaagatcga cgattaccca tccggcatct ctctgggacg ggccctggca 1500 aagtctggca agatcaacga gcggagagtg ttccagctgg tgagagccca gagcccaggc 1560 gatatgatcc agctgaggcg cctgctgatc cacgcagagc ccgtgctgga ctggagcctg 1620 tttgcaaggc agctgacctg gtggggcaag agggagagac agcagctgct ggaggatttc 1680 atgctggcca cacccgagag caacaagaag gcaggctccg gcgagggaag gggctctctg 1740 ctgacctgcg gcgacgtgga agagaaccct ggacctccaa agaagaaaag aaaagtcggc 1800 tccggcatga agccatatct gatcctgaga ctggcaggac caatgcaggc ctggggacag 1860 cctacctttg agggcaccag accaacagca aggttcccaa cacgctccgg cctgctggga 1920 ctgctgggag catgcctggg catccagagg gacgatcggt ctgccctgca ggccctgtct 1980 gagagcgtgc ggtttgccgt gagatgtgat cagagcttca tcgacggccg gaccatccct 2040 gtgacaggcc tgagagatta ccacaccgtg atggatgcca gggaggacta tcgcggcctg 2100 aagtctcacg agaccatcca gacatggagg gagtacctgt gcgacgccgt gtttaccgtg 2160 gccgtgtggg agagcgagca ggccacactg aggctgccag agctgaaggt ggccgtgtgc 2220 aagccccggt ttaccccttt cctgggcaga aagtcctgcc cactgacaca gcccctgttc 2280 gtggacctgt gcgacgccat caacccttac caggccctgg caaattatgc acctgcagga 2340 ggcgatatct attctgaggc acctccagac ggaccatgcc agacctttac agtgcgggac 2400 gagcctatca tcgccctgcc aaggcagttc gcagcaaggg agtggtacgt gatcaaggga 2460 gcaagcgacg tgagccaggg ctctggcgaa ggcagaggca gcctgctgac ttgtggcgac 2520 gtggaagaaa accctggacc tcctaaaaag aaacgaaagg taggctctgg catgtacctg 2580 agcaaagtga tcatccagaa tgcctggtgt cgcgacgtgt accagtttca ccaggccatc 2640 tggcagctgt tcccctctca gcctgcccag aagcgggcct tcctgtttag aatcgaggca 2700 aagcacccag gaaggggagc agacgtgctg ctgcagagca tggaggcacc agcatctagc 2760 gccgcagcac aggtgctggc ctgcaagccc ctggcctttc acctgaagga gggcgatcag 2820 ctgaggttcc gcctgagggc caacccaatc aagaccatca aggacgagca gcagcggctg 2880 aatggcagag gcgagatcaa gagatgtagg gtgcccctgc tgaaggagca ggagcagcac 2940 cagtggctga tcaggaagct gtccctggca gcacgcctgg agcacatcga gtccacctct 3000 gagctgcccc tgttcttttc taagaacggc acaggcggca agatccagcc tatgaatttc 3060 gagggcatcc tgaccgtgac aagcgtgcct gccctgctgt ccctgctgaa caatggagtg 3120 ggaccagcaa aggcaatggg atgcggcctg ctgtctctgg caaggccagg cagcggcgag 3180 ggaagaggct ccctgctgac ctgtggcgac gtggaagaga accctggacc tcccaagaaa 3240 aagaggaaag tgggtggctc ccagctggtg aagtctgagc tggaggagaa gaagagcgag 3300 ctgagacaca agctgaagta cgtgcctcac gagtatatcg agctgatcga gatcgccagg 3360 aatccaaccc aggatcgcat cctggagatg aaagtgatgg agttctttat gaaggtgtac 3420 ggatataggg gagagcacct gggaggctct cgcaagccag acggagcaat ctacaccgtg 3480 ggcagcccaa tcgattatgg cgtgatcgtg gacacaaagg cctactccgg cggctataac 3540 ctgccaatcg gacaggcaga cgagatgcag cggtacgtgg aggagaacca gacaagaaat 3600 aagcacatca acccaaatga gtggtggaag gtgtatccct cctctgtgac cgagttcaag 3660 tttctgttcg tgagcggcca cttcaagggc aactacaagg cccagctgac cagactgaat 3720 cacatcacaa actgcaatgg agccgtgctg tccgtggagg agctgctgat cggcggcgag 3780 atgatcaagg caggcaccct gacactggag gaggtgcgga gaaagtttaa caatggcgag 3840 atcaacttct ctgctagcga gacacctggc acctccgagt ctgccacccc agagtccggc 3900 ggctctggct ctagcggcgg ctctggctcc tccggaggaa tggatctgct ggtggaccca 3960 tggattcccg tgcgggcctt tgaggagagg caccctcaga ccatcacact gcagcggctg 4020 tgctgttccg aggagaagtg gctgctgaat ctgccaagag acgatatgga gctggccgcc 4080 ctgcagctgc tgatctgcct gctgcaggtg acctgtgagc ctagggacga ttctgagatg 4140 aggctgcggg tggcaaggcc actgtctgag gaggagttcg ccgccctgat gagcccttgg 4200 caccagacat ttcagctgga ccaccctcag atgccattca tgcaggtgaa gggcgtggag 4260 gccaaggagc caacccccat ggagaagctg atgaccggcc tgagcggcgc cacaaactgt 4320 gcctttgtga atcagccagg acagggagag gccctgtgcg gaggatgtac agcaatcgcc 4380 ctgttcaacc aggcaaacaa tgcaccagga tttggaggag gcttcaagag cggcctgagg 4440 ggaggaaccc ctatcaccac actgatcaag ggctccgatc tgcgcaccac aatctggctg 4500 aacgtgctga ccacaccccg gctgcagtcc tcttttcctc cagacagact gaccgagaat 4560 ctgcccacat ggaagaggcc tatcagctcc ggcaagacct ttcctgcagc aacaatcgga 4620 ctgctgaggg gactgttctg gcagcctgca cacatcgagc tgtgcccacc tatcggacca 4680 ggacagtgct gtggatgtgg acagcagtcc aaccagcggt acaatggctt cctgaaggcc 4740 aagtttaatt tcacagtgga gggactgtgg cctcacccac actcccccag agtgctggtg 4800 gagaagaagg gcgtgatcga gcagaagttt ctggccttca ccacagccgc cccttcttgg 4860 acccagatcg gcaggctgct ggtggataag gagacccgcc agggagaggg caggcgcgtg 4920 gccacagtgg tggagcagtt tcgggaggtg taccctagat tcaggctggc cctgatcgtg 4980 ggcggctata gaaacaatca ggccagcatc ctggagcgga gacacgatgt gctggtgttt 5040 aacgacggct ggcagaatgg ctccgatgtg atcaacgaca tcgtggagat gggcctgggc 5100 tacaagaccg ccctgaggaa gggcctgtat acattcgtgg agggcgccaa gaatcacgac 5160 gtgaagggag caggagtggc agtgcacgag gtggccgagc gccactacta taggcgcagc 5220 gagctgctga tcccagcaat cctggcctcc atcgattatt ctcagcctaa cgacgtgatc 5280 gcaaggctgc ggaaggagct gcaccagctg tgcgaggccc tgttcaatca ggtgaccgca 5340 ccatacgcac accacccaaa gctgatccgg tctctggcag tggcaagagc cagcctgcac 5400 aagcacctga acgagctgaa gccacaggga gagctggcat acgtggatgg cgactga 5457 <210> 1249 <211> 5448 <212> DNA <213> Geothermobacter sp. EPR-M <400> 1249 atgggcccca agaagaagag aaaggtaggc tccggcatgc agaactttat caattaccac 60 gtgctgatct ctcacagccc atcctgcctg aaccgcgacg atatgaatat gcagaagagc 120 gccatcttcg gaggcgtgcg gagagtgcgg atcagctccc agagcctgaa gcgggccatg 180 agaaagtccg actactatgc ccagcacctg ggcgaggcct ctatcagaac caagcacctg 240 agcggcctga gggataggct gcacgagcgc ctggcaggcc ggttcagccc cgaagtgatc 300 gacaagacaa tcaagctgct gatcgacaag gatgtgagcg tggatggaat cgtggagggc 360 gacgcagtgg caccatgggc agtggaggag tttgcatggt tctgtgagag agtgatgaac 420 gcacaggcag agggcctgga ggataaggcc ctgaccaagc agctgaagga gtccatcgcc 480 gccatgagac agacactggt gggcggcctg gatatcgccc tgtctggcag gatggccacc 540 agcggcctgc tgtccgagct gggcaaggtg gacggcgccc tggcagtggc acacgccctg 600 accacacaca ccgtggacgc cgatatcgac tggtttacag ccgtggacga tctgcaggag 660 ctgggctctg gccacctgga cacccaggag ttttctagcg gcgtgttcta cagatatgcc 720 agcctgaaca tcggacagct gcaggagaat ctgggaggag caccaaggga gcaggccctg 780 gagatcgcaa cccacgtgct gcagatgctg gccacagtgg tgccctccgc caagcagcag 840 tctttcgccg cccacaatct ggccgatctg gccctggtgt cctttgccga catccccgtg 900 agcctggcaa acgccttcga gaagccagtg cagcagaaga atggctctgg ctttcgggag 960 ccaagcatcg ccgccctgca cgactactgg cagaaggtgc acatcggcta tggcctggag 1020 gagagatgcg gccagttcgt gctgaacaag gtggagaccc ctgcaggaat cgcagcaaag 1080 gagtccctgg aggatctgaa gtcttgggtg cgcaacaatg gagagggagg cagcggcgag 1140 ggaaggggct ccctgctgac ctgtggcgac gtggaggaga accctggacc tccgaaaaaa 1200 aagcggaaag tgggctccgg catggccaag gagacagatt tcatggacct gtaccaggcc 1260 tggcagagac tgccaaacgg accaaaggca gagctgaaga ggtgcggcga tctgggcgac 1320 ctgctggaga ccagcgcctt ttacagactg ctggcaggaa ggggagaggc agagtggcag 1380 aagaaggcct atcagcggat gatcttctgc ctgccctgta tcaatcacac agagcagaag 1440 atccctctgg gagccgccct ggcacggagc agaaagggca gccggagcgc cgtgagcgag 1500 tctaggatga tccaggtggt gcgctccgag gcaccaaacg atatggtgca gctgaggcgc 1560 atcctgaagc acgcagagcc aaccgtgaac tggcctctga tggccaagca gctgtggtac 1620 tgggacctga atgagaggag caagcggagc ctgctggagg atttctttct gaaccacacc 1680 gacacaagca aggagggagg ctccggcgaa ggcagaggct ccctgctgac ttgcggcgat 1740 gtggaggaga accctggacc tccaaagaag aaaagaaaag tcggctctgg catgggcgac 1800 tatctgatcc tgaagctgca gggacctatg caggcctggg gagagcacag ctttgaggga 1860 acccgcccat ccggcaattt ccccacacgg tctgccctgc tgggactgct gggagcatgt 1920 ctgggcatcc ggcggaacga gtacgagagg ctgcagcagc tggccgatag cgtgcagttt 1980 gccgtgagaa aggacgccag gcagacccag acagagtggg gcgagccaaa gaagctgccc 2040 atggtgaaga tgaccgatta ccacacagtg aaggacgcca gacagtctta tatcggcctg 2100 aagagccacg agaccatcca gacatggagg gagtacctgc tggacgccga gtattctgtg 2160 gccatctggg agaatgagga tgcagccgtg agcctggacg agctggagac cgccgtgagg 2220 aagcccgtgt tcaccccata cctgggcagg cgcagctgcc cactggcaca gcctctgttc 2280 ggcaagcgcc tgaccgcaga gtccccaaac caggccctgc aggcagtgga gccttccggc 2340 ggcgtgatct attctgagca gccctctgat cgcagcatga ggctgaggga cctgcctatg 2400 gcaggacagc caaggcagtt cgcatctcgg accgtgtaca tccacggagg cgatcacgtg 2460 tccgagggct ctggcgaggg aagaggcagc ctgctgacat gcggcgacgt ggaagaaaac 2520 cctggacctc ctaaaaagaa acgaaaggta ggctctggca tgtacctgag caaagtgatg 2580 gtgaccggag cagcatgtag gaacccatat gagatccacc ggtccctgtg gcagctgttc 2640 cccgaggacc ccgacgcacg gagagattat ctgttccggg tggagagagc aggcaggcag 2700 caggcagaga tcctgctgca gagccagcgg aagccaagcg actccgagct gcgcaaggtg 2760 cggctgctgg caaccagagg ataccagcca aggctgcagc agggacagcg gctgagattt 2820 gccctgctgg ccaaccctgt gaagacaatc aatgatgaga ggggccgcct gaacgcaaag 2880 ggacaggtga agaagtgcag ggtgccactg atcagggagg aggagtggag aagctggctg 2940 gagcacaagc tgatcggatg tgcagagctg gagaccctgg tggcagagaa caggctgccc 3000 atcaacttca gaaagccaaa ggagaagagg gtgggcaaga tccagcccgt gagcttccag 3060 ggcatcctga gagtgtcctc tccagaggcc atgatgcagg ccatctctac cggcatcgga 3120 ccagcaaagg ccttcggctg cggactgctg agcatcgcac cagcaggctc cggcgaaggg 3180 aggggctctc tgctgacatg tggcgacgtg gaagaaaacc ctggacctcc caagaaaaag 3240 aggaaagtgg gtggctccca gctggtgaag tctgagctgg aggagaagaa gtccgagctg 3300 agacacaagc tgaagtacgt gcctcacgag tatatcgagc tgatcgagat cgcccgcaac 3360 ccaacccagg atagaatcct ggagatgaaa gtgatggagt tctttatgaa ggtgtacggc 3420 tatagaggag agcacctggg aggctccagg aagccagacg gagccatcta caccgtgggc 3480 tctcccatcg attatggcgt gatcgtggac acaaaggcct acagcggcgg ctataacctg 3540 cctatcggcc aggccgatga gatgcagcgg tacgtggagg agaaccagac ccggaataag 3600 cacatcaacc caaatgagtg gtggaaggtg tatcccagct ccgtgacaga gttcaagttt 3660 ctgttcgtgt ccggccactt caagggcaac tacaaggccc agctgacccg gctgaatcac 3720 atcacaaact gcaatggagc cgtgctgagc gtggaggagc tgctgatcgg cggcgagatg 3780 atcaaggccg gcaccctgac actggaggag gtgaggcgca agtttaacaa tggcgagatc 3840 aatttctctg ctagcgagac acctggcacc tccgagtctg ccaccccaga gtccggcggc 3900 tctggctcta gcggcggctc tggctcctcc ggaggaatga acctgctgac agatccctgg 3960 attcccgcaa ggccacaggg aagggcaacc gcacagaagc tgacactgag acagctgctg 4020 tgcgaggacg agaggtggga gctgagactg cccagggacg atatggagat ggccaccctg 4080 cagctgctga tctgtctgac ccaggccctg gcaacaccag cagatctgcc cgagctgaag 4140 cggagaatca tgaagcccct gggccagcag gagtttaatg ccgcctacac cccttttgcc 4200 gattggttcc gcctggacca cccccagtat cctttcatgc aggtgcgggg agtgaaggca 4260 aaggagccaa cacccatgga caagctgctg gcaggactga ccggagcaac aaacagctgt 4320 tttgtgaatc agtccggcct gggagaggga ctgtgcccag cctgtgccgc catcgccctg 4380 ttcaaccagg ccatgaatgt gcctggcttt ggaggaggct tcaaggcctc tctgaggggc 4440 agcgccccag tgaccacact ggtgcaggga gagcacctga ggcagaccat ctggctgaac 4500 gtgctgtcta cagagagcgt ggaggccctg ctgccatggc acaggcagac cgaggaccag 4560 aagcccacat ggatcgcccc tatcaagagc gagaccttca gctccagatc catcggcttt 4620 ctgaggggac tgttctggca gccagcacac atcgagctgc tgcctgcaga gagcgtgggc 4680 gattgctcct gctgtggcca gggcgacaca gaggtgtaca ggggctttaa caaggccaag 4740 ttcaattata ccgtgacagg aatctggcct cacccacacg gagcacgcac cagcacagtg 4800 aagaagggcg agcaggagga gaagttcgtg agcttcacca cagaggcacc tagctggacc 4860 cagctgggcc gctttgtggc aaggagggcc ttcgtggatg caaagacacc tggacaggag 4920 ccagcagccg tgatcaggca ggcacagaag ctgggcgtgc ggctgaccct gtgcatcgga 4980 ggctatagga acaatcaggc cagcatcctg gagcggagac acgagctgct gccactggga 5040 gagggatgga attccaagcc ccagatcgtg caggatgtgg tggacacagc catcggctac 5100 cgcgacgccc tgaacaagtc cctgtattct ttctttaagg gaggaggctc caagggagca 5160 ggactgccta tccacgagtt tggcaaggcc cagttctaca ggcgcaccga ggaggccatc 5220 ctggattccc tggccagact ggacttttct aatcccaggc ctgtgctgct ggccctgcag 5280 aagaagctgg atacagaggt gagaggcctg ttcgaggagg ccgtgaggcc atacctgaac 5340 gaccccaatc tgatccacac catggccgtg agccggagaa cactgtataa gaacctgaat 5400 gtgctgaagc cacagcagga gggaggagtg gacggcaaga gaaactga 5448 <210> 1250 <211> 5484 <212> DNA <213> Methylocaldum sp. 14B <400> 1250 atgggcccca agaagaagag aaaggtaggc agcggcatga ccaagaagaa ctttatcaat 60 ttccacgtgc tgatcagcca ctccccttct tgcctgaaca gagacgatat gaatatgcag 120 aagacagccg tgttcggcgg cgtgaatcgg gtgagaatca gctcccagtc cctgaagcgg 180 gccatcagaa agtctgacta ctatcaggcc aacctgggag caccaagcgt gaggacccgc 240 gatctgaata agctgaaggc ccggtttaca gagctgctga aggacagatt cgatgccgag 300 ctgatcaaca gggccctgga gtggatctcc ggcaaggagg gcatcgcaga gggagtgacc 360 gcagacgcag tggccccatg gtctgtggat gaggtgacac acttttgtga gatcatcagc 420 gccgacgatc agcaggacat caagaagctg gagaagcaga tcgagaagga ggcaaggccc 480 ttccgcgcag caatgagcaa caccgtggac atcgccctgt ccggcaggat ggccacatct 540 ggcctgatga gcaatctgcc agtggatggc gccctggcag tggcacacgc aatcaccaca 600 cacgccgtgg agcctcagga cgtggattgg ttcaccgccg tggacgatct gacacaggac 660 gcaggcgata ccggagcagg acacctggat acccagcagt tttctagcgg cgtgttctac 720 agatatgcct ccctgaacct gcgccagctg caagtgaatc tgggcctgat cgaccacatc 780 aaggcagagg agaccgcaga gtctcggcag agagccctgg atatcgccca ccacgtgttt 840 cacctgctgg ccacagtggt gccttccgcc aagcagcagt ctttcgccgc ccacaacctg 900 gccgactttg ccatcgtgag cttcgccgat cagccaatct ccctggccaa tgcctttgag 960 gagcccgtgc ggagagacta caagctggcc ggcttcctga agccatccat ccagtgcctg 1020 gccaactact ggggccggat gaatagagca tatggcctgg acgagcaggc aagggccttt 1080 gccgtggatg ccagcttcga gatgggcggc aagccccctc tggattccct gaaggccgtg 1140 gaggactgga tcgccgagga tggacaggag ggcagcggcg agggaagagg ctccctgctg 1200 acctgtggcg acgtggagga gaaccctgga cctccgaaaa aaaagcggaa agtgggcagc 1260 ggcatgacag cagagctgcc agattttgtg gccctgaaga tgcactatga cgatgagtcc 1320 ttccccaccg gagcaagggc agagctgagg cgcgcagccg agcctgacga tgtggccctg 1380 acaccagccc tgtacaggct gtttcctgga gagaggccat ctgacaggca cctgcgcgtg 1440 gcatacctgc tgccctatgc caagcacgcc gccaaggcca agagcctggg agcacagctg 1500 gcagaggcaa aggtggccga ggcccgggtg ctgcaggtgg ccagagcaca cgagcccctg 1560 gacgtggtgc agctgcggag actgctgatg caggtggagg cagcagtgga ttggtccgcc 1620 tttggcccta tggtgtggtt ctggaacgag cgggccaaga gacagctgat cgaggacttt 1680 tatatcgccc gcttctctcc agtgaccgga gcaaagggct ctggcgaggg aaggggcagc 1740 ctgctgacat gcggcgatgt ggaggagaac cctggacctc caaagaagaa aagaaaagtc 1800 ggcagcggca tgcctcggta cctgatcctg ctgctggacg gaccaatgca ggcctgggga 1860 acacacacct ttgaggattt cagaccctgc aacgccttcc ctaccaggag cggcctgctg 1920 ggactgctgg gagcctgtct gggcctggac aggcgcgata cagaggccct ggagcagctg 1980 gccatgtccg tggagtttgc cgtgagggca gacagggagg tgctgaggcc agaggcagag 2040 gtgccaaagg caaaggcagc agtgaagctg ccagatttcc acaccgtgga ggacgcccgc 2100 aaggtggatg gctctgccaa caagaatccc gtggtgagcc ggagagagta tctgtttgac 2160 gcagccttca ccgtggcaat cggagcaaag cctgacggac cagtgacact ggatgcaatc 2220 gcagaggccc tgaggcgccc ctgctttacc cctgtgctgg gccggagatc ttgtccaatc 2280 gccagaccac tgctggacgg agaggcagtg gaggccagcg atgccaaggc cgccctggca 2340 accatcgcac cagtgggcgg catgatctat acagagggag agctgatctc cgcccagcca 2400 ctgagggtgc gcgacgtgcc tatccagggc cggcacagac agttctctac ccgcctggtg 2460 tacctgcaca agggcgagac atgcagcggc tccggcgagg gaaggggctc cctgctgact 2520 tgcggcgatg tggaagaaaa ccctggacct cctaaaaaga aacgaaaggt aggcagcggc 2580 atgtttctgt cccgcgtgga gatcccatgg gacgccgtgc ggaaccccta cgagatccac 2640 aggcagctgt ggaggctgtt cccaggagag gataaggagc ctcgcaagaa tgccgaggag 2700 ggcaggcagg gcttcctgtt tcgcgtggag aacaatcagc ccggccggcc tctgagactg 2760 ctgatccaga gcaggagggc ccctgagcca acagcaggac tgaccatcgt gggcacaaga 2820 gagtttcagc cacagcctgc acacggacag aggctggcct tcctgctgac atctaaccct 2880 gtgaagacca tcatcgacgc ccagcgcgag accaagagcg gcaagtcctc tgagaagtgc 2940 cgggtgccac tgatccacga gtccgagcag agggagtggc tgaagaggaa gctgatcgga 3000 gcaggagagt tcgagggagt gaacgtggtg ccacacgcac ccgtgttctt tcggaagggc 3060 aatagaggcg gcaagatcgt gatggtgacc tttgagggcg tgctgagggt gaacgagcca 3120 ggcacactga tcgcctatct ggagaatggc atcggaccag caaaggcctt cggctgcgga 3180 ctgctgctgg tgcggagact gggaggctcc ggcgagggac gcggctctct gctgacctgt 3240 ggcgatgtgg aagaaaaccc tggacctccc aagaaaaaga ggaaagtggg tggctctcag 3300 ctggtgaaga gcgagctgga ggagaagaag tccgagctga gacacaagct gaagtacgtg 3360 cctcacgagt atatcgagct gatcgagatc gcccggaacc caacccagga cagaatcctg 3420 gagatgaaag tgatggagtt ctttatgaag gtgtacggct ataggggaga gcacctggga 3480 ggctcccgga agcccgatgg cgccatctac accgtgggct ctcctatcga ctatggcgtg 3540 atcgtggata caaaggccta cagcggcggc tataacctgc ctatcggcca ggccgacgag 3600 atgcagagat acgtggagga gaaccagacc aggaataagc acatcaaccc taatgagtgg 3660 tggaaggtgt atccaagctc cgtgacagag ttcaagtttc tgttcgtgtc tggccacttt 3720 aagggcaact acaaggccca gctgacacgc ctgaatcaca tcaccaactg taatggagcc 3780 gtgctgagcg tggaggagct gctgatcggc ggcgagatga tcaaggccgg cacactgacc 3840 ctggaggagg tgaggcgcaa gtttaacaat ggcgagatca acttctctgc tagcgagaca 3900 cctggcacct ccgagtctgc caccccagag tccggcggct ctggctctag cggcggctct 3960 ggctcctccg gaggaatgaa tctgctggag gacccttgga ttcccgtgcg ggcagatgga 4020 ggaaccggag cattccagct gctgacatac aggcagctgc tgtgcgagcc aggaaactgg 4080 caggtgagcc tgccaaggga cgatctggag ctggcctgcg tgcagctgct ggtgtgcatg 4140 acccaggtca tgtttctgcc tgagaatgac gccgtgtgga ggaagcgcct gaccgaggcc 4200 ctgacaagag aggagttcac agccggcacc gagccatgtc tggactggtt tgacctggat 4260 caccccaccc agcctttcat gcagtctagg ggcgtgcgcg cagcagagga tacaccaatc 4320 cagaagctgc tgatcggcct gcctgagggc aacaatcacg ccttctttaa tgaggcagga 4380 gaggtgcggc acctgagcgt gaccgtggcc gccatcgccc tgttcaacca ggccacaaat 4440 tgcccttcct ttggcggagg cttcaagggc tctctgaggg gaggagcacc aatcaccaca 4500 ctggtcaacg gcgagaatct gcgggagacc gtgtggtgta acgtgctgac acggtccaga 4560 ctggcagcaa ggcagatcgc aatgccaggc ctggacaggg ataggcctac ctgggtggag 4620 ccaatccagg agaaggccac catcccctgg aatacaatcg gactggcaag gggactgttt 4680 tggcagcctg cccgggtgga gctggtgaga agcatggcag cagcaccttg cgacgtgatg 4740 ggaggagcac caaccctggg atatgtgggc ttcagaaagg agaagtttaa cttcacagtg 4800 gagggcgtgt ggccacaccc acacggagcc atcacaatga ccctgaagaa gggcgccctg 4860 gagcagaagt ttgccagctt caccacaacc gcacctgcat ggacccagct gtccgagttc 4920 gtggtgccaa agggagtgaa cgatccagga gcaaaggagg gctccatccc agcaggacca 4980 gtgacccagg cctccgagct gggagagtct ggcctgcacc tgctggtggg aggatacagg 5040 acaaatcagg ccagcgtgct ggagcggaga cacgagatga tgtccctggc ccggggctgg 5100 agagacgata agagccggct gccaaagctg gtggagatgg gcaaggaggc caagaaggcc 5160 ctgaggggca agctgtattt tgccgtgcag ggcaacaagg acaagggcct gaagggaatc 5220 ggagcagcaa tccacgagac cgccgagaag ctgttctacg ccagaacaga gtctctgatc 5280 cacgagacct tcagcaatga gctgaccttc aagcagtggg ccacagccag aaaggccttt 5340 gtgcaggagc tggcaggaca ctgtagggca atcttcgagg agctgaccgc cccctacgcc 5400 atgaagcctg agctgatccc agtgatcgca tgggcaaggc gcagcctgaa cttcgacctg 5460 acaaagctga tggaggatgc ctga 5484 <210> 1251 <211> 5910 <212> DNA <213> Methanocella arvoryzae MRE50 <400> 1251 atgggcccca agaagaagag aaaggtaggc agcggcatga agctgatcga gatccacatg 60 atccagaacc acgccccctg caacctgaat agagacgata ccggcagccc taaggactgt 120 atgtttggag gcatccggcg gagccggatc agctcccaga gcatcaagag atccatcagg 180 atgtctccta tcttcaagga ggagatgaag ggcatcgagc tggccaatcg cacaaggcgc 240 ctgccagagc tggtgaaggc caagctgatc tccgatggca tcgacgagaa gatggcagca 300 atcgcagcag agaaggcaac aggctttggc accaaggatg gcaaggagcg ggaggaggac 360 ctgaatacag cccagaccat gttcatcacc cagtccgacg tggatgccgt ggcctctgtg 420 atgaaggatg ccatcctgaa ggccggcaac cccaaggcct tcaaggatat gaaggcagca 480 gacctgcaga aggcagcaga gctgaaggga tggagaccag tgacacctga cctggccctg 540 tttggcagga tgatcaccag cgatgccttc atggacatcg aggcctccat gcaggtggcc 600 cacgccatct ctacaaataa gatggatcac gagtttgact acttcaccgc cgtggacgat 660 ctgcagaagt ctagcgacgg acctggagca gatatgatcg gcgacgtgca gtttaacagc 720 gcctgctact ataagtactt ctccctggac tatgatgccc tgatccagaa cctggccggc 780 ctgaagccag gcgataatgc caccgaggcc gacaagaagg cctatgccga gtccctggag 840 aatgccaaga aggtggccgc catcaccatc acagcctttc tgaaggccgc catctacacc 900 acaccatccg gcaagcagaa ctctttcgcc gcacaccagc tgccaagcgc cgtgctggtg 960 gagatcaggc caaccaagac acccgtgtcc tacgcaaacg ccttcgtgga ccccgcaagg 1020 ccccgcaatg gcgtggatat ggtggaggac accctgaaca agttcgtgaa gcacgtggag 1080 ctgcagacag agaagtttaa cctgcggagc acccggagac tgtggttcgt ggcaggcgac 1140 aaggccctgg caggaaccga gacatgccag acaatcaacg atctgatcag cggcatcaat 1200 tccgccctgg gctctggcga gggaagaggc tccctgctga cctgtggcga cgtggaggag 1260 aaccctggac ctccgaaaaa aaagcggaaa gtgggctctg gcatgacagc cccaaacgag 1320 aataaggagc accagaagag caagaaggac gaggagttcc tggccaacct ggcaaagatg 1380 gcagagagcg ataggggagg aatggccatc ctgaagcgga acgccggcaa tacaatcgcc 1440 gagagccggg gcgccatgaa gaccttttac agcctgctgc catatggcat cagcgactcc 1500 ccctacgagg agatctattt cctgatcgcc accctgtacg gccacaacaa gtataggttt 1560 acaggcgact tcggccagac catgaagctg gtgcgcgagt cctctaattc tgagagcatc 1620 gatcagcggg tgagcacact gctggattcc gagtttaaca tcgtggacgg catcaagcca 1680 ggaggaggag agctggcata caggctgagg cagtgcgtga agctggcaag cggccacgag 1740 atcggagtgg attggtatag actgctgcag gacctgaagt actggggcta tccagagaag 1800 agggtgcaga agcggtgggc ccggtcctac ttcggctatg gcaagcccgt ggagtctgag 1860 accaaggaga gcaaggagga ggcaaaggca ggctctggcg agggcagagg cagcctgctg 1920 acatgcggcg acgtggaaga gaaccctgga cctccaaaga agaaaagaaa agtcggctct 1980 ggcatggata acccactgct gctgctgctg cggctggagg gaccaatgca gagctggggc 2040 ctgaaggcaa gatgggatat cagggacaca ggcgatgagc ccaccaagag cggcatcatc 2100 ggactgctgg gatgcgcact gggatacgcc agaaaggacc ccaggctgac cgacgagctg 2160 gattcccagc tgcgcatcgg catccgggtg gagtgtcctg gcgagatcgc cagggactat 2220 cacacagtga gcggcgagct gcgcaccgca gagggcaagc tgcgggagac cacaatcgtg 2280 tcctttagag attacctgca ggacgcagcc ttcctggtgg tgctggaggg accaggagag 2340 ctgctgacca ggatctccaa cgccctgaag gaccccgtgt ggccaatcta cctgggcaga 2400 aagtcttgcc ctccaacaag gcccgtgttc gagaccctga ccacagacta tgcctccatc 2460 gacgatgccc tgagccggca cccttggagc tccggcacca tggaggcaag gaaggcacac 2520 ccaaaggagc tgaagtgtat cgtggaggac ctgtctggcc cataccagag aacagatagg 2580 atgaccaaga gccccgccag aatgtatggc atccgccacg tgcggatgag caccgtgaag 2640 ctgcaggcag agggagaggg actgggcagc ggcgagggca ggggctccct gctgacctgc 2700 ggcgacgtgg aggaaaaccc tggacctcct aaaaagaaac gaaaggtagg ctccggcatg 2760 tacctgtctc ggctgatcct gaaccctagg acccgcgccg tgaggcgcga cctggcagat 2820 tgtcacgagc tgcaccgcac aatcctgggc ggctttccag acctgaacgg caagggagga 2880 gaggcaaggg agaccttcgg cgtgctgcac agaatcgata tccacccaag gagcggcgca 2940 atcgtgctgc tggtgcagag ccaggagaag cccgactggt ccaagctgcc tgagggctac 3000 ctgctggaga acaccggcac agagaatcct gcctgcaagg ccatcgacga gcagtacggc 3060 aagatcaagg caggcgacgt gtacgccttc cggctgagag ccaatccaac aaagaagatc 3120 ggcaccagcc ggatcgagga tatcaaggcc ggcaagccca agaacaatgg ccggagagtg 3180 cctatccgca acgagagcga ccagatcctg tggctgaaga ggaagggagc agcaggagga 3240 tttgagctga tgagcaccaa gaggttcagc gagctgtccg acgtgctgat ctccgaggag 3300 ggccaccaga agatctatac attcgatacc ggcatcaagg ccaaggtgca gaagaacgcc 3360 agagagaata ggctgacctt tggcagcgtg ctgttcgagg gcacactgaa ggtgaccaat 3420 gccgagaagt ttctggagac actgaagagc ggcatcggct ccggcaaggc ctacggattc 3480 ggactgctgt ccctggcacc tgcaaggggc tctggcgagg gacggggcag cctgctgact 3540 tgcggcgatg tggaggagaa ccctggacct cccaagaaaa agaggaaagt gggtggcagc 3600 cagctggtga agtccgagct ggaggagaag aagagcgagc tgcggcacaa gctgaagtac 3660 gtgccccacg agtatatcga gctgatcgag atcgccagaa atcctaccca ggatagaatc 3720 ctggagatga aagtgatgga gttctttatg aaggtgtacg gctatagagg agagcacctg 3780 ggaggctcca ggaagcctga cggagccatc tacacagtgg gctctccaat cgattatggc 3840 gtgatcgtgg acaccaaggc ctactccggc ggctataacc tgccaatcgg acaggcagac 3900 gagatgcagc ggtacgtgga ggagaaccag acccggaata agcacatcaa cccaaatgag 3960 tggtggaagg tgtatccctc tagcgtgaca gagttcaagt ttctgttcgt gtctggccac 4020 tttaagggca actacaaggc ccagctgaca cgcctgaatc acatcaccaa ctgcaatgga 4080 gccgtgctgt ccgtggagga gctgctgatc ggcggcgaga tgatcaaggc cggcaccctg 4140 acactggagg aggtgaggcg caagtttaac aatggcgaga tcaatttctc tgctagcgag 4200 acacctggca cctccgagtc tgccacccca gagtccggcg gctctggctc tagcggcggc 4260 tctggctcct ccggaggaat gaagaatcgc gtgaagcggg gcgagcacct ggtgtcttat 4320 aacctgctga cagagccttg gatcacctct atcgatctga gcggcaatcc agtgcaggag 4380 ggcatcctgg ccaccctgaa gaacgcccac aagatcgata gcatctttga ccctgcccct 4440 ccagtggagt tcggcatcta caggctgctg atcgccttta tcaccgacgt gttccagcca 4500 cagggcctgg aggacctggc agatctgctg gacaggaagc ggctggaccc cacagccctg 4560 gacgagtacg cagcacggtg gagagatagg tttgacctgt tcgatgagaa gtatccattc 4620 ctgcagcagg ccatcaccgg cgtgatcaag aagccccctg agcccatctc tcgcctgatg 4680 cagcacctgc ctgccggcac aaatgtgagc cactttcacc acggccggtg ggacgagaac 4740 tcttttagct tcgagcagtg cgccaagggc ctggtgacaa tcgcaccctt catgaccgca 4800 ggaggagcag gcctgtcccc ttctatcaac ggcagcccac cctggtacgt gctggtgaag 4860 ggcaacaatc tgtttgagac actgctgtat aacgtgtgcc agatccccat gaccgtgaag 4920 cctatcggcg atagcccagt ggcctggaga aacgacaaga ggatcgaccc tggcgatgag 4980 ccaaagacat tctccatcgt ggagggactg acctggaggc ctcggatcat ccagctgatc 5040 ccaggcaatg gcaagggcac ctgtacatat accggcgaga aggacgtgga taccgtgtcc 5100 cacatgcact actatccagg ccagaagtct cctgagccag gactgtgggt ggacccccag 5160 gtggcataca agaagacaaa ggatgccatc agacccctga ggcctgacga gaataaggcc 5220 ctgtggcgcg atatcggacc actgatgctg ctgcagcacg gcgattactc tggcaaggac 5280 ggcaaggtga gcttcgatcg gccagccgtg gtgacccagt ataagcagat ggtgtccaac 5340 ggcatgatca agcggagcga gccactgcgg ctggaggtgt acggcatccg cacagacggc 5400 aagatgaaga tctacgagtg gtatcacgag aagctggccc tgcccatcga gatcctgaag 5460 aaggccaatt ccggccggca gatccaggac gccatggatc tggccgactc tgtggcctac 5520 atcctgagaa aggccatgaa gaaggcctat cctaggaacg ccaagtccaa tgagtctggc 5580 tttgacaacc tgatcctgag cgtgcagtct agctattggt cccacctgaa gggccagttt 5640 gagtctatct tcctgaagac actgagccag caggatgaga atgacctgga tgcctacacc 5700 aagctgatgg agcagtggaa gaagatcctg gacgatacag gcaagaacgc cctggacaag 5760 ggactgggac ccctggacac cgatggcgac tccctgcgga gacaggtgaa ggccatgaac 5820 gagtactcct ctggcatcag attcgccctg tatcctgact ctatccaggc caagaagaag 5880 aacaggcaga agaataagga ggataagtga 5910 <210> 1252 <211> 5592 <212> DNA <213> Pseudomonas aeruginosa DHS01 <400> 1252 atgggcccca agaagaagag aaaggtaggc agcggcatga acctgtttat cgagttccac 60 ctgatccaga attttgcccc atccaacctg aatagggacg ataccggagc accaaaggac 120 gcaatctttg gaggacacag gagagccaga gtgagctccc agtgcttcaa gagagccatc 180 aggctgaccg cccacgagca ggagctggtg gcccccgagc acaggggcgt gcggacaaag 240 aagctgaagg ccctgctgct ggagaggctg gcaggacgcg atcctgcaga ggcagagggc 300 aagatcgaga ccgccctggc agcagcaggc ctgaagctga aggacgatgg caagacagag 360 tacctgctgt ttctgggaga ggcagagatc gcaggattcg ccgccctgat cgagcagcgg 420 tgggacgagc tgggcagcgc cgcaccagcc ggcgagaaga agggcaagaa ggaggccaag 480 gccaacgtgc ccaccgaagt gatcaagcag gcaagggccc tgctggatgg aggcaaggca 540 gtggacgtgg ccctgttcgg aaggatgctg gccgatctgc cagaggtcaa tcaggacgca 600 gcatgtcagg tggcacacgc aatctccacc cacagggtgg agagggagtt tgactacttc 660 acagcagtgg acgatagggg aggccccgat gagtctggcg caggaatgat cggccaggtg 720 gagtttaaca gcgccaccct gtacagatat gcagtggtgg acctgcgcaa gctgctggga 780 aacctgcaga atgatggaga gctggtgctg tccgccctgg aggccttcac ccaggcaatg 840 gtgcgcgcaa tcccatctgg caagcagaac acatttgccg cccacaatct gcctgccttc 900 gtgggaatct gcctgaggca cgcaggacca ctgaacctgg ccaatgcctt tgagaagcca 960 gtggtggcaa gggcagacgc ctccctgtct gagcggagcg tggcagagct ggcaagacac 1020 gatcagcagc tggcaagcgt gtacggcgac agccgggata gatgggccta tctggacatc 1080 tccggcgcat ggccaaagga gagaggagag ccagcaggaa acctgcagca gctggccgat 1140 tggctgaggt ctcaggtgtc tagccgcctg ggaggaggca gcggcgaggg acggggctcc 1200 ctgctgacct gtggcgatgt ggaggagaac cctggacctc cgaaaaaaaa gcggaaagtg 1260 ggcagcggca tgtccgccgc agagcaccca ttcatcggac acctgcagag gctgcagaat 1320 gacaggggcg ccctggccgt gctgaggcgc agcctgggat ttgcacctgg agcatatgtg 1380 ccagcatacc catatgtgga gcggttcgtg ggagcagaga gacacgcaca ggatgcctgg 1440 aggctggccc tgtacctgac cgcaggactg tttgcatccc acccaggaca gggaagggcc 1500 tctctggcaa tgaggttcgg agagctgatg aaggccagga acagcgcctc catcgagaag 1560 cggttcatcg ccctgctggc agcagacgca gagaatctgc ccgtgtatct gagacaggcc 1620 gtgagcctgc tggcagcaga taagctggcc ttcgactacg gcgccctgct ggacgatctg 1680 gcacactggc tggaccccta tctgccagtg gcaaggggcg acgcaatcag gcagcggtgg 1740 gccagagact tctacgccgc cctggccaac accacagata cctctctgca caaggacggc 1800 agcggcgagg gaaggggctc cctgctgaca tgcggcgacg tggaggagaa ccctggacct 1860 ccaaagaaga aaagaaaagt cggctccggc atggccaccc tgctgatgag gctgcaggga 1920 ccaatgcagt cctggggaac cacatctcgg ttcgacgaga gagatacaca gctggagcct 1980 tctaagagcg gcgtgctggg actggtgtgc gccgccctgg gaagggatag aagcgagcca 2040 ctggaggacc tggcctccct gcggatgggc gtgcgcgtgg atagggaggg catccccctg 2100 agagactatc agaccgcaac aggcgtgctg gtggcatccg gcaaggccga tcccaggaga 2160 accgtggtgt ctcctcggca ctacctggcc gacgccgtgt ttctggtggg cctggagggc 2220 agagatcagg ccctgctgga gagaatccag caggccctga gagcaccatt ttggcctctg 2280 tgcctgggaa ggaagagctt cgtgccaggc tcccccgtgt ggctgcctga gggactgtcc 2340 tctctggccc tggagcaggc cctgcaggcc tggccaagac tggcagaggc acagcctggc 2400 gacaggggca agccactgag atgtctgatc gaggacgaga ggagcggcgt ggtgcgcctg 2460 gatcagccta tcgcaccatt cgccgagagg cgctttggac caagattcgt gaggtccggc 2520 gtggcagacg tgcccgatca gaccgaccct ggctctggcg agggaagggg cagcctgctg 2580 acctgtggcg acgtggaaga aaaccctgga cctcctaaaa agaaacgaaa ggtaggctct 2640 ggcatgtatc tgaccaggct gaccctggac ccccgcagcg cccaggcacg gagagatctg 2700 ggcgacgcct acgagatgca caggaccctg agccgcgtgt ttgcagacga gcaggcacca 2760 gcatcccggt tcctgtggag actggaggcc tctggcaacg cctggagcac ccctacactg 2820 ctggtgcagg cagcatccga gggaaattgg tctgtgctgc aggccctgcc aggatacctg 2880 ctgggagagc cacagtccaa gtctctggcc ctgaggcagt ggctggagtc tgacatcagc 2940 tacaggtttc gcctgttcgc caatcccacc gtgacaaggc agggcaagcg gtacggactg 3000 gtgggagagg agcagcagct ggcatggctg gcaaggcagg gcgagagaca cggctttgtg 3060 gtggaggccg ccctggtgac cttcagcgag gtgctgggct cccggaagag acagacacgg 3120 atctccgtgc tgagagccgc ctttgagggc aggctgcgca tctctcgccc agatgccttc 3180 ggccaggccc tggtggcagg aatcggaccc gccaaggcct tcggctgcgg cctgctgtcc 3240 ctggcaagga gcggctccgg cgaaggcagg ggctctctgc tgacttgcgg cgacgtggaa 3300 gaaaaccctg gacctcccaa gaaaaagagg aaagtgggtg gctctcagct ggtgaagagc 3360 gagctggagg agaagaagag cgagctgaga cacaagctga agtacgtgcc tcacgagtat 3420 atcgagctga tcgagatcgc ccggaatcca acacaggata gaatcctgga gatgaaagtg 3480 atggagttct ttatgaaggt gtacggatat aggggagagc acctgggagg cagcagaaag 3540 cctgacggag ccatctacac cgtgggctcc ccaatcgatt atggcgtgat cgtggacaca 3600 aaggcctact ccggcggcta taacctgcct atcggccagg ccgacgagat gcagaggtac 3660 gtggaggaga accagacccg caataagcac atcaacccta atgagtggtg gaaggtgtat 3720 ccaagctccg tgacagagtt caagtttctg ttcgtgtctg gccacttcaa gggcaactac 3780 aaggcccagc tgacccggct gaatcacatc acaaactgta atggagccgt gctgtccgtg 3840 gaggagctgc tgatcggcgg cgagatgatc aaggccggca ccctgacact ggaggaggtg 3900 aggcgcaagt ttaacaatgg cgagatcaat ttctctgcta gcgagacacc tggcacctcc 3960 gagtctgcca ccccagagtc cggcggctct ggctctagcg gcggctctgg ctcctccgga 4020 ggaatgaccg agcactataa cctgctggac acaccatggc tgcctgtgcg gctggcaaat 4080 ggagaggtga gagagatggg cctgctggag gtgtacaggg aggcagagag gatctctgcc 4140 ctggcagaga ccgagccacc cagcctgatc gcccagtacc ggctgctgct ggccatcaca 4200 cacagagccc tgctgctgga gtatggagca tggaaggact ccggccggct gagatggttt 4260 agggagggcc tgcctatcga tgtggtggag cggtacctgg agcggtggag ggagcggttt 4320 tggctgttcc acccacagta tcccttcatg caggtggccg ccctggcaag cgccgcagag 4380 acctgcgata agcagaagcc atgggcacag atcagcctgg catccgccaa cggcaataca 4440 cctgtggtgt tcgatcactc ctacgacctg gccccatctg ccgtgagcgc cgaccgggcc 4500 ctgtgcgcac tgctgggctt tctgcagttc accccaggag gactggtgaa gacagtgcgc 4560 gacagcgata aggcaggcgc cctggcaaac accgcagcag tggtgccact ggcagacagc 4620 ctggcaaaga cactgtgcct ggccctgcac ccagcatccg gcgaggcagc ctttgatctg 4680 cctgcctggg agagagaggc cctgaccatc ccacagctgg cagccgaccc tatcctggca 4740 tccggcccaa atgatcgcta tacacggcag agccgggccg tgctgctgct gcccgaggag 4800 gagggctgcg tgcggtggat cagattcgca gcaggacagg ccctggcaga cgatgtgcag 4860 gcccctgacc caatggccag ctacaggcct ggcgccaaca attccatggt gcgcctgtct 4920 tttggcgaag gccgggtgtt ctggagagat ctgcctagcc tgctgccaga ctccgccgca 4980 gcaggctcta agagggcagc cgtgctggac tgggcaagca acctgcgctc catcggagca 5040 gatgcaccta gctccatgct gctggtggca ggactggcaa gcgatcaggc caagctgctg 5100 agatggaggt ccgagaccgt ggtgctgcca gccgccctgc tggactctga gggatgcgca 5160 aacgagctgc ggagatgtat ccgggagagc gaggatctgt atggcgagct gagaaagatc 5220 gcagtggcaa tgctggcaga ggccctgccc gatcctgcat ctaaggacac ctgggcaagg 5280 gcacggacca gcttcgacaa tggaccagca gcagcaacat acttcgcact gctggagagg 5340 tccctgcctt ctctgatggc cctgatcggc ggcgatcgcc tggagatgct ggacgaggca 5400 gaggccttct ggagatctag gctgctggcc gccctggagg tggcatggca gggcgtgcgg 5460 gagggactgg gcctgagcgt ggccgccctg agagcagagg caaaggtgcg cccaaggtac 5520 ctggccctgc tgaggcgcta tcggagcgag agaacctcta gcacacccct ggccgaggag 5580 cagtgcgcct ga 5592 <210> 1253 <211> 5562 <212> DNA <213> Lachnospiraceae bacterium KH1T2 <400> 1253 atgggcccca agaagaagag aaaggtaggc agcggcatga gcaattccaa gtaccagttt 60 ctgaacggca agaagctggc cgagttccac atgctgaagc tgtatcctag ctccgccctg 120 aacagagacg atgccggcga gcagaagacc ggcatgtata atggcacact gaggaacaga 180 atctctagcc agtgcatcaa gcggtcttgg agactgagcg agacctttga ggacgtgttc 240 gatgagatcg gcatcaggac aaagcgcatg ccagagtacg tgggcaagaa gctggtggag 300 aatggcgtgc ccgaggagga tgtgatctct tttaagaaga tcctgagcgg cgagaaggtg 360 gacgagaagt cctctaagaa gtccaaggcc gaccaggcca tcgatgaggg caagcctgtg 420 aagaccgccg ccctgagctt ctactccgtg gaggagctgg ataagatcgc cgagatctgc 480 aagaggatct atgacgatct ggaggagcca aagtccaaga atctgaagac aatcaagatc 540 gacaacatcc agaaggagat gcgcaagtgc gtgcacccca tgaatatcga tgtggccgcc 600 tttggcagga tggtgaccga caacatgctg aggcctgtgg agggagcaat gcaggtggcc 660 caggccctgt ctacaaatgc cgccgtgaag gagaacgatt atttcgtggc ctgcgacgat 720 ctggtgaagg gagagaccat cgaggacgtg ggaggagaga tgctgggcga catcgattac 780 aatagcgcct gctactatat ccacgccaac gccgatctgg agcagtttgc cgagaatctg 840 aaggactgtg agaacatgga ggagatcgtg aaggccctgc catctaatat ggtggaagtg 900 atggcctaca ccgaccccac agccaggcag agcaccatgg aggcccacgt gctgcccgaa 960 gtgatctacg tggagctgaa gagcaagaag cggccactga acagaatgaa ggccttcgcc 1020 gagccctgta accgcaatat cgccgagaag tccgccaaga agctggccga ttacatcaat 1080 tgcaccaacg agaaggccga cctgggcatc acaaatgccc tgtggtattg tgaggatgag 1140 agcgtgaagg ccccagagaa tgtgaccgtg gtgaactcca tcaaggagct ggagcagaag 1200 ctgaatgagt ggatgaacga gggctccggc gagggaaggg gctctctgct gacatgcggc 1260 gacgtggagg agaaccctgg acctccgaaa aaaaagcgga aagtgggctc cggcatgatc 1320 caggaggcct acgagaagct ggcccacgag gagaagcggc tgtttgccca ctgtgccggc 1380 aagctgatca aggacgcccc aaaggccatc atccccttct acaaggtggt gccctccgag 1440 atcgagtcta aaaacggcaa gaagtatacc gtggacgagg atgccttctt tgccgccctg 1500 tgcgtgaggt gtctgtttga gaagatcgag ggcgtgacac tggagcccga tatcctgatc 1560 agcgagggcc gcaagaatcc taagatctcc ctggagggct atgaccggag aatcagcgcc 1620 ctgatgtcca acaccgaggc cgagttcttt atccctaagc tggccaagct gatgaattac 1680 accctgaaga tcacatccaa caagatccca gactgcgatc agctgtattg ggatatccac 1740 aatatcggct ctaacgagaa ggacgtgcag aggcgctggg caaggaccat ctacgtgaac 1800 aatgaggagg gcagcggcga gggaagaggc tccctgctga catgtggcga tgtggaagaa 1860 aaccctggac ctccaaagaa gaaaagaaaa gtcggcagcg gcatgaagat caagatcgtg 1920 ctggagggag cattccaggc ctggggagtg ccttccgagt atacctggcg gggcacatct 1980 tactatccaa ccgccagagg catcgtgggc ctgatcggct gctgtatggg catccctagg 2040 ggcgacgatc gcctggagca gctgctgtcc gtgctgaaga tcacctacga catcaacgag 2100 gacgataacg gcaatcggaa gtctggcagc atcctgacag attttcaggt ggtgagaaag 2160 gaggacggag gcaagctgaa tgcagcaaac ggaggaaccg gcgatagcta cggcatcatc 2220 ctgcacaagt cttatatcaa tgacgccagc ttcacagtgc acatcgaggg ccctgacgat 2280 ctgatgaagg acgtgtacga tgccatgctg gaccccgtgt gggtgcctta tctgggcaga 2340 aagaattgcc ctccaaccga gccactgatc cccgagattg aaggctccgg cgaaggcaga 2400 ggctctctgc tgacctgtgg cgacgtggaa gaaaaccctg gacctcctaa aaagaaacga 2460 aaggtaggct ccggcatgta cctgaccaag ctggagctga atatccagaa caaggccgtg 2520 ctgcacaata tgtctaactg cgagtggatg cacaagctga tcctggagaa gggctttggc 2580 cacatccagg ccgagaatgc ccggcagaca ctgaagatcc tgtacgccgt ggatggcatc 2640 aaggtgtatg tgcagtccgc cgtggagccc aagttcgaga actgttctta ctggatcagc 2700 acccctgcca caatctgcat cgacgccatg aagaagatct gtggcaccgg catggccgtg 2760 cactttaagt gcacctgtaa ccccacaaag aagctgatcg atggcggcaa gagaatcttc 2820 ctgagctccg agcgggagag agacgagtgg atcaagagag tgatggagag aagcggcgcc 2880 gaggtgctgg tggagtctca gaccagcgat ttcacagtgt ggggcatgaa gaaggacaag 2940 aagaccgata agtcccacaa gatctacgcc aaggccgtga cctattctgg cgccctgaag 3000 atcacagacg aggagaagtt ttgggaggcc ttctgcaatg gcatcggccg ggagaaggcc 3060 tacggctgtg gcatgctgat gatccaagtc ggcagcggcg aagggagggg ctccctgctg 3120 acctgcggcg acgtggaaga aaaccctgga cctcccaaga aaaagaggaa agtgggtggc 3180 agccagctgg tgaagtccga gctggaggag aagaagtccg agctgagaca caagctgaag 3240 tacgtgcctc acgagtatat cgagctgatc gagatcgccc ggaacccaac ccaggataga 3300 atcctggaga tgaaagtgat ggagttcttt atgaaggtgt acggctatag gggagagcac 3360 ctgggaggca gccggaagcc tgacggcgcc atctacaccg tgggcagccc aatcgattat 3420 ggcgtgatcg tggacacaaa ggcctacagc ggcggctata atctgcctat cggccaggcc 3480 gacgagatgc agaggtacgt ggaggagaat cagacccgca acaagcacat caaccctaat 3540 gagtggtgga aggtgtatcc atctagcgtg acagagttca agtttctgtt cgtgagcggc 3600 cacttcaagg gcaattacaa ggcccagctg accagactga accacatcac aaactgcaat 3660 ggagccgtgc tgtccgtgga ggagctgctg atcggcggcg agatgatcaa ggcaggcacc 3720 ctgacactgg aggaggtgcg gagaaagttt aacaatggcg agatcaactt ctctgctagc 3780 gagacacctg gcacctccga gtctgccacc ccagagtccg gcggctctgg ctctagcggc 3840 ggctctggct cctccggagg aatgtgcgat cagcagtacg tgtctacact gaatgtgctg 3900 aaggaccctt ggattcccgt ggtgtttctg gacggcaaga tcaaggatgt gggcatcatc 3960 gagtgtttca gaaacgccga gaagatcaag accatctcta acagcaagcc atatgagaag 4020 atcgccatcc tgagatttct gaccgccttc atcacagacg tgtaccagct ggataggcgc 4080 atcgagaggc agaagctgta tgacgccggc tctttcgaga tcgagcgcat cgagaattac 4140 gtgaaggagt gcgaggagaa gaacggcgcc agctttgtgc tgggcgatag ccagcggtcc 4200 ttcttttgtt tcaactacaa tccccaggtg gacaccgagg gagtgaagct gagcgccgcc 4260 tatctgcacc tggagctgcc tcacggcaac aatccaatcc acatcgtggc ccagagggag 4320 gaggactttg agggcgatac actgccacag ttcctgaggg ccgccctggc ctttaatctg 4380 ttccctaccg gcaacatgct gaagggcgcc aattctaaga caggcgacaa ctgctacatc 4440 gatggcgtgg gcaaggacgg caagcctaag tacaccgccg cctatggcag catgggcatc 4500 aatgcaggct ctagcatggc agcagcagag cccgtgttct tttggcctga gtgcgataac 4560 ctgtttcaca cactggtcat gtgcatgagg tcccagggcg agctgcagaa caatctgaag 4620 ctgaacgatc ctccagcctt ctggaatgca gacgcagagc caaaccctaa ggcaggcaag 4680 aggggcgaca tcgtgaccag cgtgagcttc gtgagcggcc tggcattcca ggcaaggaga 4740 atcgtgccag tgatcgagaa tggcaaggtg tacgagtgtt atatctctaa cggctacaca 4800 aacagcaatg agaacgtgtg gcacgatcca tttgccgtga ggctgcgcaa ccacaagtcc 4860 ggcgagatct tccagatgcc agcaaagggc gacagggaga tgtggcgcaa tatcggcaac 4920 ctgaccgcct ccagggagga gtcttggcac ctgatgccag atgtgctgcg ccccatcaag 4980 aagagcgccg acgccacaga ttactatgag aatatctcct ctctggccat gatcccaatg 5040 acccagaacg ccggctacag cgccatgttc tatgacgata cagtgcagat ccccaaggag 5100 tacctggagg attcctacct gggcgagtat ctgaccacaa ggatggagat cgtggaggag 5160 atctctaaga tgtgggacaa gctgaagatc agcgccctgc tggacaataa ggataagttt 5220 tccggccact acagggacga tgccctgcag gagtattggg tgaagatcca ccagtttctg 5280 ttcgacggcg acgattcttt cctgaaccac gtgatcagaa tgtaccacga ggatagctcc 5340 tcttttgaga agaccgccga caaggccctg ttcgagtatc tgacaaagag cgtgaaggag 5400 atctgcgaga aggaggagaa gaataccaac tcctggaata tgctggtgaa gatcatccgc 5460 cagatccacg gcaagaacgg ctgtctgcac atcttctacg gcaccctgaa gaagtattgg 5520 aagaaggagg gcaaggacaa gaacgataca ggcagcatct ga 5562 <210> 1254 <211> 5565 <212> DNA <213> Klebsiella pneumoniae strain VRCO0172 <400> 1254 atgggcccca agaagaagag aaaggtaggc tctggcatga ccacaccctt ccgcaacacc 60 cggatcgagt ttcacatcct gcagagcttc cctgtgacat gcctgaatag agacgatgtg 120 ggagcaccaa agtctgccat cgtgggaggc gtgagccggg ccagagtgag ctcccagtgt 180 tggaagagac aggtgaggct ggccctgcct gactttggca tcagactggg cgtgaggtct 240 aagaagaccg ccagcctgct ggcaaacgcc tgccgggccc tgggagccag cgaggagcag 300 gccaccggct gtggcgaggc catggccgcc ttcttttctg acgatacact gctgtttctg 360 agcgaggcag aggcagcagc cttcgccgcc tacgcccagg gcaaggattt tgacgccgcc 420 agcctgaagg acaaggagct ggtgaaggtg gccaagaagg tggtgaacaa taccctggat 480 gccctggaca tcgccctgtt cggcagaatg gtggccaagg cagcagatat gaacgtggag 540 gcagcagcct cctttgccca cgcaatctcc acacacaagg tgtctaatga gatcgagttc 600 tttaccgccg tggacgattg caagacagag gacgagtccg gctctgccca catgggcagc 660 ctggagttca actccgccac ctactataga tacgtgtccc tggatctggg acagctggca 720 cagaccctgg gagaggatgc cgacatgaag acagccgtgg ccgcctttgt gaaggccctg 780 tacgtggcag tgccatccgc cagacagacc acacagtctg gcgcctgtcc ttgggagtat 840 gcccgcgtgc tgctgcggaa gggacaggga ctgcaggcca gcttcgagca gcctgtgaag 900 tcccagggcg agggctttct gagcccatcc aaggccgccc tgaagaattg gctgcacacc 960 aaggagaagc tgtctggcag cctgttcggc aagcagggcg actacgagtg gggcgaggat 1020 ctggactata gcatcgatcg cctgatcgca gacctgcagt cccacctggg ctctggcgag 1080 ggaaggggct ccctgctgac ctgcggcgat gtggaggaga accctggacc tccgaaaaaa 1140 aagcggaaag tgggcagcgg catggatcag gtgcctgcag acgtgacagc agagtctgcc 1200 ggcaatgaga gcccagccaa gcggttcgtg ggctatgtga tcgagcggat cgccaaggat 1260 aacggatttg cagcacgcct gaagagggca gacaatccag ccaccgagta tcagtcctgg 1320 gagatcctgg ccggcttcgg catcgacctg gagaaggagt ggcagcgcct gccatactgc 1380 gtgatcggag ccgccctggc aaaggcaaag cctgcctcta acggaaccat cacactggga 1440 gcagcaatcg caggatgtta ccccgagggc aatcagagcg agcaggcaaa ggcaaggctg 1500 cggagactgc tggcatgcac ctccacatct gaggcctgta gaatcctgag gccactgctg 1560 gccctgatgg caagccgctc cgtgaccccc gacttcgcag gactgctgaa cgagctgcag 1620 tggtttagcg gctctagcag ggagcgcatc cgggcaagat gggcacagga gttttatagg 1680 agggcaggag aggcagcagg ctctgaggcc agaaacagcc acgacggctc cggcgaggga 1740 aggggcagcc tgctgacatg tggcgatgtg gaggagaacc ctggacctcc aaagaagaaa 1800 agaaaagtcg gcagcggcat gaggcagacc acacagtaca tgctgctgtg gctggaggga 1860 ccactgcagt cctggggagg cgactctaag tttggcgtga gagataccct gaatttccct 1920 acaaggtccg gcatcctggg cctgatctgc tgtgcaaggg gagcagcagg ccctgaggtg 1980 gagtggctgg ccgagatgaa caatctgcca atggaggtga gagcctatgc caggaccgac 2040 aaggagggac agcctctgct gagggagcca acactgtgcg atttccagat ggtgggcagc 2100 ggctacgacg attccgaccc ctggcagtct ctgctgatcc ctaagaccag cgatggcaag 2160 aaggcagtgg gaggaggaac caagatgaca tacaggcact atctgcagga tgccgtgttt 2220 gcagtggtca tgggactggg cagccagcag gcagagtccc tgcctgaggc cctgcagaac 2280 ccagtgtggg acctgtacct gggccggaag tcttgcgtgc ctagcgagct gatctaccag 2340 ggcatctatg attccgccga ggcagcatgg cagcaggcaa gaaccctggc cgagagcaag 2400 cggagaacac tgtcctataa agtgatcgag ggcgagggcg atggcgacgt gatcaccctg 2460 aacgacgtgc ctgtgcagtt cggccgccac aagaggtacc gcgataggca ggtcaccgtg 2520 ctggagtgcg gaggctctgg cgaaggcaga ggcagcctgc tgacctgtgg cgacgtggag 2580 gagaatccag gaccccctaa aaagaaacga aaggtaggct ccggcatgac cgatctgttt 2640 gcatctgccc tgcacctgga cagggcagca gtgaaggccc tgaagatctc cgatgcctac 2700 tctctgcacc gggtggtgta tagcctgttc gcagatgcaa ggacagacag ggagaagtgc 2760 tcccacatct cctctggcat cgcatacgca gatcagggag gcgactttca cggacgcaag 2820 atcctgatcg tgagcgacag gctgccagca gcaaaggtgg atggactgta cggcgaagtg 2880 atctctaaga gcatccctgc cgcctttctg tcccacagcc ggtataggtt ccaggtgcaa 2940 gtgaatccag tgaggaagga caagcagacc ggcaagagag tggccgtgaa gggcagggcc 3000 gatatcgcac agtggttcat ccagagggca gcatcccggt ggggctttga tgtggacctg 3060 ccaggactgc aggtggaggc aatggaggtg ctgcagttca aggacaaggg aggccgccag 3120 gtgaccctgg gcaaggcaac agtgcaggga ctgctgaccg tgacagatag acagaagttt 3180 cagcactctt tccaccacgg aatcggcaag ggaagggcct tcggctgcgg actgctgcag 3240 atcgtgccag tggtggacgc cctgtttagc ggctccggcg aaggcagggg cagcctgctg 3300 acttgcggcg atgtggaaga aaaccctgga cctcccaaga aaaagaggaa agtgggtggc 3360 tctcagctgg tgaagagcga gctggaggag aagaagtccg agctgcgcca caagctgaag 3420 tacgtgccac acgagtatat cgagctgatc gagatcgccc gcaatcccac acaggacaga 3480 atcctggaga tgaaagtgat ggagttcttt atgaaggtgt acggctatag aggagagcac 3540 ctgggaggct ccaggaagcc agatggagcc atctacaccg tgggctctcc catcgattat 3600 ggcgtgatcg tggacacaaa ggcctacagc ggcggctata acctgccaat cggacaggca 3660 gacgagatgc agcggtacgt ggaggagaac cagacccgga ataagcacat caacccaaat 3720 gagtggtgga aggtgtatcc cagctccgtg acagagttca agtttctgtt cgtgtccggc 3780 cacttcaagg gcaactacaa ggcccagctg accaggctga atcacatcac aaactgcaat 3840 ggcgccgtgc tgtctgtgga ggagctgctg atcggcggcg agatgatcaa ggccggcacc 3900 ctgacactgg aggaggtgag gcgcaagttt aacaatggcg agatcaactt ctctgctagc 3960 gagacacctg gcacctccga gtctgccacc ccagagtccg gcggctctgg ctctagcggc 4020 ggctctggct cctccggagg aatggagaac aggttcaatc tgatcgacga gccctggatc 4080 gccgtggtgg atgtgggcct ggtgtccctg accgacatct tttctcagcc agagctgcgc 4140 gccctgggag gaaatcctgt ggagaagatc gccctgacaa agctgctgct ggcaatcgca 4200 caggcagcag caacccctac agacgattcc gactggcagc agatgggatg gcagggaatg 4260 gcacactgct gtctgcagta cctggccaag tggcacgatc ggttctacct gtatggcgag 4320 aagcccttcc tgcagatgcc tgccatccag gcagcagagt gcaagtccct gggcgtgctg 4380 agccctgagg tgtccaccgg caacaccaca gtgctgacag agtctcagca gcagcagcag 4440 ctgaccgatg ccgacaaggc cctggccatc gtgatgcaga tgggcttcgg cctgggcggc 4500 aagaagaccg acaacagcgt ggtgctgaca cccggctatc ggggcaagca gaatgataag 4560 ggcaagcctg gcagcggcaa ggcaggcgtg tccgtgggac acatgggcct gctgcactcc 4620 ttctggcagg gcaactctat cgtgcagagc atctggctga atctgtttac cgccgaggac 4680 atcacacagc tggccatgta cccaaccctg ggcacagccc catgggagag aatgcccacc 4740 ggcgaggacg atgacatcgc cagatccctg aaggcctctc tgctgggcag gctgatcctg 4800 atgggcaagt tctgtctgct ggccgaggat ggcatccact acagcgacgg catctcccac 4860 gccggctatc tggagggcaa gaccgatccc agcgtgtccg tggacttcag cggcaagaag 4920 cctaaggccc tgtgggtgaa tccaggcaag agaccctgga gggagctgac atctctgctg 4980 cagtttatcg agcaggacag cccacgcggc tatgagaccc ggcagctgag cctgcccctg 5040 aagagaatca cacaccacgc agagcagttt gcactgtggt ccggcggact gagggtgagc 5100 tccaacgcag gagagcagta cgccagcggc accgatgact atgtgcagtc cgagatctgg 5160 ctgtctagcg acctgatcaa tcacaccttc ctggagtacc tgaagtatga gatgacacag 5220 ctggatgcag tgcagaagca gctgtgggga gcagtggtgc gctactttcg gcagctgtcc 5280 gatatcgaca agtctgccac aggcaaggca cagcccttcg tggcaaagca ggcagagaag 5340 gccaccacaa tcttttggca gctgtgcgag aggcaggcac agaccctgat caacgcctgt 5400 ctgaatagcg gcgaggacca cacagccaga ctgcagctga ggaagatctt tgccagatat 5460 gccggccagg tgttcgatca gctgtgccct gccgactccg ccaggcagct ggatgcctgg 5520 gcactggccc ggccaaactt ctctcagtac ctgaccctgg attga 5565 <210> 1255 <211> 5769 <212> DNA <213> Streptococcus thermophilus strain ND07 <400> 1255 atgggcccca agaagaagag aaaggtaggc agcggcatga ccacagagca gagactgttt 60 ctggacatcc acgccatcca gagcctgccc ccttccaaca tgaatcggga cgataccggc 120 tcccctaaga cagcccagta tggcggcgtg cggagatcta gggtgagctc ccaggcctgg 180 aagaaggcca tgcgcgagta cttcaacacc cacggcgatc acagcaatgt gggcatcagg 240 acaaaggaga tcgtgcgcta tgtggccgac aagatcgtgg agctggattc tagcatctcc 300 atcgaggacg ccctggagaa ggccgataag gtgctgatcg ccgccggcat caagaagaag 360 ggcgaggtga aggccctgta cttcatgggc gattcccagg ccaagaagct ggcacaggca 420 gcatacgaca acatcaccca caagaaggag ctgcagaagc tggccaatga ggaccccgcc 480 atcgatatcg ccctgttcgg aaggatggtg gcagaggacc ctaccctgaa cgaggattcc 540 tctagccagg tggcacacgc aatcagcacc cacccagtgc agacagagtt tgatttcttt 600 accgcagtgg acgatctggc ccccgaggac aatgcaggag caggaatgct gggaaccgtg 660 gagttcaact cctctacact gtaccggtat gccaatgtgg ccatccacga gctgtctaag 720 cagctgggca acaaggagag cctggagaat tctctgagcc tgtttatcga ggccttcgcc 780 aagtccctgc ctaccggcaa ggtgaacaca tttgccaatc agacactgcc acagaccctg 840 atcgtgacag tgaggtccga ccgcccagtg aacctggtgt ctgccttcga ggagcccgtg 900 aagagcatcg agggctatgt gaccaagtcc atcgataagc tggccaagga gtttatcaag 960 gtggagaagt tcgtggacaa gcccctgatg accttttacg tgacactgca cgagtccgat 1020 tctctgaagc agatcggcga ggagaaggat agcgtgtcca agctgctgga ggacttcagc 1080 gagatgatcg cacagtacat cggctctggc gagggaaggg gcagcctgct gacctgcggc 1140 gacgtggagg agaaccctgg acctccgaaa aaaaagcgga aagtgggctc cggcatgtct 1200 cagcacacca agcagacagt gtggaccgtg acaaagaaga tcatcttcaa gctgtccaat 1260 cagaaggagg agacctacga taaggccaca ctggccaagg tgcgcaagac cctgggcaag 1320 cctctgtctg aggccacaga gatctggcct atcctgtttg agaacctgcc agaggagttc 1380 ctgagctcct accagcagcc atcctatgag gagctggcca tctacaccgc cctgcagctg 1440 tatgccctgc accagcaggg cgtgtctaca agcgtgatgc tggacgattc taagccttat 1500 gagaacatcg gcagcgccct gggcaagctg cgcaaggagg acgataccac aagcatcgac 1560 aggcgcttta ataccatgat cacatctagc accttcgagg agctgaccta ccacctgcgg 1620 cacctgatct ccctgctgaa ggtggagtct ccagtgatcc aggtggacta ctccggcctg 1680 gccaacgatc tgtattggtt cctgaacaat tctcaggaga acgtgaggct gaattgggcc 1740 cgcgcctact ataagcagat caagggcgag aagaacaatg acaacggcag cggcgaggga 1800 aggggctccc tgctgacctg tggcgatgtg gaggagaacc ctggacctcc aaagaagaaa 1860 agaaaagtcg gcagcggcat gaagaccatc ctgctgaagt ttgcaggacc tctgcagtcc 1920 tggggcacat cctctcactt tgagacaaga cacaccgact tctatccatc caagtctgcc 1980 gtgatcggac tgctggcagc cagcctggga taccggagag acgaggatga gaagatccag 2040 aagctgaatg agctggactt cgccgtgcgg gtggatcagc agggcaacct gctgagagac 2100 tttcacgtgg cccagaagta caccgagaag ggcaagttcg atcggaacta tgtgacaaat 2160 agatactatc tggaggacgc cgtgtttgtg gtggccctgt cccacaccga cgattctttc 2220 atcgatatca tcaagggcgc cctgaagaac ccctactttc agcctttcat gggcaggcgc 2280 gccctgccta tcaccgcaga ctttatcctg ggcgagacag atgtgaatcc actggagagc 2340 ctgaagtccc tgaagtggca ggcctctctg tggttcatga agaagagcca cgacaaggat 2400 gccatctccc tggaggtgta cctggactct cagctggtga acaaggacgt gtaccagctg 2460 cggcaggact acgtgcggag cttcagccag aagggccgga gattcggctt taggtacgag 2520 gtgcgcgagc tgatctccgt gcagaaccct cactatctga acaagaatac cgagcacaat 2580 atcttcgaga gcatcggcga cggctccggc gaaggcaggg gcagcctgct gacatgcggc 2640 gatgtggagg agaaccctgg acctcctaaa aagaaacgaa aggtaggctc tggcatgtac 2700 atcagcaggg tggagatcga tcgctataat aggaggaagg tgcgcgacct gacccacgtg 2760 ggagcatatc acgcctgggt ggaggagtct tttccaagcg agctggagca gtctatcagg 2820 acacgcaagc tgtggcggat cgacagaatc cagggcaagg attacctgat catcgtgagc 2880 aaggagaagc ccaatctgca gaagctggag aagtacggag tggtgggcag cgcccagact 2940 aaggactatc agcacttcct ggattccatc aagacaggct ttcggatgaa cttcagaatc 3000 gtgctgaatc ccgtgatctc catcacctct cctgacaaga gcaagcgggg cgtggtgaag 3060 ccccacgtga caatcaagca ccagatggat tttctggtga agcagtctga gaagaacggc 3120 tttagcctgg tgggcgagtc tttcagcatc gtggagaggg gctatgaggt gttccagaag 3180 cctgagaagc caatccgcct gtctaaggtg gtgtacgagg gcaccctgac agtgagcgac 3240 gataccctgt ttaagaagat gctgacagag ggcgtgggca agaagaaggc ctacggcttc 3300 ggcctgatga ccgtggtgcc cctggaggag ggctccggcg agggcagggg ctctctgctg 3360 acatgtggcg acgtggaaga gaaccctgga cctcccaaga aaaagaggaa agtgggtggc 3420 tcccagctgg tgaagtctga gctggaggag aagaagtccg agctgcggca caagctgaag 3480 tacgtgcccc acgagtatat cgagctgatc gagatcgcca ggaaccctac ccaggaccgc 3540 atcctggaga tgaaagtgat ggagttcttt atgaaggtgt acggctatag gggagagcac 3600 ctgggaggca gccggaagcc tgatggagcc atctacaccg tgggcagccc aatcgactat 3660 ggcgtgatcg tggatacaaa ggcctacagc ggcggctata acctgcccat cggccaggcc 3720 gacgagatgc agaggtacgt ggaggagaac cagacccgca ataagcacat caaccctaat 3780 gagtggtgga aggtgtatcc aagctccgtg acagagttca agtttctgtt cgtgtctggc 3840 cacttcaagg gcaactacaa ggcccagctg accagactga atcacatcac aaactgtaat 3900 ggagccgtgc tgagcgtgga ggagctgctg atcggcggcg agatgatcaa ggcaggcacc 3960 ctgacactgg aggaggtgcg gagaaagttt aacaatggcg agatcaactt ctctgctagc 4020 gagacacctg gcacctccga gtctgccacc ccagagtccg gcggctctgg ctctagcggc 4080 ggctctggct cctccggagg aatgtccagg ttcaacctgc tggatgagcc atggatctcc 4140 gtgatctatg acgagaaggg cagcaccaag gacgtgtccc tgcaggatct gtttacaaat 4200 gcccaccagt acaaggagct ggccggcgac accaagacac aggatttcgc cgtgctgcgg 4260 gtgctgctgg ccgtgctgca caccgtgttt agcagattcg acatcgatgg caacgcctac 4320 gagtatctga caatcgacga gggctggaat cagctggagc ctgtggacga gatggatatc 4380 gagaactacg aggaggccct gtatgagacc tgggagaagc tgtggacaaa taagcggttc 4440 ccaaacatcg tgaatcagta cctggagaag tggcgggacc ggttctacct gttcgatcag 4500 aagtatccct tctttcaggt gaccaaggag gacatcgccg gcgataagat cagcaaggcc 4560 aagggcacat ccatcctggg caagaacatc aatagaatca tctctgagag cggcaacaag 4620 atcgccctgt tctccccaaa ggacgaggag aacaagaata ccctgacagc agcagagctg 4680 gcaaggtggc tgatcacctt tcagggctac tctggcgtga gcgacaaagt gatcttcggc 4740 aacgagaagt atacacccag caagggctgg ctgtttgata tcggcgccat ctacatcaag 4800 ggcaataccc tgttcgagac actgctgctg aactacatct ccccatataa tgagtgcggc 4860 aacgtggaga atatccagcg gccctgttgg gagagaaaga gctccgatat catcaagtct 4920 tacctggacg agaaggatat caccaatatc gcctctctgt acacagtgtg gagcaagggc 4980 atctatatcg accccgactt caacctgaat aagccctttt ccttcgacat cgtgaagctg 5040 ccagacatca accacaggga taatttcctg gagcccatga ccctgtggaa gtacaacgtg 5100 tccggcaaga atcgcgattc ttatacaccc aagaagcacc tgctgaacca gtctctgtgg 5160 aggagctttg gcctgctgag catcaaggac accgatctgc agcaccgcaa gcctggcgtg 5220 atcgagtggc tgacatacat cgacgatatc atcggcaacc ggctgagcaa tatcgtggcc 5280 atctccatgc aggacgatgg caatccacag agcagactgc ccaccgacga agtgatcgat 5340 tccatcttca tcaacgacct ggtgctgaca gacctggatg agggcggctg ggtgcccaga 5400 atcaatgagg tggtggagga gaccaagaag atcatctccc ggacatacaa gacctatatc 5460 aacgatatca aggagatcag aaacatctcc aatggctctt acacccagca gatcgtggag 5520 agcctgtact tcaagatcga ccagcccttc agacagtggc tggcctccat ccagcctgag 5580 gacgataagg attctaagat ccaggagtgg agggtgctgc tgaagaagat cgtgaaggcc 5640 gaggcagaag tgatcctgca ccagggagga gccagggatt atctgggcat ccagaaggac 5700 ggccgcatca agaacatcgc caccgcctac aatagctttg acttctggct gaggcagcag 5760 ctgaagtga 5769 <210> 1256 <211> 6294 <212> DNA <213> Streptomyces sp. S4 <400> 1256 atgggcccca agaagaagag aaaggtaggc agcggcatgt cccagccagc agcaaggcca 60 cctagaacat acgtggactt tcacatcctg cagaccgtgc cacccgccaa cctgaatcgg 120 gacgatcagg gcaacccaaa ggaggcctac tatggcggcg tgcggagatc cagagtgagc 180 tcccaggcct ggaagagggc aacccgcaca cacttcgcag agcgggtgcc cgagcaggat 240 ctggcaacca gaacaaggag gatcatcggc gccctggcag acgatatcca gaagagggcc 300 ggcctggata ggcctgccgc cctgaggctg gcagacgccc tgctggcccc actggagctg 360 tccggcggca agaagaagga cgagtctgcc tacctgctgt tttatggccg gagacagctg 420 gatgcagtgg ccgccctggt ggcagaccag gcaaccgagc tgtctgccct gagcgatgca 480 gacctggcat cccgggtgaa ggagctgccc gtgagagagc agttttctac aggccaccct 540 atcgacgtgg ccctgttcgg caggatggtg gccgacatcc ctgccctgaa ggtggatgca 600 gcagcacagg tggcacacgc cctgagcaca cacgccgtgg agctggagtt tgattacttc 660 accgccgtgg acgatgagca gacagacgag gagaccggag caggaatgat cggaaccatc 720 ggcttcaaca gcgccacact gtaccgctat gcctccgtgg gactgcacca gctgctggac 780 aatctgaccg atgaggaggc cgccctgaca gccatctccg agtttgccac ctccttcgcc 840 cggtctatgc ccacaggcta tcagaactct tttgcccaca ggaccctgcc cagcctggtg 900 gcagtggtgg tgcgcgagga ccagcctgtg aatctggtga gcgccttcga gcagccagtg 960 gccacaccat ccggcatcgc agcagcatct gccgcaaggc tggccgagga gcacacccgc 1020 gcaaccgtga catggggcga tgcaccagcc tttgccgcag caacacacgt gttcaccgac 1080 caccagaaga ccacagccgc cctgaacagc gcctttggcc ctagcatccc attctccgcc 1140 ctgctggagg gactgcacac ccacctggca ggcgccctga agcctaagca ggcagcacag 1200 ggcagcggcg agggaagggg ctccctgctg acctgcggcg acgtggagga gaaccctgga 1260 cctccgaaaa aaaagcggaa agtgggctcc ggcatgtcca catctccact gtctgccccc 1320 gtgcctggcc agagagtgtc tagcctgcca aggccatact ggtccggcag ggcagatgag 1380 cagggacagt ggcggaccag agcaggagag agcctgaggc cacctggaga ggacctgtcc 1440 gccctgagag caggactggg caagaaggcc ttcacagagc caaggctgtg gcagtactat 1500 accacaccca cagatggccg cgtgaccctg gagctggagg cagagcacgc cgccctggcc 1560 ctgtacggac tgcaccagca gagccaggag cagccaatgc acaggcaggg cgtgcggacc 1620 ggaagagccc tgagggccct gcaccagcgg tactctgagg aggcaacaga caggcgcgtg 1680 gcacaggcag tgggagccac cagcgccgca gcctttgcct ataggctgcg cgccctggtg 1740 acccagctga ggtctatcgg ccagccactg gattacgacc agctgatgca ggatctgctg 1800 aggtggcact tccccgacgg ccggagcaga gtgcggagag gatggggact gggataccac 1860 ggaagggaca ggcagcccga tgaggcccca ccccctgagg gcagcggctc cggcgaaggc 1920 agaggctccc tgctgacttg tggcgacgtg gaagagaacc ctggacctcc aaagaagaaa 1980 agaaaagtcg gctctggcat gaccacagca cctacaccag agccagcagg aaatacccac 2040 ccagcacacg gctccgatga gcctaccgtg ctgctgctga ggctggcagg accactgcag 2100 tcttggggcg tgagatcctc ttttaacagg agggacacag gagcagagcc aaccaagtcc 2160 ggcgtgatcg gactgctggc agcagcagca ggacacccta gagagcagcc actgggagag 2220 ctggcagatc tgaccctggg catcagggtg gaccagccag gcacactgct gagggactac 2280 cacaccgtga gcgattatag gggcagacct ctgccacagg caggcgtgtc tgccaagggc 2340 atccagaagc ccaccagccc tgccaagcac acacacgtga ccacaaggtt ttacctgcag 2400 gatgccgtgt tcgtggccgc cctggaggga cctccaggac tgctgaccac actggacagg 2460 gccgtgcgga atccagcatt cccactggcc ctgggccgga gaagctgtcc acctacccag 2520 ccactgtccc tgggactgcg gaccacagat atggagacag ccctgagatc tgagccttgg 2580 caggccagcg cccacaccag agagcagtat gcaaggcgcc tgggaaggga gaggggactg 2640 caccagcctc tgcacccagg aaccatcgac agggcagcaa caatcgagga ccccaggggc 2700 gacgataggc tgcaggacgc acccgtgagc tttgatcctc accagagggc cttcacctcc 2760 agacaggtga ggcacacctg gctggccatc cccacaggct ttgaccacat cgacgatgac 2820 cagcctcacg gacaggcaga tgaccccgat cacgaccctt tcgccctgct gggatggggc 2880 tccggcgagg gcaggggctc tctgctgacc tgcggcgatg tggaggagaa ccctggacct 2940 cctaaaaaga aacgaaaggt aggcagcggc atgacatacc tgtcccggat cagaatcaac 3000 ccactgcgga aggacagccg gaagctgctg agcaatccaa gggcagtgca cggagccgtg 3060 atgggaggcc tgccaaacca caagcccgat gacagggtgc tgtggcgcat ggaccccgac 3120 aatcctcaca ggccacacct gtttgtgctg agccccacac gccctgactg gacccacatc 3180 atccaggatt gtggctggcc agatgcagac ggcgatcacg cagccgtgag agactatacc 3240 ccactgctga gccagctggc agtgggaaga gagttcgcct ttaggctgac agcctccccc 3300 gtgcagaaca ccgccacacc aaccaaggca accccagcac aggcagcaag gctgaccaca 3360 cacgccgaga atggcaagcg gatcagaggc ttcagaatgg gacacagaac cgcagcagca 3420 cagctggatt ggtttctgac acgcaccgac cggtggggct tcgatatccc tgcaacaaga 3480 tctgacccag cagcaccagg catccacgca ccaacacctc caaccgcacc aaggcctaca 3540 agcccaccta gaccagatcc caacccacca tacgaggtgc gcatcaccgc aaggcacaga 3600 cactcctttc agaagaatgg ccacggcgcc cacgtggtgt ttcggtctgc caccttcgag 3660 ggcaggctgc gcatcacaga caccgatcgg ttcaccacat ctctgctgac aggcctgggc 3720 cctagcagag cctatggatg cggactgctg acactggcac ctctgccagg acagcagacc 3780 ggctctggcg agggaagggg cagcctgctg acctgtggcg acgtggagga gaaccctgga 3840 cctcccaaga aaaagaggaa agtgggtggc tcccagctgg tgaagtctga gctggaggag 3900 aagaagtccg agctgaggca caagctgaag tacgtgcccc acgagtatat cgagctgatc 3960 gagatcgcca ggaatcctac ccaggatcgc atcctggaga tgaaagtgat ggagttcttt 4020 atgaaggtgt acggctatag gggagagcac ctgggaggca gccgcaagcc agacggcgcc 4080 atctacacag tgggctcccc catcgactat ggcgtgatcg tggataccaa ggcctacagc 4140 ggcggctata acctgccaat cggacaggca gacgagatgc agcggtatgt ggaggagaac 4200 cagaccagaa ataagcacat caacccaaat gagtggtgga aggtgtaccc cagctccgtg 4260 acagagttca agtttctgtt cgtgtccggc cacttcaagg gcaactataa ggcccagctg 4320 acccggctga atcacatcac aaactgcaat ggcgccgtgc tgtctgtgga ggagctgctg 4380 atcggcggcg agatgatcaa ggcaggcaca ctgaccctgg aggaggtgcg gagaaagttt 4440 aacaatggcg agatcaattt ctctgctagc gagacacctg gcacctccga gtctgccacc 4500 ccagagtccg gcggctctgg ctctagcggc ggctctggct cctccggagg aatgcctggc 4560 aagggaggag caagcgtgaa cctgctgtcc gatggctggc tgagcgccgt gtccgccggc 4620 ggcggcagcg gctttggagg aggacctgga gcaggaccag cagagttcgg cgtgcgcgag 4680 ctgctgctga atgccgagaa gtttgccgac atcgtggtgg atctgccaac ccagaggcct 4740 gccgtgttcc ggcaggtgct gctgcctctg gtggtggacg ccctgggatg tccaaaggac 4800 gcagaggcct ggatggatat gtttagggca ggagccttct cccccgagca gaggcaggtg 4860 ctggccgact acctggataa gcaccagcac ctgtttggac tgctggaccc cgtggagcca 4920 ttcggccagg tggccgacct gagaacagca aagggagaga ccaagggcag cgccctgctg 4980 gtggcaacag cagccaccgg caacaatgtg cccctgttta gctcccggac agagggcgac 5040 gtgctggagc tgacccctgc agaggcagca agatggctgc tgcacacaca ctgctgggat 5100 accgcagcca tcaagacagg agcagtgggc gaccctatgg tgaagagcgg caagaccacc 5160 ggaaacccaa caggacctct gggacagctg ggagtgacca tgccagtggg ctccacactg 5220 ttcgagaccc tgctgctgaa tatcccatac ggacaggcag gactgtctga tgacgtgcca 5280 cagtggaggc gccggagcac ccagggcgac gtgaaggata ccctgtcctg tgcaacaccc 5340 gtgtggcaga gccggccagc aaggggactg ctggaggcct ggacatggca ggccagaagg 5400 atcagactga tctcccagga cacagatcgc ggcccaagga tcaccagagt gctggtggca 5460 gcaggcgaca ggctggaggt gtctccagat acagagcccc acaccgcatg ggtggtggat 5520 agcccagcag gccggagagg caagtctcct gcacggagcg gcgtgaagtc cgccagacca 5580 agaaggcaca ccgcaggaag ggcaggatgg aggggcctgg acgccctgct ggccgtgaac 5640 gccgtggacc aggatcagca ggcaacagca acccggagcg gcgccgtgtc tagccagctg 5700 gtgagacagc tgtctgccat cagccgccgg ctgcctagcc ggtacccact gagagtggag 5760 ctgaccggca tcgcctatgg caaccagtcc gccgtgatcg aggacatgta cttcgatgag 5820 atcccactgc ctgtggccgc cctggacccc gagggcatcg tgtacggcgc cctgctggag 5880 gtggtggacc aggccgagga tctggccaag gccgtgaatc acctgtccgg cgacctgaga 5940 agggcagcag gctctgagcc aatcccatgg gacaagggac agaggcctgg cgataccctg 6000 ctgcacgccc tggacccaat cgtgcgccgg ctgctggcag gactgaggca ggccggcgat 6060 gactttgata ggtgtgagca gggcctggag gcctgggagc acaaggcagg acaggccaca 6120 ctgcgggtgg cagagggcct gtttaatagc gccccagccg ccctgttcac cggcagaagg 6180 gtgaagaagg acggcaagga gcaggtgtat cgcctgtcta cagcagaggc cagcttccgc 6240 cggagactgg ccgtgatcct gcacaggcgc gccgccgccc ggaccgccgg ctga 6294 <210> 1257 <211> 5103 <212> DNA <213> Campylobacter fetus subsp. testudinum Sp3 <400> 1257 atgggcccca agaagaagag aaaggtaggc tctggcatga agctggccaa ccgcatctac 60 ggcatcatcg gcatcaagag caccatggcc aattggaacg ccgacttttc tggccgcccc 120 aagagcacag gcaatggcga catcttcgcc agcgataagg ccctgaagta tcctatgaag 180 aagatgtggg agtcctacgg caagaacatc ctgttcgtga agtccctgaa gcagggcaag 240 tctaaggacg gcaacgataa gctggtgcca aataccctgg gcgagcggta tggcctgctg 300 tttggcgata tcaagaaggc caagagcaca aaggaggtgc tgtccaatct gttcaactgc 360 atcgatgtga agaattttgg cgccaccttc ccagaggacg gctacaacct gagcatcaca 420 ggcgccgtgc agatcggcca gggctttaac aagttcggcg acatcaacat cgaggtgcag 480 aatatcctgt cccccttcgc cgatagccgg gccaaggaga agaatgagaa cggagaggac 540 gcctcccagt ctaccctggg cacaaagatc gtgaccgatg aggcccacta cttttatggc 600 ttctgtatca accccctggc ctataatgac tacaaggaga tcctgggcga cgattttggc 660 tataatgagg acgattacgc cgagttcaag aaggccgcca gattctgcgc cacctacttt 720 aatagcaact ccaagtttgg ctgtgagaac gagtttgcca tgttcatcga gacagccgtg 780 gacgcctatc tgcctgatct gagctcctac atggacttca tctgcaagga taagaacagg 840 ctggtgaatc tggagaagat cgagaagatg atcgagtcta gcgatgtgaa gaaggtggag 900 atctactata atcctctgtc cctggacgtg gagaccaagt ttgacaagtt cgatatctat 960 tctggcaaca agatcggcag cggcgaggga aggggctccc tgctgacatg tggcgacgtg 1020 gaggagaacc ctggacctcc taaaaagaaa cgaaaggtag gcagcggcat ggatgtgaag 1080 atctaccagc tgaaggtgtt cctgaagctg aatcagaacg tggacttcat caacagccca 1140 gagtttctgt ccaccaatct gcacaaggcc atgctgggcg atgaggccct gaggtccatc 1200 cacatgcagc ggtacctgaa gccctactct atcggctttc tgtacagcat gaagggcaag 1260 aaggacacat ttgtgagcgg cgaggatatg tacttctatg tgcggtccat cgacgagtct 1320 ttcatcagca agctgagaat ctgcctggag aattctaaga acctgggctt taacgtgtat 1380 ctgagcaagt tcgagaatct ggacatcaag caggtggata ggctgtacac catgagccct 1440 gccacaatcg tgctgaagga gggcgataag accatcccat ggcggagaga gaactccgac 1500 atcacagtgc tgaaggaggc cctgatctct aatctgaaga acaagtacga gtatttcctg 1560 gacaagaaga tcgagatcaa ggacgatatc atcgagctga tcgagatcaa gaccaatcgg 1620 gccttcgcct ttagatataa gaacggcaag atctacgcct ataggtacca gatccacttt 1680 agccagaacc gcctggccca ggagttcgcc aatatcgcca tgatcctggg cgtgggcgtg 1740 aagaataccc tgggcttcgg cttttgcatg aggtccaaca atgcagtggg ctctggcgag 1800 ggaaggggca gcctgctgac ctgcggcgat gtggaggaga accctggacc tccaaagaag 1860 aaaagaaaag tcggctccgg catgaaggcc atcagcttta agctgtccgg caagtttgcc 1920 cacttcaaga agccagacgt gaacgagtac gtgtacttca cctacaacaa tatccccaag 1980 cctacactgc tgggactgct gggagcaatc atcggcctga agggctatgc ccagaagacc 2040 tacaacaata agaaggacaa gaagagcctg ctgaacaatg agaatcggtc caacgagcct 2100 gagttctatg agagactgaa gcacctgaag atctgcatca tcccactggt gaagtacggc 2160 aagttttcta agaagatcca ggtgttcaac aattctgtgg gatatgccag caccgaggag 2220 ggaggaaatc tgatcgtgag ggagcagtgg ctggagaacc ccagctggca gatcctgatc 2280 gaggacgatg gctctgccga gtttgagaca atcagccagt atctgttcga taagaaggcc 2340 aagtttatcc cttacctggg caagaatgac cacttcgccg atatctccga ggtggagaag 2400 atcgacctgg ccgagtccaa gaaggataag atcgtgatca agtctctgtt cctggacaac 2460 ctggccaagc aggtggacga tcccgacgat gagatctctt atctgtttaa cgagttctac 2520 cctatcggct tcaatgagct gatgttttac aagctggaga agaccacctt caccaatcag 2580 atctgtcagg ccatggatgg caagtggtat gagttcaagg acggcaccat ctgcttcttt 2640 ggctccggcg aaggcagggg ctctctgctg acatgtggcg atgtggaaga aaaccctgga 2700 cctcccaaga aaaagaggaa agtgggcggc tcccagctgg tgaagtctga gctggaggag 2760 aagaagagcg agctgaggca caagctgaag tatgtgccac acgagtatat tgagctgatc 2820 gagatcgccc ggaatcccac ccaggataga atcctggaga tgaaagtgat ggagttcttt 2880 atgaaggtgt atggctacag gggcgagcac ctgggaggct ctcgcaagcc agacggagcc 2940 atctataccg tgggcagccc tatcgactac ggcgtgatcg tggatacaaa ggcctattcc 3000 ggcggctaca acctgcctat cggccaggcc gacgagatgc agcggtacgt ggaggagaac 3060 cagaccagaa ataagcacat caatccaaac gagtggtgga aggtgtatcc ctcctctgtg 3120 acagagttca agtttctgtt cgtgtccggc cacttcaagg gcaattacaa ggcccagctg 3180 acccggctga accacatcac aaattgcaac ggcgccgtgc tgtctgtgga ggagctgctg 3240 atcggcggcg agatgatcaa ggccggcacc ctgacactgg aggaggtgag gcgcaagttt 3300 aacaatggcg agatcaactt ctctgctagc gagacacctg gcacctccga gtctgccacc 3360 ccagagtccg gcggctctgg ctctagcggc ggctctggct cctccggagg aatgctgttc 3420 gagctgctgg atgagtttaa gaagcagctg gagaagaaca agcacatcgt gacacagaat 3480 cacatcctga aggatggcgt gtatgcccgc atctccgacg agaagtgtga gatcttctac 3540 gtgaagacca tcacagagaa gatcggcaag accgcccaga agcggacaat cctgtataag 3600 cagaacggcg acatcgccct gaatgacgat atgcagtggt ttgagcaggc cgactacctg 3660 agcttcctgt gggatatgaa caaggccgtg ctgcccaata agaagttcca cagcatcaac 3720 tttctgtccc tgttctttaa gctggaggag tccgagtacg tgaaggagaa tctggaggag 3780 tattttgaca tcttcagaga ttactccgcc tttaacaagg ccaaggataa ggagatcctg 3840 tctttctata tggactacat caaggatgag aataggcaga acctgatcac caattctgtg 3900 gtgctgagca agaagtactt caatgacatc aacgattttg ccgtgcagaa caatttcaag 3960 aagtgctaca tcaagttctt tatcgacaag gatttcgaga tctacgagaa ggagagccag 4020 atctatatcg acctgaagat ctacaattcc aacgagcaca acatcaagta taacaatgag 4080 atcttcggcc tgtctaactt caacatgggc atgaatagca agaagccatt tctggagcac 4140 aagaaccgcc tgttcaagat cccctacgcc atctcccaga aggatgccct ggcctctaag 4200 atgctgtttg actggctggg cagccagaac aagcggatca tcagagactt taattccatc 4260 ttcatctcta agtttaacaa gcagtctaag gccgtggtga gcgacttcga gtacgtgccc 4320 gtggataaga acaagtttaa gttcgacaag ttcaagctga agaacttcat gaacatcgag 4380 aatggcgaga aggagatcct gagctttgac gatttcaagc aggtcatcga tgagcagctg 4440 tatcacaagt gcctgtttgg caacctgtac aatgatgaga tcagggtgag caagcgcatc 4500 tccgaggaca tgcagaatct gctgtatcag acccggtgtt ccatggtgga gtactttgac 4560 aagttcaaca ataacgagtt ctactatgtg atccagaagt actctaacga cttcatcaag 4620 atcgccatgc aggacagcga gttcggccgc ctgaacggca agaagagcat caatctgctg 4680 ctgtccatca aggagatcaa gggcgagaag gtggacatcg atggcatcaa gaatagagtg 4740 atctccgccc tgaccgacga taacgtgaca aagctgtctg gcaatgagta ctattttctg 4800 gtgggcaacc tggccatgta cctggtgagc aagtccaaga cctggaagaa gacattcgcc 4860 ctgaccgatc catatacaaa ggcccggaac accaagaagc tgaagatggc cctgtttatc 4920 gacttcgata gatataacta cgacatcttt ctggagaatg gcatcctgaa gaaggccttc 4980 agcctggccc agaattgtga ggatatcgtg atgtccaata acgaccagca gatggtgctg 5040 atcggcatga tgacaaagaa catcatcaag aagcccggcg agaaggacga gatcagcgag 5100 tga 5103 <210> 1258 <211> 5319 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <400> 1258 atgggcccca agaagaagag aaaggtaggc tccggcatgt ctaacacctt caagaatcgg 60 gtgtttggct gcgtggtcat caagagcgtg aactccaatt ataacgccga cttctcccac 120 cagccacgca cactgcctga cggcagcgtg tacgccaccg ataaggccct gaagtacaca 180 gtgcggaact atatcgacaa gaattaccct gaggataagg tgttctactt taagtctctg 240 aacggcgaca tgcagccacg cgacctggat cagaattatg cccggttctt tggcgactac 300 cccaaggccg ataagaagga ggccgtgaag gccagaaaag tgatcctggg caacctgctg 360 agctgtctgg atgtgaggct gtttggcggc accttcgcct ctaagacagc caacctgagc 420 atccacggag tggtgcagcc tacccacgga gtgaatagat atgtggaggg catcatctac 480 agcgagcaga tcgcctcccc attcaggaat tctaacgaca attctaccga tagcatgcag 540 accacactgg gcacacagtt caagctgcag gagggccact acgtgcacca ctttagcgtg 600 aacccaggca atctggacga gctgaccgag tttgtggata acggccgcct gacaggcgag 660 gacatcgcaa agctgaagga ggccctgaga tgcggagtga cctactatga tagctcctct 720 aaggccggca cagagaacga ggccctgctg tgggtggagc tgaaggagga gtccaagctg 780 gtgctgccct ctttcgtgga cctgatcgaa gtgaatgccg agcgggagat cgattttgcc 840 aaggtgtcta ccctgctgag caaggagaag atcaagaacg agatctccaa gatcgagctg 900 ttctacaata agggcatcac caaagtgatc cacctgcctg agggcacagt ggagctggag 960 ctgaacggac tgggcagcgg cgagggaaga ggctccctgc tgacctgtgg cgacgtggag 1020 gagaaccctg gacctcctaa aaagaaacga aaggtaggca gcggcatgag gctgaagctg 1080 gtgctgaaga tcgtggaggg cacagtgctg ccctgcaact atatgtacga gctgagctcc 1140 tgtctgtaca aggtgctgaa cgagggcaat cccgtgttca ccgcctggct gcacgataag 1200 ggctattgca aggagaagaa ggcctttaag ctgttcacat tttccaattt ctactttcca 1260 tgtttcagaa tcgagggcga caggatcttt gtgctggccg ataccgccca gctgatcgtg 1320 tctttctacc ccatcgaggc catcgacgcc ttcgtgatgg gcctgtttaa gaaccgccag 1380 ctggaagtgg gcgatcggaa gtccagggtg cgctttgagg tgttcaatct ggagaggcag 1440 gcagagcctg agttcaccag ccggatgttc tttaagacac tgtccccaat gtttatcgag 1500 gagcagctgc ccgagacaag aaaggccatc cacctgtctc ctggcaaccc aaagttcgcc 1560 gagctgctgc acctgaatct gctggacaag tacagagtgt tttatggcca ggagcccgat 1620 cctagctggc cactgaccag gctgcacctg ctgtccgagc caaagcccaa gacaatcgtg 1680 ctgaaggtcg gcacccccga ggagacaaga atgaagggct ataccttcag gtttgagctg 1740 gagggccagc ctgagctgct gagactggga tacgagggag gattcggcag gctgaacagc 1800 cagggctttg gctgcgtgga ggtgctgaag cagggctctg gcgagggaag gggcagcctg 1860 ctgacatgcg gcgacgtgga agagaaccct ggacctccaa agaagaaaag aaaagtcggc 1920 tccggcatga acaatcagcg gctgatctct ttcgacatcc aggccgattt tggcttcttt 1980 aagaagcctg actataacga tggcgtgctg ctgacctaca atatgctgca caagccagcc 2040 ctgctgggca tcctgggagc catcatcggc ctgagaggct acaggaagaa gggcgagtgg 2100 cccgagtact atcagagact ggccgccctg cctgtgggaa tcgagccact ggagggcagg 2160 cacgagaagg gcaacttcca gaagacaatc gtgaagtata ccaatacagt gggctacgcc 2220 aaccaggacg gcaatctgct ggtggaggag tctatgctga tccgccctgc ctaccggtgc 2280 tatctgctgc tgagcgagga gcacccagat caccgcaagc tgtatgagta catccgggag 2340 ggctgggccg agtacatccc ttatctgggc aagaacgagt atccagcctg gtttggcgac 2400 tccttccgcg agtacgcctt taagaccttc gtgcctgaga cagatttccg ggtgtctagc 2460 ctgtttatca aggagggcgt gctgaagggc cagcaggtga aggcctcctt ctcttttagc 2520 ctgaagggca tcgtgaatag aggcagcttc gtgtacttcg agaggctgcc cgtgggcttc 2580 caccctgtgc tgatgcagta cgagctggcc gacttcgcct ttaccgattg gacactgcag 2640 gccgccaccc agatggtgaa cctgtaccag ctggaggagg agggcaagat cgtgcagctg 2700 tttggctccg gcgaaggcag aggctctctg ctgacatgtg gcgacgtgga agaaaaccct 2760 ggacctccca agaaaaagag gaaagtgggc ggcagccagc tggtgaagtc cgagctggag 2820 gagaagaagt ccgagctgcg ccacaagctg aagtatgtgc cccacgagta catcgagctg 2880 atcgagatcg ccagaaaccc tacccaggac agaatcctgg agatgaaagt gatggagttc 2940 tttatgaagg tgtatggata caggggagag cacctgggag gctctcggaa gccagatgga 3000 gccatctata ccgtgggcag ccctatcgac tacggcgtga tcgtggatac aaaggcctac 3060 agcggcggct ataacctgcc aatcggccag gccgatgaga tgcagagata tgtggaggag 3120 aaccagacca ggaataagca catcaacccc aatgagtggt ggaaggtgta cccttcctct 3180 gtgacagagt tcaagtttct gttcgtgagc ggccacttca agggcaacta taaggcccag 3240 ctgacccggc tgaatcacat cacaaactgc aatggagccg tgctgtccgt ggaggagctg 3300 ctgatcggcg gcgagatgat caaggcaggc accctgacac tggaggaggt gcggagaaag 3360 ttcaacaatg gcgagatcaa cttttctgct agcgagacac ctggcacctc cgagtctgcc 3420 accccagagt ccggcggctc tggctctagc ggcggctctg gctcctccgg aggaatgctg 3480 caggagatca acaatttcat gaattctctg ccagcagagc tgaagcaggc aggcctgaag 3540 ccaaaggagg gactgcacgt gctgctgaag atccaggaga aggagggcac ccactttatg 3600 gacgagcagt ccgtgtgccg ggtgtgcctg acccggaagg caacagagtt tgattacccc 3660 ttcctgcagc actgcgcaga gctggcccaa gtgggatggt gcgtgaacac aaataagtgt 3720 ttcgacctgc ctgccaaggg cctgcactct tgcagcccat attgtatcgc cctgaagaga 3780 gagagcctgg agggaggcgg caagtacgca aaggacaaga ccaagatcta tgacaggatc 3840 gatacatact ttgccaacgc cctgagctac gtggaggagg attccgagaa ggagcggatc 3900 agagtgtttc agcacttcat caactccaag gagaagctga atgccctgtt tgcctgtttc 3960 cagtctgagg tggacgaggt gaaggataag gagtacatca tcctgtatct ggaggaggag 4020 atggagaagt ataggcgcgt gcacgagaag tacctgtccg acaagctgtt caacaccaat 4080 gagtataaca tcagcgtgga gaatcagctg tacggcacct ccgattttct gaacggcttc 4140 ccaacaaaga agcccttcct gagccaccag tccgccgtgt ttgacatcgc aggaaggatc 4200 accggagaga tggcaggcaa cctgcacgat tttcaggaga tcatgcggag aaatgtgctg 4260 cctcgcccac tgcccctgtt cgtgtatcgg gaggagctgc agacagagat gctggccgtg 4320 tttagcagat acctggccga cggcaagagg atcggctatc aggagatcat ccgcgagctg 4380 tacaagaacc accaggacga tatcggcgac tactatctgc tgtactatta cggcgatacc 4440 gtgtgcgact ttgatttcgt gtctaggttc cgctacaggc tgcagagcgg cgacaaggag 4500 ggatggatgg tgaaggatca ctttcagatc ggcttcaccg agaagatcag ccacgtgttc 4560 gagctggagg agaaggtgct gcgggagatc tttaacaatt ccctgatcac cagaacaaag 4620 gccggcgaca cacagaggaa gtatttcgat gagctggagc ccaagtactg taagtctgag 4680 aacaattatc tgctggtgct gaagtacaga caggccttct atgactacat ctataagagc 4740 cgcctgcagg cagtgacccg gcctatgttt gatcacatcc tgctgacagg catcctggag 4800 gacatcagac tggatgagct gaagggcaac cagcacaccc agaggtgggg catcctgtcc 4860 aagatgaata tctggttctc tctggccgag cggttcgacc tgcagttcaa gaacaccgat 4920 acaatggcca gcaagctgga ggagcagcgg gtgttcatgg tggccctgtc ccagggagag 4980 gcaatcctgg agaatgacga gcagtacgcc tttgccgccg gccaggtcat ctactacctg 5040 ctgcacaagt ctaagaccgc cgataagagc tataagaggc tggagccctt cctgcagcag 5100 gtgcacgcct ccgagctgaa caaggccatc gcccgcctgt ttgacaccta caagcacgag 5160 aacttttctg gcaatttccg gcacccattt gccagcgtga tggcctatca gacacaggcc 5220 aatatgcgcg actacctgcc catgatgctg gccggcatct tcagcgataa cctgctgttt 5280 tccgtgaata agtctgagga gaccaacgag gagaattga 5319 <210> 1259 <211> 4341 <212> DNA <213> Bacillus halodurans C-125 <400> 1259 atgggcccca agaagaagag aaaggtaggc agcggcatga ccatcctgga tcacaagatc 60 gacttcgccg tgatcctgtc cgtgacaaag gccaatccta acggcgaccc actgaatggc 120 aacaggcctc gccagaatta cgatggccac ggcgagatct ctgacgtggc catcaagaga 180 aagatcagaa acagactgct ggatatggag gagcccatct ttgtgcagag cgacgatagg 240 aaggccgact ctttcaagag cctgagggat cgcgccgact ccaatcctga gctggccaag 300 atgctgaagg ccaagaacgc ctctgtggat gagtttgcca agatcgcctg ccaggagtgg 360 atggacgtgc gctccttcgg ccaggtgttc gcctttaagg gctccaatct gtctgtgggc 420 gtgcggggac ccgtgagcat ccacaccgcc acaagcatcg atccaatcga catcgtgtct 480 acccagatca caaagagcgt gaactccgtg accggcgata agagaagctc cgacacaatg 540 ggcatgaagc acagggtgga ttttggcgtg tacgtgttca agggctccat caatacccag 600 ctggccgaga agaccggctt tacaaacgag gacgccgaga agatcaagag agccctgatc 660 acactgttcg agaacgattc tagctccgcc aggcctgacg gctccatgga ggtgcacaag 720 gtgtattggt gggagcactc tagcaagctg ggccagtact cctctgccaa ggtgcaccgg 780 agcctgaaga tcgagtccaa gaccgataca ccaaagagct tcgacgatta cgccgtggag 840 ctgtatgagc tggatggcct gggcgtggaa gtgatcgacg gacagggctc cggcgaggga 900 agaggctctc tgctgacctg tggcgacgtg gaggagaacc ctggacctcc aaagaagaaa 960 agaaaagtcg gcagcggcat gcggaacgag gtgcagtttg agctgttcgg cgattacgcc 1020 ctgtttaccg accccctgac aaagatcggc ggcgagaagc tgtcctactc tgtgcctacc 1080 tatcaggccc tgaagggcat cgccgagtcc atctattgga agccaacaat cgtgttcgtg 1140 atcgatgagc tgagagtgat gaagcccatc cagatggagt ctaagggcgt gaggcctatc 1200 gagtatggcg gcggcaacac cctggcccac tacacatatc tgaaggacgt gcactaccag 1260 gtgaaggccc acttcgagtt taatctgcac agacccgatc tggcctttga caggaacgag 1320 ggcaagcact actctatcct gcagcgcagc ctgaaggcag gaggccggag agacatcttc 1380 ctgggagcaa gggagtgcca gggatatgtg gccccttgtg agtttggctc tggcgatggc 1440 ttctacgacg gccagggcaa gtatcacctg ggcaccatgg tgcacggctt caattaccca 1500 gatgagacag gccagcacca gctggacgtg aggctgtggt ccgccgtgat ggagaacggc 1560 tatatccagt ttcctagacc agaggattgc cccatcgtga ggcctgtgaa ggagatggag 1620 ccaaagatct tcaatcccga taacgtgcag agcgccgagc agctgctgca cgacctggga 1680 ggagagggca gcggcgaggg aaggggctcc ctgctgactt gcggcgacgt ggaagaaaac 1740 cctggacctc ccaagaaaaa gaggaaagtg ggcggctccc agctggtgaa gtctgagctg 1800 gaggagaaga agtccgagct gagacacaag ctgaagtacg tgccacacga gtatatcgag 1860 ctgatcgaga tcgccaggaa ccccacccag gatcgcatcc tggagatgaa agtgatggag 1920 ttctttatga aggtgtacgg ctatagggga gagcacctgg gaggctcccg gaagccagac 1980 ggcgccatct acaccgtggg ctctcccatc gattatggcg tgatcgtgga cacaaaggcc 2040 tacagcggcg gctataatct gcccatcggc caggccgacg agatgcagag atatgtggag 2100 gagaatcaga ccaggaacaa gcacatcaat cccaacgagt ggtggaaggt gtaccctagc 2160 tccgtgacag agttcaagtt tctgttcgtg agcggccact ttaagggcaa ttataaggcc 2220 cagctgaccc ggctgaacca catcacaaat tgcaacggag ccgtgctgtc cgtggaggag 2280 ctgctgatcg gcggcgagat gatcaaggcc ggcaccctga cactggagga ggtgaggcgc 2340 aagtttaaca atggcgagat caacttctct gctagcgaga cacctggcac ctccgagtct 2400 gccaccccag agtccggcgg ctctggctct agcggcggct ctggctcctc cggaggaatg 2460 agctggctgc tgcacctgta cgagacatat gaggccaatc tggatcaagt gggcaagacc 2520 gtgaagaagg gcgaggacag agagtacaca ctgctgccaa tctcccacac cacacagaac 2580 gcccacatcg aggtgaccct ggacgaggat ggcgacttcc tgagggccaa ggccctgacc 2640 aaggagtcta cactgatccc atgcacagag gaggcagcct cccgctctgg cagcaaggtg 2700 gcaccatacc ctctgcacga taagctgagc tatgtggccg gcgactttgt gaagtacggc 2760 ggcaagatca agaatcagga cgatgcccca ttcgacacct atatcaagaa tctgggagag 2820 tgggcaaaca gcccatacgc aaccgagaag gtgaagtgta tctacacata tctgaagaag 2880 ggccgcctga tcgaggatct ggtggacgcc ggcgtgctga agctggatga gaaccagcag 2940 ctgatcgaga agtgggagaa gcggtacgag gagctgctgg gcgagaagcc tgccatcttt 3000 agctccggcg caaccgacca ggccagcgcc ttcgtgcggt tcaacgtgtt ccacccagag 3060 tccatcgacg acgtgtggaa ggataaggag atgttcgact cctttatctc tttctataac 3120 gataagctgg gcgaggagga catctgcttc gtgaccggca atcggctgcc cagcacagag 3180 agacacgcca acaagatcag gcacgccgcc gataaggcca agctgatcag cgccaatgac 3240 aactccggct ttaccttccg gggccggttc aagaccagcc gggaggcagt gggaatcagc 3300 tacgaggtgt cccagaaggc ccacaatgcc ctgaagtggc tgatccaccg ccagtccaag 3360 tctatcgacg atcgggtgtt cctggtgtgg tctaatgata acagcctggt gccaaatccc 3420 gatgaggacg ccgtggacat catgaagcac gccaacaggg agctggagcg cgatccagac 3480 accggacaga tcttcgcagg agaggtgaag aaggcaatcg gaggctaccg cagcgatctg 3540 aactatcagc ccgaggtgca catcctggtg ctggactctg ccaccacagg ccgcatggcc 3600 gtgctgtact atcggagcct gaataaggag ctgtacctga accgcctgga ggcctggcac 3660 gattcttgtg cctgggagca ccggtatcgg agagacgaga aggagtttat cagcttctac 3720 ggcgcccccg ccaccaagga tatcgccttt gccgcatatg gacctagggc ctccgagaaa 3780 gtgatcaagg acctgatgga gcggatgctg ccttgcatcg tggatggcag gcgcgtgcca 3840 aaggacatcg tgcggagcgc cttccagaga gcctccaatc ccgtgtctat ggagagatgg 3900 gagtgggaga agaccctgtc catcacatgt gccctgatca ggaagatgca catcgagcag 3960 aaggaggagt ggggcgtgcc tctggataag tctagcaccg accgcagcta cctgtttggc 4020 cggctgctgg ccgtggcaga tgtgctggag aggggcgccc tgggcaagga cgagaccaga 4080 gccacaaacg ccatcaggta catgaatagc tattccaaga accctggccg cacctggaag 4140 acaatccagg agtccctgca gccatatcag gccaagctgg gcaccaaggc cacatacctg 4200 tctaagctgg tggatgagat cggcgaccag tttgagcctg gcgacttcaa caataaccca 4260 ctgaccgagc agtacctgct gggcttctat agccagcgga gagagctgta caagaagaag 4320 gaggaggaga caaaccagtg a 4341 <210> 1260 <211> 4290 <212> DNA <213> Desulfovibrio vulgaris <400> 1260 atgggcccca agaagaagag aaaggtaggc agcggcatga ccgcaatcgc aaaccgctat 60 gagtttgtgc tgctgttcga cgtggagaac ggcaatccaa acggcgaccc cgatgccggc 120 aatatgccta ggatcgaccc agagaccgga cacggactgg tgacagacgt gtgcctgaag 180 agaaagatca ggaaccacgt ggccctgaca aaggagggcg ccgagaggtt caacatctac 240 atccaggaga aggccatcct gaatgagacc cacgagcgcg cctatacagc ctgtgacctg 300 aagccagagc ccaagaagct gccaaagaag gtggaggacg ccaagcgggt gaccgattgg 360 atgtgcacaa acttttacga tatcagaacc ttcggcgccg tgatgaccac agaagtgaat 420 tgtggacagg tgcggggacc agtgcagatg gcctttgcca gatccgtgga gcccgtggtg 480 cctcaggagg tgtctatcac ccggatggcc gtgaccacaa aggccgaggc cgagaagcag 540 cagggcgaca acagaacaat gggcaggaag cacatcgtgc catacggcct gtatgtggca 600 cacggcttca tcagcgcccc cctggccgag aagaccggct tttccgacga ggatctgaca 660 ctgttctggg acgccctggt gaatatgttt gagcacgatc gctccgccgc aaggggactg 720 atgagctccc ggaagctgat cgtgtttaag caccagaata gactgggcaa cgcccctgcc 780 cacaagctgt tcgacctggt gaaggtgtct agggcagagg gctctagcgg ccctgcacgc 840 agcttcgccg attatgcagt gaccgtggga caggccccag agggagtgga ggtgaaggag 900 atgctgggct ccggcgaggg aaggggctct ctgctgacat gcggcgacgt ggaggagaac 960 cctggacctc caaagaagaa aagaaaagtc ggcagcggca tgacccacgg agcagtgaag 1020 acatacggca tcagactgag ggtgtggggc gactatgcct gttttacccg gcctgagatg 1080 aaggtggaga gagtgagcta cgatgtgatg ccaccatccg ccgcaagggg catcctggag 1140 gcaatccact ggaagccagc catcagatgg atcgtggaca gaatccacgt gctgcgcccc 1200 atcgtgttcg ataatgtgcg gagaaacgag gtgtcctcta agatccctaa gccaaaccca 1260 gcaacagcaa tgagggatag gaagcccctg tattttctgg tggacgatgg ctccaacagg 1320 cagcagaggg cagccaccct gctgcggaat gtggactacg tgatcgaggc ccacttcgag 1380 ctgacagaca aggccggcgc cgaggataat gccggcaagc acctggatat cttcaggcgc 1440 cgggcaaggg caggacagag ctttcagcag ccttgcctgg gctgtcgcga gtttccagcc 1500 tccttcgagc tgctggaggg cgacgtgcca ctgtcttgct acgcaggcga gaagcgggat 1560 ctgggctata tgctgctgga catcgatttc gagagagaca tgaccccact gttctttaag 1620 gccgtgatgg aggatggcgt gatcacccct ccatctagga caagccccga ggtgcgcgca 1680 ggcagcggcg agggcagggg ctccctgctg acatgtggcg acgtggaaga aaaccctgga 1740 cctcccaaga aaaagaggaa agtgggcggc tcccagctgg tgaagtctga gctggaggag 1800 aagaagtccg agctgcggca caagctgaag tacgtgcctc acgagtatat cgagctgatc 1860 gagatcgccc ggaatccaac ccaggacaga atcctggaga tgaaagtgat ggagttcttt 1920 atgaaggtgt acggctatag gggagagcac ctgggaggca gccgcaagcc cgatggcgcc 1980 atctacaccg tgggctcccc tatcgactat ggcgtgatcg tggatacaaa ggcctacagc 2040 ggcggctata acctgccaat cggacaggca gacgagatgc agcggtacgt ggaggagaat 2100 cagaccagaa acaagcacat caatcccaac gagtggtgga aggtgtatcc tagctccgtg 2160 acagagttca agtttctgtt cgtgtctggc cactttaagg gcaactacaa ggcccagctg 2220 accagactga atcacatcac aaattgcaac ggagccgtgc tgagcgtgga ggagctgctg 2280 atcggcggcg agatgatcaa ggccggcacc ctgacactgg aggaggtgag aaggaagttt 2340 aacaatggcg agatcaactt ctctgctagc gagacacctg gcacctccga gtctgccacc 2400 ccagagtccg gcggctctgg ctctagcggc ggctctggct cctccggagg aatgatcctg 2460 caggccctgc acggatacta tcagagaatg tccgccgacc ctgatgcagg aatgccaccc 2520 tacggcacca gcatggagaa tatctccttc gccctggtgc tggacgccaa gggcacactg 2580 aggggcatcg aggatctgcg cgagcaggag ggcaagaagc tgagaccaag gaagatgctg 2640 gtgcccatcg ccgagaagaa gggcaatggc atcaagccaa actttctgtg ggagaatacc 2700 agctatatcc tgggcgtgga cgccaagggc aagcaggaga ggaccgataa gtgccacgcc 2760 gccttcatcg cccacatcaa ggcctactgt gacaccgcag accaggatct ggcagccgtg 2820 ctgcagttcc tggagcacgg cgagaaggat ctgtctgcct ttcccgtgag cgaggaagtg 2880 atcggctcca acatcgtgtt cagaatcgag ggcgagcccg gctttgtgca cgagagacct 2940 gcagcaaggc aggcctgggc caattgtctg aacaggaggg agcagggact gtgcggacag 3000 tgtctgatca ccggcgagag gcagaagcct atcgcccagc tgcacccaag catcaaggga 3060 ggaagggacg gcgtgcgggg agcacaggcc gtggccagca tcgtgtcctt taacaatacc 3120 gccttcgagt cttacggcaa ggagcagagc atcaacgcac ccgtgtccca ggaggcagcc 3180 ttttcttacg tgacagccct gaattatctg ctgaatcctt ccaacaggca gaaggtgacc 3240 atcgccgatg ccacagtggt gttctgggca gagcgcagct ccccagcaga ggacatcttt 3300 gccggcatgt tcgatcctcc atctaccaca gccaagcccg agtctagcaa cggaaccccc 3360 cctgaggact ctgaggaggg cagccagcca gatacagcaa gggacgatcc acacgcagca 3420 gcaaggatgc acgacctgct ggtggccatc agatctggca agagggccac cgatatcatg 3480 cccgacatgg atgagagcgt gagatttcac gtgctgggcc tgtctcctaa tgcagcaagg 3540 ctgagcgtgc ggttctggga ggtggacaca gtgggccaca tgctggataa agtgggcaga 3600 cactataggg agctggagat catccctcag tttaacaatg agcaggagtt cccatccctg 3660 tctaccctgc tgagacagac agccgtgctg aataagaccg agaacatctc tccagtgctg 3720 gccggaggac tgttcagggc aatgctgaca ggaggacctt acccacagag cctgctgcca 3780 gccgtgctgg gacgcatccg ggcagagcac gcacggcctg aggacaagtc cagatacagg 3840 ctggaggtgg tgacctacta tagagccgcc ctgatcaagg cctatctgat ccgcaaccgg 3900 aagctggagg tgcccgtgtc cctggaccct gcaaggaccg ataggccata tctgctgggc 3960 cgcctgtttg ccgtgctgga gaaggcacag gaggacgcag tgcctggagc caacgccaca 4020 atcaaggatc ggtacctggc cagcgcctcc gccaatccag gacaggtgtt ccacatgctg 4080 ctgaagaatg cctccaacca caccgccaag ctgcggaagg accctgagag aaagggctct 4140 gccatccact acgagatcat gatgcaggag atcatcgaca atatcagcga tttcccagtg 4200 accatgtcct ctgatgagca gggcctgttt atgatcggct actatcacca gaggaaggcc 4260 ctgttcacaa agaagaataa ggagaactga 4290 <210> 1261 <211> 4497 <212> DNA <213> Geobacillus thermocatenulatus strain KCTC 3921 <400> 1261 atgggcccca agaagaagag aaaggtaggc agcggcatga tggagagata tatcgatccc 60 accaagaggc acgagtttgt gctgctgttc gacgtgaagg atggcaaccc taatggcgac 120 ccagatgcag gaaacatgcc ccgggtggac cctgagacaa tgcacggcat cgtgaccgat 180 gtggccatca agagaaagat cagggactat gccgccatgg tgctgggcaa gcctatcttt 240 atccagtctc agacagccct gaacaccatc atcttccagg cctaccagga tgtgggcgtg 300 aagctggcca ccatcgagct gaatgaggag gagaaggaga acggcgagct gatgaattgg 360 ctgagccagc tggaggagca gggactggtg ctggaggaca atagagtgat ctacacaggc 420 gaggatatca aggagaagga catcagggag aagctgaccg agggcctgga ggaggcaggc 480 ctgaagaagc agctggagaa gagcctgcgc aacatggcaa agcggctggc ccaggccgcc 540 aacaatatga agatcgatga gcagacccgc cagaatgccc agaaggccct gtgccagaag 600 tactatgacg tgcggatgtt cggcgccgtg atgtccacag gcctgaacgc aggacaggtg 660 aggggaccaa tgcagctgac cttttcccgc tctatcgatc ccgtgttccc atgggacctg 720 accatcacaa gaagcgccat cacaaaggag tccgatcgga gaaggaagca gaccgagatg 780 ggccgcaagc ccctgatccc ttacggcctg tatcggctgc acggctttta caatcccttc 840 ctgggcgaga agacaggagt gaccgcagag gacctggcag atttttggga cgccctggtg 900 cacctgttcg cctttgacca cagcgccgca aggggagaga tgaacgtgcg ggccctgtat 960 atcttttccc acgagaatgc caagggctct gcccctgccc acaagctgtt cgatctggtg 1020 aagatcgagc gccggcagca ggaggcacca agatccttcc acgactacgt gctgctggga 1080 ccagcagatg agggacagaa ggacgtgttt ctggagggct tctctggcgt gaccgtgaca 1140 cggctggtgg gctctggcga gggaagaggc agcctgctga cctgcggcga cgtggaggag 1200 aaccctggac ctccaaagaa gaaaagaaaa gtcggctccg gcatgcagag aagggccaag 1260 gtgcaggtga aagtgtgggg cgagtacgcc tgttttacac gcccagagtt caaggtggag 1320 cggatcagct atccagtgat gaccccatcc gccgcaaggg gcgtgctgga ggccatcttt 1380 tggaagcccg agttcagata cgaggtgagg cagatcggca tcctgagcct gggaggacag 1440 caggcaatcc tgcggaacga gctgacatcc aagcagaaca agaatcctat cgtgatcgag 1500 tctgccaggg cacagcggac cagcctgatc ctgaagaacg tggcctactg gatcgtggcc 1560 gatatcatcc tgacaaatag ggcagtggac cccgcagcca agtatagaga ccagttcaat 1620 cgccgggtgg agaggggaca gtgccaccac acaccttacc tgggcacccg cgagtttgcc 1680 gcctatttca gctccatcga cgaggacgat gtggtgaagc cagtggacat ggatatcggc 1740 accatgctgc tggatttcgc ctttatcgag gacggcagca gaaaggagat ggagtttctg 1800 agatacgagg agaccggaac acgcaccgca gtgggattcg caaagccact gttctttgag 1860 gccaaggtgg agaacggctg gctgcacgtg cccaaggaga cctaccagca gctgtatgcc 1920 ctggagggcc agaatgccct gagggtggat ggctccggcg agggaagggg ctctctgctg 1980 acatgtggcg acgtggaaga aaaccctgga cctcccaaga aaaagaggaa agtgggcggc 2040 tcccagctgg tgaagtctga gctggaggag aagaagagcg agctgaggca caagctgaag 2100 tacgtgcctc acgagtatat cgagctgatc gagatcgcca gaaatccaac ccaggataga 2160 atcctggaga tgaaagtgat ggagttcttt atgaaggtgt acggatatag gggagagcac 2220 ctgggaggct ccagaaagcc agacggagcc atctacacag tgggctctcc tatcgattat 2280 ggcgtgatcg tggacaccaa ggcctactcc ggcggctata acctgcccat cggccaggcc 2340 gacgagatgc agaggtacgt ggaggagaac cagacccgca ataagcacat caaccccaat 2400 gagtggtgga aggtgtatcc ttctagcgtg acagagttca agtttctgtt cgtgagcggc 2460 cacttcaagg gcaactacaa ggcccagctg acacggctga atcacatcac caactgtaat 2520 ggagccgtgc tgtccgtgga ggagctgctg atcggcggcg agatgatcaa ggccggcaca 2580 ctgaccctgg aggaggtgag aaggaagttt aacaatggcg agatcaactt ctctgctagc 2640 gagacacctg gcacctccga gtctgccacc ccagagtccg gcggctctgg ctctagcggc 2700 ggctctggct cctccggagg aatgcactgg agagataaga tgctgtatga gctgatcgag 2760 ctggccgcca agctgcagag ggagaagaag ctgcctccaa tcagctacaa gcccaagtcc 2820 atcaactgga tcatcgatct gggaggcgac cagccttacc tgaagggacc atttcgccgg 2880 ggagagtata ggctggtgga ggcacctttc cgcctgaggc agggcaaggt gaccgaggag 2940 aatgtgaagc catacctgct ggccgacgat ggcagatatg tgctgggcat cccagagtcc 3000 cccgagaagg cagacgaggc agagctgatg cacaagggct acgtgaggct gatcgaggag 3060 gcctatgaga agacaaagct gaaggagctg aagaaggtgc tggattttct gtattctcct 3120 atgaagaacg ccttccggga gcagatcggc gccaaggaca tcgtgacatt ccaggacgat 3180 gaggagagcc tgatctttga gaagtccgag atccagacct tctgggccga gtacctggcc 3240 tccgatctgc tgtctgacga tgagtgcgac tgtagcgtgt gcggcaagag aagcgcctac 3300 gtgaggtatc tgccaaatcc cgtgcagctg tttggccagt cttgtcagct gaccagcttt 3360 aacaatccct ctttcgagag catgggcaag acacagacca acaatgtgcc cgtgtgcttc 3420 ggctgtgcca cactggtggt ggataccctg aactacctga tcagagagga ccagcaccac 3480 acacctctgt atatctccga taggaatatc ctgcagtctc agatggccat ctactgggtg 3540 gacgatcaga tcgagggcag aggctgcatc cagctggacg agaagctgtt tgcctctcct 3600 atcgagcagt ggctgttcga cgaggataca aaccagcgca ccccccctcc agagctgaag 3660 cagctggagg agctgctggc cctgccaaag acaggaaggg agcaggccct gcacctggac 3720 aagaccttct ttcacatggc cgtgctgtcc gccaataagg caaggctggt ggtgcgggag 3780 tggattcaca cctccatctc tcagctgctg atgcacctgg agcggtacgc agcagccgtg 3840 cggatcgtgc agcctacagg cgagaagggc tatctgctgc cactggccgc cctgatcagg 3900 gcagtggata tgagcccagg cctggtgaga cagtgtctga ggacaatcta tcagggcgcc 3960 ctgccaccta ccgagctgct gcccctggcc ctgcagcggt tcagaagcct gaaggtgctg 4020 tctgacccta aggagacctg gagataccac tctagcgcct ctctgctgaa gctggtgctg 4080 acatatggca aggaggaggc caacaccatg cagagcctga acaatcactg cctgcagccc 4140 gcctacatct gtggcaggct gctggccgtg ctggaggaga tccagagaag ggccctgggc 4200 taccggatcg gctctaccat cgtggatcgg ttctacggag cagccagcac agcacctgcc 4260 agcaccttcg gctccctgct gaggctgagc accacagcac acctgccaaa ggtgtccggc 4320 gagctgggcc ggctgctgga ggaagtgatg aagcagctgg acgaggcagg aggatttcca 4380 acaatcttca atctgaggga gcaggcagag tttgcactgg gcttctacca ccagagggca 4440 gagttccgct ctcggcacca gagcaaccag acaaatggca ccggcgagtc ccagtga 4497 <210> 1262 <211> 4806 <212> DNA <213> Vibrio cholerae strain L15 L15_contig8 <400> 1262 atgggcccca agaagaagag aaaggtaggc tccggcatgg ccaagaacaa tgacatcgcc 60 tctgtgctgg ccttcgagaa gaagctggtg cctagcgatg gctacctgtt tggctgccag 120 tgggagacca aggagcaggc caccccactg acactgcagg agaagagcgt gagaggcaca 180 atctccaaca ggctgaaggc cgccgtgcag aacgaccctg ccaagctgaa tgccgaggtg 240 gagaaggcca atctgcagcg ggtggatgcc tgtgcactgg gacaggacca cgataccctg 300 aagctgcact tcacactgaa ggtgctggga ggcctggccc agccatctgc ctgcaacaat 360 gccctgttta agcagtctta cagcaccgcc gtgagccagt acatcacaaa gtatggctgt 420 ttcgagctgg ccaagagata tgccaccaac ctggccaatg ccaggtttct gtggcggaac 480 agagtgggcg ccgaggagat cgaggtgcag gtgaaggccc tgaacaaggg cgccgagcag 540 acctggacct tcaacgccaa gcagttctct accaggcact ttgaccacaa cgatagccag 600 ctgaattccc tggccgacag gatcgcacag gccctggcca gcgagacaga ccacctgatg 660 ctgcagatcg attgctacgc caaagtgggc aaggcccagg aggtgtatcc ctccgaggag 720 ctggtgctgg ataagggcaa cagcaagacc aagaagtcca agatcctgta cgccgtgaac 780 gagcacgccg ccatgcactc tcagaagatc ggcaatgccc tgcgcagcat cgacacatgg 840 taccctgatt atgcctctga ggagcagagc gccggagcaa tcgcaatcga gccctacggc 900 gccgtgacca atctgggcaa ggccttcaga acccctaagg acaagcagga cttctacacc 960 ttctttgaca agtgggcaag gggagagagc ctgcctaggg aggaggatga gcactacgtg 1020 atggccgtgc tggtgcgggg aggcgtgttc ggagagtccg acaagggctc tggcgaggga 1080 agaggcagcc tgctgacctg tggcgatgtg gaggagaacc ctggacctcc taaaaagaaa 1140 cgaaaggtag gctccggcat gaattactat caggagatca cactgctgcc cgacgcagat 1200 atcgccctgg gcttcctgtg gcagaacgtg tttcagcagg tgcacatcgc cctggtggag 1260 cacaaggtgg cctctaatca gagcctggtg gccgtgggct tccctgacta cagacaggcc 1320 aagtttccac tgggcgccaa gctgaggctg ttcgccaagg agcaggtgac cctggagaag 1380 ctggacatcc acagatggct gacaaggctg gaggattacg tgcacatcaa gggcgtgaag 1440 ccagtgccct ctgacgtgac ctatgtgagc tttgtgagaa agcaggtgaa gtcccccgag 1500 cggatcgaga gagatatgca gcagaaggcc gagctgtggg ccgccaagtc tggcaagcct 1560 ctggtggagt gcctggtgga cctgcagcag tccaagccca ccgccctgtg ctctctgcct 1620 ttcatctacc tgcacagcca gcagacaaag cagaggtctc cagagaagaa cagcaagttt 1680 cccctgttca tcgagatgca gcagcagtcc acatctcagg acggcggctt cgattgctat 1740 ggcctgagct ccaaggccaa tggccagagc atgctggcca ccgtgccaca ctttggctcc 1800 ggcgagggaa ggggctctct gctgacatgt ggcgacgtgg aagaaaaccc tggacctcca 1860 aagaagaaaa gaaaagtcgg ctccggcatg aatgtgctga tcctgcctca cctgaagatc 1920 cacaacgcca atgccctgtc tagccccttt accgtgggct tccctgccat gacagcatgg 1980 ctgggattcg tgcacgccct ggagagaaag ctgtcccagg ccggcctgtc tgatctgatg 2040 ctgcacagca ccgcagtggt gtcccacagg tgcgacgtgc agacacacaa gggcgagggc 2100 gatttcgtgc acagcatcat cggcaccgcc aaccccctgg acaaggatgg cagccgctcc 2160 gcctttatcg aggaggcccg gtgtcacctg gacgtgagcc tggtcatcga gtggtccggc 2220 aatgaggagc aggtgcagca gcctgagttt accgagcagc tgcaggccgt gatcgccaca 2280 atgaaggtgg caggaggcga tgtgctggcc gtgggcaagc cttccgtgaa gtctgtgatc 2340 accgaggacg atacaggcag ggtgctgagg cagctgatgc caggatacgt gctgatcgag 2400 cggagagacc tgatgatcga tgccatgcag cagggcgacg atgcaatcga cgccctgctg 2460 ggctatctga ccgtgcacca ccactgcgag cagctggagg atcagtctgt ggtgtggcac 2520 agccagcgga agacctccgg ctggatcgtg cccatcgcca caggcttcca gggcatctcc 2580 cctctgggcg aggccaagaa ccagagagac cctagcgtgc cacacaggtt cgcagagtcc 2640 gtggtgaccc tgggagagtt tgtgatggtg cacaagatca agcacctgga cgatatcctg 2700 tggcagtacc acccagacct ggagaacgat ctgtatctgt gccagaaggt gaacgccatc 2760 aatgagcacc agggctctgg cgaaggcagg ggcagcctgc tgacatgcgg cgatgtggaa 2820 gagaaccctg gacctcccaa gaaaaagagg aaagtgggcg gctctcagct ggtgaagagc 2880 gagctggagg agaagaagag cgagctgcgg cacaagctga agtacgtgcc tcacgagtat 2940 atcgagctga tcgagatcgc cagaaaccca acccaggaca gaatcctgga gatgaaagtg 3000 atggagttct ttatgaaggt gtacggctat agaggcgagc acctgggcgg ctctaggaag 3060 ccagatggcg ccatctacac cgtgggcagc cccatcgact atggcgtgat cgtggataca 3120 aaggcctact ccggcggcta taatctgcca atcggacagg cagacgagat gcagcggtac 3180 gtggaggaga accagacccg gaataagcac atcaacccca atgagtggtg gaaggtgtac 3240 ccttcctctg tgacagagtt caagtttctg ttcgtgagcg gccacttcaa gggcaactat 3300 aaggcccagc tgaccagact gaatcacatc acaaactgta atggagccgt gctgtccgtg 3360 gaggagctgc tgatcggcgg cgagatgatc aaggccggca ccctgacact ggaggaggtg 3420 aggcgcaagt tcaacaatgg cgagatcaac ttttctgcta gcgagacacc tggcacctcc 3480 gagtctgcca ccccagagtc cggcggctct ggctctagcg gcggctctgg ctcctccgga 3540 ggaatgatcg acccagtgat cgccgccttc tttgccgaga ggaaggaggc ctggctgaag 3600 aagaatatca gcgccgcaat gtccgatgca gaggtgctgg agaagcagca ggagtgcgag 3660 cagaacttcc tgctggacaa ttggctgccc gatgcagcaa agagggcagg acagatctct 3720 gtggccagcc acccatgtac attttcccac ccctctgccc gcaagaacaa gaatggctac 3780 gtgtcctcta tcatcgccaa gaacaagcca cgcatcgacg gcttcctgcg gtctggcaac 3840 gtgagcgtgg agccagacgc cctgggaaat gcagccgccc tggacgtgta caagtttctg 3900 tccctggaga tgtctgatca gcgcagcctg ctggtgcaca tcgagcagga gagcgagctg 3960 gccaggcagc tgctggacat cccttcctgc gagtatcagg ccctgagaga tggcttcctg 4020 aagatggtgg actccgatca ggcctctgtg agctcctcta agatcaagca ggtgtacttt 4080 ccaatcgccg acggcgagta tcacctgctg tccctgctga cccactctgg ccacctgttc 4140 gagctgagga agcgcctgga cgccctgagg tttggcgatg ccgtgaagga ggcccgggag 4200 tgtaagaaga ccaaccactt ccacccagcc ggctaccagg agatcttcgg cctgaccaca 4260 atcggctttg gcggcacaaa gccccagaac atcagcgtgc tgaacaatca gaatgcaggc 4320 aaggcacacc tgctggcctc catcccccct gagctgaccc ctcgggacat cagactgcca 4380 aagacagatt tctttaagga gtccttcaac gcctggcagg ccaaggaggt gctggagtct 4440 ctgcacagac tgtttcagac cgactgcaac aatatcaatc tgagggacgg ccgcgattac 4500 agaatccagc agtatgtgga cctggtcatc gagaagatgt ggcaggtgag gctgttcctg 4560 gaggcctaca gcggcgagct gagctccgcc ctgcctctgg agcagaagat ctggctgtat 4620 ccagagtttg cagagcagag gcagcaggag gacgagtggc tggataagat catccgccac 4680 atcgcccggg gcctgatcaa ccactacagc cggtccaaag tgatcaccaa tcctgtgaca 4740 ctggccgacc aggagctgct ggccatcgag gaggtggtgg cctccaacaa ggagaatctg 4800 agatga 4806 <210> 1263 <211> 4866 <212> DNA <213> Pseudomonas aeruginosa UCBPP-PA14 <400> 1263 atgggcccca agaagaagag aaaggtaggc tctggcatga gcaagcccat cctgtccacc 60 gcctctgtgc tggcctttga gcggaagctg gacccttctg atgccctgat gagcgccgga 120 gcatgggcac agagagatgc cagccaggag tggccagccg tgacagtgag agagaagtcc 180 gtgaggggca ccatctctaa ccgcctgaag acaaaggacc gggaccccgc aaagctggat 240 gccagcatcc agtcccctaa cctgcagacc gtggacgtgg ccaatctgcc aagcgacgcc 300 gataccctga aggtgcgctt cacactgcgg gtgctgggag gagcaggaac accatccgcc 360 tgcaatgatg ccgcctatag agacaagctg ctgcagaccg tggccacata cgtgaacgac 420 cagggatttg cagagctggc ccggagatac gcccacaacc tggccaatgc caggttcctg 480 tggaggaaca gggtgggagc agaggcagtg gaggtgcgca tcaatcacat caggcaggga 540 gaggtggcaa gggcatggcg gtttgatgcc ctggccatcg gcctgagaga cttcaaggca 600 gatgcagagc tggacgccct ggccgagctg atcgccagcg gcctgtctgg cagcggccac 660 gtgctgctgg aggtggtggc ctttgccagg atcggcgacg gccaggaggt gttcccttcc 720 caggagctga tcctggacaa gggcgataag aagggccaga agtccaagac cctgtactct 780 gtgcgggatg cagcagcaat ccacagccag aagatcggca atgccctgag aaccatcgac 840 acatggtatc cagacgagga tggactggga ccaatcgcag tggagcctta cggctctgtg 900 accagccagg gcaaggccta taggcagccc aagcagaagc tggacttcta cacactgctg 960 gacaattggg tgctgaggga tgaggcacct gcagtggagc agcagcacta cgtgatcgcc 1020 aacctgatca ggggaggcgt gttcggagag gcagaggaga agggcagcgg cgagggaagg 1080 ggctccctgc tgacctgtgg cgacgtggag gagaaccctg gacctcctaa aaagaaacga 1140 aaggtaggct ccggcatgga tcactatctg gacatcagac tgaggccaga tcccgagttt 1200 ccacccgccc agctgatgtc tgtgctgttc ggcaagctgc accaggccct ggtggcacag 1260 ggaggcgacc ggatcggcgt gtcttttcca gacctggatg agtcccgctc tcggctggga 1320 gagcggctga gaatccacgc cagcgccgac gatctgagag ccctgctggc caggccatgg 1380 ctggagggac tgcgcgatca cctgcagttc ggagagcctg cagtggtgcc tcacccaacc 1440 ccctacagac aggtgtctag ggtgcaggcc aagagcaacc cagagcggct gaggcgccgg 1500 ctgatgagaa ggcacgacct gagcgaggag gaggcaagga agagaatccc cgacacagtg 1560 gcacgcgccc tggatctgcc ctttgtgacc ctgcggagcc agtccacagg ccagcacttt 1620 cgcctgttca tcaggcacgg accactgcag gtgaccgcag aggagggagg cttcacatgc 1680 tatggcctgt ccaagggcgg ctttgtgcct tggttcggct ccggcgaagg caggggctct 1740 ctgctgacct gtggcgatgt ggaggagaac cctggacctc caaagaagaa aagaaaagtc 1800 ggctccggca tgtctgtgac agaccctgag gccctgctgc tgctgccaag actgagcatc 1860 cagaacgcca atgccatcag ctccccactg acctggggat tcccttcccc aggcgccttt 1920 acaggattcg tgcacgccct gcagcgccgg gtgggcatct ccctggatat cgagctggac 1980 ggagtgggaa tcgtgtgcca ccgctttgag gcccagatct ctcagccagc cggcaagcgg 2040 accaaggtgt tcaacctgac acgcaacccc ctgaatcggg atggctctac cgcagcaatc 2100 gtggaggagg gaagagcaca cctggaggtg agcctgctgc tgggagtgca cggcgacggc 2160 ctggacgatc acccagccca ggagatcgca agacaggtgc aggagcaggc aggagcaatg 2220 aggctggccg gaggctctat cctgccatgg tgcaacgaga ggtttcccgc ccctaatgca 2280 gagctgctga tgctgggagg cagcgacgag cagagaagga agaatcagcg ccggctgacc 2340 agaaggctgc tgccaggatt cgcactggtg agcagagagg ccctgctgca gcagcacctg 2400 gagacactga ggaccacact gcctgaggca accaccctgg acgccctgct ggacctgtgc 2460 agaatcaact ttgagccacc tgccacctct agcgaggagg aggccagccc acccgacgca 2520 gcctggcagg tgagggataa gcctggatgg ctggtgccaa tcccagcagg atacaacgcc 2580 ctgtcccctc tgtatctgcc aggcgaggtg cgcaatgcca gagataggga gacacccctg 2640 cggtttgtgg agaacctgtt cggcctgggc gagtggctgt ctcctcacag ggtggccgcc 2700 ctgagcgatc tgctgtggta tcaccacgcc gagcctgaca agggcctgta cagatggagc 2760 accccaaggt tcgtggagca cgcaatcgca ggcagcggcg aaggcagagg ctccctgctg 2820 acatgcggcg acgtggagga gaaccctgga cctcccaaga aaaagaggaa agtgggcggc 2880 agccagctgg tgaagtccga gctggaggag aagaagtccg agctgcggca caagctgaag 2940 tacgtgcctc acgagtatat cgagctgatc gagatcgcca gaaacccaac ccaggataga 3000 atcctggaga tgaaagtgat ggagttcttt atgaaggtgt acggctatag aggcgagcac 3060 ctgggaggct ccaggaagcc agacggagca atctacaccg tgggctctcc tatcgactat 3120 ggcgtgatcg tggatacaaa ggcctacagc ggcggctata atctgccaat cggacaggca 3180 gacgagatgc agcggtacgt ggaggagaac cagacccgga ataagcacat caacccaaat 3240 gagtggtgga aggtgtaccc ctcctctgtg acagagttca agtttctgtt cgtgtctggc 3300 cacttcaagg gcaactataa ggcccagctg acccgcctga atcacatcac aaactgtaat 3360 ggagccgtgc tgtccgtgga ggagctgctg atcggcggcg agatgatcaa ggcaggcacc 3420 ctgacactgg aggaggtgcg ccggaagttt aacaatggcg agatcaactt ctctgctagc 3480 gagacacctg gcacctccga gtctgccacc ccagagtccg gcggctctgg ctctagcggc 3540 ggctctggct cctccggagg aatgacatct cctctgccaa cccccacatg gcaggagctg 3600 agacagttta tcgagagctt catccaggag aggctgcagg gcaagctgga taagctgcag 3660 cctgacgagg acgataagcg gcagaccctg ctggccacac acagaaggga ggcctggctg 3720 gccgatgcag cacgccgggt gggacagctg cagctggtga cccacacact gaagccaatc 3780 caccctgacg caaggggctc taatctgcac agcctgccac aggcaccagg acagcctggc 3840 ctggccggct ctcacgagct gggcgatagg ctggtgagcg acgtggtggg aaacgcagcc 3900 gccctggacg tgtttaagtt cctgtccctg cagtaccagg gcaagaacct gctgaattgg 3960 ctgaccgagg atagcgccga ggccctgcag gccctgtccg acaatgcaga gcaggcaaga 4020 gagtggaggc aggcctttat cggaatcacc acagtgaagg gagcaccagc cagccactcc 4080 ctggccaagc agctgtactt tcctctgcca ggcagcggct atcacctgct ggccccactg 4140 ttccccacct ccctggtgca ccacgtgcac gccctgctga gggaggcaag gttcggcgac 4200 gcagccaagg ccgccagaga ggcacgctcc cggcaggagt cttggccaca cggctttagc 4260 gagtacccta atctggccat ccagaagttc ggcggcacca agccccagaa catctcccag 4320 ctgaacaatg agagaagggg cgagaactgg ctgctgcctt ctctgccccc taattggcag 4380 agacagaacg tgaatgcccc aatgaggcac tccagcgtgt tcgagcacga tttcggccgc 4440 acccctgagg tgagcagact gaccaggaca ctgcagcggt tcctggccaa gacagtgcac 4500 aacaatctgg ccatcagaca gaggagggca cagctggtgg cacagatctg cgacgaggcc 4560 ctgcagtacg cagcaagact gagggagctg gagccaggat ggtccgccac cccaggctgt 4620 cagctgcacg acgcagagca gctgtggctg gaccccctga gggcacagac cgacgagaca 4680 tttctgcaga gaaggctgag gggcgattgg ccagcagaag tgggaaacag gttcgcaaac 4740 tggctgaatc gggccgtgag ctccgactct cagatcctgg gcagccccga ggcagcacag 4800 tggagccagg agctgtccaa ggagctgacc atgttcaagg agatcctgga ggacgagagg 4860 gattga 4866 <210> 1264 <211> 3405 <212> DNA <213> Shewanella putrefaciens CN-32 <400> 1264 atgggcccca agaagaagag aaaggtaggc agcggcatgc agaaggtgac cggcatcaag 60 tccgtggact tcaagatcaa ggccctgggc cacggcgtgg tgaactggaa tggccccacc 120 acactgacag gcgacgatgg caagaccgtg gacaatcaca cactgcctaa gctgagaggc 180 tacaccaacc tgacaggcaa ggtgaaggat gagaccggct acaagtataa gaagcaggcc 240 accgacatca atttcaagga gacacctctg tacatcagcc agaactgcat ccggcaccac 300 ctgtttagag agcaggcctt cgatctgcac tatgcctctg acaagaacct gaagaatgtg 360 ctggccagca tcaccggact gatcagggga tacgtggtgc caagctccca gtgtaagcgg 420 acatcccccc tgctgctgga ggattttgtg gaccagctgg gcaacggcaa tttcgagcag 480 tacggacagg caggagcaag ggatagcacc tccttcttta gcaagaccac attcggcgac 540 acagagtaca tctcctatgg ctctatcagc atcgagcagc tgcagtttat cagcctggat 600 aagaagttcg accgcgccgc catggtcatc aaggagggag agggagaagt gatcgcagca 660 gagctgcaga attacatcca gagcctgaac ccctccctga atcctcaggc catctttcac 720 tctaactatg tgcggagagg caccatcttc gaggagggcg agtgcggcat cctgctgaat 780 gacgatgcag tgaaggccct ggtggcagag accctggaga gactggccaa cctgtccatc 840 aggcaggcca agggctacat gtatgtggac gatatcacag tggattacaa tgactctcac 900 aagatgatgc ggatcaagag agatgagagc gagatcatca acgagcagca cgcccctttt 960 gcccagtact tctatgcaaa gggctctggc gagggaaggg gcagcctgct gacctgtggc 1020 gacgtggagg agaaccctgg acctcctaaa aagaaacgaa aggtaggctc tggcatgaac 1080 agctatatcg atatccgcct gaagccagac gcagagatga gggaggcaga gctgtctagc 1140 aaggtgttta ccaagttcca caaggccctg gtgacactga actcccacaa gatcggcatc 1200 tcttttccac agatgaagct gtccctgggc cagctgttca gaatccacgg cgatgcctct 1260 ctgctgcacg atctgcaggg cctggactgg ctgggacctc tggccggata ctgccaggtg 1320 accgccgtga gcgccgtgcc agaccacgtg cagtatagga tcgtgtccgt gaagcggagc 1380 aatctgagca aggccaagct gaagaggctg atcgcccgcg gcagcatcga caaggatggc 1440 gagaagcggt acaaggtgaa gatgctgggc cagggctttg ataacccata cctggacctg 1500 ttctcctcta gcaccggcca ggtgtataga aagttctttg agttttccga tatccaggcc 1560 cacccactgg atggcgagtt cgactcctat ggcctgtcta agaccgcaac agtgccatgg 1620 ttcggcagcg gcgagggcag aggctccctg ctgacatgcg gcgacgtgga agagaaccct 1680 ggacctccaa agaagaaaag aaaagtcggc ggctctcagc tggtgaagag cgagctggag 1740 gagaagaaga gcgagctgcg ccacaagctg aagtacgtgc cccacgagta tatcgagctg 1800 atcgagatcg cccggaaccc tacccaggat agaatcctgg agatgaaagt gatggagttc 1860 tttatgaagg tgtacggcta tagaggcgag cacctgggag gctctaggaa gcctgacgga 1920 gccatctaca ccgtgggcag cccaatcgat tatggcgtga tcgtggacac aaaggcctac 1980 tccggcggct ataacctgcc aatcggacag gcagacgaga tgcagcggta cgtggaggag 2040 aaccagaccc ggaataagca catcaaccca aatgagtggt ggaaggtgta cccctcctct 2100 gtgacagagt tcaagtttct gttcgtgtcc ggccacttta agggcaatta taaggcccag 2160 ctgacccggc tgaaccacat cacaaactgc aatggcgccg tgctgtctgt ggaggagctg 2220 ctgatcggcg gcgagatgat caaggccggc accctgacac tggaggaggt gaggcgcaag 2280 tttaacaatg gcgagatcaa tttctctgct agcgagacac ctggcacctc cgagtctgcc 2340 accccagagt ccggcggctc tggctctagc ggcggctctg gctcctccgg aggaatgaag 2400 atcatcatcg agtacgactc ctgctggaga aacgccttcc tgggcggctc taacaatgag 2460 cctgtgccaa agaagggcag ggagtttctg ggcagcatga catccctgaa gaaggagggc 2520 aacttcaagg tgtgcgagaa taccctggat acagtgatgg gcgtgctgaa caggctgatc 2580 ggcgaccaga ggaagctgta ccaggcacgg tccaagatgt atgagtctgc ctactatttt 2640 gaggccctgg aggataaggt gagcttcatc gacaagcccc agctgaccaa tgagatctcc 2700 tttatcagaa acatgaatgg ctctaccgat cagaacgcct tcacaggcat gatcaaggtg 2760 agcgaccccg tgttcacctc tgagtacagc cagcagttct ggggcgtgct ggccctggac 2820 ttcacccagc tgtgcgactt catcatcaag cagagccagg tggtgggctc catcgagctg 2880 aaccccctgt ctatcatcaa taggctggag agcctgaacc aggagaaggc cctggagaat 2940 agcgacgatc tggcccaggt gctgaaggtg ctgaacgagt actttccaga catcgagtat 3000 ctgaacaata agggcctgat cacccccatc agcatctact gttccgccct gtatctgcag 3060 ctggcccgcc tggagacctc cttcaatatg accacagcca agacaaaggc cggcggcatc 3120 tccggcatct ctaagagagg ctttaccaag aaggatttca tggacaggta caccacaggc 3180 cccaagaaga caatctgggg caaccctttt atcaagaagg agaagatcaa gggccagggc 3240 gaggtgacct ctatgatgac aaaggccagc ggccagctgg agatctccat cgacgtggat 3300 cgggacaagg cccaggagat caagatcctg atcgagaatg ccggcgtgtc ctctttctac 3360 ctgggcaaga agggcctggc ctatgtgagc aacatcaagc tgtga 3405 <210> 1265 <211> 3501 <212> DNA <213> Acinetobacter sp. 869535 <400> 1265 atgggcccca agaagaagag aaaggtaggc agcggcatgg ccaaggtgac aggcgtgaag 60 tccgtggact tcaagatcac cgcctacggc tatggcgtgg tgaactggaa tggcccaaca 120 agcctgaccg gcaatgacgg caagacagtg gataaccaca ccctgcccaa gctgagaggc 180 ttctccaatc tgtctggcag ggtgaaggag gagacaggct acaagtatag gaaggaggcc 240 tctgacatcg acttcaacga gacccctctg tacatcagcc agaactgcat caggcaccac 300 ctgtttcgcg accagtcctt cgatctgcac tatgccaagg acaagaacct gatcgatgtg 360 ctggcctcta tcaccggact gatcagggga tacgtggtgc caagctccca gtgtaagcgg 420 acaagccccc tgctgatcac cgacttcatc gatcagctgg gcaacggcaa ttttgagcag 480 ctgagcaatg cctctagctc cgaggagatc acacaggacg atggctccaa gacctacaag 540 cgcggcgaga acagcatctt ttccaagacc acattcggcg acaccgagta catcgcctat 600 ggctccatct ctatcgagca gctgcagttt atctccctgg acaagaagtt cgatagagcc 660 tctatgatca tcaaggaggg cgagggcgag aagatcgccg agagggtgca ggagttcatc 720 aagagcctgg accccagcaa ggagcctaag gccatcttcc acaagaatta cgtgcggaag 780 ggcacaatct ttaacgaggg cgaagtgggc atcctgctgg acaatacagc catcgatatc 840 ctggtgaagg agaccctgag catgctggag gagctggtca tcaagcaggc caagggctac 900 atgtgcgccg acaccgtgga ggtggactat aacgattccc acaagatgat gaggatcaag 960 cgcaatccag accaggccaa ccccgagctg cagcaggatt acgccgtgta tttcgaggca 1020 cagggcagcg gcgagggaag aggctccctg ctgacatgtg gcgacgtgga ggagaaccct 1080 ggacctccta aaaagaaacg aaaggtaggc agcggcatga attactatat cgaggtgacc 1140 ctgatggaga acgatcagtt ttctccttac gagctgtgga gccagctgta tccacagctg 1200 cacctggccc tggtggaggc aaagaacgcc gacaataagg tgaacatcgg cttctccttt 1260 ccccagtacc gctttcacca ggataagggc gtgggcttca tcggcaccaa gctgcggctg 1320 tttgccgagt ccgaggccga cctgaagaag ctggatatcc ggcggtggct ggagagactg 1380 gaggactatg tgcacgtgac atctatcagg gaggtgccca atgatatcaa gaactacgcc 1440 atctataaga ggaagcaggt gaagaccaac gcacagcgcc tggccaggca cagagtgaag 1500 cggggcgaca tcggcttcga tgaggccctg gcccgctaca gcaatgtggt gaccacaacc 1560 aacatgcctt atatcgagat gaagagcctg tccacatctg accagcagtc tgagaagcgg 1620 tttaagctgt tcatcgagaa gcagtccgcc gagaagtctg agacacaggt gttcagcacc 1680 tacggcctgt ctagcgtgtc ctctgtgcct gagtttggct ccggcgaggg aaggggctct 1740 ctgctgacct gcggcgatgt ggaggagaac cctggacctc caaagaagaa aagaaaagtc 1800 ggcggctctc agctggtgaa gagcgagctg gaggagaaga agagcgagct gagacacaag 1860 ctgaagtacg tgcctcacga gtatatcgag ctgatcgaga tcgcccggaa cccaacccag 1920 gacagaatcc tggagatgaa agtgatggag ttctttatga aggtgtacgg ctatagagga 1980 gagcacctgg gaggctccag gaagccagat ggagccatct acacagtggg ctctcctatc 2040 gactatggcg tgatcgtgga taccaaggcc tactccggcg gctataacct gccaatcgga 2100 caggcagacg agatgcagcg gtacgtggag gagaatcaga cacggaacaa gcacatcaac 2160 cctaatgagt ggtggaaggt gtacccaagc tccgtgaccg agttcaagtt tctgttcgtg 2220 agcggccact tcaagggcaa ttataaggcc cagctgacaa gactgaacca catcaccaac 2280 tgtaatggag ccgtgctgtc cgtggaggag ctgctgatcg gcggcgagat gatcaaggcc 2340 ggcacactga ccctggagga ggtgaggcgc aagtttaaca atggcgagat caatttctct 2400 gctagcgaga cacctggcac ctccgagtct gccaccccag agtccggcgg ctctggctct 2460 agcggcggct ctggctcctc cggaggaatg cagatcatca tcgagtacga gagctcctgg 2520 cgcaactcct tcctggacgg ctctaacaat gagcctctgc caaagggcgg ccggaacttc 2580 atcgcctcca tgacaaccct gaagcaggag ggcaactaca agaagcggag catctctaag 2640 gatacagtga tgggcatcct gaacaggctg atcggcgacc agcgcaagct gtatcaggcc 2700 cggcaggatg agaattacta tttcaccgag gtggagaagg tgctgcagga gaacgacatc 2760 gtggatcacg ccctgaacag caatgagatg gtgtacatca gaaacgtgag cggcagcaca 2820 gaccagaact ccttcaccgg agagatcaag gccaatgatc ccagcttttc tagctccttc 2880 tccgccgagc tgtggggcgt gctgtggctg aacctgtccg aggtgtctaa gtttatcctg 2940 gacgagtctt acagcgtgac atattctgag gtgctggacc ccatcaccgt gtgcaatcgg 3000 atcgaggtgc tgagcgccga gaagcctatg gacctgaccg aggatatcca ggccgtgctg 3060 gactacctgc tgaaccactt tccagataca aagtatctga ccgccaagaa gcagctgccc 3120 ctgatcagca tctacgcctc cgccctgtat ctgcagatca cacggctgtc tcagagatac 3180 gacctgagca cagtgctgac caagtccggc ggactgagcg gcatctccaa gagaggcttt 3240 accaagaagg acttcatgga taggtacaca accggcagca agaagctgat ctggggcaat 3300 ccttatctgc tgaaggagaa gaagaagggc gagggcgaga tcgtgtctgt gctgacaaag 3360 gccagcggca agctgatcat caacctgaat atctccaagg agcaggccag agacctggag 3420 gagaagatcg agaacgccgg cgtgtctagc ttctacctgg gcaagaaggg cctggcctat 3480 gtgaccgata tcaggccatg a 3501 <210> 1266 <211> 4806 <212> DNA <213> Vibrio cholerae HE48 vcoHE48.contig.11 <400> 1266 atgggcccca agaagaagag aaaggtaggc tccggcatgg ccaagaacaa tgacatcgcc 60 tctgtgctgg ccttcgagaa gaagctggtg cctagcgatg gctacctgtt tggctgccag 120 tgggagacca aggagcaggc caccccactg acactgcagg agaagagcgt gagaggcaca 180 atctccaaca ggctgaaggc cgccgtgcag aacgaccctg ccaagctgaa tgccgaggtg 240 gagaaggcca atctgcagcg ggtggatgcc tgtgcactgg gacaggacca cgataccctg 300 aagctgcact tcacactgaa ggtgctggga ggcctggccc agccatctgc ctgcaacaat 360 gccctgttta agcagtctta cagcaccgcc gtgagccagt acatcacaaa gtatggctgt 420 ttcgagctgg ccaagagata tgccaccaac ctggccaatg ccaggtttct gtggcggaac 480 agagtgggcg ccgaggagat cgaggtgcag gtgaaggccc tgaacaaggg cgccgagcag 540 acctggacct tcaacgccaa gcagttctct accaggcact ttgaccacaa cgatagccag 600 ctgaattccc tggccgacag gatcgcacag gccctggcca gcgagacaga ccacctgatg 660 ctgcagatcg attgctacgc caaagtgggc aaggcccagg aggtgtatcc ctccgaggag 720 ctggtgctgg ataagggcaa cagcaagacc aagaagtcca agatcctgta cgccgtgaac 780 gagcacgccg ccatgcactc tcagaagatc ggcaatgccc tgcgcagcat cgacacatgg 840 taccctgatt atgcctctga ggagcagagc gccggagcaa tcgcaatcga gccctacggc 900 gccgtgacca atctgggcaa ggccttcaga acccctaagg acaagcagga cttctacacc 960 ttctttgaca agtgggcaag gggagagagc ctgcctaggg aggaggatga gcactacgtg 1020 atggccgtgc tggtgcgggg aggcgtgttc ggagagtccg acaagggctc tggcgaggga 1080 agaggcagcc tgctgacctg tggcgatgtg gaggagaacc ctggacctcc taaaaagaaa 1140 cgaaaggtag gctccggcat gaattactat caggagatca cactgctgcc cgacgcagat 1200 atcgccctgg gcttcctgtg gcagaacgtg tttcagcagg tgcacatcgc cctggtggag 1260 cacaaggtgg cctctaatca gagcctggtg gccgtgggct tccctgacta cagacaggcc 1320 aagtttccac tgggcgccaa gctgaggctg ttcgccaagg agcaggtgac cctggagaag 1380 ctggacatcc acagatggct gacaaggctg gaggattacg tgcacatcaa gggcgtgaag 1440 ccagtgccct ctgacgtgac ctatgtgagc tttgtgagaa agcaggtgaa gtcccccgag 1500 cggatcgaga gagatatgca gcagaaggcc gagctgtggg ccgccaagtc tggcaagcct 1560 ctggtggagt gcctggtgga cctgcagcag tccaagccca ccgccctgtg ctctctgcct 1620 ttcatctacc tgcacagcca gcagacaaag cagaggtctc cagagaagaa cagcaagttt 1680 cccctgttca tcgagatgca gcagcagtcc acatctcagg acggcggctt cgattgctat 1740 ggcctgagct ccaaggccaa tggccagagc atgctggcca ccgtgccaca ctttggctcc 1800 ggcgagggaa ggggctctct gctgacatgt ggcgacgtgg aagaaaaccc tggacctcca 1860 aagaagaaaa gaaaagtcgg ctccggcatg aatgtgctga tcctgcctca cctgaagatc 1920 cacaacgcca atgccctgtc tagccccttt accgtgggct tccctgccat gacagcatgg 1980 ctgggattcg tgcacgccct ggagagaaag ctgtcccagg ccggcctgtc tgatctgatg 2040 ctgcacagca ccgcagtggt gtcccacagg tgcgacgtgc agacacacaa gggcgagggc 2100 gatttcgtgc acagcatcat cggcaccgcc aaccccctgg acaaggatgg cagccgctcc 2160 gcctttatcg aggaggcccg gtgtcacctg gacgtgagcc tggtcatcga gtggtccggc 2220 aatgaggagc aggtgcagca gcctgagttt accgagcagc tgcaggccgt gatcgccaca 2280 atgaaggtgg caggaggcga tgtgctggcc gtgggcaagc cttccgtgaa gtctgtgatc 2340 accgaggacg atacaggcag ggtgctgagg cagctgatgc caggatacgt gctgatcgag 2400 cggagagacc tgatgatcga tgccatgcag cagggcgacg atgcaatcga cgccctgctg 2460 ggctatctga ccgtgcacca ccactgcgag cagctggagg atcagtctgt ggtgtggcac 2520 agccagcgga agacctccgg ctggatcgtg cccatcgcca caggcttcca gggcatctcc 2580 cctctgggcg aggccaagaa ccagagagac cctagcgtgc cacacaggtt cgcagagtcc 2640 gtggtgaccc tgggagagtt tgtgatggtg cacaagatca agcacctgga cgatatcctg 2700 tggcagtacc acccagacct ggagaacgat ctgtatctgt gccagaaggt gaacgccatc 2760 aatgagcacc agggctctgg cgaaggcagg ggcagcctgc tgacatgcgg cgatgtggaa 2820 gagaaccctg gacctcccaa gaaaaagagg aaagtgggcg gctctcagct ggtgaagagc 2880 gagctggagg agaagaagag cgagctgcgg cacaagctga agtacgtgcc tcacgagtat 2940 atcgagctga tcgagatcgc cagaaaccca acccaggaca gaatcctgga gatgaaagtg 3000 atggagttct ttatgaaggt gtacggctat agaggcgagc acctgggcgg ctctaggaag 3060 ccagatggcg ccatctacac cgtgggcagc cccatcgact atggcgtgat cgtggataca 3120 aaggcctact ccggcggcta taatctgcca atcggacagg cagacgagat gcagcggtac 3180 gtggaggaga accagacccg gaataagcac atcaacccca atgagtggtg gaaggtgtac 3240 ccttcctctg tgacagagtt caagtttctg ttcgtgagcg gccacttcaa gggcaactat 3300 aaggcccagc tgaccagact gaatcacatc acaaactgta atggagccgt gctgtccgtg 3360 gaggagctgc tgatcggcgg cgagatgatc aaggccggca ccctgacact ggaggaggtg 3420 aggcgcaagt tcaacaatgg cgagatcaac ttttctgcta gcgagacacc tggcacctcc 3480 gagtctgcca ccccagagtc cggcggctct ggctctagcg gcggctctgg ctcctccgga 3540 ggaatgatcg acccagtgat cgccgccttc tttgccgaga ggaaggaggc ctggctgaag 3600 aagaatatca gcgccgcaat gtccgatgca gaggtgctgg agaagcagca ggagtgcgag 3660 cagaacttcc tgctggacaa ttggctgccc gatgcagcaa agagggcagg acagatctct 3720 gtggccagcc acccatgtac attttcccac ccctctgccc gcaagaacaa gaatggctac 3780 gtgtcctcta tcatcgccaa gaacaagcca cgcatcgacg gcttcctgcg gtctggcaac 3840 gtgagcgtgg agccagacgc cctgggaaat gcagccgccc tggacgtgta caagtttctg 3900 tccctggaga tgtctgatca gcgcagcctg ctggtgcaca tcgagcagga gagcgagctg 3960 gccaggcagc tgctggacat cccttcctgc gagtatcagg ccctgagaga tggcttcctg 4020 aagatggtgg actccgatca ggcctctgtg agctcctcta agatcaagca ggtgtacttt 4080 ccaatcgccg acggcgagta tcacctgctg tccctgctga cccactctgg ccacctgttc 4140 gagctgagga agcgcctgga cgccctgagg tttggcgatg ccgtgaagga ggcccgggag 4200 tgtaagaaga ccaaccactt ccacccagcc ggctaccagg agatcttcgg cctgaccaca 4260 atcggctttg gcggcacaaa gccccagaac atcagcgtgc tgaacaatca gaatgcaggc 4320 aaggcacacc tgctggcctc catcccccct gagctgaccc ctcgggacat cagactgcca 4380 aagacagatt tctttaagga gtccttcaac gcctggcagg ccaaggaggt gctggagtct 4440 ctgcacagac tgtttcagac cgactgcaac aatatcaatc tgagggacgg ccgcgattac 4500 agaatccagc agtatgtgga cctggtcatc gagaagatgt ggcaggtgag gctgttcctg 4560 gaggcctaca gcggcgagct gagctccgcc ctgcctctgg agcagaagat ctggctgtat 4620 ccagagtttg cagagcagag gcagcaggag gacgagtggc tggataagat catccgccac 4680 atcgcccggg gcctgatcaa ccactacagc cggtccaaag tgatcaccaa tcctgtgaca 4740 ctggccgacc aggagctgct ggccatcgag gaggtggtgg cctccaacaa ggagaatctg 4800 agatga 4806 <210> 1267 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Oceanicola sp. HL-35 <400> 1267 ctgttccccg cacacgcggg gatgaaccg 29 <210> 1268 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Pseudomonas sp. S-6-2 <400> 1268 gtgttccccg cacctgcggg gatgaaccg 29 <210> 1269 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Salmonella enterica subsp. enterica serovar Muenster strain <400> 1269 gtgttccccg cgccagcggg gataaaccg 29 <210> 1270 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Atlantibacter hermannii NBRC 105704 <400> 1270 gtgttccccg cgccagcggg gataaaccg 29 <210> 1271 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Geothermobacter sp. EPR-M <400> 1271 ctgttccccg cacccgcggg gatgaaccg 29 <210> 1272 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Methylocaldum sp. 14B <400> 1272 ctgttcccca cgtacgtggg gatgaaccg 29 <210> 1273 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Methanocella arvoryzae MRE50 <400> 1273 aaagtcccca caggcgtggg ggtgaaccg 29 <210> 1274 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Pseudomonas aeruginosa DHS01 <400> 1274 gtgttcccca catgcgtggg gatgaaccg 29 <210> 1275 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Lachnospiraceae bacterium KH1T2 <400> 1275 gtattcccca cgcacgtggg ggtaaatc 28 <210> 1276 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Klebsiella pneumoniae strain VRCO0172 <400> 1276 gtattcccca cacgcgtggg ggtgtttc 28 <210> 1277 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Streptococcus thermophilus strain ND07 <400> 1277 gtttttcccg cacacgcggg ggtgatcc 28 <210> 1278 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Streptomyces sp. S4 <400> 1278 gtcggccccg cacccgcggg gatgctcc 28 <210> 1279 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Campylobacter fetus subsp. testudinum Sp3 <400> 1279 gtttgctaat gacaatattt gtgttaaaac 30 <210> 1280 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Odoribacter splanchnicus DSM 20712 <400> 1280 cttttaattg aactaaggta gaattgaaac 30 <210> 1281 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Bacillus halodurans C-125 <400> 1281 gtcgcactct tcatgggtgc gtggattgaa at 32 <210> 1282 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Desulfovibrio vulgaris RCH1 plasmid pDEVAL01 <400> 1282 gtcgcccccc acgcgggggc gtggattgaa ac 32 <210> 1283 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Geobacillus thermocatenulatus strain KCTC 3921 <400> 1283 gttgcacccg gctattaagc cgggtgagga ttgaaac 37 <210> 1284 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Vibrio cholerae strain L15 L15_contig8 <400> 1284 gttcactgcc gtacaggcag cttagaaa 28 <210> 1285 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Pseudomonas aeruginosa UCBPP-PA14 <400> 1285 gttcactgcc gtgtaggcag ctaagaaa 28 <210> 1286 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Shewanella putrefaciens CN-32 <400> 1286 gttcaccgcc gcacaggcgg cttagaaa 28 <210> 1287 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Acinetobacter sp. 869535 <400> 1287 gttcactgcc atataggcag cttagaaa 28 <210> 1288 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: CRISPR repeats for Vibrio cholerae HE48 vcoHE48.contig.11 <400> 1288 gttcactgcc gcacaggcag cttagaaa 28 <210> 1289 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_F_1 <400> 1289 cgggcaggca gagctggagg cctttcaggc ccctgttccc cgcacacgcg gggatgaacc 60 gggcctgagg tgctgcctgg gcatgtgtaa agg 93 <210> 1290 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_F_2 <400> 1290 tctgtggctg tcgacatgct aagtgagggc ctctgttccc cgcacacgcg gggatgaacc 60 gtagtctcaa gtttgttcaa agctggactc ctc 93 <210> 1291 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_F_3 <400> 1291 atgagtctag gttacattca gtgcaaaaaa ccctgttccc cgcacacgcg gggatgaacc 60 ggtaagtttt taaaatatat atctaccatg tat 93 <210> 1292 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_F_4 <400> 1292 atgattggaa ttatcttcta gctcttgtcg aactgttccc cgcacacgcg gggatgaacc 60 ggtatcaaga ctgtgacttt taattgtagt tta 93 <210> 1293 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_F_5 <400> 1293 acaagttttg ggtctcagcg caggcctcag ttctgttccc cgcacacgcg gggatgaacc 60 gaggtctgtc cagatgctaa gaccaggtac ttc 93 <210> 1294 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_F_6 <400> 1294 gatttcctaa aggaatttaa caacaagacc atctgttccc cgcacacgcg gggatgaacc 60 ggttcctctg tctgatggac ttattcaatg ttt 93 <210> 1295 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_F_7 <400> 1295 tcttagaccc cagccacagg gatatttccc tgctgttccc cgcacacgcg gggatgaacc 60 gttccttcgt catccttgta atccatcagg gtc 93 <210> 1296 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_F_8 <400> 1296 atgctgctct tcatctctct tatttaccac tgctgttccc cgcacacgcg gggatgaacc 60 gcaggcaata tctggaactt ctccagtggc ttc 93 <210> 1297 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_R_1 <400> 1297 cctttacaca tgcccaggca gcacctcagg cccggttcat ccccgcgtgt gcggggaaca 60 ggggcctgaa aggcctccag ctctgcctgc ccg 93 <210> 1298 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_R_2 <400> 1298 gaggagtcca gctttgaaca aacttgagac tacggttcat ccccgcgtgt gcggggaaca 60 gaggccctca cttagcatgt cgacagccac aga 93 <210> 1299 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_R_3 <400> 1299 atacatggta gatatatatt ttaaaaactt accggttcat ccccgcgtgt gcggggaaca 60 gggttttttg cactgaatgt aacctagact cat 93 <210> 1300 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_R_4 <400> 1300 taaactacaa ttaaaagtca cagtcttgat accggttcat ccccgcgtgt gcggggaaca 60 gttcgacaag agctagaaga taattccaat cat 93 <210> 1301 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_R_5 <400> 1301 gaagtacctg gtcttagcat ctggacagac ctcggttcat ccccgcgtgt gcggggaaca 60 gaactgaggc ctgcgctgag acccaaaact tgt 93 <210> 1302 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_R_6 <400> 1302 aaacattgaa taagtccatc agacagagga accggttcat ccccgcgtgt gcggggaaca 60 gatggtcttg ttgttaaatt cctttaggaa atc 93 <210> 1303 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_R_7 <400> 1303 gaccctgatg gattacaagg atgacgaagg aacggttcat ccccgcgtgt gcggggaaca 60 gcagggaaat atccctgtgg ctggggtcta aga 93 <210> 1304 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_R_8 <400> 1304 gaagccactg gagaagttcc agatattgcc tgcggttcat ccccgcgtgt gcggggaaca 60 gcagtggtaa ataagagaga tgaagagcag cat 93 <210> 1305 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_F_1 <400> 1305 aatcagacca ctcacagcat aggagcagct ctggtattcc ccacacgcgt gggggtgttt 60 cactctgtgc atactctggg gctgggagtt acca 94 <210> 1306 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_F_2 <400> 1306 atttctagcc ttacttccac cttatttctt cccgtattcc ccacacgcgt gggggtgttt 60 caaatagctc ttcagttgtt tctggttaat tgag 94 <210> 1307 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_F_3 <400> 1307 ttctattatg ggatctgtaa cactttattg gatgtattcc ccacacgcgt gggggtgttt 60 ctcattattt ctgcctagag atggatcagg aaat 94 <210> 1308 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_F_4 <400> 1308 aaaataacaa gtttcatgga agaataccca accgtattcc ccacacgcgt gggggtgttt 60 cctttaatga ttgggaatct ggagttaagg gaaa 94 <210> 1309 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_F_5 <400> 1309 tcaccacata gtatgtccct ttaaagcatt gacgtattcc ccacacgcgt gggggtgttt 60 cacaaacttt ctgaacaata caattttaat gcat 94 <210> 1310 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_F_6 <400> 1310 tgacggtgga aacgttctct actacgaagt gatgtattcc ccacacgcgt gggggtgttt 60 catcagtaac atggaagtct caaatatttc agca 94 <210> 1311 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_F_7 <400> 1311 cccttgccct tcttgtggcc cagtggtttt caagtattcc ccacacgcgt gggggtgttt 60 cacgggagag gggaggggag gagttcagag gaag 94 <210> 1312 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_F_8 <400> 1312 tcacttgagg tcaggagttc aagaccaccc tgggtattcc ccacacgcgt gggggtgttt 60 cgatactggg ccagatcatt gtttctcaaa ttgc 94 <210> 1313 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_R_1 <400> 1313 aggcctctag gaagacaggt ggaggttagg gatttctaag ctgcctgtgc ggcagtgaac 60 aacctaatta taaggaggtt gttttggcca tg 92 <210> 1314 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_R_2 <400> 1314 cgctctggag ccgcagtgcg cactgcgctg cgtttctaag ctgcctgtgc ggcagtgaac 60 ttattcagga ctgactcccc ctgccagtcc ca 92 <210> 1315 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_R_3 <400> 1315 tatgctcata gcaagatgcc acatgaaaca gttttctaag ctgcctgtgc ggcagtgaac 60 ggctgcgggc ctagaaacaa tagctggtga aa 92 <210> 1316 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_R_4 <400> 1316 attcaggaga tccacattct ctttttagtt tatttctaag ctgcctgtgc ggcagtgaac 60 taatactttt tagctattaa gtaattaaga ta 92 <210> 1317 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_R_5 <400> 1317 cctcagaaca acttcctgaa ggtgatagcg gttttctaag ctgcctgtgc ggcagtgaac 60 gatttgtgga tgccgggttc caactcttct tg 92 <210> 1318 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_R_6 <400> 1318 tgtccatcac tcccataggc tgagtttatt tatttctaag ctgcctgtgc ggcagtgaac 60 caataaatac ttatttagac cttgtgctac ag 92 <210> 1319 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_R_7 <400> 1319 ctgggaccct gatggattac aaggatgacg aatttctaag ctgcctgtgc ggcagtgaac 60 aatatccctg tggctggggt ctaagacttt ga 92 <210> 1320 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_R_8 <400> 1320 aatattttgg tcacatgaag aaatatgcaa tatttctaag ctgcctgtgc ggcagtgaac 60 tggcctgtga atggtctcaa ctaacccttt ca 92 <210> 1321 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_F_1 <400> 1321 tctggggaat ctgtaaaagg tatatagaaa ctctctgttt gctaatgaca atatttgtgt 60 taaaacaaac aaaaaaacta atctattggt acaatatagt ta 102 <210> 1322 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_F_2 <400> 1322 gtgttttaaa gttacaccga tacattccag tgccttgttt gctaatgaca atatttgtgt 60 taaaacataa gaaaatcctg ttttctcttt aggacaggaa ct 102 <210> 1323 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_F_3 <400> 1323 aataatagaa taatggatct tcagtttaca agttttgttt gctaatgaca atatttgtgt 60 taaaacctga tacctaggga atcagtctta tcccccatag ga 102 <210> 1324 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_R_1 <400> 1324 taactatatt gtaccaatag attagttttt ttgtttgttt taacacaaat attgtcatta 60 gcaaacagag agtttctata taccttttac agattcccca ga 102 <210> 1325 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_R_2 <400> 1325 agttcctgtc ctaaagagaa aacaggattt tcttatgttt taacacaaat attgtcatta 60 gcaaacaagg cactggaatg tatcggtgta actttaaaac ac 102 <210> 1326 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_R_3 <400> 1326 tcctatgggg gataagactg attccctagg tatcaggttt taacacaaat attgtcatta 60 gcaaacaaaa cttgtaaact gaagatccat tattctatta tt 102 <210> 1327 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set4_F_1 <400> 1327 gtgttttaaa gttacaccga tacattccag tgccttcttt taattgaact aaggtagaat 60 tgaaacataa gaaaatcctg ttttctcttt aggacaggaa ct 102 <210> 1328 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set4_F_2 <400> 1328 aataatagaa taatggatct tcagtttaca agttttcttt taattgaact aaggtagaat 60 tgaaacctga tacctaggga atcagtctta tcccccatag ga 102 <210> 1329 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set4_R_1 <400> 1329 agttcctgtc ctaaagagaa aacaggattt tcttatgttt caattctacc ttagttcaat 60 taaaagaagg cactggaatg tatcggtgta actttaaaac ac 102 <210> 1330 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set4_R_2 <400> 1330 tcctatgggg gataagactg attccctagg tatcaggttt caattctacc ttagttcaat 60 taaaagaaaa cttgtaaact gaagatccat tattctatta tt 102 <210> 1331 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_F_1 <400> 1331 atgactttgt aggtgtcttt attgctaggc tgtagtcgca ctcttcatgg gtgcgtggat 60 tgaaattgtt atcatcattt atggagtgtt gccactaacg 100 <210> 1332 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_F_2 <400> 1332 caaattattc cattaccaca gcattaatca cacagtcgca ctcttcatgg gtgcgtggat 60 tgaaattgag gaggatacat gtcagatata agttgagatc 100 <210> 1333 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_F_3 <400> 1333 tccatcttca gtgcctcaac ttgctttaac aactgtcgca ctcttcatgg gtgcgtggat 60 tgaaatcaat catcttacaa aactggaaac tgaggcatct 100 <210> 1334 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_F_4 <400> 1334 tcaccaaata tatgccttcg tgtgtccaaa gtatgtcgca ctcttcatgg gtgcgtggat 60 tgaaattata ttcaagtaat aacacagcat tgcctataca 100 <210> 1335 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_F_5 <400> 1335 tttatgagat atttattgga tgaagaaata gagcgtcgca ctcttcatgg gtgcgtggat 60 tgaaatacgg agccagaggc ctaagttcaa ttcttggcac 100 <210> 1336 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_F_6 <400> 1336 cacccccaac ccccaccttt cctaaggaca ggtcgtcgca ctcttcatgg gtgcgtggat 60 tgaaataacc cacctcactt actctacatg cagggtccac 100 <210> 1337 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_F_7 <400> 1337 ttcagagtct ggattgacag ttatttttga aattgtcgca ctcttcatgg gtgcgtggat 60 tgaaatcaag tagctaatga aaggaataat cttgctttag 100 <210> 1338 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_R_1 <400> 1338 cgttagtggc aacactccat aaatgatgat aacaatttca atccacgcac ccatgaagag 60 tgcgactaca gcctagcaat aaagacacct acaaagtcat 100 <210> 1339 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_R_2 <400> 1339 gatctcaact tatatctgac atgtatcctc ctcaatttca atccacgcac ccatgaagag 60 tgcgactgtg tgattaatgc tgtggtaatg gaataatttg 100 <210> 1340 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_R_3 <400> 1340 agatgcctca gtttccagtt ttgtaagatg attgatttca atccacgcac ccatgaagag 60 tgcgacagtt gttaaagcaa gttgaggcac tgaagatgga 100 <210> 1341 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_R_4 <400> 1341 tgtataggca atgctgtgtt attacttgaa tataatttca atccacgcac ccatgaagag 60 tgcgacatac tttggacaca cgaaggcata tatttggtga 100 <210> 1342 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_R_5 <400> 1342 gtgccaagaa ttgaacttag gcctctggct ccgtatttca atccacgcac ccatgaagag 60 tgcgacgctc tatttcttca tccaataaat atctcataaa 100 <210> 1343 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_R_6 <400> 1343 gtggaccctg catgtagagt aagtgaggtg ggttatttca atccacgcac ccatgaagag 60 tgcgacgacc tgtccttagg aaaggtgggg gttgggggtg 100 <210> 1344 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_R_7 <400> 1344 ctaaagcaag attattcctt tcattagcta cttgatttca atccacgcac ccatgaagag 60 tgcgacaatt tcaaaaataa ctgtcaatcc agactctgaa 100 <210> 1345 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_F_1 <400> 1345 atgactttgt aggtgtcttt attgctaggc tgtagtcgcc ccccacgcgg gggcgtggat 60 tgaaactgtt atcatcattt atggagtgtt gccactaacg 100 <210> 1346 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_F_2 <400> 1346 caaattattc cattaccaca gcattaatca cacagtcgcc ccccacgcgg gggcgtggat 60 tgaaactgag gaggatacat gtcagatata agttgagatc 100 <210> 1347 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_F_3 <400> 1347 tttatgagat atttattgga tgaagaaata gagcgtcgcc ccccacgcgg gggcgtggat 60 tgaaacacgg agccagaggc ctaagttcaa ttcttggcac 100 <210> 1348 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_F_4 <400> 1348 cacccccaac ccccaccttt cctaaggaca ggtcgtcgcc ccccacgcgg gggcgtggat 60 tgaaacaacc cacctcactt actctacatg cagggtccac 100 <210> 1349 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_R_1 <400> 1349 cgttagtggc aacactccat aaatgatgat aacagtttca atccacgccc ccgcgtgggg 60 ggcgactaca gcctagcaat aaagacacct acaaagtcat 100 <210> 1350 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_R_2 <400> 1350 gatctcaact tatatctgac atgtatcctc ctcagtttca atccacgccc ccgcgtgggg 60 ggcgactgtg tgattaatgc tgtggtaatg gaataatttg 100 <210> 1351 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_R_3 <400> 1351 gtgccaagaa ttgaacttag gcctctggct ccgtgtttca atccacgccc ccgcgtgggg 60 ggcgacgctc tatttcttca tccaataaat atctcataaa 100 <210> 1352 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_R_4 <400> 1352 gtggaccctg catgtagagt aagtgaggtg ggttgtttca atccacgccc ccgcgtgggg 60 ggcgacgacc tgtccttagg aaaggtgggg gttgggggtg 100 <210> 1353 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_F_1 <400> 1353 atgactttgt aggtgtcttt attgctaggc tgtacgttgc acccggctat taagccgggt 60 gaggattgaa actgttatca tcatttatgg agtgttgcca ctaacga 107 <210> 1354 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_F_2 <400> 1354 tccatcttca gtgcctcaac ttgctttaac aactggttgc acccggctat taagccgggt 60 gaggattgaa accaatcatc ttacaaaact ggaaactgag gcatcta 107 <210> 1355 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_F_3 <400> 1355 tcaccaaata tatgccttcg tgtgtccaaa gtatagttgc acccggctat taagccgggt 60 gaggattgaa actatattca agtaataaca cagcattgcc tatacag 107 <210> 1356 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_F_4 <400> 1356 cacccccaac ccccaccttt cctaaggaca ggtccgttgc acccggctat taagccgggt 60 gaggattgaa acaacccacc tcacttactc tacatgcagg gtccact 107 <210> 1357 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_R_1 <400> 1357 tcgttagtgg caacactcca taaatgatga taacagtttc aatcctcacc cggcttaata 60 gccgggtgca acgtacagcc tagcaataaa gacacctaca aagtcat 107 <210> 1358 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_R_2 <400> 1358 tagatgcctc agtttccagt tttgtaagat gattggtttc aatcctcacc cggcttaata 60 gccgggtgca accagttgtt aaagcaagtt gaggcactga agatgga 107 <210> 1359 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_R_3 <400> 1359 ctgtataggc aatgctgtgt tattacttga atatagtttc aatcctcacc cggcttaata 60 gccgggtgca actatacttt ggacacacga aggcatatat ttggtga 107 <210> 1360 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_R_4 <400> 1360 agtggaccct gcatgtagag taagtgaggt gggttgtttc aatcctcacc cggcttaata 60 gccgggtgca acggacctgt ccttaggaaa ggtgggggtt gggggtg 107 <210> 1361 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_1 <400> 1361 tttcaccagc tattgtttct aggcccgcag ccgttcactg ccgtacaggc agcttagaaa 60 actgtttcat gtggcatctt gctatgagca ta 92 <210> 1362 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_2 <400> 1362 tatcttaatt acttaatagc taaaaagtat tagttcactg ccgtacaggc agcttagaaa 60 taaactaaaa agagaatgtg gatctcctga at 92 <210> 1363 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_3 <400> 1363 caagaagagt tggaacccgg catccacaaa tcgttcactg ccgtacaggc agcttagaaa 60 accgctatca ccttcaggaa gttgttctga gg 92 <210> 1364 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_4 <400> 1364 ctgtagcaca aggtctaaat aagtatttat tggttcactg ccgtacaggc agcttagaaa 60 taaataaact cagcctatgg gagtgatgga ca 92 <210> 1365 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_5 <400> 1365 tcaaagtctt agaccccagc cacagggata ttgttcactg ccgtacaggc agcttagaaa 60 ttcgtcatcc ttgtaatcca tcagggtccc ag 92 <210> 1366 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_1 <400> 1366 tatgctcata gcaagatgcc acatgaaaca gttttctaag ctgcctgtac ggcagtgaac 60 ggctgcgggc ctagaaacaa tagctggtga aa 92 <210> 1367 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_2 <400> 1367 attcaggaga tccacattct ctttttagtt tatttctaag ctgcctgtac ggcagtgaac 60 taatactttt tagctattaa gtaattaaga ta 92 <210> 1368 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_3 <400> 1368 cctcagaaca acttcctgaa ggtgatagcg gttttctaag ctgcctgtac ggcagtgaac 60 gatttgtgga tgccgggttc caactcttct tg 92 <210> 1369 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_4 <400> 1369 tgtccatcac tcccataggc tgagtttatt tatttctaag ctgcctgtac ggcagtgaac 60 caataaatac ttatttagac cttgtgctac ag 92 <210> 1370 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_5 <400> 1370 ctgggaccct gatggattac aaggatgacg aatttctaag ctgcctgtac ggcagtgaac 60 aatatccctg tggctggggt ctaagacttt ga 92 <210> 1371 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_1 <400> 1371 tgggactggc agggggagtc agtcctgaat aagttcactg ccgtgtaggc agctaagaaa 60 cgcagcgcag tgcgcactgc ggctccagag cg 92 <210> 1372 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_2 <400> 1372 caagaagagt tggaacccgg catccacaaa tcgttcactg ccgtgtaggc agctaagaaa 60 accgctatca ccttcaggaa gttgttctga gg 92 <210> 1373 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_3 <400> 1373 ctgtagcaca aggtctaaat aagtatttat tggttcactg ccgtgtaggc agctaagaaa 60 taaataaact cagcctatgg gagtgatgga ca 92 <210> 1374 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_F_4 <400> 1374 tgaaagggtt agttgagacc attcacaggc cagttcactg ccgtgtaggc agctaagaaa 60 tattgcatat ttcttcatgt gaccaaaata tt 92 <210> 1375 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_1 <400> 1375 cgctctggag ccgcagtgcg cactgcgctg cgtttcttag ctgcctacac ggcagtgaac 60 ttattcagga ctgactcccc ctgccagtcc ca 92 <210> 1376 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_2 <400> 1376 cctcagaaca acttcctgaa ggtgatagcg gttttcttag ctgcctacac ggcagtgaac 60 gatttgtgga tgccgggttc caactcttct tg 92 <210> 1377 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_3 <400> 1377 tgtccatcac tcccataggc tgagtttatt tatttcttag ctgcctacac ggcagtgaac 60 caataaatac ttatttagac cttgtgctac ag 92 <210> 1378 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_R_4 <400> 1378 aatattttgg tcacatgaag aaatatgcaa tatttcttag ctgcctacac ggcagtgaac 60 tggcctgtga atggtctcaa ctaacccttt ca 92 <210> 1379 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_F_1 <400> 1379 catggccaaa acaacctcct tataattagg ttgttcaccg ccgcacaggc ggcttagaaa 60 tccctaacct ccacctgtct tcctagaggc ct 92 <210> 1380 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_F_2 <400> 1380 ctgtagcaca aggtctaaat aagtatttat tggttcaccg ccgcacaggc ggcttagaaa 60 taaataaact cagcctatgg gagtgatgga ca 92 <210> 1381 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_F_3 <400> 1381 tcaaagtctt agaccccagc cacagggata ttgttcaccg ccgcacaggc ggcttagaaa 60 ttcgtcatcc ttgtaatcca tcagggtccc ag 92 <210> 1382 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_R_1 <400> 1382 aggcctctag gaagacaggt ggaggttagg gatttctaag ccgcctgtgc ggcggtgaac 60 aacctaatta taaggaggtt gttttggcca tg 92 <210> 1383 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_R_2 <400> 1383 tgtccatcac tcccataggc tgagtttatt tatttctaag ccgcctgtgc ggcggtgaac 60 caataaatac ttatttagac cttgtgctac ag 92 <210> 1384 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_R_3 <400> 1384 ctgggaccct gatggattac aaggatgacg aatttctaag ccgcctgtgc ggcggtgaac 60 aatatccctg tggctggggt ctaagacttt ga 92 <210> 1385 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_F_1 <400> 1385 tgggactggc agggggagtc agtcctgaat aagttcactg ccatataggc agcttagaaa 60 cgcagcgcag tgcgcactgc ggctccagag cg 92 <210> 1386 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_F_2 <400> 1386 tttcaccagc tattgtttct aggcccgcag ccgttcactg ccatataggc agcttagaaa 60 actgtttcat gtggcatctt gctatgagca ta 92 <210> 1387 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_F_3 <400> 1387 tatcttaatt acttaatagc taaaaagtat tagttcactg ccatataggc agcttagaaa 60 taaactaaaa agagaatgtg gatctcctga at 92 <210> 1388 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_F_4 <400> 1388 ctgtagcaca aggtctaaat aagtatttat tggttcactg ccatataggc agcttagaaa 60 taaataaact cagcctatgg gagtgatgga ca 92 <210> 1389 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_F_5 <400> 1389 tcaaagtctt agaccccagc cacagggata ttgttcactg ccatataggc agcttagaaa 60 ttcgtcatcc ttgtaatcca tcagggtccc ag 92 <210> 1390 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_F_6 <400> 1390 tgaaagggtt agttgagacc attcacaggc cagttcactg ccatataggc agcttagaaa 60 tattgcatat ttcttcatgt gaccaaaata tt 92 <210> 1391 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_R_1 <400> 1391 cgctctggag ccgcagtgcg cactgcgctg cgtttctaag ctgcctatat ggcagtgaac 60 ttattcagga ctgactcccc ctgccagtcc ca 92 <210> 1392 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_R_2 <400> 1392 tatgctcata gcaagatgcc acatgaaaca gttttctaag ctgcctatat ggcagtgaac 60 ggctgcgggc ctagaaacaa tagctggtga aa 92 <210> 1393 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_R_3 <400> 1393 attcaggaga tccacattct ctttttagtt tatttctaag ctgcctatat ggcagtgaac 60 taatactttt tagctattaa gtaattaaga ta 92 <210> 1394 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_R_4 <400> 1394 tgtccatcac tcccataggc tgagtttatt tatttctaag ctgcctatat ggcagtgaac 60 caataaatac ttatttagac cttgtgctac ag 92 <210> 1395 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_R_5 <400> 1395 ctgggaccct gatggattac aaggatgacg aatttctaag ctgcctatat ggcagtgaac 60 aatatccctg tggctggggt ctaagacttt ga 92 <210> 1396 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_R_6 <400> 1396 aatattttgg tcacatgaag aaatatgcaa tatttctaag ctgcctatat ggcagtgaac 60 tggcctgtga atggtctcaa ctaacccttt ca 92 <210> 1397 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set11_F_1 <400> 1397 tgggactggc agggggagtc agtcctgaat aagttcactg ccgcacaggc agcttagaaa 60 cgcagcgcag tgcgcactgc ggctccagag cg 92 <210> 1398 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set11_F_2 <400> 1398 tgaaagggtt agttgagacc attcacaggc cagttcactg ccgcacaggc agcttagaaa 60 tattgcatat ttcttcatgt gaccaaaata tt 92 <210> 1399 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set11_R_1 <400> 1399 cgctctggag ccgcagtgcg cactgcgctg cgtttctaag ctgcctgtgc ggcagtgaac 60 ttattcagga ctgactcccc ctgccagtcc ca 92 <210> 1400 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set11_R_2 <400> 1400 aatattttgg tcacatgaag aaatatgcaa tatttctaag ctgcctgtgc ggcagtgaac 60 tggcctgtga atggtctcaa ctaacccttt ca 92 <210> 1401 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_F_1 <400> 1401 cactctttcc ctacacgacg ctcttccgat ctttcctccc taacctccac ct 52 <210> 1402 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_F_2 <400> 1402 cactctttcc ctacacgacg ctcttccgat ctctaggttg gcagcgaatg ag 52 <210> 1403 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_F_3 <400> 1403 cactctttcc ctacacgacg ctcttccgat ctccactgtt tcatgtggca tc 52 <210> 1404 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_F_4 <400> 1404 cactctttcc ctacacgacg ctcttccgat cttgaggcac tgaagatgga ga 52 <210> 1405 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_F_5 <400> 1405 cactctttcc ctacacgacg ctcttccgat cttttggaca cacgaaggca ta 52 <210> 1406 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_F_6 <400> 1406 cactctttcc ctacacgacg ctcttccgat cttcaggtca tgcgtggaca 50 <210> 1407 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_F_7 <400> 1407 cactctttcc ctacacgacg ctcttccgat ctcaagggtt cttctcaacc ca 52 <210> 1408 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_F_8 <400> 1408 cactctttcc ctacacgacg ctcttccgat ctctttgcca cgtatttcta gcct 54 <210> 1409 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_R_1 <400> 1409 ggagttcaga cgtgtgctct tccgatctta aagagcccaa ccagatgc 48 <210> 1410 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_R_2 <400> 1410 ggagttcaga cgtgtgctct tccgatctga caaatctcca gctgctcc 48 <210> 1411 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_R_3 <400> 1411 ggagttcaga cgtgtgctct tccgatcttt ggtaaaaggg caacaatg 48 <210> 1412 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_R_4 <400> 1412 ggagttcaga cgtgtgctct tccgatcttc aagtttacaa gagggaatac tgaa 54 <210> 1413 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_R_5 <400> 1413 ggagttcaga cgtgtgctct tccgatctct aactgccctg gagacctg 48 <210> 1414 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_R_6 <400> 1414 ggagttcaga cgtgtgctct tccgatcttt ggcaacatgt ggattcat 48 <210> 1415 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_R_7 <400> 1415 ggagttcaga cgtgtgctct tccgatctga gaggcacgag aacacaca 48 <210> 1416 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set1_ilmn_R_8 <400> 1416 ggagttcaga cgtgtgctct tccgatcttt gcattgaaag tctctttagg tg 52 <210> 1417 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_F_1 <400> 1417 cactctttcc ctacacgacg ctcttccgat ctaatgccct tctctcttgc ct 52 <210> 1418 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_F_2 <400> 1418 cactctttcc ctacacgacg ctcttccgat ctacgtcaca aagcgagtga ga 52 <210> 1419 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_F_3 <400> 1419 cactctttcc ctacacgacg ctcttccgat ctgatatagc gtctggtatc aaggg 55 <210> 1420 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_F_4 <400> 1420 cactctttcc ctacacgacg ctcttccgat cttttggatt agggaggtat ggc 53 <210> 1421 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_F_5 <400> 1421 cactctttcc ctacacgacg ctcttccgat ctactgtgct ttaaacattt gtctgtg 57 <210> 1422 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_F_6 <400> 1422 cactctttcc ctacacgacg ctcttccgat ctttccaaga ttcccagtca cc 52 <210> 1423 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_F_7 <400> 1423 cactctttcc ctacacgacg ctcttccgat ctgctgttca acccacctca ct 52 <210> 1424 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_F_8 <400> 1424 cactctttcc ctacacgacg ctcttccgat ctccaccacg cctgactaat tt 52 <210> 1425 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_R_1 <400> 1425 ggagttcaga cgtgtgctct tccgatctga tggaagacag gcttctcg 48 <210> 1426 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_R_2 <400> 1426 ggagttcaga cgtgtgctct tccgatctgg gcttgtttct tccttcct 48 <210> 1427 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_R_3 <400> 1427 ggagttcaga cgtgtgctct tccgatctcc ctactttcca atcaaggct 49 <210> 1428 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_R_4 <400> 1428 ggagttcaga cgtgtgctct tccgatctgg gcaagatgag cagagact 48 <210> 1429 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_R_5 <400> 1429 ggagttcaga cgtgtgctct tccgatctaa gctgttggcc tatctgga 48 <210> 1430 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_R_6 <400> 1430 ggagttcaga cgtgtgctct tccgatctca tttgtgacag cagcgtg 47 <210> 1431 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_R_7 <400> 1431 ggagttcaga cgtgtgctct tccgatctcc cagccacagg gatattt 47 <210> 1432 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set2_ilmn_R_8 <400> 1432 ggagttcaga cgtgtgctct tccgatctaa ataagtttca caactatgaa caggtc 56 <210> 1433 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_ilmn_F_1 <400> 1433 cactctttcc ctacacgacg ctcttccgat ctttggactt acagaagagt tggaaa 56 <210> 1434 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_ilmn_F_2 <400> 1434 cactctttcc ctacacgacg ctcttccgat ctgtgtattt gggagggaag ca 52 <210> 1435 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_ilmn_F_3 <400> 1435 cactctttcc ctacacgacg ctcttccgat ctaaatcgaa atgggattca cg 52 <210> 1436 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_ilmn_R_1 <400> 1436 cactctttcc ctacacgacg ctcttccgat ctgtgtattt gggagggaag ca 52 <210> 1437 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_ilmn_R_2 <400> 1437 cactctttcc ctacacgacg ctcttccgat ctaaatcgaa atgggattca cg 52 <210> 1438 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set3_ilmn_R_3 <400> 1438 cactctttcc ctacacgacg ctcttccgat ctggcgattc acacaactga aa 52 <210> 1439 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set4_ilmn_F_1 <400> 1439 cactctttcc ctacacgacg ctcttccgat ctaaagattt gcctgcgtga at 52 <210> 1440 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set4_ilmn_F_2 <400> 1440 cactctttcc ctacacgacg ctcttccgat cttaggtcca agggtagcca ag 52 <210> 1441 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set4_ilmn_R_1 <400> 1441 cactctttcc ctacacgacg ctcttccgat ctatccgtga cactacatgc ca 52 <210> 1442 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set4_ilmn_R_2 <400> 1442 cactctttcc ctacacgacg ctcttccgat ctcccatgct cttaagccac tc 52 <210> 1443 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_F_1 <400> 1443 cactctttcc ctacacgacg ctcttccgat ctaccatttg gccagagtcc ta 52 <210> 1444 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_F_2 <400> 1444 cactctttcc ctacacgacg ctcttccgat ctgcatcacc ttcaagaaag gtaca 55 <210> 1445 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_F_3 <400> 1445 cactctttcc ctacacgacg ctcttccgat ctggcgattc acacaactga aa 52 <210> 1446 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_F_4 <400> 1446 cactctttcc ctacacgacg ctcttccgat ctaaagattt gcctgcgtga at 52 <210> 1447 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_F_5 <400> 1447 cactctttcc ctacacgacg ctcttccgat ctcccatgct cttaagccac tc 52 <210> 1448 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_F_6 <400> 1448 cactctttcc ctacacgacg ctcttccgat ctaccatttg gccagagtcc ta 52 <210> 1449 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_F_7 <400> 1449 cactctttcc ctacacgacg ctcttccgat ctaggcttgt ccctggtaac ct 52 <210> 1450 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_R_1 <400> 1450 cactctttcc ctacacgacg ctcttccgat cttaggtcca agggtagcca ag 52 <210> 1451 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_R_2 <400> 1451 cactctttcc ctacacgacg ctcttccgat ctatccgtga cactacatgc ca 52 <210> 1452 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_R_3 <400> 1452 cactctttcc ctacacgacg ctcttccgat ctaccatttg gccagagtcc ta 52 <210> 1453 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_R_4 <400> 1453 cactctttcc ctacacgacg ctcttccgat ctttgttccc agtgttggtt ga 52 <210> 1454 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_R_5 <400> 1454 cactctttcc ctacacgacg ctcttccgat cttggatttc atattacaga ggcattt 57 <210> 1455 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_R_6 <400> 1455 cactctttcc ctacacgacg ctcttccgat ctgtggacta gcacttggct cc 52 <210> 1456 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set5_ilmn_R_7 <400> 1456 cactctttcc ctacacgacg ctcttccgat ctttggcaca tggtaaacac tca 53 <210> 1457 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_ilmn_F_1 <400> 1457 cactctttcc ctacacgacg ctcttccgat ctcaagggtt cttctcaacc ca 52 <210> 1458 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_ilmn_F_2 <400> 1458 cactctttcc ctacacgacg ctcttccgat ctggaaatcg accaaagacg ag 52 <210> 1459 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_ilmn_F_3 <400> 1459 cactctttcc ctacacgacg ctcttccgat ctgtggacta gcacttggct cc 52 <210> 1460 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_ilmn_F_4 <400> 1460 cactctttcc ctacacgacg ctcttccgat ctttggcaca tggtaaacac tca 53 <210> 1461 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_ilmn_R_1 <400> 1461 cactctttcc ctacacgacg ctcttccgat ctcagaagcc ctttgagagt gg 52 <210> 1462 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_ilmn_R_2 <400> 1462 cactctttcc ctacacgacg ctcttccgat ctaggcaaat agaattgggc tg 52 <210> 1463 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_ilmn_R_3 <400> 1463 cactctttcc ctacacgacg ctcttccgat ctttggcaca tggtaaacac tca 53 <210> 1464 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set6_ilmn_R_4 <400> 1464 cactctttcc ctacacgacg ctcttccgat ctcaagggtt cttctcaacc ca 52 <210> 1465 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_ilmn_F_1 <400> 1465 cactctttcc ctacacgacg ctcttccgat ctggaaatcg accaaagacg ag 52 <210> 1466 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_ilmn_F_2 <400> 1466 cactctttcc ctacacgacg ctcttccgat ctttgttccc agtgttggtt ga 52 <210> 1467 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_ilmn_F_3 <400> 1467 cactctttcc ctacacgacg ctcttccgat cttggatttc atattacaga ggcattt 57 <210> 1468 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_ilmn_F_4 <400> 1468 cactctttcc ctacacgacg ctcttccgat ctttggcaca tggtaaacac tca 53 <210> 1469 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_ilmn_R_1 <400> 1469 cactctttcc ctacacgacg ctcttccgat ctcaagggtt cttctcaacc ca 52 <210> 1470 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_ilmn_R_2 <400> 1470 cactctttcc ctacacgacg ctcttccgat ctcagaagcc ctttgagagt gg 52 <210> 1471 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_ilmn_R_3 <400> 1471 cactctttcc ctacacgacg ctcttccgat ctggaaatcg accaaagacg ag 52 <210> 1472 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set7_ilmn_R_4 <400> 1472 cactctttcc ctacacgacg ctcttccgat ctcagaagcc ctttgagagt gg 52 <210> 1473 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_1 <400> 1473 ggagttcaga cgtgtgctct tccgatctgc agggagtaaa ccaacaaca 49 <210> 1474 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_2 <400> 1474 ggagttcaga cgtgtgctct tccgatctgg atctggtgat gagaggga 48 <210> 1475 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_3 <400> 1475 ggagttcaga cgtgtgctct tccgatctcc attcggctct gacagataa 49 <210> 1476 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_4 <400> 1476 ggagttcaga cgtgtgctct tccgatctgg atctggtgat gagaggga 48 <210> 1477 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_5 <400> 1477 ggagttcaga cgtgtgctct tccgatctcc attcggctct gacagataa 49 <210> 1478 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_1 <400> 1478 ggagttcaga cgtgtgctct tccgatctca ggtagtgtgc agcctcaa 48 <210> 1479 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_2 <400> 1479 ggagttcaga cgtgtgctct tccgatctgg ttcagaactt gagcaggg 48 <210> 1480 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_3 <400> 1480 ggagttcaga cgtgtgctct tccgatcttc aagtttacaa gagggaatac tgaa 54 <210> 1481 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_4 <400> 1481 ggagttcaga cgtgtgctct tccgatctgc tcttcgtagt ggtgcattt 49 <210> 1482 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_5 <400> 1482 ggagttcaga cgtgtgctct tccgatctaa gaaatttgcc caaggtcat 49 <210> 1483 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_1 <400> 1483 ggagttcaga cgtgtgctct tccgatcttg gaacacaatg ggttgaga 48 <210> 1484 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_2 <400> 1484 ggagttcaga cgtgtgctct tccgatcttg ggttcgttta cacaagtcaa 50 <210> 1485 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_3 <400> 1485 ggagttcaga cgtgtgctct tccgatctca ggtagtgtgc agcctcaa 48 <210> 1486 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_F_4 <400> 1486 ggagttcaga cgtgtgctct tccgatctgg ttcagaactt gagcaggg 48 <210> 1487 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_1 <400> 1487 ggagttcaga cgtgtgctct tccgatctaa gaaatttgcc caaggtcat 49 <210> 1488 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_2 <400> 1488 ggagttcaga cgtgtgctct tccgatcttg gaacacaatg ggttgaga 48 <210> 1489 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_3 <400> 1489 ggagttcaga cgtgtgctct tccgatctgc atcaaagcca ggaatctc 48 <210> 1490 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set8_ilmn_R_4 <400> 1490 ggagttcaga cgtgtgctct tccgatcttc aagtttacaa gagggaatac tgaa 54 <210> 1491 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_ilmn_F_1 <400> 1491 ggagttcaga cgtgtgctct tccgatctgc tcttcgtagt ggtgcattt 49 <210> 1492 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_ilmn_F_2 <400> 1492 ggagttcaga cgtgtgctct tccgatcttg gaacacaatg ggttgaga 48 <210> 1493 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_ilmn_F_3 <400> 1493 ggagttcaga cgtgtgctct tccgatctac aagcccgtga agatgagt 48 <210> 1494 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_ilmn_R_1 <400> 1494 ggagttcaga cgtgtgctct tccgatctgc caggtaagag gactttagga a 51 <210> 1495 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_ilmn_R_2 <400> 1495 ggagttcaga cgtgtgctct tccgatcttc tctgatgaag acccaggc 48 <210> 1496 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set9_ilmn_R_3 <400> 1496 ggagttcaga cgtgtgctct tccgatcttt cccgtgtcac atagcgta 48 <210> 1497 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnF_1 <400> 1497 ggagttcaga cgtgtgctct tccgatctga gaggcacgag aacacaca 48 <210> 1498 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnF_2 <400> 1498 ggagttcaga cgtgtgctct tccgatctag cacgtttaga atctggcg 48 <210> 1499 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnF_3 <400> 1499 ggagttcaga cgtgtgctct tccgatcttc tctgatgaag acccaggc 48 <210> 1500 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnF_4 <400> 1500 ggagttcaga cgtgtgctct tccgatcttt cccgtgtcac atagcgta 48 <210> 1501 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnF_5 <400> 1501 ggagttcaga cgtgtgctct tccgatctag gctagaaata cgtggcaaag 50 <210> 1502 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnF_6 <400> 1502 ggagttcaga cgtgtgctct tccgatcttg gcttcacagt gagcgtag 48 <210> 1503 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnR_1 <400> 1503 ggagttcaga cgtgtgctct tccgatcttt cccgtgtcac atagcgta 48 <210> 1504 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnR_2 <400> 1504 ggagttcaga cgtgtgctct tccgatctga gaggcacgag aacacaca 48 <210> 1505 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnR_3 <400> 1505 ggagttcaga cgtgtgctct tccgatctag cacgtttaga atctggcg 48 <210> 1506 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnR_4 <400> 1506 ggagttcaga cgtgtgctct tccgatctac aagcccgtga agatgagt 48 <210> 1507 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnR_5 <400> 1507 ggagttcaga cgtgtgctct tccgatctgc caggtaagag gactttagga a 51 <210> 1508 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set10_ilmnR_6 <400> 1508 ggagttcaga cgtgtgctct tccgatcttt cccgtgtcac atagcgta 48 <210> 1509 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set11_ilmnF_1 <400> 1509 ggagttcaga cgtgtgctct tccgatctga gaggcacgag aacacaca 48 <210> 1510 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set11_ilmnF_2 <400> 1510 ggagttcaga cgtgtgctct tccgatctag gctagaaata cgtggcaaag 50 <210> 1511 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set11_ilmnR_1 <400> 1511 ggagttcaga cgtgtgctct tccgatctag cacgtttaga atctggcg 48 <210> 1512 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: homolog screen target set11_ilmnR_2 <400> 1512 ggagttcaga cgtgtgctct tccgatctag gctagaaata cgtggcaaag 50 <210> 1513 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: oCB5714 <400> 1513 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tg 82 <210> 1514 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: oCB5715 <400> 1514 gctgttagag agataattgg aattaatttg actgtaaaca caaagatatt agtacaaaat 60 acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 120 atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 180 ttgtggaaag gacgaaacac 200 <210> 1515 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: oCB5717 <400> 1515 gccccagctg gttctttccg 20 <210> 1516 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa345_Pseud <400> 1516 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgtactc 60 gtcggcatcc accacgtcgt ccatgtcggt tcatccccgc aggtgcgggg aacacagaat 120 gcatttgcca agtcctacag actccaacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1517 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa346_Pseud <400> 1517 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccgctt 60 cccctctcag gccagcttcc ctaaggcggt tcatccccgc aggtgcgggg aacacgggtc 120 cagtggatgc cacagcccag cttggcccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1518 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa347_Pseud <400> 1518 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccgctt 60 cccctctcag gccagcttcc ctaaggcggt tcatccccgc aggtgcgggg aacacgggtc 120 cagtggatgc cacagcccag cttggcccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1519 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa348_Pseud <400> 1519 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacaagtgc 60 ttggtgaggg cttccagcag ctcctgcggt tcatccccgc aggtgcgggg aacaccactg 120 tgcccatgct gaaagaggcc tgccgggcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1520 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa349_Pseud <400> 1520 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacacacat 60 gcttttaaga aacgtcaatg tatatccggt tcatccccgc aggtgcgggg aacacgcata 120 cagcattcaa aaccagtgct ggaatagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1521 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa350_Pseud <400> 1521 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactgctgg 60 gaattccaac catccaatcg gacaagcggt tcatccccgc aggtgcgggg aacacaaatg 120 ttattcatgc ttcttatttt aaaagtgcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1522 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa351_Pseud <400> 1522 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactctaaa 60 tataaaagag gactgcaatg ccatggcggt tcatccccgc aggtgcgggg aacacggctc 120 aggggcctcc aggttcacct cagtcttcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1523 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa352_Pseud <400> 1523 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgcatgt 60 ttggtaaaaa tgtttttgtg agagttcggt tcatccccgc aggtgcgggg aacacactta 120 aaaattttta aatgccctta aaagtgacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1524 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa353_Pseud <400> 1524 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacctggct 60 gcacaaacac cttctcgttt cagagtcggt tcatccccgc aggtgcgggg aacacgtgtt 120 ttatttttca tgtagtgtgc tccaccacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1525 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa354_Pseud <400> 1525 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagtcac 60 ctgaattttc tggtcatcca actcttcggt tcatccccgc aggtgcgggg aacacgtgca 120 gatacacacc ccgcaggaac atccctccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1526 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa355_Pseud <400> 1526 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactggcat 60 gaggaggggg aagctttttt gaatcgcggt tcatccccgc aggtgcgggg aacacaatga 120 attgatttcc ataaagcaaa tcttactcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1527 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa356_Pseud <400> 1527 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgcagcc 60 tctagagcct tcttgctttc attttccggt tcatccccgc aggtgcgggg aacactagct 120 ttgggtttca ggcacttcag taagagacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1528 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa357_Pseud <400> 1528 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacttttgt 60 ttcctgaaat tatcacatct ccatcacggt tcatccccgc aggtgcgggg aacactctct 120 tgcagtcgtc agcctgaaca taacatccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1529 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa358_Pseud <400> 1529 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagtcac 60 ctgaattttc tggtcatcca actcttcggt tcatccccgc aggtgcgggg aacacgtgca 120 gatacacacc ccgcaggaac atccctccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1530 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa359_Pseud <400> 1530 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccagact 60 tttataatct ccagtggcat ctttcccggt tcatccccgc aggtgcgggg aacactattc 120 atctttgcca gtctatcaaa tctgctgcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1531 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa360_Pseud <400> 1531 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgatgca 60 gaaaaggtag actggggcca ctgggtcggt tcatccccgc aggtgcgggg aacaccttcc 120 tggcagggat gtcagaccca gccttggcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1532 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa361_Pseud <400> 1532 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccgcaat 60 acaggaaccc ccaggggaaa gatgagcggt tcatccccgc aggtgcgggg aacacaaaat 120 acagggaaga aacggtaaaa atcaaagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1533 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa362_Pseud <400> 1533 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacacacat 60 tcggctccct ggagccagac tctggtcggt tcatccccgc aggtgcgggg aacaccgatt 120 gttcctggga gcttctccag accttggcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1534 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa363_Pseud <400> 1534 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccctcct 60 tcccaggtcc tccagccctt ctgcgacggt tcatccccgc aggtgcgggg aacactgctc 120 tccggccggg ccaacgcgcg gggcctgcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1535 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa364_Pseud <400> 1535 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccgtga 60 aatgggttgt gggccaaagc tttcttcggt tcatccccgc aggtgcgggg aacactgtat 120 ttttcagtaa tggcaatgca gatgcagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1536 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa365_Pseud <400> 1536 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactctccc 60 tagagatata atttagatat tcctatcggt tcatccccgc aggtgcgggg aacacggtgt 120 aaccactgcc aataggctgt ttctatgcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1537 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa366_Pseud <400> 1537 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacggagtt 60 gccatgattt tttcagtaaa gggcatcggt tcatccccgc aggtgcgggg aacacattta 120 tctcctttct tcaggcttcc agctggtcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1538 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa367_Pseud <400> 1538 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccttctc 60 accgtgtttt ctcttggtaa ctttcccggt tcatccccgc aggtgcgggg aacacgactg 120 ggctccttgg tggatgagtt taaggagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1539 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa368_Pseud <400> 1539 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactccctc 60 tcctgcagca gcctccgcag cgtgcgcggt tcatccccgc aggtgcgggg aacacttgct 120 gctggtggtg gccctgggga tcggcctcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1540 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa369_Pseud <400> 1540 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacacctca 60 gagtatgttc tgctgcttga actttacggt tcatccccgc aggtgcgggg aacacatgac 120 aaggtggaac tagccaatat gaatagacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1541 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa370_Pseud <400> 1541 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccattta 60 cctcagagta tgttctgctg cttgaacggt tcatccccgc aggtgcgggg aacacaaggt 120 ggaactagcc aatatgaata gacttttcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1542 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa371_Pseud <400> 1542 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacatactt 60 tatcaaattg taaaatttta taaaaccggt tcatccccgc aggtgcgggg aacacaaatg 120 aaatgcagtt tttcaaaaat aaatttccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1543 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa372_Pseud <400> 1543 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgtaaat 60 atttttaaaa ttcactgaat ttttgtcggt tcatccccgc aggtgcgggg aacacatcag 120 taagatcata agcagtgatc gagatctcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1544 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa373_Pseud <400> 1544 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacctattc 60 aacctcctta catgtcaggt ccactgcggt tcatccccgc aggtgcgggg aacacgtgct 120 gcagcagcac ttcaggaacc tggaggccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1545 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa374_Pseud <400> 1545 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccttca 60 cacaaaagaa cagtatatag tacaaacggt tcatccccgc aggtgcgggg aacacggtga 120 tggtgtagcc ctcccacttt gctgttccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1546 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa375_Pseud <400> 1546 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgtagag 60 cagcatccag aaagtctgtt attcctcggt tcatccccgc aggtgcgggg aacacaacac 120 tgatacccca aaataggatt ttccttccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1547 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa376_Pseud <400> 1547 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactcccag 60 catgctctgg ggaggcggct ctggctcggt tcatccccgc aggtgcgggg aacacaaata 120 aacaaaagaa agaaaagaaa aatagcccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1548 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa377_Pseud <400> 1548 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccattcg 60 gctccctgga gccagactct ggtcttcggt tcatccccgc aggtgcgggg aacacgccat 120 cgattgttcc tgggagcttc tccagaccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1549 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa378_Pseud <400> 1549 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacaagtca 60 cgcgcagtag aacatgaacg gcgcagcggt tcatccccgc aggtgcgggg aacacgatca 120 taaagacact gttctccctt caagttccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1550 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa379_Pseud <400> 1550 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagtttg 60 gtgcgaacgc cattctgggg gtgtcccggt tcatccccgc aggtgcgggg aacacaagtc 120 agcgatgtgg cggtacaggg ggacccccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1551 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa380_Pseud <400> 1551 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacctaaag 60 gtaccctcag tgtcaatgta catggccggt tcatccccgc aggtgcgggg aacacttcat 120 ttctactgtt gtttttgttc tctatagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1552 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa381_Pseud <400> 1552 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacacttgg 60 aaagggttta tcatacctca tagtcgcggt tcatccccgc aggtgcgggg aacaccttta 120 aaacatattt ttctttgttt taagccgcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1553 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa382_Pseud <400> 1553 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccataaa 60 taagtttcca ggctaaaaaa actatccggt tcatccccgc aggtgcgggg aacactagtt 120 ttgagatgct aggattatac tgtgattcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1554 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa383_Pseud <400> 1554 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacaggagt 60 cacctgaatt ttctggtcat ccaactcggt tcatccccgc aggtgcgggg aacacgtgca 120 gatacacacc ccgcaggaac atccctccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1555 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa384_Pseud <400> 1555 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccccaac 60 cccaggcagc ctctagagcc ttcttgcggt tcatccccgc aggtgcgggg aacacggttt 120 caggcacttc agtaagagac tttcccccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1556 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa385_Pseud <400> 1556 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactttcat 60 cccagggttc tctcctctcc tcacagcggt tcatccccgc aggtgcgggg aacacgccaa 120 atccttgcgt agcccgaagc ggtggcacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1557 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa386_Pseud <400> 1557 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccccag 60 cgcctatctt tctcctttgg ggaccacggt tcatccccgc aggtgcgggg aacaccccga 120 tccactaggg atgcactcac cgctggccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1558 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa387_Pseud <400> 1558 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgttttc 60 actccagcta acacagatgt aaaagacggt tcatccccgc aggtgcgggg aacactggtc 120 agtcttttat atctgaaaaa tgtgtaacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1559 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa388_Pseud <400> 1559 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgttgta 60 ggattctaca ttaattctct tgtgcccggt tcatccccgc aggtgcgggg aacacttaaa 120 gcaatttaaa aaaccaattc aggcttgcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1560 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa389_Pseud <400> 1560 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacctcctt 60 tccttagtgg tgtctatcga agatcccggt tcatccccgc aggtgcgggg aacaccccac 120 tacctggatt cctgcactgg ctgtgaacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1561 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa390_Pseud <400> 1561 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgtcatc 60 ggcatggacg tagcggcctc cgagttcggt tcatccccgc aggtgcgggg aacacggcga 120 gatgtacctg ctggggtcat cgggagacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1562 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa391_Pseud <400> 1562 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactaaccg 60 tgaaatgggt tgtgggccaa agctttcggt tcatccccgc aggtgcgggg aacactgtat 120 ttttcagtaa tggcaatgca gatgcagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1563 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa392_Pseud <400> 1563 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgggttg 60 tcttcattgg tgaacagcat gatcctcggt tcatccccgc aggtgcgggg aacacctcag 120 tgaagtgctg tgggtctgtg ccaacctcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1564 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa393_Pseud <400> 1564 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacttagaa 60 aaataacagt ggagagcaca gcttcacggt tcatccccgc aggtgcgggg aacactcctt 120 tcccctgtgt gggataatct ctcccagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1565 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa394_Pseud <400> 1565 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagttct 60 agtctctctg gggccacaca gaaactcggt tcatccccgc aggtgcgggg aacacagctc 120 caagacctgg tcccatggtc ctgcctacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1566 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa395_Pseud <400> 1566 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacggaggg 60 tgctttgttc cttctgcaga gtcgtgcggt tcatccccgc aggtgcgggg aacacggggc 120 cggcccaggc ctagggtgtg gaggagccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1567 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa396_Pseud <400> 1567 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgctctg 60 caaccaggag cccagtgggg agggtgcggt tcatccccgc aggtgcgggg aacacggagg 120 agccttgcca tcgggcttcc tgtctctcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1568 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa397_Pseud <400> 1568 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacattaat 60 atccttgtac ttacctgtca caaatacggt tcatccccgc aggtgcgggg aacacccaga 120 tatgaccatg tatttgtggc ttaaactcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1569 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa398_Pseud <400> 1569 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacaatgcc 60 cactgacctg gtggtgggta gctgctcggt tcatccccgc aggtgcgggg aacacagaat 120 ctctgcccat gagaactctg aggcctccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1570 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa399_Pseud <400> 1570 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactccttc 60 tccctgtatc tgaggatcat atactacggt tcatccccgc aggtgcgggg aacactgatc 120 ctgtaatctt tttctttcca gtaatcccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1571 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa400_Pseud <400> 1571 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acaccgaaca 60 acacaaatgg ataacggccc gcttaccggt tcatccccgc aggtgcgggg aacacagtac 120 agggcccgcg catgcgtgga ttgtcgtcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1572 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa401_Pseud <400> 1572 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacatgtaa 60 aagacttttt tttatacgat aaataacggt tcatccccgc aggtgcgggg aacaccaagc 120 aataaaaact gtacaatatt ggtcagtcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1573 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa402_Pseud <400> 1573 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagcttg 60 ggcagccacc tccttaggtg ttagtgcggt tcatccccgc aggtgcgggg aacacacagc 120 ggtaaataca gaacagaaaa taaccatcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1574 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa403_Pseud <400> 1574 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacggcggt 60 gggggaagac ttaaccgagt tgccgtcggt tcatccccgc aggtgcgggg aacacgggag 120 atgtagtccc gggccgacgc attacctcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1575 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa404_Pseud <400> 1575 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactggcat 60 gaggaggggg aagctttttt gaatcgcggt tcatccccgc aggtgcgggg aacactttat 120 taatgaattg atttccataa agcaaatcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1576 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa405_Pseud <400> 1576 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgtagag 60 cagcatccag aaagtctgtt attcctcggt tcatccccgc aggtgcgggg aacacgtcaa 120 acactgatac cccaaaatag gattttccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1577 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa406_Pseud <400> 1577 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccgctt 60 cccctctcag gccagcttcc ctaaggcggt tcatccccgc aggtgcgggg aacacgactc 120 tagggtccag tggatgccac agcccagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1578 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa407_Pseud <400> 1578 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccgctt 60 cccctctcag gccagcttcc ctaaggcggt tcatccccgc aggtgcgggg aacacgactc 120 tagggtccag tggatgccac agcccagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1579 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa408_Pseud <400> 1579 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacacaaaa 60 cataccctat caatggcact gcccttcggt tcatccccgc aggtgcgggg aacacttgtg 120 tcctggctaa atcagaactc gaatggccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1580 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa409_Pseud <400> 1580 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacggccac 60 cctggatggg agccgtgttc attacccggt tcatccccgc aggtgcgggg aacactgggg 120 ctggatatgg gtgagaacct ggagccgcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1581 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa410_Pseud <400> 1581 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactggaca 60 ttcatctgtt tccactgagt ctgagtcggt tcatccccgc aggtgcgggg aacacaaaaa 120 aaagttattt atcgtataaa aaaaagtcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1582 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa411_Pseud <400> 1582 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactttttt 60 ttttcctcct aaggaaggtt ttttttcggt tcatccccgc aggtgcgggg aacacgcact 120 gagacgctga gggtttcaaa gtcacatcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1583 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa412_Pseud <400> 1583 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagagca 60 cagaagtttt ctgctgtctt tggaatcggt tcatccccgc aggtgcgggg aacacgtgtt 120 cttagaaatt gccatcgaca gtgagcccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1584 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa413_Pseud <400> 1584 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacataata 60 agtattctct gttttcaggt gtgtagcggt tcatccccgc aggtgcgggg aacactggaa 120 ctttccttcc agagatgtgg ctactaacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1585 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa414_Pseud <400> 1585 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgccgta 60 gctgaaattg gctgcaccat gtcggccggt tcatccccgc aggtgcgggg aacaccactt 120 acagtcaaac accgtgtagt tgaagcccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1586 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa415_Pseud <400> 1586 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgagcat 60 tgcaatttca acgacgtcac aacccgcggt tcatccccgc aggtgcgggg aacactcaag 120 ctgttcgtta aagttacaca ggtccttcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1587 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa416_Pseud <400> 1587 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactttcca 60 cattccacat tctcattaac atttagcggt tcatccccgc aggtgcgggg aacacgatga 120 aaaatatgca aacatcactg tggattacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1588 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa417_Pseud <400> 1588 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacctattc 60 catttacctc agagtatgtt ctgctgcggt tcatccccgc aggtgcgggg aacacaaggt 120 ggaactagcc aatatgaata gacttttcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1589 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa418_Pseud <400> 1589 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacctaggg 60 atcatgaaat aataaactga aaaaaacggt tcatccccgc aggtgcgggg aacacccatt 120 taatcccatg ggcctctgct ccctcaacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1590 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa419_Pseud <400> 1590 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccagtt 60 gagcaggtac tgggagccaa tattgtcggt tcatccccgc aggtgcgggg aacactccac 120 cgtgcagctc atcacgcagc tcatgcccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1591 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa420_Pseud <400> 1591 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacggggac 60 agctctggaa aggggacgct cactcccggt tcatccccgc aggtgcgggg aacacgctgg 120 agggtggcag tgggaccgct ccggcggcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1592 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa421_Pseud <400> 1592 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacggggac 60 agctctggaa aggggacgct cactcccggt tcatccccgc aggtgcgggg aacacgctgg 120 agggtggcag tgggaccgct ccggcggcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1593 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa422_Pseud <400> 1593 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacaaatgg 60 tattaagctc atcatggaat ttctgccggt tcatccccgc aggtgcgggg aacactattt 120 tagctgctgt ttgaggttta ttttgttcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1594 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa423_Pseud <400> 1594 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactaacag 60 cacatgcatc tttccctcca gggccacggt tcatccccgc aggtgcgggg aacactttaa 120 cagccacctg ctcccctgta ttgtccccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1595 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa424_Pseud <400> 1595 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactgcatg 60 aactatgacc ccaatcagag gcctttcggt tcatccccgc aggtgcgggg aacacttaaa 120 gcagcacatg gcaggtctta ctctgctcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1596 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa425_Pseud <400> 1596 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacatgtgt 60 gtctaggcag gacctgtggc caagttcggt tcatccccgc aggtgcgggg aacacgattc 120 actacacgct ctggaatgtt cagttcccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1597 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa426_Pseud <400> 1597 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacaccagg 60 agcccagtgg ggagggtgct ttgttccggt tcatccccgc aggtgcgggg aacacggcct 120 agggtgtgga ggagccttgc catcgggcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1598 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa427_Pseud <400> 1598 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacttgcca 60 tgattttttc agtaaagggc atcttccggt tcatccccgc aggtgcgggg aacacaaatc 120 aaagaaaatt tatctccttt cttcaggcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1599 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa428_Pseud <400> 1599 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacggtttc 60 ctttagaaat aaagagatct cagcagcggt tcatccccgc aggtgcgggg aacacgtctt 120 ccttcacctt ccacaaagca actctttcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1600 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa429_Pseud <400> 1600 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagatca 60 gcaacaatga gggagcagct gcaccacggt tcatccccgc aggtgcgggg aacactccat 120 ctatttgtct ggtttttgca gccactacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1601 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa430_Pseud <400> 1601 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccatct 60 gggaactcaa gcaggaagga aggttccggt tcatccccgc aggtgcgggg aacactggca 120 tcaagaggtg ggagggccct ccgaccacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1602 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa431_Pseud <400> 1602 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacccatct 60 gggaactcaa gcaggaagga aggttccggt tcatccccgc aggtgcgggg aacactggca 120 tcaagaggtg ggagggccct ccgaccacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1603 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa432_Pseud <400> 1603 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacaaaaca 60 aaacataccc tatcaatggc actgcccggt tcatccccgc aggtgcgggg aacacttgtg 120 tcctggctaa atcagaactc gaatggccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1604 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa433_Pseud <400> 1604 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactacttt 60 tagaaaaata acagtggaga gcacagcggt tcatccccgc aggtgcgggg aacactcctt 120 tcccctgtgt gggataatct ctcccagcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1605 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa434_Pseud <400> 1605 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactttctc 60 ccaggaagct ttgattttta ccgtttcggt tcatccccgc aggtgcgggg aacactatca 120 ttacaagaga gcaggtgcaa aaggttacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1606 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa435_Pseud <400> 1606 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgctctg 60 tcgttcgtgg cgctcgtgga cggctacggt tcatccccgc aggtgcgggg aacacacttc 120 ctccagcagc ctcggcggtg ccacctccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1607 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa436_Pseud <400> 1607 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacggtact 60 ccccctcctt cccaggtcct ccagcccggt tcatccccgc aggtgcgggg aacactgctc 120 tccggccggg ccaacgcgcg gggcctgcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1608 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa437_Pseud <400> 1608 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgagcat 60 tgcaatttca acgacgtcac aacccgcggt tcatccccgc aggtgcgggg aacacttttc 120 aagctgttcg ttaaagttac acaggtccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1609 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa438_Pseud <400> 1609 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagtgct 60 cgcttcctgg tctccttggc gcgaaccggt tcatccccgc aggtgcgggg aacacagcat 120 agcagaggat gaggacctca gggttcacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1610 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa439_Pseud <400> 1610 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactttcaa 60 caatgttctc tagtttcaag ctccagcggt tcatccccgc aggtgcgggg aacacgtagt 120 tcagttatta ttgagtctca ctttctacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1611 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa440_Pseud <400> 1611 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacacacac 60 ccccaacccc aggcagcctc tagagccggt tcatccccgc aggtgcgggg aacacggttt 120 caggcacttc agtaagagac tttcccccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1612 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa345_ilmn_F <400> 1612 cactctttcc ctacacgacg ctcttccgat cttagcatct ctacgggcca tt 52 <210> 1613 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa346_ilmn_F <400> 1613 cactctttcc ctacacgacg ctcttccgat ctctcgttgg aagaggaaca gc 52 <210> 1614 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa347_ilmn_F <400> 1614 cactctttcc ctacacgacg ctcttccgat ctctcgttgg aagaggaaca gc 52 <210> 1615 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa348_ilmn_F <400> 1615 cactctttcc ctacacgacg ctcttccgat ctagaggagc tgaagaccca ca 52 <210> 1616 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa349_ilmn_F <400> 1616 cactctttcc ctacacgacg ctcttccgat ctcacagggt gatgattgat gg 52 <210> 1617 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa350_ilmn_F <400> 1617 cactctttcc ctacacgacg ctcttccgat ctgagaagga cttgataatc tgtgga 56 <210> 1618 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa351_ilmn_F <400> 1618 cactctttcc ctacacgacg ctcttccgat ctccgacaga tagaagatca cttcc 55 <210> 1619 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa352_ilmn_F <400> 1619 cactctttcc ctacacgacg ctcttccgat ctctgcatgg ccgacaagat 50 <210> 1620 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa353_ilmn_F <400> 1620 cactctttcc ctacacgacg ctcttccgat ctttggatgg aatactattt ggaaca 56 <210> 1621 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa354_ilmn_F <400> 1621 cactctttcc ctacacgacg ctcttccgat ctaccctgtt cagtgctctg ct 52 <210> 1622 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa355_ilmn_F <400> 1622 cactctttcc ctacacgacg ctcttccgat cttgcccatg actattctag caac 54 <210> 1623 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa356_ilmn_F <400> 1623 cactctttcc ctacacgacg ctcttccgat ctaacattgt tgaaaggctg gc 52 <210> 1624 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa357_ilmn_F <400> 1624 cactctttcc ctacacgacg ctcttccgat cttcaatcaa aggtggtctg ga 52 <210> 1625 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa358_ilmn_F <400> 1625 cactctttcc ctacacgacg ctcttccgat ctaccctgtt cagtgctctg ct 52 <210> 1626 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa359_ilmn_F <400> 1626 cactctttcc ctacacgacg ctcttccgat ctgagagaga gagaggcagg ca 52 <210> 1627 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa360_ilmn_F <400> 1627 cactctttcc ctacacgacg ctcttccgat cttcactgca ccatagagac gc 52 <210> 1628 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa361_ilmn_F <400> 1628 cactctttcc ctacacgacg ctcttccgat ctttggagga gagatgaggg aa 52 <210> 1629 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa362_ilmn_F <400> 1629 cactctttcc ctacacgacg ctcttccgat cttcctgtgt gagtgctgca a 51 <210> 1630 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa363_ilmn_F <400> 1630 cactctttcc ctacacgacg ctcttccgat ctggaatcct gcacccacta aa 52 <210> 1631 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa364_ilmn_F <400> 1631 cactctttcc ctacacgacg ctcttccgat ctgagagatg caccttattt ctctagtgt 59 <210> 1632 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa365_ilmn_F <400> 1632 cactctttcc ctacacgacg ctcttccgat ctaaatttcc aatagtttgg agactca 57 <210> 1633 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa366_ilmn_F <400> 1633 cactctttcc ctacacgacg ctcttccgat ctccagcacc acaggacata aa 52 <210> 1634 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa367_ilmn_F <400> 1634 cactctttcc ctacacgacg ctcttccgat ctgactcacc aggccactct tc 52 <210> 1635 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa368_ilmn_F <400> 1635 cactctttcc ctacacgacg ctcttccgat ctttgttcct ccacctcatt cc 52 <210> 1636 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa369_ilmn_F <400> 1636 cactctttcc ctacacgacg ctcttccgat ctttcatcag aataccacta ttttcatttt 60 <210> 1637 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa370_ilmn_F <400> 1637 cactctttcc ctacacgacg ctcttccgat ctttttcatt ttagttgcta ctctttgatt 60 <210> 1638 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa371_ilmn_F <400> 1638 cactctttcc ctacacgacg ctcttccgat cttgttgcct tggtgagtct tct 53 <210> 1639 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa372_ilmn_F <400> 1639 cactctttcc ctacacgacg ctcttccgat ctttatggag cttccattta gtggt 55 <210> 1640 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa373_ilmn_F <400> 1640 cactctttcc ctacacgacg ctcttccgat ctaacagaag tgacagcttt gagaac 56 <210> 1641 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa374_ilmn_F <400> 1641 cactctttcc ctacacgacg ctcttccgat ctgccttgtc ctcagccagt ta 52 <210> 1642 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa375_ilmn_F <400> 1642 cactctttcc ctacacgacg ctcttccgat ctatttaatc ccatgggcct ct 52 <210> 1643 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa376_ilmn_F <400> 1643 cactctttcc ctacacgacg ctcttccgat ctccacagga gcacatcaag ac 52 <210> 1644 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa377_ilmn_F <400> 1644 cactctttcc ctacacgacg ctcttccgat ctgttcctgt attgcggcag ag 52 <210> 1645 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa378_ilmn_F <400> 1645 cactctttcc ctacacgacg ctcttccgat ctaagcaggt accaagacac gc 52 <210> 1646 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa379_ilmn_F <400> 1646 cactctttcc ctacacgacg ctcttccgat ctcaactcct tgcttgggaa gt 52 <210> 1647 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa380_ilmn_F <400> 1647 cactctttcc ctacacgacg ctcttccgat ctaagggaat gcctccttcc ta 52 <210> 1648 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa381_ilmn_F <400> 1648 cactctttcc ctacacgacg ctcttccgat ctctcctctt tgaaacgatt agtaatga 58 <210> 1649 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa382_ilmn_F <400> 1649 cactctttcc ctacacgacg ctcttccgat cttgatttca gaaagtctca actacca 57 <210> 1650 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa383_ilmn_F <400> 1650 cactctttcc ctacacgacg ctcttccgat ctaccctgtt cagtgctctg ct 52 <210> 1651 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa384_ilmn_F <400> 1651 cactctttcc ctacacgacg ctcttccgat ctaacattgt tgaaaggctg gc 52 <210> 1652 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa385_ilmn_F <400> 1652 cactctttcc ctacacgacg ctcttccgat ctggactggc aggtcaagga ta 52 <210> 1653 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa386_ilmn_F <400> 1653 cactctttcc ctacacgacg ctcttccgat ctggcaacta ttccagcttc ca 52 <210> 1654 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa387_ilmn_F <400> 1654 cactctttcc ctacacgacg ctcttccgat ctggtcctgc ctagacacac atc 53 <210> 1655 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa388_ilmn_F <400> 1655 cactctttcc ctacacgacg ctcttccgat ctcacttcca attcagcaag ca 52 <210> 1656 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa389_ilmn_F <400> 1656 cactctttcc ctacacgacg ctcttccgat ctgttgactt tgagcaggag gc 52 <210> 1657 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa390_ilmn_F <400> 1657 cactctttcc ctacacgacg ctcttccgat ctcacctggg tagtccttga tga 53 <210> 1658 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa391_ilmn_F <400> 1658 cactctttcc ctacacgacg ctcttccgat ctgagagatg caccttattt ctctagtgt 59 <210> 1659 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa392_ilmn_F <400> 1659 cactctttcc ctacacgacg ctcttccgat ctgtttccaa gacatgatgg gc 52 <210> 1660 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa393_ilmn_F <400> 1660 cactctttcc ctacacgacg ctcttccgat cttttcatca tagggctttg cac 53 <210> 1661 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa394_ilmn_F <400> 1661 cactctttcc ctacacgacg ctcttccgat ctaagccatg gagatcagag ga 52 <210> 1662 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa395_ilmn_F <400> 1662 cactctttcc ctacacgacg ctcttccgat ctttcccttg actttggcat tt 52 <210> 1663 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa396_ilmn_F <400> 1663 cactctttcc ctacacgacg ctcttccgat ctttcccttg actttggcat tt 52 <210> 1664 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa397_ilmn_F <400> 1664 cactctttcc ctacacgacg ctcttccgat cttcttaggg acacggctga ct 52 <210> 1665 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa398_ilmn_F <400> 1665 cactctttcc ctacacgacg ctcttccgat ctagatgtct gtggagagcc gt 52 <210> 1666 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa399_ilmn_F <400> 1666 cactctttcc ctacacgacg ctcttccgat ctaaatgttt tggccttttg ga 52 <210> 1667 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa400_ilmn_F <400> 1667 cactctttcc ctacacgacg ctcttccgat ctcatgcgtg atgacgtaga gg 52 <210> 1668 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa401_ilmn_F <400> 1668 cactctttcc ctacacgacg ctcttccgat ctggtcctgc ctagacacac atc 53 <210> 1669 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa402_ilmn_F <400> 1669 cactctttcc ctacacgacg ctcttccgat cttttaccac acaaagtggg ca 52 <210> 1670 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa403_ilmn_F <400> 1670 cactctttcc ctacacgacg ctcttccgat ctaatagtcc agctgcgatg gt 52 <210> 1671 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa404_ilmn_F <400> 1671 cactctttcc ctacacgacg ctcttccgat cttgcccatg actattctag caac 54 <210> 1672 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa405_ilmn_F <400> 1672 cactctttcc ctacacgacg ctcttccgat ctatttaatc ccatgggcct ct 52 <210> 1673 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa406_ilmn_F <400> 1673 cactctttcc ctacacgacg ctcttccgat ctctcgttgg aagaggaaca gc 52 <210> 1674 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa407_ilmn_F <400> 1674 cactctttcc ctacacgacg ctcttccgat ctctcgttgg aagaggaaca gc 52 <210> 1675 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa408_ilmn_F <400> 1675 cactctttcc ctacacgacg ctcttccgat ctcccatcaa gccaactctc at 52 <210> 1676 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa409_ilmn_F <400> 1676 cactctttcc ctacacgacg ctcttccgat ctcaaccaat gaaaccaagg ct 52 <210> 1677 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa410_ilmn_F <400> 1677 cactctttcc ctacacgacg ctcttccgat ctcaagacaa aaatccaaca agca 54 <210> 1678 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa411_ilmn_F <400> 1678 cactctttcc ctacacgacg ctcttccgat ctggctaagg gcacaagaga atta 54 <210> 1679 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa412_ilmn_F <400> 1679 cactctttcc ctacacgacg ctcttccgat ctagccctgt actaccagcg tg 52 <210> 1680 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa413_ilmn_F <400> 1680 cactctttcc ctacacgacg ctcttccgat ctaaaccttt ggttggatgc tg 52 <210> 1681 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa414_ilmn_F <400> 1681 cactctttcc ctacacgacg ctcttccgat ctagttgccc atggtcacaa at 52 <210> 1682 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa415_ilmn_F <400> 1682 cactctttcc ctacacgacg ctcttccgat ctctgctgcc agaaatggag tc 52 <210> 1683 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa416_ilmn_F <400> 1683 cactctttcc ctacacgacg ctcttccgat ctgggatatt tggttagttg atttgatatt 60 <210> 1684 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa417_ilmn_F <400> 1684 cactctttcc ctacacgacg ctcttccgat ctttttcatt ttagttgcta ctctttgatt 60 <210> 1685 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa418_ilmn_F <400> 1685 cactctttcc ctacacgacg ctcttccgat ctttcttgtc aggccctaca cc 52 <210> 1686 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa419_ilmn_F <400> 1686 cactctttcc ctacacgacg ctcttccgat ctctccagga agcctacgtg at 52 <210> 1687 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa420_ilmn_F <400> 1687 cactctttcc ctacacgacg ctcttccgat ctcccagagc ctcagagaag g 51 <210> 1688 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa421_ilmn_F <400> 1688 cactctttcc ctacacgacg ctcttccgat ctcccagagc ctcagagaag g 51 <210> 1689 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa422_ilmn_F <400> 1689 cactctttcc ctacacgacg ctcttccgat ctttacccag gacagagtgc ct 52 <210> 1690 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa423_ilmn_F <400> 1690 cactctttcc ctacacgacg ctcttccgat ctacctccac tctcaggctt ca 52 <210> 1691 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa424_ilmn_F <400> 1691 cactctttcc ctacacgacg ctcttccgat ctaaacagag tgaaaggcag tcg 53 <210> 1692 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa425_ilmn_F <400> 1692 cactctttcc ctacacgacg ctcttccgat ctccacggga atggagagat ta 52 <210> 1693 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa426_ilmn_F <400> 1693 cactctttcc ctacacgacg ctcttccgat ctttcccttg actttggcat tt 52 <210> 1694 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa427_ilmn_F <400> 1694 cactctttcc ctacacgacg ctcttccgat ctccagcacc acaggacata aa 52 <210> 1695 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa428_ilmn_F <400> 1695 cactctttcc ctacacgacg ctcttccgat cttcatcctg agcactctgt gg 52 <210> 1696 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa429_ilmn_F <400> 1696 cactctttcc ctacacgacg ctcttccgat ctgcctcagg ctgtctgaac tc 52 <210> 1697 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa430_ilmn_F <400> 1697 cactctttcc ctacacgacg ctcttccgat ctcagaagcc ctgatgtgtc ct 52 <210> 1698 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa431_ilmn_F <400> 1698 cactctttcc ctacacgacg ctcttccgat ctcagaagcc ctgatgtgtc ct 52 <210> 1699 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa432_ilmn_F <400> 1699 cactctttcc ctacacgacg ctcttccgat ctcccatcaa gccaactctc at 52 <210> 1700 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa433_ilmn_F <400> 1700 cactctttcc ctacacgacg ctcttccgat cttttcatca tagggctttg cac 53 <210> 1701 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa434_ilmn_F <400> 1701 cactctttcc ctacacgacg ctcttccgat ctagaacaag ggaggagctg gt 52 <210> 1702 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa435_ilmn_F <400> 1702 cactctttcc ctacacgacg ctcttccgat ctacaggtcc ttacgtgatg gg 52 <210> 1703 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa436_ilmn_F <400> 1703 cactctttcc ctacacgacg ctcttccgat ctggaatcct gcacccacta aa 52 <210> 1704 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa437_ilmn_F <400> 1704 cactctttcc ctacacgacg ctcttccgat ctctgctgcc agaaatggag tc 52 <210> 1705 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa438_ilmn_F <400> 1705 cactctttcc ctacacgacg ctcttccgat ctccttgact tgatgcacct ga 52 <210> 1706 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa439_ilmn_F <400> 1706 cactctttcc ctacacgacg ctcttccgat ctaggagagt agaattgggc tgg 53 <210> 1707 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa440_ilmn_F <400> 1707 cactctttcc ctacacgacg ctcttccgat ctaacattgt tgaaaggctg gc 52 <210> 1708 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa345_ilmn_R <400> 1708 ggagttcaga cgtgtgctct tccgatctta ccagagagct caggaggg 48 <210> 1709 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa346_ilmn_R <400> 1709 ggagttcaga cgtgtgctct tccgatctac agtctctgaa tgggtcgc 48 <210> 1710 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa347_ilmn_R <400> 1710 ggagttcaga cgtgtgctct tccgatctac agtctctgaa tgggtcgc 48 <210> 1711 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa348_ilmn_R <400> 1711 ggagttcaga cgtgtgctct tccgatctta actggctgag gacaaggc 48 <210> 1712 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa349_ilmn_R <400> 1712 ggagttcaga cgtgtgctct tccgatctac tcattcccag aacctgga 48 <210> 1713 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa350_ilmn_R <400> 1713 ggagttcaga cgtgtgctct tccgatctaa aagtcattgc atttccaaaa 50 <210> 1714 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa351_ilmn_R <400> 1714 ggagttcaga cgtgtgctct tccgatctcc aacaccaaat gtttctgc 48 <210> 1715 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa352_ilmn_R <400> 1715 ggagttcaga cgtgtgctct tccgatcttg ttcacctgtt tcatctgagg 50 <210> 1716 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa353_ilmn_R <400> 1716 ggagttcaga cgtgtgctct tccgatctca gcaaccacac ccatagtg 48 <210> 1717 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa354_ilmn_R <400> 1717 ggagttcaga cgtgtgctct tccgatctgg ttcagaagcc ctggaaat 48 <210> 1718 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa355_ilmn_R <400> 1718 ggagttcaga cgtgtgctct tccgatctag ctggatccac atggtctt 48 <210> 1719 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa356_ilmn_R <400> 1719 ggagttcaga cgtgtgctct tccgatctaa ggaatggtcc tctgggag 48 <210> 1720 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa357_ilmn_R <400> 1720 ggagttcaga cgtgtgctct tccgatctcc ggaggtccca aacagt 46 <210> 1721 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa358_ilmn_R <400> 1721 ggagttcaga cgtgtgctct tccgatctgg ttcagaagcc ctggaaat 48 <210> 1722 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa359_ilmn_R <400> 1722 ggagttcaga cgtgtgctct tccgatcttc agactcccag aattgggt 48 <210> 1723 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa360_ilmn_R <400> 1723 ggagttcaga cgtgtgctct tccgatctgt cagcatgatg tcagaggc 48 <210> 1724 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa361_ilmn_R <400> 1724 ggagttcaga cgtgtgctct tccgatcttt gcagcactca cacagga 47 <210> 1725 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa362_ilmn_R <400> 1725 ggagttcaga cgtgtgctct tccgatctat ctcttacgcc caaccctt 48 <210> 1726 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa363_ilmn_R <400> 1726 ggagttcaga cgtgtgctct tccgatcttt gaatggcaaa gggatagg 48 <210> 1727 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa364_ilmn_R <400> 1727 ggagttcaga cgtgtgctct tccgatctgt aaaggttgta ataccttcca ctaggt 56 <210> 1728 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa365_ilmn_R <400> 1728 ggagttcaga cgtgtgctct tccgatctaa catttggtag ttgagacttt ctga 54 <210> 1729 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa366_ilmn_R <400> 1729 ggagttcaga cgtgtgctct tccgatctga tagccttcat cttgccca 48 <210> 1730 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa367_ilmn_R <400> 1730 ggagttcaga cgtgtgctct tccgatctta gcccacatgt ccacattc 48 <210> 1731 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa368_ilmn_R <400> 1731 ggagttcaga cgtgtgctct tccgatctaa ctgctaatgg cccgttct 48 <210> 1732 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa369_ilmn_R <400> 1732 ggagttcaga cgtgtgctct tccgatctat ggtacttgat tgctattcca tt 52 <210> 1733 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa370_ilmn_R <400> 1733 ggagttcaga cgtgtgctct tccgatcttt cactgaatat ggtacttgat tgc 53 <210> 1734 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa371_ilmn_R <400> 1734 ggagttcaga cgtgtgctct tccgatctga tgcaatgcca acttgaga 48 <210> 1735 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa372_ilmn_R <400> 1735 ggagttcaga cgtgtgctct tccgatctgc tgatcttaaa atattactga cctgg 55 <210> 1736 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa373_ilmn_R <400> 1736 ggagttcaga cgtgtgctct tccgatctga gaggactggg aaatgcac 48 <210> 1737 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa374_ilmn_R <400> 1737 ggagttcaga cgtgtgctct tccgatcttg gatgcaaggc atacacac 48 <210> 1738 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa375_ilmn_R <400> 1738 ggagttcaga cgtgtgctct tccgatctgc aacatccttc aattgcg 47 <210> 1739 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa376_ilmn_R <400> 1739 ggagttcaga cgtgtgctct tccgatctca tcctcccagc atgctcta 48 <210> 1740 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa377_ilmn_R <400> 1740 ggagttcaga cgtgtgctct tccgatctac ctcagaggct gttcttgg 48 <210> 1741 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa378_ilmn_R <400> 1741 ggagttcaga cgtgtgctct tccgatctct tctttcgaat cccaaatacc t 51 <210> 1742 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa379_ilmn_R <400> 1742 ggagttcaga cgtgtgctct tccgatctag ggcagtacag caggagaa 48 <210> 1743 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa380_ilmn_R <400> 1743 ggagttcaga cgtgtgctct tccgatctac ctacctctca gccactgc 48 <210> 1744 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa381_ilmn_R <400> 1744 ggagttcaga cgtgtgctct tccgatctct tcatcaaata tgtcaccaga agtt 54 <210> 1745 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa382_ilmn_R <400> 1745 ggagttcaga cgtgtgctct tccgatcttg atagaagact caccaaggca 50 <210> 1746 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa383_ilmn_R <400> 1746 ggagttcaga cgtgtgctct tccgatctgg ttcagaagcc ctggaaat 48 <210> 1747 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa384_ilmn_R <400> 1747 ggagttcaga cgtgtgctct tccgatctaa ggaatggtcc tctgggag 48 <210> 1748 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa385_ilmn_R <400> 1748 ggagttcaga cgtgtgctct tccgatcttc actcctactg aggctggg 48 <210> 1749 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa386_ilmn_R <400> 1749 ggagttcaga cgtgtgctct tccgatctgt tcatgcagcc tcttgtcc 48 <210> 1750 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa387_ilmn_R <400> 1750 ggagttcaga cgtgtgctct tccgatcttt ccactgagtc tgagtcttca a 51 <210> 1751 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa388_ilmn_R <400> 1751 ggagttcaga cgtgtgctct tccgatctga aaccctcagc gtctcagt 48 <210> 1752 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa389_ilmn_R <400> 1752 ggagttcaga cgtgtgctct tccgatctca cactgatgaa gcgtgtcc 48 <210> 1753 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa390_ilmn_R <400> 1753 ggagttcaga cgtgtgctct tccgatcttt gggaaagctg gctacact 48 <210> 1754 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa391_ilmn_R <400> 1754 ggagttcaga cgtgtgctct tccgatctgt aaaggttgta ataccttcca ctaggt 56 <210> 1755 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa392_ilmn_R <400> 1755 ggagttcaga cgtgtgctct tccgatcttg ccaatttaag agaacggg 48 <210> 1756 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa393_ilmn_R <400> 1756 ggagttcaga cgtgtgctct tccgatctag cagaagagga cagtaaacaa tg 52 <210> 1757 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa394_ilmn_R <400> 1757 ggagttcaga cgtgtgctct tccgatctag aacaggcctc ccaagttt 48 <210> 1758 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa395_ilmn_R <400> 1758 ggagttcaga cgtgtgctct tccgatctgt gaggacttgg agctctgc 48 <210> 1759 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa396_ilmn_R <400> 1759 ggagttcaga cgtgtgctct tccgatctca ggcgtatctg tgtgagga 48 <210> 1760 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa397_ilmn_R <400> 1760 ggagttcaga cgtgtgctct tccgatctag caggcttctc acttccag 48 <210> 1761 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa398_ilmn_R <400> 1761 ggagttcaga cgtgtgctct tccgatctat tctgggagac cagcacac 48 <210> 1762 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa399_ilmn_R <400> 1762 ggagttcaga cgtgtgctct tccgatcttg cttgccagct ctaatcaa 48 <210> 1763 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa400_ilmn_R <400> 1763 ggagttcaga cgtgtgctct tccgatcttc gcacacttaa ggctaacg 48 <210> 1764 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa401_ilmn_R <400> 1764 ggagttcaga cgtgtgctct tccgatcttt ccactgagtc tgagtcttca a 51 <210> 1765 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa402_ilmn_R <400> 1765 ggagttcaga cgtgtgctct tccgatctga agtcggcctc tctctcct 48 <210> 1766 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa403_ilmn_R <400> 1766 ggagttcaga cgtgtgctct tccgatctgc gagagtatcg tctgagcc 48 <210> 1767 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa404_ilmn_R <400> 1767 ggagttcaga cgtgtgctct tccgatctga tccacatggt cttgaggg 48 <210> 1768 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa405_ilmn_R <400> 1768 ggagttcaga cgtgtgctct tccgatctgc aacatccttc aattgcg 47 <210> 1769 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa406_ilmn_R <400> 1769 ggagttcaga cgtgtgctct tccgatctac agtctctgaa tgggtcgc 48 <210> 1770 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa407_ilmn_R <400> 1770 ggagttcaga cgtgtgctct tccgatctac agtctctgaa tgggtcgc 48 <210> 1771 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa408_ilmn_R <400> 1771 ggagttcaga cgtgtgctct tccgatctac caaacacagc agggactc 48 <210> 1772 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa409_ilmn_R <400> 1772 ggagttcaga cgtgtgctct tccgatctac ctctgttctg agccgcta 48 <210> 1773 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa410_ilmn_R <400> 1773 ggagttcaga cgtgtgctct tccgatctag agggtccagc ctcaagat 48 <210> 1774 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa411_ilmn_R <400> 1774 ggagttcaga cgtgtgctct tccgatctgg agtggcctct ttgtgtgt 48 <210> 1775 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa412_ilmn_R <400> 1775 ggagttcaga cgtgtgctct tccgatctcc accctgacac ataaaccc 48 <210> 1776 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa413_ilmn_R <400> 1776 ggagttcaga cgtgtgctct tccgatctaa tgattgttgg agtgctttca 50 <210> 1777 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa414_ilmn_R <400> 1777 ggagttcaga cgtgtgctct tccgatctgc caatgtttgg agtctggt 48 <210> 1778 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa415_ilmn_R <400> 1778 ggagttcaga cgtgtgctct tccgatcttt acccttgtgt gtgtctccc 49 <210> 1779 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa416_ilmn_R <400> 1779 ggagttcaga cgtgtgctct tccgatctat gcacctcatt gtttgtgc 48 <210> 1780 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa417_ilmn_R <400> 1780 ggagttcaga cgtgtgctct tccgatcttt cactgaatat ggtacttgat tgc 53 <210> 1781 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa418_ilmn_R <400> 1781 ggagttcaga cgtgtgctct tccgatctca tggtagagca gcatccag 48 <210> 1782 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa419_ilmn_R <400> 1782 ggagttcaga cgtgtgctct tccgatctcc gtatctccct tccctgat 48 <210> 1783 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa420_ilmn_R <400> 1783 ggagttcaga cgtgtgctct tccgatctgt ttcgcgtttt ctggatgt 48 <210> 1784 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa421_ilmn_R <400> 1784 ggagttcaga cgtgtgctct tccgatctgt ttcgcgtttt ctggatgt 48 <210> 1785 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa422_ilmn_R <400> 1785 ggagttcaga cgtgtgctct tccgatctct catttggcag cctcagac 48 <210> 1786 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa423_ilmn_R <400> 1786 ggagttcaga cgtgtgctct tccgatctga cttctgtgtg ttccgtgg 48 <210> 1787 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa424_ilmn_R <400> 1787 ggagttcaga cgtgtgctct tccgatcttg taaggagctg gctgacct 48 <210> 1788 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa425_ilmn_R <400> 1788 ggagttcaga cgtgtgctct tccgatcttg cttgttggat ttttgtcttg 50 <210> 1789 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa426_ilmn_R <400> 1789 ggagttcaga cgtgtgctct tccgatctgt gaggacttgg agctctgc 48 <210> 1790 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa427_ilmn_R <400> 1790 ggagttcaga cgtgtgctct tccgatctga tagccttcat cttgccca 48 <210> 1791 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa428_ilmn_R <400> 1791 ggagttcaga cgtgtgctct tccgatctag ccttaccctg gcatcttt 48 <210> 1792 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa429_ilmn_R <400> 1792 ggagttcaga cgtgtgctct tccgatctag ctggaggtag tggagcaa 48 <210> 1793 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa430_ilmn_R <400> 1793 ggagttcaga cgtgtgctct tccgatctgg cctcagaatc cacaaaga 48 <210> 1794 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa431_ilmn_R <400> 1794 ggagttcaga cgtgtgctct tccgatctgg cctcagaatc cacaaaga 48 <210> 1795 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa432_ilmn_R <400> 1795 ggagttcaga cgtgtgctct tccgatctac caaacacagc agggactc 48 <210> 1796 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa433_ilmn_R <400> 1796 ggagttcaga cgtgtgctct tccgatctag cagaagagga cagtaaacaa tg 52 <210> 1797 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa434_ilmn_R <400> 1797 ggagttcaga cgtgtgctct tccgatctct ctgccgcaat acaggaac 48 <210> 1798 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa435_ilmn_R <400> 1798 ggagttcaga cgtgtgctct tccgatctgt ttcactgggc tctgacg 47 <210> 1799 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa436_ilmn_R <400> 1799 ggagttcaga cgtgtgctct tccgatcttt gaatggcaaa gggatagg 48 <210> 1800 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa437_ilmn_R <400> 1800 ggagttcaga cgtgtgctct tccgatcttt acccttgtgt gtgtctccc 49 <210> 1801 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa438_ilmn_R <400> 1801 ggagttcaga cgtgtgctct tccgatctcc cagcctgctt ctgattta 48 <210> 1802 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa439_ilmn_R <400> 1802 ggagttcaga cgtgtgctct tccgatctga agtgcctgaa acccaaag 48 <210> 1803 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa440_ilmn_R <400> 1803 ggagttcaga cgtgtgctct tccgatctaa ggaatggtcc tctgggag 48 <210> 1804 <211> 8729 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas3-10aa-FokI <400> 1804 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaaggg gggcagcgga agtagtggcg ggagtgggca 3660 gctggtgaag tccgagctgg aggagaagaa gagcgagctg cgccacaagc tgaagtacgt 3720 gccccacgag tatatcgagc tgatcgagat cgccaggaat cctacccagg atcgcatcct 3780 ggagatgaaa gtgatggagt tctttatgaa ggtgtacggc tataggggag agcacctggg 3840 aggcagccgc aagcctgacg gcgccatcta cacagtgggc tccccaatcg actatggcgt 3900 gatcgtggat accaaggcct acagcggcgg ctataacctg ccaatcggac aggcagacga 3960 gatgcagcgg tacgtggagg agaaccagac aagaaataag cacatcaacc caaatgagtg 4020 gtggaaggtg tatccctcct ctgtgaccga gttcaagttt ctgttcgtgt ccggccactt 4080 taagggcaac tacaaggccc agctgacacg gctgaatcac atcaccaact gtaatggcgc 4140 cgtgctgtct gtggaggagc tgctgatcgg cggcgagatg atcaaggccg gcaccctgac 4200 actggaggag gtgagaagga agtttaacaa tggcgagatc aatttctaac attggaagtg 4260 gataatctag agggccctat tctatagtgt cacctaaatg ctagagctcg ctgatcagcc 4320 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 4380 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 4440 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 4500 gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 4560 gaaagaacca gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc 4620 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 4680 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 4740 ctaaatcggg gcatcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 4800 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 4860 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 4920 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttggggat ttcggcctat 4980 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt 5040 gtcagttagg gtgtggaaag tccccaggct ccccaggcag gcagaagtat gcaaagcatg 5100 catctcaatt agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt 5160 atgcaaagca tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc 5220 ccgcccctaa ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt 5280 atttatgcag aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc 5340 ttttttggag gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga 5400 tctgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 5460 ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 5520 ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 5580 aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 5640 ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 5700 gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 5760 gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 5820 acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 5880 gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 5940 ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg atctcgtcgt gacccatggc 6000 gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 6060 ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 6120 gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 6180 gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagc gggactctgg 6240 ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 6300 ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 6360 tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 6420 ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 6480 tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtataccgt 6540 cgacctctag ctagagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 6600 atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 6660 cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 6720 gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 6780 gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 6840 ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 6900 acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 6960 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 7020 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 7080 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 7140 tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt 7200 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 7260 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 7320 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 7380 tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 7440 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 7500 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 7560 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 7620 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 7680 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 7740 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 7800 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 7860 caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7920 ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 7980 attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 8040 ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 8100 gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 8160 ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 8220 tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 8280 gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 8340 cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 8400 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 8460 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 8520 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 8580 gttgaatact catactcttc ctttttcatt attattgaag catttatcag ggttattgtc 8640 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 8700 catttccccg aaaagtgcca cctgacgtc 8729 <210> 1805 <211> 8750 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas3-17aa-FokI <400> 1805 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaaggc tgacccaact aacagagcta agggcctgga 3660 ggccgtatct gtggcatcac agctggtgaa gtccgagctg gaggagaaga agagcgagct 3720 gcgccacaag ctgaagtacg tgccccacga gtatatcgag ctgatcgaga tcgccaggaa 3780 tcctacccag gatcgcatcc tggagatgaa agtgatggag ttctttatga aggtgtacgg 3840 ctatagggga gagcacctgg gaggcagccg caagcctgac ggcgccatct acacagtggg 3900 ctccccaatc gactatggcg tgatcgtgga taccaaggcc tacagcggcg gctataacct 3960 gccaatcgga caggcagacg agatgcagcg gtacgtggag gagaaccaga caagaaataa 4020 gcacatcaac ccaaatgagt ggtggaaggt gtatccctcc tctgtgaccg agttcaagtt 4080 tctgttcgtg tccggccact ttaagggcaa ctacaaggcc cagctgacac ggctgaatca 4140 catcaccaac tgtaatggcg ccgtgctgtc tgtggaggag ctgctgatcg gcggcgagat 4200 gatcaaggcc ggcaccctga cactggagga ggtgagaagg aagtttaaca atggcgagat 4260 caatttctaa cattggaagt ggataatcta gagggcccta ttctatagtg tcacctaaat 4320 gctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 4380 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 4440 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 4500 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg 4560 ggctctatgg cttctgaggc ggaaagaacc agctggggct ctagggggta tccccacgcg 4620 ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 4680 cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 4740 gccggctttc cccgtcaagc tctaaatcgg ggcatccctt tagggttccg atttagtgct 4800 ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 4860 ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 4920 ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 4980 attttgggga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 5040 aattaattct gtggaatgtg tgtcagttag ggtgtggaaa gtccccaggc tccccaggca 5100 ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca 5160 ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc 5220 ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc 5280 catggctgac taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta 5340 ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga 5400 gcttgtatat ccattttcgg atctgatcaa gagacaggat gaggatcgtt tcgcatgatt 5460 gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat 5520 gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag 5580 gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaggac 5640 gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac 5700 gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc 5760 ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg 5820 ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag 5880 cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat 5940 caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag 6000 gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc 6060 ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg 6120 ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg 6180 ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag 6240 ttcttctgag cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat 6300 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 6360 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 6420 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 6480 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 6540 cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc 6600 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6660 taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6720 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6780 gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 6840 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 6900 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 6960 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7020 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7080 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7140 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct 7200 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7260 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7320 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7380 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 7440 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7500 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7560 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7620 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7680 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7740 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7800 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 7860 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 7920 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 7980 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8040 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8100 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8160 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8220 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8280 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8340 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8400 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8460 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8520 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8580 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcat tattattgaa 8640 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8700 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc 8750 <210> 1806 <211> 8789 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas3-30aa-FokI <400> 1806 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaagag cggctccgaa acgccgggta catccgagtc 3660 cgcgactcct gagtcaggag gcagcggctc ctctggtgga agcggctcaa gtggagggca 3720 gctggtgaag tccgagctgg aggagaagaa gagcgagctg cgccacaagc tgaagtacgt 3780 gccccacgag tatatcgagc tgatcgagat cgccaggaat cctacccagg atcgcatcct 3840 ggagatgaaa gtgatggagt tctttatgaa ggtgtacggc tataggggag agcacctggg 3900 aggcagccgc aagcctgacg gcgccatcta cacagtgggc tccccaatcg actatggcgt 3960 gatcgtggat accaaggcct acagcggcgg ctataacctg ccaatcggac aggcagacga 4020 gatgcagcgg tacgtggagg agaaccagac aagaaataag cacatcaacc caaatgagtg 4080 gtggaaggtg tatccctcct ctgtgaccga gttcaagttt ctgttcgtgt ccggccactt 4140 taagggcaac tacaaggccc agctgacacg gctgaatcac atcaccaact gtaatggcgc 4200 cgtgctgtct gtggaggagc tgctgatcgg cggcgagatg atcaaggccg gcaccctgac 4260 actggaggag gtgagaagga agtttaacaa tggcgagatc aatttctaac attggaagtg 4320 gataatctag agggccctat tctatagtgt cacctaaatg ctagagctcg ctgatcagcc 4380 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 4440 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 4500 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 4560 gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 4620 gaaagaacca gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc 4680 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 4740 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 4800 ctaaatcggg gcatcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 4860 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 4920 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 4980 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttggggat ttcggcctat 5040 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt 5100 gtcagttagg gtgtggaaag tccccaggct ccccaggcag gcagaagtat gcaaagcatg 5160 catctcaatt agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt 5220 atgcaaagca tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc 5280 ccgcccctaa ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt 5340 atttatgcag aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc 5400 ttttttggag gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga 5460 tctgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 5520 ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 5580 ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 5640 aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 5700 ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 5760 gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 5820 gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 5880 acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 5940 gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 6000 ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg atctcgtcgt gacccatggc 6060 gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 6120 ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 6180 gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 6240 gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagc gggactctgg 6300 ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 6360 ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 6420 tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 6480 ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 6540 tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtataccgt 6600 cgacctctag ctagagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 6660 atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 6720 cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 6780 gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 6840 gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 6900 ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 6960 acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 7020 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 7080 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 7140 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 7200 tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt 7260 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 7320 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 7380 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 7440 tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 7500 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 7560 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 7620 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 7680 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 7740 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 7800 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 7860 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 7920 caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7980 ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 8040 attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 8100 ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 8160 gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 8220 ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 8280 tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 8340 gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 8400 cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 8460 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 8520 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 8580 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 8640 gttgaatact catactcttc ctttttcatt attattgaag catttatcag ggttattgtc 8700 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 8760 catttccccg aaaagtgcca cctgacgtc 8789 <210> 1807 <211> 8819 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-Cas3-40aa-FokI <400> 1807 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaagag cggctccgaa acgccgggta catccgagtc 3660 cgcgactcct gagtcaggag gcagcggctc ctctggtgga agcggctcaa gtggagggag 3720 cggctcaagt ggtggaagcg gctcaagtca gctggtgaag tccgagctgg aggagaagaa 3780 gagcgagctg cgccacaagc tgaagtacgt gccccacgag tatatcgagc tgatcgagat 3840 cgccaggaat cctacccagg atcgcatcct ggagatgaaa gtgatggagt tctttatgaa 3900 ggtgtacggc tataggggag agcacctggg aggcagccgc aagcctgacg gcgccatcta 3960 cacagtgggc tccccaatcg actatggcgt gatcgtggat accaaggcct acagcggcgg 4020 ctataacctg ccaatcggac aggcagacga gatgcagcgg tacgtggagg agaaccagac 4080 aagaaataag cacatcaacc caaatgagtg gtggaaggtg tatccctcct ctgtgaccga 4140 gttcaagttt ctgttcgtgt ccggccactt taagggcaac tacaaggccc agctgacacg 4200 gctgaatcac atcaccaact gtaatggcgc cgtgctgtct gtggaggagc tgctgatcgg 4260 cggcgagatg atcaaggccg gcaccctgac actggaggag gtgagaagga agtttaacaa 4320 tggcgagatc aatttctaac attggaagtg gataatctag agggccctat tctatagtgt 4380 cacctaaatg ctagagctcg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 4440 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 4500 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 4560 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 4620 gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 4680 ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 4740 accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 4800 gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg gcatcccttt agggttccga 4860 tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 4920 gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 4980 agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 5040 ttataaggga ttttggggat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 5100 tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 5160 ccccaggcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac caggtgtgga 5220 aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca 5280 accatagtcc cgcccctaac tccgcccatc ccgcccctaa ctccgcccag ttccgcccat 5340 tctccgcccc atggctgact aatttttttt atttatgcag aggccgaggc cgcctctgcc 5400 tctgagctat tccagaagta gtgaggaggc ttttttggag gcctaggctt ttgcaaaaag 5460 ctcccgggag cttgtatatc cattttcgga tctgatcaag agacaggatg aggatcgttt 5520 cgcatgattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta 5580 ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg 5640 tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa 5700 ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct 5760 gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg 5820 caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca 5880 atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat 5940 cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac 6000 gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gcgcatgccc 6060 gacggcgagg atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa 6120 aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag 6180 gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc 6240 ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt 6300 cttgacgagt tcttctgagc gggactctgg ggttcgaaat gaccgaccaa gcgacgccca 6360 acctgccatc acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa 6420 tcgttttccg ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct 6480 tcgcccaccc caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 6540 caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 6600 tcaatgtatc ttatcatgtc tgtataccgt cgacctctag ctagagcttg gcgtaatcat 6660 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 6720 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 6780 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 6840 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 6900 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 6960 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 7020 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 7080 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 7140 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 7200 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 7260 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 7320 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 7380 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 7440 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 7500 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 7560 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 7620 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 7680 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 7740 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 7800 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 7860 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 7920 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 7980 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 8040 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 8100 cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 8160 cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 8220 cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 8280 agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 8340 tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 8400 agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 8460 atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 8520 ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 8580 cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 8640 caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcatt 8700 attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 8760 agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtc 8819 <210> 1808 <211> 8729 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-nCas3-10aa-FokI <400> 1808 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggct gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaaggg gggcagcgga agtagtggcg ggagtgggca 3660 gctggtgaag tccgagctgg aggagaagaa gagcgagctg cgccacaagc tgaagtacgt 3720 gccccacgag tatatcgagc tgatcgagat cgccaggaat cctacccagg atcgcatcct 3780 ggagatgaaa gtgatggagt tctttatgaa ggtgtacggc tataggggag agcacctggg 3840 aggcagccgc aagcctgacg gcgccatcta cacagtgggc tccccaatcg actatggcgt 3900 gatcgtggat accaaggcct acagcggcgg ctataacctg ccaatcggac aggcagacga 3960 gatgcagcgg tacgtggagg agaaccagac aagaaataag cacatcaacc caaatgagtg 4020 gtggaaggtg tatccctcct ctgtgaccga gttcaagttt ctgttcgtgt ccggccactt 4080 taagggcaac tacaaggccc agctgacacg gctgaatcac atcaccaact gtaatggcgc 4140 cgtgctgtct gtggaggagc tgctgatcgg cggcgagatg atcaaggccg gcaccctgac 4200 actggaggag gtgagaagga agtttaacaa tggcgagatc aatttctaac attggaagtg 4260 gataatctag agggccctat tctatagtgt cacctaaatg ctagagctcg ctgatcagcc 4320 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 4380 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 4440 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 4500 gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 4560 gaaagaacca gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc 4620 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 4680 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 4740 ctaaatcggg gcatcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 4800 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 4860 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 4920 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttggggat ttcggcctat 4980 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt 5040 gtcagttagg gtgtggaaag tccccaggct ccccaggcag gcagaagtat gcaaagcatg 5100 catctcaatt agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt 5160 atgcaaagca tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc 5220 ccgcccctaa ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt 5280 atttatgcag aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc 5340 ttttttggag gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga 5400 tctgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 5460 ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 5520 ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 5580 aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 5640 ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 5700 gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 5760 gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 5820 acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 5880 gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 5940 ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg atctcgtcgt gacccatggc 6000 gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 6060 ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 6120 gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 6180 gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagc gggactctgg 6240 ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 6300 ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 6360 tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 6420 ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 6480 tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtataccgt 6540 cgacctctag ctagagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 6600 atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 6660 cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 6720 gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 6780 gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 6840 ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 6900 acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 6960 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 7020 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 7080 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 7140 tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt 7200 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 7260 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 7320 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 7380 tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 7440 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 7500 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 7560 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 7620 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 7680 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 7740 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 7800 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 7860 caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7920 ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 7980 attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 8040 ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 8100 gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 8160 ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 8220 tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 8280 gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 8340 cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 8400 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 8460 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 8520 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 8580 gttgaatact catactcttc ctttttcatt attattgaag catttatcag ggttattgtc 8640 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 8700 catttccccg aaaagtgcca cctgacgtc 8729 <210> 1809 <211> 8750 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-nCas3-17aa-FokI <400> 1809 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggct gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaaggc tgacccaact aacagagcta agggcctgga 3660 ggccgtatct gtggcatcac agctggtgaa gtccgagctg gaggagaaga agagcgagct 3720 gcgccacaag ctgaagtacg tgccccacga gtatatcgag ctgatcgaga tcgccaggaa 3780 tcctacccag gatcgcatcc tggagatgaa agtgatggag ttctttatga aggtgtacgg 3840 ctatagggga gagcacctgg gaggcagccg caagcctgac ggcgccatct acacagtggg 3900 ctccccaatc gactatggcg tgatcgtgga taccaaggcc tacagcggcg gctataacct 3960 gccaatcgga caggcagacg agatgcagcg gtacgtggag gagaaccaga caagaaataa 4020 gcacatcaac ccaaatgagt ggtggaaggt gtatccctcc tctgtgaccg agttcaagtt 4080 tctgttcgtg tccggccact ttaagggcaa ctacaaggcc cagctgacac ggctgaatca 4140 catcaccaac tgtaatggcg ccgtgctgtc tgtggaggag ctgctgatcg gcggcgagat 4200 gatcaaggcc ggcaccctga cactggagga ggtgagaagg aagtttaaca atggcgagat 4260 caatttctaa cattggaagt ggataatcta gagggcccta ttctatagtg tcacctaaat 4320 gctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 4380 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 4440 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 4500 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg 4560 ggctctatgg cttctgaggc ggaaagaacc agctggggct ctagggggta tccccacgcg 4620 ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 4680 cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 4740 gccggctttc cccgtcaagc tctaaatcgg ggcatccctt tagggttccg atttagtgct 4800 ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 4860 ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 4920 ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 4980 attttgggga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 5040 aattaattct gtggaatgtg tgtcagttag ggtgtggaaa gtccccaggc tccccaggca 5100 ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca 5160 ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc 5220 ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc 5280 catggctgac taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta 5340 ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga 5400 gcttgtatat ccattttcgg atctgatcaa gagacaggat gaggatcgtt tcgcatgatt 5460 gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat 5520 gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag 5580 gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaggac 5640 gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac 5700 gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc 5760 ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg 5820 ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag 5880 cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat 5940 caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag 6000 gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc 6060 ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg 6120 ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg 6180 ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag 6240 ttcttctgag cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat 6300 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 6360 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 6420 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 6480 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 6540 cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc 6600 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6660 taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6720 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6780 gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 6840 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 6900 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 6960 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7020 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7080 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7140 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct 7200 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7260 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7320 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7380 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 7440 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7500 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7560 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7620 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7680 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7740 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7800 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 7860 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 7920 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 7980 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8040 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8100 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8160 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8220 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8280 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8340 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8400 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8460 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8520 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8580 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcat tattattgaa 8640 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8700 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc 8750 <210> 1810 <211> 8789 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-nCas3-30aa-FokI <400> 1810 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggct gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaagag cggctccgaa acgccgggta catccgagtc 3660 cgcgactcct gagtcaggag gcagcggctc ctctggtgga agcggctcaa gtggagggca 3720 gctggtgaag tccgagctgg aggagaagaa gagcgagctg cgccacaagc tgaagtacgt 3780 gccccacgag tatatcgagc tgatcgagat cgccaggaat cctacccagg atcgcatcct 3840 ggagatgaaa gtgatggagt tctttatgaa ggtgtacggc tataggggag agcacctggg 3900 aggcagccgc aagcctgacg gcgccatcta cacagtgggc tccccaatcg actatggcgt 3960 gatcgtggat accaaggcct acagcggcgg ctataacctg ccaatcggac aggcagacga 4020 gatgcagcgg tacgtggagg agaaccagac aagaaataag cacatcaacc caaatgagtg 4080 gtggaaggtg tatccctcct ctgtgaccga gttcaagttt ctgttcgtgt ccggccactt 4140 taagggcaac tacaaggccc agctgacacg gctgaatcac atcaccaact gtaatggcgc 4200 cgtgctgtct gtggaggagc tgctgatcgg cggcgagatg atcaaggccg gcaccctgac 4260 actggaggag gtgagaagga agtttaacaa tggcgagatc aatttctaac attggaagtg 4320 gataatctag agggccctat tctatagtgt cacctaaatg ctagagctcg ctgatcagcc 4380 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 4440 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 4500 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 4560 gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 4620 gaaagaacca gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc 4680 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 4740 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 4800 ctaaatcggg gcatcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 4860 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 4920 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 4980 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttggggat ttcggcctat 5040 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt 5100 gtcagttagg gtgtggaaag tccccaggct ccccaggcag gcagaagtat gcaaagcatg 5160 catctcaatt agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt 5220 atgcaaagca tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc 5280 ccgcccctaa ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt 5340 atttatgcag aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc 5400 ttttttggag gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga 5460 tctgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 5520 ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 5580 ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 5640 aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 5700 ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 5760 gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 5820 gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 5880 acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 5940 gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 6000 ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg atctcgtcgt gacccatggc 6060 gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 6120 ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 6180 gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 6240 gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagc gggactctgg 6300 ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 6360 ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 6420 tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 6480 ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 6540 tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtataccgt 6600 cgacctctag ctagagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 6660 atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 6720 cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 6780 gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 6840 gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 6900 ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 6960 acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 7020 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 7080 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 7140 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 7200 tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt 7260 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 7320 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 7380 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 7440 tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 7500 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 7560 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 7620 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 7680 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 7740 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 7800 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 7860 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 7920 caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7980 ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 8040 attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 8100 ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 8160 gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 8220 ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 8280 tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 8340 gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 8400 cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 8460 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 8520 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 8580 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 8640 gttgaatact catactcttc ctttttcatt attattgaag catttatcag ggttattgtc 8700 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 8760 catttccccg aaaagtgcca cctgacgtc 8789 <210> 1811 <211> 8819 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-nCas3-40aa-FokI <400> 1811 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggct gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaagag cggctccgaa acgccgggta catccgagtc 3660 cgcgactcct gagtcaggag gcagcggctc ctctggtgga agcggctcaa gtggagggag 3720 cggctcaagt ggtggaagcg gctcaagtca gctggtgaag tccgagctgg aggagaagaa 3780 gagcgagctg cgccacaagc tgaagtacgt gccccacgag tatatcgagc tgatcgagat 3840 cgccaggaat cctacccagg atcgcatcct ggagatgaaa gtgatggagt tctttatgaa 3900 ggtgtacggc tataggggag agcacctggg aggcagccgc aagcctgacg gcgccatcta 3960 cacagtgggc tccccaatcg actatggcgt gatcgtggat accaaggcct acagcggcgg 4020 ctataacctg ccaatcggac aggcagacga gatgcagcgg tacgtggagg agaaccagac 4080 aagaaataag cacatcaacc caaatgagtg gtggaaggtg tatccctcct ctgtgaccga 4140 gttcaagttt ctgttcgtgt ccggccactt taagggcaac tacaaggccc agctgacacg 4200 gctgaatcac atcaccaact gtaatggcgc cgtgctgtct gtggaggagc tgctgatcgg 4260 cggcgagatg atcaaggccg gcaccctgac actggaggag gtgagaagga agtttaacaa 4320 tggcgagatc aatttctaac attggaagtg gataatctag agggccctat tctatagtgt 4380 cacctaaatg ctagagctcg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 4440 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 4500 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 4560 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 4620 gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 4680 ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 4740 accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 4800 gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg gcatcccttt agggttccga 4860 tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 4920 gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 4980 agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 5040 ttataaggga ttttggggat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 5100 tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 5160 ccccaggcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac caggtgtgga 5220 aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca 5280 accatagtcc cgcccctaac tccgcccatc ccgcccctaa ctccgcccag ttccgcccat 5340 tctccgcccc atggctgact aatttttttt atttatgcag aggccgaggc cgcctctgcc 5400 tctgagctat tccagaagta gtgaggaggc ttttttggag gcctaggctt ttgcaaaaag 5460 ctcccgggag cttgtatatc cattttcgga tctgatcaag agacaggatg aggatcgttt 5520 cgcatgattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta 5580 ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg 5640 tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa 5700 ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct 5760 gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg 5820 caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca 5880 atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat 5940 cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac 6000 gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gcgcatgccc 6060 gacggcgagg atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa 6120 aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag 6180 gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc 6240 ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt 6300 cttgacgagt tcttctgagc gggactctgg ggttcgaaat gaccgaccaa gcgacgccca 6360 acctgccatc acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa 6420 tcgttttccg ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct 6480 tcgcccaccc caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 6540 caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 6600 tcaatgtatc ttatcatgtc tgtataccgt cgacctctag ctagagcttg gcgtaatcat 6660 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 6720 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 6780 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 6840 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 6900 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 6960 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 7020 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 7080 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 7140 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 7200 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 7260 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 7320 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 7380 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 7440 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 7500 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 7560 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 7620 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 7680 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 7740 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 7800 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 7860 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 7920 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 7980 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 8040 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 8100 cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 8160 cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 8220 cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 8280 agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 8340 tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 8400 agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 8460 atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 8520 ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 8580 cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 8640 caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcatt 8700 attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 8760 agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtc 8819 <210> 1812 <211> 8729 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-dCas3-10aa-FokI <400> 1812 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgcca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaaggg gggcagcgga agtagtggcg ggagtgggca 3660 gctggtgaag tccgagctgg aggagaagaa gagcgagctg cgccacaagc tgaagtacgt 3720 gccccacgag tatatcgagc tgatcgagat cgccaggaat cctacccagg atcgcatcct 3780 ggagatgaaa gtgatggagt tctttatgaa ggtgtacggc tataggggag agcacctggg 3840 aggcagccgc aagcctgacg gcgccatcta cacagtgggc tccccaatcg actatggcgt 3900 gatcgtggat accaaggcct acagcggcgg ctataacctg ccaatcggac aggcagacga 3960 gatgcagcgg tacgtggagg agaaccagac aagaaataag cacatcaacc caaatgagtg 4020 gtggaaggtg tatccctcct ctgtgaccga gttcaagttt ctgttcgtgt ccggccactt 4080 taagggcaac tacaaggccc agctgacacg gctgaatcac atcaccaact gtaatggcgc 4140 cgtgctgtct gtggaggagc tgctgatcgg cggcgagatg atcaaggccg gcaccctgac 4200 actggaggag gtgagaagga agtttaacaa tggcgagatc aatttctaac attggaagtg 4260 gataatctag agggccctat tctatagtgt cacctaaatg ctagagctcg ctgatcagcc 4320 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 4380 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 4440 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 4500 gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 4560 gaaagaacca gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc 4620 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 4680 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 4740 ctaaatcggg gcatcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 4800 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 4860 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 4920 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttggggat ttcggcctat 4980 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt 5040 gtcagttagg gtgtggaaag tccccaggct ccccaggcag gcagaagtat gcaaagcatg 5100 catctcaatt agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt 5160 atgcaaagca tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc 5220 ccgcccctaa ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt 5280 atttatgcag aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc 5340 ttttttggag gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga 5400 tctgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 5460 ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 5520 ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 5580 aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 5640 ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 5700 gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 5760 gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 5820 acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 5880 gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 5940 ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg atctcgtcgt gacccatggc 6000 gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 6060 ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 6120 gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 6180 gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagc gggactctgg 6240 ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 6300 ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 6360 tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 6420 ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 6480 tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtataccgt 6540 cgacctctag ctagagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 6600 atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 6660 cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 6720 gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 6780 gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 6840 ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 6900 acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 6960 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 7020 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 7080 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 7140 tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt 7200 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 7260 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 7320 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 7380 tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 7440 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 7500 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 7560 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 7620 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 7680 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 7740 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 7800 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 7860 caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7920 ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 7980 attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 8040 ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 8100 gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 8160 ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 8220 tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 8280 gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 8340 cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 8400 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 8460 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 8520 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 8580 gttgaatact catactcttc ctttttcatt attattgaag catttatcag ggttattgtc 8640 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 8700 catttccccg aaaagtgcca cctgacgtc 8729 <210> 1813 <211> 8750 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-dCas3-17aa-FokI <400> 1813 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgcca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaaggc tgacccaact aacagagcta agggcctgga 3660 ggccgtatct gtggcatcac agctggtgaa gtccgagctg gaggagaaga agagcgagct 3720 gcgccacaag ctgaagtacg tgccccacga gtatatcgag ctgatcgaga tcgccaggaa 3780 tcctacccag gatcgcatcc tggagatgaa agtgatggag ttctttatga aggtgtacgg 3840 ctatagggga gagcacctgg gaggcagccg caagcctgac ggcgccatct acacagtggg 3900 ctccccaatc gactatggcg tgatcgtgga taccaaggcc tacagcggcg gctataacct 3960 gccaatcgga caggcagacg agatgcagcg gtacgtggag gagaaccaga caagaaataa 4020 gcacatcaac ccaaatgagt ggtggaaggt gtatccctcc tctgtgaccg agttcaagtt 4080 tctgttcgtg tccggccact ttaagggcaa ctacaaggcc cagctgacac ggctgaatca 4140 catcaccaac tgtaatggcg ccgtgctgtc tgtggaggag ctgctgatcg gcggcgagat 4200 gatcaaggcc ggcaccctga cactggagga ggtgagaagg aagtttaaca atggcgagat 4260 caatttctaa cattggaagt ggataatcta gagggcccta ttctatagtg tcacctaaat 4320 gctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 4380 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 4440 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 4500 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg 4560 ggctctatgg cttctgaggc ggaaagaacc agctggggct ctagggggta tccccacgcg 4620 ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 4680 cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 4740 gccggctttc cccgtcaagc tctaaatcgg ggcatccctt tagggttccg atttagtgct 4800 ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 4860 ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 4920 ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 4980 attttgggga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 5040 aattaattct gtggaatgtg tgtcagttag ggtgtggaaa gtccccaggc tccccaggca 5100 ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca 5160 ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc 5220 ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc 5280 catggctgac taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta 5340 ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga 5400 gcttgtatat ccattttcgg atctgatcaa gagacaggat gaggatcgtt tcgcatgatt 5460 gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat 5520 gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag 5580 gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaggac 5640 gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac 5700 gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc 5760 ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg 5820 ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag 5880 cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat 5940 caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag 6000 gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc 6060 ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg 6120 ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg 6180 ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag 6240 ttcttctgag cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat 6300 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 6360 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 6420 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 6480 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 6540 cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc 6600 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6660 taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6720 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6780 gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 6840 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 6900 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 6960 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7020 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7080 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7140 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct 7200 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7260 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7320 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7380 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 7440 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7500 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7560 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7620 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7680 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7740 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7800 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 7860 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 7920 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 7980 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8040 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8100 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8160 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8220 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8280 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8340 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8400 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8460 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8520 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8580 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcat tattattgaa 8640 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8700 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc 8750 <210> 1814 <211> 8750 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-dCas3-30aa-FokI <400> 1814 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgcca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaaggc tgacccaact aacagagcta agggcctgga 3660 ggccgtatct gtggcatcac agctggtgaa gtccgagctg gaggagaaga agagcgagct 3720 gcgccacaag ctgaagtacg tgccccacga gtatatcgag ctgatcgaga tcgccaggaa 3780 tcctacccag gatcgcatcc tggagatgaa agtgatggag ttctttatga aggtgtacgg 3840 ctatagggga gagcacctgg gaggcagccg caagcctgac ggcgccatct acacagtggg 3900 ctccccaatc gactatggcg tgatcgtgga taccaaggcc tacagcggcg gctataacct 3960 gccaatcgga caggcagacg agatgcagcg gtacgtggag gagaaccaga caagaaataa 4020 gcacatcaac ccaaatgagt ggtggaaggt gtatccctcc tctgtgaccg agttcaagtt 4080 tctgttcgtg tccggccact ttaagggcaa ctacaaggcc cagctgacac ggctgaatca 4140 catcaccaac tgtaatggcg ccgtgctgtc tgtggaggag ctgctgatcg gcggcgagat 4200 gatcaaggcc ggcaccctga cactggagga ggtgagaagg aagtttaaca atggcgagat 4260 caatttctaa cattggaagt ggataatcta gagggcccta ttctatagtg tcacctaaat 4320 gctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 4380 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 4440 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 4500 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg 4560 ggctctatgg cttctgaggc ggaaagaacc agctggggct ctagggggta tccccacgcg 4620 ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 4680 cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 4740 gccggctttc cccgtcaagc tctaaatcgg ggcatccctt tagggttccg atttagtgct 4800 ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 4860 ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 4920 ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 4980 attttgggga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 5040 aattaattct gtggaatgtg tgtcagttag ggtgtggaaa gtccccaggc tccccaggca 5100 ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca 5160 ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc 5220 ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc 5280 catggctgac taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta 5340 ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga 5400 gcttgtatat ccattttcgg atctgatcaa gagacaggat gaggatcgtt tcgcatgatt 5460 gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat 5520 gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag 5580 gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaggac 5640 gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac 5700 gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc 5760 ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg 5820 ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag 5880 cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat 5940 caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag 6000 gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc 6060 ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg 6120 ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg 6180 ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag 6240 ttcttctgag cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat 6300 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 6360 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 6420 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 6480 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 6540 cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc 6600 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6660 taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6720 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6780 gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 6840 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 6900 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 6960 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7020 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7080 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7140 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct 7200 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7260 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7320 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7380 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 7440 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7500 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7560 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7620 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7680 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7740 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7800 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 7860 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 7920 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 7980 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8040 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8100 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8160 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8220 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8280 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8340 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8400 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8460 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8520 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8580 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcat tattattgaa 8640 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8700 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc 8750 <210> 1815 <211> 8819 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NLS-dCas3-40aa-FokI <400> 1815 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatgc cacccccaag aaaaagagaa aagtaggatc 960 gggcatggag cccttcaagt acatctgcca ctattggggc aagagctcca agagcctgac 1020 aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag cagtggcaga 1080 ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg agatgctgag 1140 caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgcca tcggcaagtt 1200 cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc cagccacacc 1260 cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg cagcaggact 1320 gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct tttctttctt 1380 tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag tgacaggaca 1440 ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga tgccagccag 1500 cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct ccgtgctgga 1560 ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg actgctctag 1620 cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca caaccaatac 1680 attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct acttccagga 1740 taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta ataagcggtg 1800 ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc tgcaggtgct 1860 ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta ccggctccgg 1920 caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga tcgccgactc 1980 tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca ggatggaggc 2040 ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca acagccggtt 2100 caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac aggaggaggc 2160 ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc tgggccagat 2220 cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc acaggtttat 2280 caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg cctacgacac 2340 atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg gcggctctgt 2400 gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg atacatacgg 2460 cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt ggaggggagt 2520 gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac cacggttttc 2580 catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca tgctggagag 2640 aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc tggtggatgt 2700 ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg acatcgatct 2760 gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg tgatcagcaa 2820 cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac aggtggtgga 2880 gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg ccgatctgct 2940 gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg caggattcga 3000 gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc acgagcacat 3060 ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc tgaacggcgc 3120 cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg acgatgccga 3180 gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg ccgagtgtga 3240 gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc tgcaggataa 3300 cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac tgctgcctta 3360 tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg acctgagcca 3420 cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca cctggaagcg 3480 gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca agcagaatct 3540 ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg acgagggcat 3600 gaccagagtg atcccagcca accccaagag cggctccgaa acgccgggta catccgagtc 3660 cgcgactcct gagtcaggag gcagcggctc ctctggtgga agcggctcaa gtggagggag 3720 cggctcaagt ggtggaagcg gctcaagtca gctggtgaag tccgagctgg aggagaagaa 3780 gagcgagctg cgccacaagc tgaagtacgt gccccacgag tatatcgagc tgatcgagat 3840 cgccaggaat cctacccagg atcgcatcct ggagatgaaa gtgatggagt tctttatgaa 3900 ggtgtacggc tataggggag agcacctggg aggcagccgc aagcctgacg gcgccatcta 3960 cacagtgggc tccccaatcg actatggcgt gatcgtggat accaaggcct acagcggcgg 4020 ctataacctg ccaatcggac aggcagacga gatgcagcgg tacgtggagg agaaccagac 4080 aagaaataag cacatcaacc caaatgagtg gtggaaggtg tatccctcct ctgtgaccga 4140 gttcaagttt ctgttcgtgt ccggccactt taagggcaac tacaaggccc agctgacacg 4200 gctgaatcac atcaccaact gtaatggcgc cgtgctgtct gtggaggagc tgctgatcgg 4260 cggcgagatg atcaaggccg gcaccctgac actggaggag gtgagaagga agtttaacaa 4320 tggcgagatc aatttctaac attggaagtg gataatctag agggccctat tctatagtgt 4380 cacctaaatg ctagagctcg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 4440 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 4500 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 4560 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 4620 gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 4680 ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 4740 accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 4800 gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg gcatcccttt agggttccga 4860 tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 4920 gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 4980 agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 5040 ttataaggga ttttggggat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 5100 tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 5160 ccccaggcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac caggtgtgga 5220 aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca 5280 accatagtcc cgcccctaac tccgcccatc ccgcccctaa ctccgcccag ttccgcccat 5340 tctccgcccc atggctgact aatttttttt atttatgcag aggccgaggc cgcctctgcc 5400 tctgagctat tccagaagta gtgaggaggc ttttttggag gcctaggctt ttgcaaaaag 5460 ctcccgggag cttgtatatc cattttcgga tctgatcaag agacaggatg aggatcgttt 5520 cgcatgattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta 5580 ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg 5640 tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa 5700 ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct 5760 gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg 5820 caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca 5880 atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat 5940 cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac 6000 gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gcgcatgccc 6060 gacggcgagg atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa 6120 aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag 6180 gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc 6240 ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt 6300 cttgacgagt tcttctgagc gggactctgg ggttcgaaat gaccgaccaa gcgacgccca 6360 acctgccatc acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa 6420 tcgttttccg ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct 6480 tcgcccaccc caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 6540 caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 6600 tcaatgtatc ttatcatgtc tgtataccgt cgacctctag ctagagcttg gcgtaatcat 6660 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 6720 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 6780 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 6840 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 6900 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 6960 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 7020 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 7080 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 7140 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 7200 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 7260 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 7320 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 7380 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 7440 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 7500 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 7560 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 7620 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 7680 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 7740 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 7800 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 7860 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 7920 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 7980 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 8040 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 8100 cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 8160 cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 8220 cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 8280 agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 8340 tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 8400 agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 8460 atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 8520 ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 8580 cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 8640 caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcatt 8700 attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 8760 agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtc 8819 <210> 1816 <211> 5169 <212> DNA <213> Fusobacterium nucleatum <400> 1816 atgggcccca agaagaagag aaaggtaggc agcggcatgg agaagagagt gtacggcatc 60 ctgggcatca gctccatcat gtccaattgg aacgccgatt tctctggcga gcctaagtct 120 atcagcaatg gcagaatctt tggctccgac aaggccttca agtacccaat gaagaagatg 180 tgggagaacc agggcgagaa ggtgctgtat atcaagtctc tgaaggtgga taagggcgcc 240 ctgatcccca agaccctgaa ggagaggtac gagcagctgt ttcctgagaa gaagctggat 300 aagaacaccg agacaatcga agtgatcaag aatctgttca aggccatcga cgtgaagaac 360 tttggcgcca ccttcgccga ggagggcaac aatatcagca tcacaggcgc cgtgcagatc 420 ggccagggct tcaactttta cgacgagagc aataccgagg tgcaggatat cctgtccccc 480 ttcagagacc ctaagggcaa gatcaacaag gagacaaagg agaacgagga tgccaagaat 540 agcaccctgg gcacaaagat cgtgtccgac gaggcccact acttttatcc attcaatatc 600 aaccccctgg cctacaagga gtttatcgag ctggagatca ccgatggcta cacagaggag 660 gactatctga agttcaagga ggccgccctg tctagcgcca ccttctttgc cacaaactcc 720 aaagtgggct gcgataatga gtttggcctg ttcatcgaga ccgaggagga cttttacctg 780 ccaatcctga cacagtatat caagttcgag aagggcgagg agaagaacaa gatcaccctg 840 aatctgtcta caatcctgaa gggcgtggag aaccacatca agaatatcga gatctactat 900 aatcccgtga ccacagagat cgtgaccgat atcagcaact acaagctgat caatatcctg 960 acaaagaagg aagtgggctc tggcgaggga aggggcagcc tgctgacctg tggcgacgtg 1020 gaggagaacc ctggacctcc taaaaagaaa cgaaaggtag gctctggcat ggaggtgtac 1080 gagatgaagc tgaaggtgaa gctgaagaag gatatctttc tgaaggacgt gagcacctat 1140 atcacaagat tcatggatat gaacctgtcc gccaatccaa ccatgtacaa ctatcacaca 1200 tctaagatct acaagggcta tacctttgac ggcctgttcc ccatcgagga ggataagatc 1260 tacaagaagg acaagaccta tagctttcgg gtgagaacaa tcaaccagaa gatcgccaat 1320 tacttcctgg ataccctgat gttctttgag aataaggaca tccagggcct gacactgaac 1380 atcagagtga tcgagaagaa gctgatcgag aagctgtaca ccatcacacc tatcctgatg 1440 aagaccgatg agggctactg gcggtattct atgacatttg aggagttcga gaagagactg 1500 aagatcaact gcctgaagaa gtacctgtat ttcaccgaga acaatgacga tatcaccatc 1560 gacacagagc tgctgaagaa gctgggcgag gataagagcg acgatatcga cctgtttaca 1620 aacatcaagt tcatcaatag gatgcccgtg cctatcatct acaagggccg caagctggtg 1680 ggcgataagg tggagctgca ggtggccaac aatgagaagg cccaggacat cgcctatatg 1740 ctgctgggaa ccggactgct ggagaattgc gcacggggct gtggctttct gaacttcaag 1800 aattacgagg gctccggcga gggaagaggc tctctgctga cctgtggcga tgtggaggag 1860 aaccctggac ctccaaagaa gaaaagaaaa gtcggctccg gcatggaggc cctgaagttt 1920 acactgagcg gcaattccgc cttctttaag gacaacgtga tcaataccgt gtacctgaca 1980 tatggcaaca tccacagggt ggccctgctg ggcatgtttg gcgccatcct gggctacggc 2040 ggctattcta agcagaacga catgctgaag aagaagaaca agaagatgcc agattacccc 2100 gagttctatg agaagctgaa ggacatcaag atctctatcg tgagcaacgg caagaatggc 2160 tactttaata agaagctgca gaccttcaac aatagcgtgg gctatgcctc caaggaggag 2220 ggcggcaatc tgatcgtgaa gcagttctgg ctggagaacc cctcctggga tatctacatc 2280 ctgctggact gcgatgaggc caagaagatc gccgactata tccagaaccg caaggccatc 2340 tacctgcctt atctgggctc caacgatcac ctggccaata tcatggatgt ggagatcatc 2400 gacatcgagg agaagatgtc ctctgaggac gagaccatcg agatcctgtc tatggtgaag 2460 gactccgata tctctgagaa gaagaagaac gtgttcagca tcgacaaaaa tagcatccgg 2520 gacgatatct acaagtattc tgagtacctg cctgtgacac tgagcaagga gctgaatcag 2580 tatgagaagg agaagatgac catcacaaac atgagcgtga tcctgaagaa gtcctactat 2640 aaggtggagg ataagaatat cgtgttctac ggctctggcg aaggcagagg cagcctgctg 2700 acttgcggcg acgtggaaga gaaccctgga cctcccaaga aaaagaggaa agtgggcggc 2760 tcccagctgg tgaagtctga gctggaggag aagaagagcg agctgaggca caagctgaag 2820 tacgtgccac acgagtatat cgagctgatc gagatcgcca ggaaccccac ccaggatcgc 2880 atcctggaga tgaaagtgat ggagttcttt atgaaggtgt acggatatag gggagagcac 2940 ctgggaggca gcagaaagcc tgacggagcc atctacaccg tgggctcccc aatcgattat 3000 ggcgtgatcg tggacacaaa ggcctactcc ggcggctata acctgccaat cggccaggcc 3060 gacgagatgc agaggtacgt ggaggagaac cagacccgca ataagcacat caatcctaac 3120 gagtggtgga aggtgtatcc aagctccgtg acagagttca agtttctgtt cgtgagcggc 3180 cacttcaagg gcaattacaa ggcccagctg acccgcctga accacatcac aaattgcaac 3240 ggagccgtgc tgtccgtgga ggagctgctg atcggcggcg agatgatcaa ggcaggcacc 3300 ctgacactgg aggaggtgcg gagaaagttt aacaatggcg agatcaactt ctctgctagc 3360 gagacacctg gcacctccga gtctgccacc ccagagtccg gcggctctgg ctctagcggc 3420 ggctctggct cctccggagg aatgatcgat gaggccctgg aggtgtttaa gaagatctac 3480 gacaaggagg gcgagaagct ggtggtgaat aagcacatcc ccaaggacgg cacatatatc 3540 ctggtgaata tcaagtctgg caagatcatc gagaagctga acatcttcta cgataagaag 3600 agcaagaaga tcgacggcga gctgaaccag tactatggct attttcgcgc cttcgattac 3660 tatagcaacc tggtggatat gaataagcct atggacccaa agaagaccat ccacagcaat 3720 cagatctatt ccttctttat caagaaggac tctatccggg agaacaagct gacaaagagc 3780 atcatcgagg gctacaagaa gaacctgctg aatcctgagg agaagtacaa ttccaaggag 3840 ggcaaggagc tgtataagaa catcgccgag aagctgccaa agatcgagaa ggatatcgtg 3900 gaggacatct tcctgtggat cgaggacaat gtgaacgaga atctgctgga gaacgataat 3960 aagaaggact atctgaagat cttctttgtg gaggaggacc tggataagag cctggagctg 4020 tttaagaacg agcacaagag gtacatcatc cctaacatct tcaactccaa cgattacaat 4080 aagaagatcg gcgagaccat ctatggcctg tctaacaata acatgggcct gaacgccaag 4140 aaggcctttc tggagaataa gaccaggcgc gtgagcacac cctacctggt gaatacagac 4200 gagatcctgc tgcagtatgc cttctacaac tatctgctgc ctgaggtgaa gcagggcaac 4260 tactttatct atttctccga gaatgagatc atcccaagaa cctacaagga gggctgcccc 4320 aacggcgcca agtacctgct gaatgcctct tatagcaagg acgtggatat caagaacttt 4380 aatgtgatct ccaagaatag ctccgaggag atcaacatca atttcaagga gatcctgcac 4440 cagaagaaga aggacacaga tgagatcgag tacggcaacc tgaataggga gaagatgatg 4500 aacaacatca acaagatcct gttttataac tccctgctgg gcaatttcct gctgtctgac 4560 ggcgatctgg acatcaagga tatcgagatc aagaagctgc tgatgaagta ccgcaatgcc 4620 ttttacaagt ggttctatct gaacgatgag gccgaggtga agaagaatat cagaaagatc 4680 tacctggacg ccgtgatggt ggccatcggc aacggctatt tctttaaggc cagccagcag 4740 ctggactttg gcttctgtct ggagaagtac ttctatggca agtccgagct gatggaggag 4800 atcatgaacg tgaaagaggt gtttctgaat cacaccctga gcgaggagga ttgggagttc 4860 ctgaacgacg aggagtactt ctttgccgtg ggccagatcc tggcctacat caactatatg 4920 cgcaattcca aggccaagag cctgaacttc atcaagcagc tgacattcgt gaagaacatc 4980 gacgtgctga aggagaagat caagaagatc gtgatctcct attctcacat ctttgagacc 5040 aagaacaaga agatcaatag gacagtgtct aacatcagcc tgtaccagcc aaaggagatc 5100 cgcatcgata tcctgctggc cggcttcacc gccgacatca tcttctttaa gaagcgggag 5160 gagaagtga 5169 <210> 1817 <211> 4791 <212> DNA <213> Klebsiella oxytoca <400> 1817 atgggcccca agaagaagag aaaggtaggc agcggcatgg caaaggcacc cgtgtctgtg 60 aagaccgcca gcgtgctggc ctttgagagg aagctggcca catccgacgc catgatgtac 120 gccggcaact ggctgggcga ttcttggcag cctatcgaga tcaaggagaa ggccgtgagg 180 ggcaccatca gcaatcgcct gaagaacgcc atcgcctccg acgccacaaa gctggatgcc 240 gagatccaga aggcaaatct gcagcgggtg gacaccgccg ccctgccagc cgacgccgat 300 accctgaagg tggtgttcac actgagagtg ctgggaaacc tggcaacccc aagcgtgtgc 360 aatgatatgg cctaccagaa cgccatccag cagacaatcg agggctatat cagcgagcac 420 ggatttgcag agctggcccg gagatacgcc gccaatctgg ccaacggcag attcctgtgg 480 cggaatagaa tcggcgccga gcagatccag gtgtctgtga gcgcccaggg acaggcctgg 540 gtgtttaacg gccacgacta ttccctgagg gagttctctc aggacgatga ggagatcgcc 600 tctctggccg ccctgatcga gcagggactg agcggccagg cctgggtcat gctgaccgtg 660 gaggcacagg tgcggctggg agcaggccag gaggtgtttc catctcagga gctggtgctg 720 gatagcaata gctccaagtc ccgcgtgctg taccaggtgg caggaatcgc aggcatccac 780 agccagaaga tcggcaacgc cctgcggaca atcgacacct ggcaccccaa ggtggatgag 840 ctgggagcaa tcgcagtgga gccttacggc agcgtgacct cccgcggaat ggcatgcagg 900 cagcccaagg acaagatgga cttctacacc ctgctggact cctgggtgac aaagggcatc 960 aagcctgatg tggagcagca gcactacgtg atggccgtgc tgatcagggg aggcgtgttc 1020 ggcgagaagt ctgagggcag cggcgaggga aggggcagcc tgctgacatg tggcgacgtg 1080 gaggagaacc ctggacctcc taaaaagaaa cgaaaggtag gcagcggcat ggactacttc 1140 ctggatatca gagtgctgcc agaccccgag ttttccgagg agatgctgat ggccgccctg 1200 ttcgccaagc tgcacagagc cctgggagca aggggcaagg gcgatatcgg cgtgtctttt 1260 ccagagttca gcgtgaagcc tggaccactg ctgaggctgc acggcgacga gtccgccctg 1320 tgcgccctgg aggagaccct gtggagaaag ggcctgaatg attattgtca gtctggccag 1380 atcatgcctg tggaggagat caagggatgg agatgcgtga gccgggtgca ggtgaagtct 1440 agcccagaga ggctgatgag gcgcagcgtg cgcaagggat ggctgaccca ggacgaggca 1500 aacgagcgcc tgctgtccat gaggggagag tctacagccc tgccttggct gaatatgaag 1560 tccctgtcta acggccagaa gtttccactg ttcatctgcc acggagagct gctggcccag 1620 cgcgtggcag gcacctttaa ttcttacggc ctgagccaca tcgccacaat cccttggttc 1680 ggctctggcg aaggcagggg cagcctgctg acctgtggcg atgtggagga gaaccctgga 1740 cctccaaaga agaaaagaaa agtcggctcc ggcatgtctt acctgctgct gctgccccac 1800 atccgcatcg agaatgcaaa cgcagtggca ggactgacct ggggatttcc tgccatcaca 1860 cacttcctgg gctatgtgca cgccctgtcc cggagagtgt ctgagtttgg cgtgtccttc 1920 accggctgcg ccgtgatcaa tcacgagcac cacatccagg cctactcctc tggccgggac 1980 tatcagtttg ccctgacaag aaatcctctg accaaggagg gcaagacagc cgccttcaac 2040 gaggagggca gaatgcacct gaccgtgagc ctgctggtgg agtgtcaggg cgagatcatc 2100 aatggagagt acggcaaggc cgccctgtgc agctccctgc tgaccctgtg ccagagccac 2160 aagctggccg gaggctccat cgtgatgatg agggagccac agatctttaa cgcccccgac 2220 gatgagagga ccctgcgcaa gatcctgtgg aggctgatgc caggattcgc actgtgcgat 2280 aggtccgagt ggctgatgga gcactacagg cagctgcagc agaggcgccc tgagtctagc 2340 ctgctggacg cctggctgga tttcgccgcc atcaagtatc agcctgtgca gcaggagcca 2400 gaggacagca tgtcctggga gtaccagccc aagcctaagc caggctatct ggtgcccctg 2460 atgtgcggct accagcggat cagcagactg tatcagccag gcgaggtggc caacgtgagg 2520 gataccacaa cccccttcgc ctttaccgag gccgtgtacg gagtgggaga gtggagagga 2580 ctgcacagga tcgccgacct ggagccactg atctggaggt atcgcacatc tgataccggc 2640 tactattgca gcgccatgcc cgtggccgac gatgacttca tctttaatga ggatgacgat 2700 ctggagggct ccggcgaggg aaggggctct ctgctgacct gcggcgacgt ggaagagaac 2760 cctggacctc ccaagaaaaa gaggaaagtg ggcggcagcc agctggtgaa gtccgagctg 2820 gaggagaaga agtccgagct gaggcacaag ctgaagtacg tgcctcacga gtatatcgag 2880 ctgatcgaga tcgcccggaa tccaacacag gacagaatcc tggagatgaa agtgatggag 2940 ttctttatga aggtgtacgg atatagggga gagcacctgg gaggctctcg caagccagat 3000 ggagccatct acaccgtggg cagccccatc gactatggcg tgatcgtgga tacaaaggcc 3060 tacagcggcg gctataacct gccaatcgga caggcagacg agatgcagcg gtatgtggag 3120 gagaatcaga ccagaaacaa gcacatcaat cctaacgagt ggtggaaggt gtacccatcc 3180 tctgtgacag agttcaagtt tctgttcgtg tccggccact tcaagggcaa ttataaggcc 3240 cagctgaccc gcctgaacca catcacaaat tgcaacggcg ccgtgctgtc tgtggaggag 3300 ctgctgatcg gcggcgagat gatcaaggca ggcacactga ccctggagga ggtgcggaga 3360 aagtttaaca atggcgagat caatttctct gctagcgaga cacctggcac ctccgagtct 3420 gccaccccag agtccggcgg ctctggctct agcggcggct ctggctcctc cggaggaatg 3480 acaaccgagg ccctgacaca ctttatcatc gactacatcg cctcccggaa gcagccaaag 3540 ctggatgcct tcgagaagga ggccgccaag agactggccc agggagagga cgcaggagca 3600 atcgcccagg agaggcagga gctggaggtg aagtatcagc caaggaactg gctgaccgat 3660 gcagcaagga gggcaggaca gatcagcctg gtgacccacg ccgccaagtt cacacacggc 3720 gactccaagt cctctagcat ctacagagag accgtgggcg atgagggcta tctgtccaca 3780 gccgtgctgg ccaatgtggc agcagacgca gtgggaaacg cagccgccct ggatgtggca 3840 aagctgctgc agacagaagt gggaggcgac agcctgctgg cctgtctgaa gaggggcgat 3900 cgctccccac tgatgggctt tgccgagaat gacgcacagc tggccctgtg gatggagggc 3960 ttctcccagg ccctgacccc agcccagcct acatctcaca agctggccaa gcagatctac 4020 tttcctgtgg atggcggcta tcacctgctg agcccactgt tcgcctcctc tctggcccag 4080 gccatgcacg agaagatggt ggcagcaagg tttggagagc aggcaaaggc agcaagagag 4140 gcaaggagag ccggcaagtg gcacgcacag ccagacgtgc gctaccctaa cgtggccgag 4200 atgcacttcg gcggcaccaa gccccagaat atctccgccc tgaacagctc ccggggaggc 4260 agagtgtggc tgctgccctc tcagccccct aagtggacca tgctggacaa ggcccctcag 4320 aatctgacaa gcctgtttgc cctgagaggc gacttcaaca gggccgccac agataccgtg 4380 agccggatgg tgtccctgct gaaggagaag acagataaca ataacaggca catccgcaat 4440 gcaagggcag gatacgtgga cgagctgatc gatctgctgt ttctgcacgc cgccacctat 4500 cagcaggagg cctggcaggg ctggacactg aactccccag acctgccact gcaccagcag 4560 ctgtggctgg acccctggag gtccaagaca gatgagacct ttagatctga gagggagaag 4620 ggcgactggc agcgcagcgt ggcagacgat ttcgcaaggt ggctgaatta ccggctgaac 4680 aaggccagac tggatgtggg aatcgcagag aggagggagt ggcagaccca gcggctgttc 4740 agccagcgga tgagagagat ggaggccatc gtgcaggagg ccctgaagtg a 4791 <210> 1818 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Hsa414 single target guide template primer <400> 1818 cccagctggt tctttccgaa aaaaacggtt tatccccgct ggcgcgggga actcgccgta 60 gctgaaattg gctgcaccat gtcggccggt ttatccccgc tggcgcgggg aactcgccgt 120 agctgaaatt ggctgcacca tgtcggccgg tttatccccg ctggcgcggg gaactcggtg 180 tttcgtcctt tccacaagat 200 <210> 1819 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Wild-type Cas3 <400> 1819 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1820 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 1 plasmid <400> 1820 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccgcct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1821 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 2 plasmid <400> 1821 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggcg 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1822 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 3 plasmid <400> 1822 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccgccaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1823 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 4 plasmid <400> 1823 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaacac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1824 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 5 plasmid <400> 1824 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagaa cgagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1825 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 6 plasmid <400> 1825 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctggagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1826 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 7 plasmid <400> 1826 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggaagaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1827 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 8 plasmid <400> 1827 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggataacgtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1828 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 9 plasmid <400> 1828 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca ggcgctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1829 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 10 plasmid <400> 1829 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc cagctgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1830 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 11 plasmid <400> 1830 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccagcacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1831 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 12 plasmid <400> 1831 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacaaacg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1832 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 13 plasmid <400> 1832 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac gccaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1833 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 14 plasmid <400> 1833 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa tgggaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1834 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 15 plasmid <400> 1834 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcgccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1835 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 16 plasmid <400> 1835 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc catcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1836 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 17 plasmid <400> 1836 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatacggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1837 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 18 plasmid <400> 1837 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcgc cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1838 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 19 plasmid <400> 1838 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgtcaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1839 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 20 plasmid <400> 1839 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgcccagttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1840 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 21 plasmid <400> 1840 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg acagcagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1841 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 22 plasmid <400> 1841 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc gcacaggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1842 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 23 plasmid <400> 1842 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acagcggtgg 2880 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1843 <211> 8114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 24 plasmid <400> 1843 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat ccctacttcc aatccaatcg ccaccatgcc caagaaaaag agaaaagtag 960 gatcgggcat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 1020 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 1080 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 1140 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 1200 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 1260 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 1320 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 1380 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 1440 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 1500 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 1560 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 1620 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 1680 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 1740 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 1800 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 1860 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 1920 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 1980 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 2040 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 2100 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 2160 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 2220 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 2280 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 2340 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 2400 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 2460 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 2520 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 2580 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 2640 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 2700 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 2760 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 2820 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 2880 tggagcactc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 2940 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 3000 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 3060 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 3120 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 3180 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 3240 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 3300 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 3360 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 3420 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 3480 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 3540 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 3600 gcatgaccag agtgatccca gccaacccca agtaaattgg aagtggataa tctagagggc 3660 cctattctat agtgtcacct aaatgctaga gctcgctgat cagcctcgac tgtgccttct 3720 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3780 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3840 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3900 agcaggcatg ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg 3960 ggctctaggg ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 4020 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 4080 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcggggcatc 4140 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 4200 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 4260 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 4320 gtctattctt ttgatttata agggattttg gggatttcgg cctattggtt aaaaaatgag 4380 ctgatttaac aaaaatttaa cgcgaattaa ttctgtggaa tgtgtgtcag ttagggtgtg 4440 gaaagtcccc aggctcccca ggcaggcaga agtatgcaaa gcatgcatct caattagtca 4500 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4560 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 4620 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 4680 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 4740 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 4800 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 4860 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 4920 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 4980 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5040 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5100 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5160 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5220 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5280 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5340 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5400 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5460 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 5520 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 5580 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 5640 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 5700 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5760 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5820 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5880 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 5940 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 6000 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 6060 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 6120 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 6180 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 6240 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 6300 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6360 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6420 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6480 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6540 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6600 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6660 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6720 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6780 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6840 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6900 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6960 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 7020 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 7080 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7140 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7200 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7260 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7320 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7380 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7440 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7500 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7560 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7620 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7680 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7740 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7800 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7860 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7920 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7980 tcttcctttt tcattattat tgaagcattt atcagggtta ttgtctcatg agcggataca 8040 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 8100 tgccacctga cgtc 8114 <210> 1844 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Wild-type Cas3 <400> 1844 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1845 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 1 plasmid <400> 1845 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1846 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 2 plasmid <400> 1846 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ala Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1847 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 3 plasmid <400> 1847 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Ala Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1848 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 4 plasmid <400> 1848 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Asn 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1849 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 5 plasmid <400> 1849 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Asn Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1850 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 6 plasmid <400> 1850 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Glu Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1851 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 7 plasmid <400> 1851 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Glu Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1852 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 8 plasmid <400> 1852 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Asn Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1853 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 9 plasmid <400> 1853 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Ala Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1854 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 10 plasmid <400> 1854 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Gln Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1855 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 11 plasmid <400> 1855 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Ala Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1856 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 12 plasmid <400> 1856 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Asn Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1857 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 13 plasmid <400> 1857 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Ala Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1858 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 14 plasmid <400> 1858 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Gly Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1859 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 15 plasmid <400> 1859 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Ala Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1860 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 16 plasmid <400> 1860 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile His Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1861 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 17 plasmid <400> 1861 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Thr Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1862 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 18 plasmid <400> 1862 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe Ala Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1863 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 19 plasmid <400> 1863 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Val Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1864 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 20 plasmid <400> 1864 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Gln Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1865 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 21 plasmid <400> 1865 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Ser Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1866 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 22 plasmid <400> 1866 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Ala Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1867 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 23 plasmid <400> 1867 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Ala Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1868 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Cas3 mutation variant 24 plasmid <400> 1868 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu His 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1869 <211> 944 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca-Cas3 <400> 1869 Met Pro Glu His Asp Ser Thr Asp Asp Lys His Gly Ile Pro Pro Leu 1 5 10 15 Asp Leu Arg Phe Trp Ala Lys Glu Arg Gly Leu Arg Gly Lys Thr Tyr 20 25 30 Pro Leu Val Cys His Ser Leu Asp Ala Ala Ala Ala Ala Leu Val Leu 35 40 45 Trp Asn Glu Tyr Leu Ser Pro Gly Leu Arg Asp Thr Ile Ala Ser Ser 50 55 60 Met Glu Thr Asp Glu Glu His Ala Gly His Cys Ile Ala Phe Trp Ala 65 70 75 80 Gly Leu His Asp Ile Gly Lys Leu Thr Arg Glu Phe Gln Gln Gln Ile 85 90 95 Ala Ile Asp Leu Ser Ala Tyr Pro Gly Glu Glu Leu Ser Gly Glu Gln 100 105 110 Arg Ser His Ala Ala Ala Thr Gly Lys Trp Leu Pro Phe Ala Leu Pro 115 120 125 Ser Leu Gly Tyr Pro Asn Gly Gly Leu Val Thr Gly Leu Val Ala Gln 130 135 140 Met Leu Gly Gly His His Gly Thr Phe His Pro His Pro Ser Phe Gln 145 150 155 160 Ser Arg Asn Pro Leu Ala Glu Phe Gly Phe Ser Ser Pro His Trp Glu 165 170 175 Lys Gln Arg His Ala Leu Leu His Ala Val Phe Asp Ala Thr Gly Arg 180 185 190 Pro Thr Pro Pro Asp Met Leu Asp Gly Pro Thr Ala Ser Val Val Cys 195 200 205 Gly Leu Val Ile Leu Ala Asp Trp Leu Val Ser Gln Glu Asp Phe Leu 210 215 220 Leu Glu Arg Leu Thr Ser Leu Pro Ala Asp Gly Ser Ala Ser Ala Leu 225 230 235 240 Arg Ala His Phe Glu Thr Ser Leu Arg Arg Ile Pro Ser Leu Leu Asp 245 250 255 Ala Ala Gly Leu Arg Pro Ile Thr Val Pro Pro Ala Thr Phe Thr Glu 260 265 270 Ser Phe Pro His Leu Ser Lys Pro Asn Gly Leu Gln Ala Ser Leu Ala 275 280 285 Lys His Leu Pro Cys Leu Cys Thr Gly Pro Gly Leu Val Leu Ile Thr 290 295 300 Ala Pro Met Gly Glu Gly Lys Thr Glu Ala Ala Tyr His Val Ala Asp 305 310 315 320 Leu Leu Gly Lys Ala Thr Gly Arg Pro Gly Arg Phe Leu Ala Leu Pro 325 330 335 Thr Met Ala Thr Ala Asp Gln Met His Thr Arg Leu Lys Glu Tyr Ala 340 345 350 Arg Tyr Arg Val Glu Asn Thr Asp Leu Pro Arg Ser Ser Thr Leu Ala 355 360 365 Leu Leu His Ser Met Ala Trp Leu Asn Pro Asp Tyr Ala Pro Ala Asp 370 375 380 Leu Pro Gly Val Ser Lys Val Leu Ser Asn Leu Gly His Arg Asp Pro 385 390 395 400 Phe Ala Ala Thr Asp Trp Leu Met Gly Arg Lys Arg Gly Leu Leu Ala 405 410 415 Pro Trp Ala Val Gly Thr Ile Asp Gln Ala Leu Met Ala Val Leu Arg 420 425 430 Ala Lys His Asn Ala Leu Arg Leu Phe Gly Leu Ala Gly Lys Val Val 435 440 445 Val Val Asp Glu Ala His Ala Val Asp Pro Tyr Met Gln Val Leu Leu 450 455 460 Glu Gln Leu Leu Arg Trp Leu Gly Thr Leu Asp Val Pro Val Val Leu 465 470 475 480 Leu Ser Ala Thr Leu His His Ser Ile Ala Asn Ser Leu Val Lys Ala 485 490 495 Tyr Leu Glu Gly Ala Arg Gly Arg Arg Trp Asn Arg Ser Glu Pro Gln 500 505 510 Pro Val Ser Glu Val Ser Tyr Pro Gly Trp Leu His Val Asp Ala Arg 515 520 525 Ile Gly Lys Val Thr Arg Ser Ser Asp Val Asp Pro Leu Pro Ile Ala 530 535 540 Thr Thr Pro Arg Lys Pro Leu Glu Val Arg Leu Val Asp Val Pro Val 545 550 555 560 Lys Glu Gly Ala Leu Asn Arg Ser Thr Val Leu Ala Lys Glu Leu Thr 565 570 575 Pro Leu Val Lys Gln Gly Gly Cys Ala Ala Ile Ile Cys Thr Thr Val 580 585 590 Ala Glu Ala Gln Gly Val Tyr Asp Leu Leu Ser Gln Trp Phe Ala Thr 595 600 605 Leu Gly Glu Asp Ala Pro Asp Leu Tyr Leu Leu His Ser Arg Phe Pro 610 615 620 Asn Arg Gln Arg Thr Glu Ile Thr Ala Thr Ile Val Asp Leu Phe Gly 625 630 635 640 Lys Glu Gly Ala Gln Ser Gly Arg Arg Pro Thr Arg Gly Ala Val Leu 645 650 655 Val Ala Thr Gln Val Val Glu Gln Ser Leu Asp Leu Asp Val Asp Leu 660 665 670 Met Ile Ser Asp Leu Ala Pro Val Ser Leu Leu Leu Gln Arg Ala Gly 675 680 685 Arg Cys Trp Arg His Glu His Leu Gly Ile Ile Asn Arg Pro Gln Trp 690 695 700 Ala Lys Gln Pro Glu Leu Val Val Leu Thr Pro Glu Gln Asn Gly Asp 705 710 715 720 Ala Asp Arg Ala Pro Trp Phe Pro Arg Ser Trp Thr Ser Val Tyr Pro 725 730 735 Leu Ala Leu Leu Gln Arg Thr Tyr Thr Leu Leu Arg Arg Arg Asn Gly 740 745 750 Ala Pro Val Gln Ile Pro Glu Asp Val Gln Gln Leu Val Asp Asp Val 755 760 765 Tyr Asp Asp Asp Ser Leu Ala Glu Asp Leu Glu Ala Asp Met Glu Arg 770 775 780 Met Gly Glu Glu Leu Ala Gln Arg Gly Leu Ala Arg Asn Ala Val Ile 785 790 795 800 Pro Asp Pro Asp Asp Ala Glu Asp Asn Leu Asn Gly Leu Thr Glu Phe 805 810 815 Ser Phe Asp Val Asp Glu His Val Leu Ala Thr Arg Phe Gly Ala Gly 820 825 830 Ser Val Arg Val Leu Cys Tyr Tyr Val Asp Thr Ala Gly Asn Arg Trp 835 840 845 Leu Asp Pro Glu Cys Thr Val Glu Phe Pro Glu Gln Gly Thr Gly Arg 850 855 860 Glu Gly Arg Phe Thr Met Ala Asp Cys Arg Asp Leu Val Ala Arg Thr 865 870 875 880 Ile Pro Val Arg Met Gly Pro Trp Ala Ser Gln Leu Thr Glu Asp Asn 885 890 895 His Pro Pro Glu Ala Trp Arg Glu Ser Phe Tyr Leu Arg Asp Leu Val 900 905 910 Leu Ile Pro Gln Arg Val Thr Asp Glu Gly Ala Val Leu Pro Thr Glu 915 920 925 Thr Gly Gly Arg Glu Trp Leu Leu Asp Pro Cys Lys Gly Leu Ile Phe 930 935 940 <210> 1870 <211> 919 <212> PRT <213> Saccharomonospora viridis <400> 1870 Met Leu Leu Val Asp Leu Arg Phe Trp Gly Lys Glu Arg Gly Leu Glu 1 5 10 15 Gly Ala Arg Tyr Pro Leu Val Cys His Gly Leu Asp Ala Ala Ala Ala 20 25 30 Val Arg Trp Leu Trp Lys Arg Tyr Leu Ser Ala Arg Val Arg Ala Gly 35 40 45 Leu Ala Glu Ala Val Gly Leu Thr Glu Glu Gln Thr Cys Arg Val Leu 50 55 60 Glu Phe Trp Ala Ala Ala His Asp Val Gly Lys Leu Thr Pro Gly Phe 65 70 75 80 Gln Glu Gln Val Gly Val Pro Glu Gly Tyr Leu Pro Asp Ser Thr Gly 85 90 95 Arg Arg Cys Arg His Glu Glu Ala Ser His Ile Trp Leu Pro Ser Ala 100 105 110 Leu Thr Ala Val Glu His Thr Thr Asn Ser Arg Asn Ala Arg Leu Ile 115 120 125 Ala Gln Met Leu Gly Gly His His Gly Val Phe Arg Arg Arg Asp Ser 130 135 140 Ala Asp Phe Arg Pro Gly Met Phe Val His Leu Gly Leu Gly Asp Ser 145 150 155 160 Ser Trp Asp Leu Gln Arg His Ala His Leu Gln Ala Trp Arg Ala Leu 165 170 175 Leu Glu Pro Pro Thr Leu Pro Arg Arg Leu Ser Arg His Ala Ala Ala 180 185 190 Val Ala Thr Gly Val Val Ile Leu Ala Asp Trp Leu Val Ser Gln Ile 195 200 205 Asp Tyr Val Arg Ser Arg Leu Pro Ser Leu Pro Glu Gln Gly Asp Leu 210 215 220 Pro Ser Leu Ser Glu Phe Leu Ser Gly Ser Arg Glu Ala Thr Glu Ser 225 230 235 240 Val Val Arg Gln Ala Gly Leu Ser Arg Leu Arg Leu Arg Gly Gly Thr 245 250 255 Phe Glu Glu Glu Phe Gly Phe Asp Glu Pro Asn Glu Leu Gln Ser Ser 260 265 270 Ile Ala Ala Glu Leu Pro Gly Leu Leu Gly Asn Pro Gly Leu Leu Met 275 280 285 Ile Ala Ala Pro Thr Gly Phe Gly Lys Thr Glu Ala Ala Leu His Ala 290 295 300 Ala Arg Leu Leu Ser Asp Ala Ala Gly Thr Ser Gly Met Phe Phe Ala 305 310 315 320 Leu Pro Thr Met Ala Thr Ser Asp Glu Met Phe Asn Arg Ile Ala Arg 325 330 335 Tyr Val Val Arg Arg Ala Glu Thr Gly Val Ala Gln Ser Leu Leu His 340 345 350 Gly Met Ala Trp Leu Lys Pro Leu Arg Glu Thr Leu Glu Gln Ile His 355 360 365 Ala Glu Glu Gly Leu Ser Ser Asp Asp Glu Thr Gln Val His Gly Leu 370 375 380 Glu Trp Leu Gln Gly Leu Lys Arg Ala Met Leu Ala Pro Val Gly Val 385 390 395 400 Gly Thr Ile Asp Gln Ala Leu Leu Ala Val Leu Pro Val Arg His Asn 405 410 415 Ala Leu Arg Leu Phe Ser Leu Leu Gly Lys Thr Val Val Ile Asp Glu 420 425 430 Val His Ala Phe Ser Pro Tyr Met Arg Arg Leu Leu Cys Thr Leu Leu 435 440 445 Gly Trp Leu Gly Glu Trp Asn Val Pro Val Val Leu Leu Ser Ala Thr 450 455 460 Leu Pro Arg Asn Ile Ala Ala Glu Leu Ala Ala Ala Tyr Arg Gly Gln 465 470 475 480 Asn Thr Gly Thr Pro Pro Asp Val Pro Val Pro Tyr Pro Gly Trp Thr 485 490 495 Tyr Ile Glu Arg Glu Ser Gly Ile Lys Thr Arg Ser Val Asp Phe Pro 500 505 510 Arg Ser His Arg Arg Thr Leu Ser Val Gln Leu Arg Pro Val Ala Val 515 520 525 Ala Arg Glu Ser Gly Pro Asp Arg Leu Pro Val Leu Arg Glu Val Leu 530 535 540 Ala Pro Ile Val Val Asp Glu Gly Gly Gly Cys Ala Leu Val Leu Cys 545 550 555 560 Thr Thr Val Ala Glu Ala Gln Gln Thr Tyr Arg Ala Leu Arg Asp Trp 565 570 575 Leu Gly Glu Thr Asp Val Asp Leu Arg Leu Leu His Ala Arg Tyr Pro 580 585 590 Met His Arg Arg Glu Thr Leu Thr Ala Glu Leu Met Arg Ala Phe Gly 595 600 605 Lys Pro Gln His Gly Asp Gly Gly Ala Ser His Val Gly Asn Arg Pro 610 615 620 Ala Lys Ala Val Val Val Ala Thr Gln Val Val Glu Gln Ser Leu Asp 625 630 635 640 Leu Asp Phe Asp Leu Val Val Ser Asp Leu Ala Pro Ile Glu Leu Leu 645 650 655 Leu Gln Arg Ala Gly Arg Leu Gln Arg His Ser Gly Trp Asp Pro His 660 665 670 Arg Pro Ala Trp Ala Asp Val Ser Arg Gly Gly Gln Arg Arg Phe Ile 675 680 685 Val Leu Thr Ala Pro Asp Gly Asp Leu His Arg Leu Pro Arg Ser Trp 690 695 700 Lys Phe Ile Tyr Pro Pro Ile Ser Leu Ile Arg Ala His Arg Leu Leu 705 710 715 720 Ala Glu Arg Ala Ala Arg Gly Val Arg Ile Pro Asp Asp Val Gln Glu 725 730 735 Leu Val Asp Arg Gly Asn Pro Gly Gln Phe Pro Asp Leu Asp Asp Pro 740 745 750 Ser Val Ser Gly Phe Thr Glu Glu Glu Ile Arg Arg Ser Ala Glu Ser 755 760 765 Leu Val Glu Thr Gly Thr Ala Asp Ser Ala Ser Ile Pro Val Pro Lys 770 775 780 Ala Leu Thr Asn Leu Thr Asp Leu Ser Lys Gly Pro Leu Glu Glu Glu 785 790 795 800 Gln Val Thr Thr Arg Phe Asn Ala Asp Ser His Arg Ala Leu Pro Val 805 810 815 Phe Arg Thr His Asp Gly Ala Leu Arg Leu Gly Gly Ala His Gly Glu 820 825 830 Pro Leu Pro Val Pro Arg Glu Gly Lys Leu Ser Lys Asp Glu Leu Lys 835 840 845 Ser Ile Met Lys His Thr Val Pro Val Pro Gly Ser Val Val Arg Gly 850 855 860 Lys Asp Glu Arg His Gln Leu Pro Glu Pro Trp Arg Glu Ile Thr Val 865 870 875 880 Leu Arg Asp Leu Val Val Leu Pro His His Ile Asp Glu Asp Gly Thr 885 890 895 Val His Pro Ala Ser Val Gly Gly Arg Lys Leu Leu Leu Asp Asp Val 900 905 910 Leu Gly Leu Leu Ala Val Glu 915 <210> 1871 <211> 10300 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: EcoCascade polycistronic plasmid <400> 1871 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cccaagaaaa agagaaaagt aggatcgggc gaacagaaac 960 ttatatctga ggaggacctc ggatcgggca tgtcaaattt tattaatatt catgttctga 1020 tcagtcatag cccgagttgc ctgaatagag acgacatgaa tatgcagaaa gacgcaattt 1080 tcggtggcaa gaggcgagtc cgaataagca gccaaagtct taagcgagcc atgaggaaga 1140 gcggctatta tgcccagaat atcggcgagt cctcattgcg gaccatccac ctcgcccagt 1200 tgagagacgt cttgaggcag aaactggggg aaagattcga ccagaaaatc attgacaaga 1260 cccttgccct ccttagtggg aagagcgtgg acgaggctga aaaaatctct gccgacgccg 1320 taacgccctg ggttgtgggt gagattgctt ggttttgtga acaggtggcg aaggcggagg 1380 ccgataacct ggatgacaag aagctgctga aggtccttaa ggaggacata gctgccattc 1440 gggtcaattt gcagcaggga gtggatatcg cattgtccgg aagaatggct acatcaggca 1500 tgatgaccga gctgggcaag gtagacggag ccatgagtat cgcacacgcc atcaccaccc 1560 accaagtcga ctcagacatc gactggttca cagcagtaga tgacctccag gagcaggggt 1620 ctgcccacct tgggacacag gagttctctt ccggggtgtt ttatcgctat gctaatatca 1680 atctggcgca gctgcaagaa aacctggggg gagcctctcg agagcaggcc ctggagattg 1740 caactcacgt cgtgcatatg cttgcgacag aggtacctgg cgccaagcag aggacatacg 1800 ctgcttttaa tccagcagat atggtcatgg taaatttctc tgatatgcct ctctccatgg 1860 ccaacgcatt cgagaaggca gtgaaggcaa aggacgggtt cctgcagcca tcaattcaag 1920 cgtttaatca gtattgggac agagtggcga acggctatgg actgaacgga gccgcagctc 1980 agtttagcct cagcgatgtc gatcccataa ctgcacaggt gaaacagatg cctacgttgg 2040 aacagctgaa gtcatgggta agaaataacg gcgaagccgg cagcggcgag ggcagaggca 2100 gcctgctgac ctgcggcgac gtggaggaga accccggccc ccccaagaaa aagagaaaag 2160 taggatcggg cgattacaaa gatcacgatg gggactacaa ggatcacgat attgactata 2220 aggacgacga tgacaaggga tcgggcatgg ccgacgagat tgacgcaatg gcactttacc 2280 gggcctggca gcagttggat aatggttcat gtgcccagat tcgcagagtt agtgaacctg 2340 acgaactgag agatatcccc gcgttttaca gacttgtcca accgttcgga tgggagaacc 2400 cacggcacca acaagcactc cttcgaatgg tcttctgttt gtccgcagga aaaaatgtaa 2460 tcagacacca agacaaaaag agcgagcaaa ccacaggtat cagcctgggc agggcacttg 2520 ccaactctgg gcggatcaac gaaaggagaa tttttcagct gatacgcgct gatcggactg 2580 cggacatggt gcagctgcgc agactcctta ctcatgccga acctgtcctg gattggcccc 2640 tgatggcacg catgctgact tggtggggaa agagagaaag acagcaactg cttgaagact 2700 tcgtgctcac tacaaataag aatgccggat ccggagaagg aaggggatcc ctcctcacat 2760 gtggagatgt cgaagaaaat cctggacctc ccaagaaaaa gagaaaagta ggatcgggca 2820 tgcggagcta tctcatcctg agactggccg gaccaatgca ggcctgggga cagcctacct 2880 tcgaaggtac acgccccaca ggccgctttc ctaccaggag cggcctgctg ggcctgcttg 2940 gcgcttgtct tgggatccag cgcgatgata ctagctccct gcaagcactg tcagagagcg 3000 tgcagtttgc cgtaagatgc gacgaactga tccttgatga taggcgggtc agtgtcactg 3060 gtctccggga ctaccacacg gtgctggggg cccgggagga ttataggggc ctgaaaagtc 3120 acgagacgat tcaaacctgg cgcgaatatc tgtgcgatgc cagcttcacc gtggccctgt 3180 ggctgactcc acatgccact atggtcatca gtgaactgga aaaggctgtt cttaagcctc 3240 gatatactcc gtatctgggc cgccggagtt gtccacttac acacccactt ttcctcggca 3300 cctgccaggc cagcgaccct caaaaggccc ttctgaatta cgagccagtt ggcggtgaca 3360 tatacagcga agagtccgtg acgggacacc atcttaagtt caccgctcgg gacgagccca 3420 tgattaccct cccacggcag ttcgcatcaa gggagtggta cgtcataaag gggggcatgg 3480 atgtgagtca ggggtctggg gaggggcggg ggtctttgtt gacttgcggg gatgttgagg 3540 agaacccagg gccacccaag aaaaagagaa aagtaggctc aggcggtaaa cccatcccaa 3600 accccttgct tggtctcgac tcaaccggat cgggcatgta tctgtcaaag gttatcattg 3660 cacgcgcgtg gagtagggat ctgtatcagc tgcaccaggg tctgtggcat cttttcccga 3720 accgccccga cgcggcacga gactttctgt ttcacgttga aaaaagaaac acccccgagg 3780 gctgtcatgt gctcctgcag tctgcccaga tgccggtgag cacagctgtg gcgactgtga 3840 tcaagaccaa gcaggtcgag tttcagctcc aggtaggggt tccactgtat tttcgcctga 3900 gagctaatcc gatcaaaacc atactggata atcagaagag gctcgacagc aaaggaaata 3960 ttaaaaggtg ccgggtcccg ctcatcaaag aggctgagca aatcgcttgg cttcaacgga 4020 aactggggaa cgcagcccgc gtggaagacg tccacccgat tagtgaacgg ccccaatatt 4080 tttccggaga cggaaagagc ggcaagattc agacagtctg tttcgagggg gtgctcacca 4140 tcaatgatgc ccccgccctg atagacctgg tgcagcaggg cataggcccc gctaaaagca 4200 tgggatgcgg actgcttagt ctggcaccgc tgggatccgg agagggcaga ggaagtctgc 4260 taacatgcgg tgacgtcgag gagaatcctg gacctcccaa gaaaaagaga aaagtaggat 4320 cgggcatgaa tttgctcatt gataattgga ttccggtgcg cccccggaac ggtgggaaag 4380 tgcagatcat caatttgcaa agtctctact gttccaggga ccagtggaga ctcagcctgc 4440 cacgggatga tatggagctg gcggcgttgg ctctgctcgt atgcatcggc cagattattg 4500 cgccagcaaa ggatgacgtt gaattccggc atcggataat gaaccccctt actgaagatg 4560 agttccagca gcttatcgcc ccatggatcg acatgttcta cctcaaccac gccgagcatc 4620 cttttatgca gaccaaggga gtcaaggcga atgatgtgac tcccatggag aagctgctgg 4680 ccggtgtatc tggggcgacc aactgcgcat tcgtgaatca gcctggacag ggggaggccc 4740 tctgtggagg ctgcactgct atagcacttt ttaaccaagc taatcaagcc cccggctttg 4800 gtggagggtt taagagtgga ttgagggggg gcactcccgt aaccactttt gtgaggggaa 4860 ttgatctgag gtctactgtg ttgctgaacg tcctcacact cccaaggctc cagaagcagt 4920 tcccaaacga aagtcatacc gaaaaccagc ccacatggat caagcccatc aaatctaatg 4980 agagcatacc ggctagcagt attggatttg tacggggtct gttctggcag ccagctcaca 5040 tcgagctgtg tgatcctatt gggatcggca agtgctcttg ttgtgggcag gagtccaacc 5100 ttaggtatac tggatttctg aaagagaagt ttacctttac agtaaatggg ctctggcccc 5160 acccccactc accttgcctt gtgacagtga aaaaggggga agtcgaggag aagtttctgg 5220 cctttacaac ttctgcccct tcctggactc agatttccag agtggtggta gataagataa 5280 ttcaaaacga gaatggcaat agagtggccg ccgtggtgaa ccagtttcgc aacatcgccc 5340 ctcagtcccc cctggagctg attatgggcg gttatcggaa taaccaggcc agtatactcg 5400 agcgacggca cgatgtcctc atgttcaatc aaggttggca gcaatatggc aatgtgatta 5460 acgagatcgt aaccgtgggc ctgggatata agaccgccct gcggaaggcg ttgtatactt 5520 ttgcagaagg ctttaagaat aaggatttta agggtgccgg cgtgagtgtc catgaaacag 5580 ctgaacggca cttttatcgg cagtccgagc tgttgatacc agacgtgctg gctaatgtga 5640 acttctcaca ggccgacgaa gtgatcgctg atctgcggga taaactgcac caactgtgcg 5700 agatgctgtt taatcaaagc gtcgctcctt atgcccacca cccaaagctg atctccacgc 5760 tggccctggc gcgcgccaca ctttataaac atctccgcga actgaaaccc caggggggcc 5820 ccagcaatgg ctaataatct agagggccct attctatagt gtcacctaaa tgctagagct 5880 cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 5940 gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 6000 attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 6060 agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 6120 gcttctgagg cggaaagaac cagctggggc tctagggggt atccccacgc gccctgtagc 6180 ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 6240 gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 6300 ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac 6360 ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag 6420 acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 6480 actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg 6540 atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattaattc 6600 tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta 6660 tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag 6720 caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa 6780 ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc catggctgac 6840 taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta ttccagaagt 6900 agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga gcttgtatat 6960 ccattttcgg atctgatcaa gagacaggat gaggatcgtt tcgcatgatt gaacaagatg 7020 gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat gactgggcac 7080 aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag gggcgcccgg 7140 ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaggac gaggcagcgc 7200 ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac gttgtcactg 7260 aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc ctgtcatctc 7320 accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg ctgcatacgc 7380 ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag cgagcacgta 7440 ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat caggggctcg 7500 cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag gatctcgtcg 7560 tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc ttttctggat 7620 tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg ttggctaccc 7680 gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg ctttacggta 7740 tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag ttcttctgag 7800 cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt 7860 cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 7920 ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 7980 tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 8040 atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 8100 ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc tgtttcctgt 8160 gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 8220 agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 8280 tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 8340 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8400 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8460 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8520 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8580 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8640 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8700 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 8760 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 8820 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 8880 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 8940 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9000 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9060 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9120 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9180 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9240 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9300 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9360 catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 9420 ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 9480 aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 9540 ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 9600 caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 9660 attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 9720 agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 9780 actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 9840 ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 9900 ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 9960 gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 10020 atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 10080 cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 10140 gacacggaaa tgttgaatac tcatactctt cctttttcat tattattgaa gcatttatca 10200 gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 10260 ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc 10300 <210> 1872 <211> 1638 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: EcoCascade polycistronic plasmid <400> 1872 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Glu Gln Lys Leu Ile 1 5 10 15 Ser Glu Glu Asp Leu Gly Ser Gly Met Ser Asn Phe Ile Asn Ile His 20 25 30 Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp Asp Met Asn 35 40 45 Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val Arg Ile Ser 50 55 60 Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr Tyr Ala Gln 65 70 75 80 Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala Gln Leu Arg 85 90 95 Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln Lys Ile Ile 100 105 110 Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp Glu Ala Glu 115 120 125 Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly Glu Ile Ala 130 135 140 Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn Leu Asp Asp 145 150 155 160 Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala Ile Arg Val 165 170 175 Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg Met Ala Thr 180 185 190 Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala Met Ser Ile 195 200 205 Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile Asp Trp Phe 210 215 220 Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His Leu Gly Thr 225 230 235 240 Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn Ile Asn Leu 245 250 255 Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu Gln Ala Leu 260 265 270 Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu Val Pro Gly 275 280 285 Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp Met Val Met 290 295 300 Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala Phe Glu Lys 305 310 315 320 Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile Gln Ala Phe 325 330 335 Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu Asn Gly Ala 340 345 350 Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr Ala Gln Val 355 360 365 Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val Arg Asn Asn 370 375 380 Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly 385 390 395 400 Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val Gly 405 410 415 Ser Gly Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile 420 425 430 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Gly Met Ala Asp Glu Ile 435 440 445 Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser 450 455 460 Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp Glu Leu Arg Asp Ile 465 470 475 480 Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly Trp Glu Asn Pro Arg 485 490 495 His Gln Gln Ala Leu Leu Arg Met Val Phe Cys Leu Ser Ala Gly Lys 500 505 510 Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile 515 520 525 Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg 530 535 540 Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala Asp Met Val Gln Leu 545 550 555 560 Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu Asp Trp Pro Leu Met 565 570 575 Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu 580 585 590 Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly 595 600 605 Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro 610 615 620 Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Arg Ser Tyr Leu Ile 625 630 635 640 Leu Arg Leu Ala Gly Pro Met Gln Ala Trp Gly Gln Pro Thr Phe Glu 645 650 655 Gly Thr Arg Pro Thr Gly Arg Phe Pro Thr Arg Ser Gly Leu Leu Gly 660 665 670 Leu Leu Gly Ala Cys Leu Gly Ile Gln Arg Asp Asp Thr Ser Ser Leu 675 680 685 Gln Ala Leu Ser Glu Ser Val Gln Phe Ala Val Arg Cys Asp Glu Leu 690 695 700 Ile Leu Asp Asp Arg Arg Val Ser Val Thr Gly Leu Arg Asp Tyr His 705 710 715 720 Thr Val Leu Gly Ala Arg Glu Asp Tyr Arg Gly Leu Lys Ser His Glu 725 730 735 Thr Ile Gln Thr Trp Arg Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val 740 745 750 Ala Leu Trp Leu Thr Pro His Ala Thr Met Val Ile Ser Glu Leu Glu 755 760 765 Lys Ala Val Leu Lys Pro Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser 770 775 780 Cys Pro Leu Thr His Pro Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp 785 790 795 800 Pro Gln Lys Ala Leu Leu Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr 805 810 815 Ser Glu Glu Ser Val Thr Gly His His Leu Lys Phe Thr Ala Arg Asp 820 825 830 Glu Pro Met Ile Thr Leu Pro Arg Gln Phe Ala Ser Arg Glu Trp Tyr 835 840 845 Val Ile Lys Gly Gly Met Asp Val Ser Gln Gly Ser Gly Glu Gly Arg 850 855 860 Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro 865 870 875 880 Lys Lys Lys Arg Lys Val Gly Ser Gly Gly Lys Pro Ile Pro Asn Pro 885 890 895 Leu Leu Gly Leu Asp Ser Thr Gly Ser Gly Met Tyr Leu Ser Lys Val 900 905 910 Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu Tyr Gln Leu His Gln Gly 915 920 925 Leu Trp His Leu Phe Pro Asn Arg Pro Asp Ala Ala Arg Asp Phe Leu 930 935 940 Phe His Val Glu Lys Arg Asn Thr Pro Glu Gly Cys His Val Leu Leu 945 950 955 960 Gln Ser Ala Gln Met Pro Val Ser Thr Ala Val Ala Thr Val Ile Lys 965 970 975 Thr Lys Gln Val Glu Phe Gln Leu Gln Val Gly Val Pro Leu Tyr Phe 980 985 990 Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile Leu Asp Asn Gln Lys Arg 995 1000 1005 Leu Asp Ser Lys Gly Asn Ile Lys Arg Cys Arg Val Pro Leu Ile 1010 1015 1020 Lys Glu Ala Glu Gln Ile Ala Trp Leu Gln Arg Lys Leu Gly Asn 1025 1030 1035 Ala Ala Arg Val Glu Asp Val His Pro Ile Ser Glu Arg Pro Gln 1040 1045 1050 Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys Ile Gln Thr Val Cys 1055 1060 1065 Phe Glu Gly Val Leu Thr Ile Asn Asp Ala Pro Ala Leu Ile Asp 1070 1075 1080 Leu Val Gln Gln Gly Ile Gly Pro Ala Lys Ser Met Gly Cys Gly 1085 1090 1095 Leu Leu Ser Leu Ala Pro Leu Gly Ser Gly Glu Gly Arg Gly Ser 1100 1105 1110 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys 1115 1120 1125 Lys Lys Arg Lys Val Gly Ser Gly Met Asn Leu Leu Ile Asp Asn 1130 1135 1140 Trp Ile Pro Val Arg Pro Arg Asn Gly Gly Lys Val Gln Ile Ile 1145 1150 1155 Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser 1160 1165 1170 Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu Ala Leu Leu Val 1175 1180 1185 Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp Val Glu Phe 1190 1195 1200 Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln 1205 1210 1215 Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala Glu 1220 1225 1230 His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr 1235 1240 1245 Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys 1250 1255 1260 Ala Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly 1265 1270 1275 Cys Thr Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly 1280 1285 1290 Phe Gly Gly Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val 1295 1300 1305 Thr Thr Phe Val Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu 1310 1315 1320 Asn Val Leu Thr Leu Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu 1325 1330 1335 Ser His Thr Glu Asn Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser 1340 1345 1350 Asn Glu Ser Ile Pro Ala Ser Ser Ile Gly Phe Val Arg Gly Leu 1355 1360 1365 Phe Trp Gln Pro Ala His Ile Glu Leu Cys Asp Pro Ile Gly Ile 1370 1375 1380 Gly Lys Cys Ser Cys Cys Gly Gln Glu Ser Asn Leu Arg Tyr Thr 1385 1390 1395 Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr Val Asn Gly Leu Trp 1400 1405 1410 Pro His Pro His Ser Pro Cys Leu Val Thr Val Lys Lys Gly Glu 1415 1420 1425 Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp 1430 1435 1440 Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln Asn Glu 1445 1450 1455 Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn Ile 1460 1465 1470 Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn 1475 1480 1485 Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe 1490 1495 1500 Asn Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val 1505 1510 1515 Thr Val Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr 1520 1525 1530 Thr Phe Ala Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly 1535 1540 1545 Val Ser Val His Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser 1550 1555 1560 Glu Leu Leu Ile Pro Asp Val Leu Ala Asn Val Asn Phe Ser Gln 1565 1570 1575 Ala Asp Glu Val Ile Ala Asp Leu Arg Asp Lys Leu His Gln Leu 1580 1585 1590 Cys Glu Met Leu Phe Asn Gln Ser Val Ala Pro Tyr Ala His His 1595 1600 1605 Pro Lys Leu Ile Ser Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr 1610 1615 1620 Lys His Leu Arg Glu Leu Lys Pro Gln Gly Gly Pro Ser Asn Gly 1625 1630 1635 <210> 1873 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target specific primer <400> 1873 cactctttcc ctacacgacg ctcttccgat ctctcttcca accacactgc ag 52 <210> 1874 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Target specific primer <400> 1874 ggagttcaga cgtgtgctct tccgatctgg tttccaggtt gccgtttt 48 <210> 1875 <211> 12850 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas3-17aa-Cas8 fusion <400> 1875 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcagggg tctggggagg ggcgggggtc tttgttgact tgcggggatg 3420 ttgaggagaa tcctggacct cccaaaaaaa aacggaaggt gggctcaggc atgtatctgt 3480 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 3540 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 3600 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 3660 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 3720 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 3780 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 3840 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 3900 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 3960 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 4020 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctggga tccggagagg 4080 gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct cccaagaaaa 4140 agagaaaagt aggatcgggc atggagccct tcaagtacat ctgccactat tggggcaaga 4200 gctccaagag cctgacaaag ggcaacgaca tccacctgct gatctaccac tgcctggacg 4260 tggcagcagt ggcagattgt tggtgggacc agtctgtggt gctgcagaat accttttgtc 4320 ggaacgagat gctgagcaag cagagagtga aggcctggct gctgttcttt atcgccctgc 4380 acgacatcgg caagttcgac atcaggtttc agtataagtc cgccgagtct tggctgaagc 4440 tgaatccagc cacacccagc ctgaacggcc cttccaccca gatgtgcagg aagttcaatc 4500 acggcgcagc aggactgtac tggtttaacc aggactctct gagcgagcag tccctgggcg 4560 atttcttttc tttctttgac gcagcacctc acccctacga gagctggttc ccttgggtgg 4620 aggcagtgac aggacaccac ggctttatcc tgcacagcca ggaccaggat aagtccaggt 4680 gggagatgcc agccagcctg gcctcctacg ccgcacagga taagcaggcc cgcgaggagt 4740 ggatctccgt gctggaggcc ctgttcctga ccccagcagg actgtctatc aatgacatcc 4800 cccctgactg ctctagcctg ctggccggct tttgttctct ggccgactgg ctgggcagct 4860 ggaccacaac caatacattc ctgtttaacg aggatgcacc atccgacatc aacgcactgc 4920 gcacctactt ccaggatagg cagcaggacg ccagccgggt gctggagctg tccggcctgg 4980 tgtctaataa gcggtgctac gagggagtgc acgcactgct ggataacggc tatcagccca 5040 gacagctgca ggtgctggtg gacgcactgc ctgtggcacc aggactgaca gtgatcgagg 5100 cacctaccgg ctccggcaag acagagaccg ccctggccta tgcctggaag ctgatcgatc 5160 agcagatcgc cgactctgtg atcttcgccc tgccaacaca ggccaccgcc aatgccatgc 5220 tgaccaggat ggaggcctcc gcctctcacc tgttttcctc tcccaacctg atcctggccc 5280 acggcaacag ccggttcaat cacctgtttc agtctatcaa gagcagagcc atcacagagc 5340 agggacagga ggaggcctgg gtgcagtgct gtcagtggct gagccagtcc aataagaagg 5400 tgttcctggg ccagatcggc gtgtgcacca tcgatcaggt gctgatcagc gtgctgcctg 5460 tgaagcacag gtttatcagg ggactgggaa tcggccgctc cgtgctgatc gtggatgagg 5520 tgcacgccta cgacacatat atgaacggcc tgctggaggc cgtgctgaag gcacaggcag 5580 acgtgggcgg ctctgtgatc ctgctgagcg ccaccctgcc aatgaagcag aagcagaagc 5640 tgctggatac atacggcctg cacaccgacc ccgtggagaa caattctgcc tatcctctga 5700 tcaattggag gggagtgaac ggagcacagc ggttcgacct gctggcccac cctgagcagc 5760 tgccaccacg gttttccatc cagcccgagc ctatctgcct ggccgatatg ctgccagacc 5820 tgaccatgct ggagagaatg atcgctgccg ccaatgcagg agcacaggtg tgcctgatct 5880 gtaacctggt ggatgtggcc caggtgtgct accagcggct gaaggagctg aacaatacac 5940 aggtggacat cgatctgttc cacgccaggt ttaccctgaa tgaccggaga gagaaggaga 6000 accgcgtgat cagcaacttc ggcaagaatg gcaagagaaa cgtgggcaga atcctggtgg 6060 ccacacaggt ggtggagcag tccctggacg tggatttcga ctggctgatc acccagcact 6120 gccccgccga tctgctgttt cagcggctgg gcagactgca caggcaccac cgcaagtata 6180 ggcctgcagg attcgagatc ccagtggcaa caatcctgct gcctgacgga gagggatacg 6240 gccggcacga gcacatctat agcaatgtgc gcgtgatgtg gcggacccag cagcacatcg 6300 aggagctgaa cggcgccagc ctgttctttc cagatgccta cagacagtgg ctggactcca 6360 tctatgacga tgccgagatg gatgagcccg agtgggtggg caatggcatg gacaagttcg 6420 agtccgccga gtgtgagaag cggttcaagg ccaggaaggt gctgcagtgg gccgaggagt 6480 actctctgca ggataacgac gagacaatcc tggccgtgac ccgggacgga gagatgagcc 6540 tgccactgct gccttatgtg cagacaagct ccggcaagca gctgctggat ggccaggtgt 6600 acgaggacct gagccacgag cagcagtatg aggccctggc cctgaacagg gtgaatgtgc 6660 ccttcacctg gaagcggagc ttcagcgaag tggtggatga ggacggcctg ctgtggctgg 6720 agggcaagca gaatctggat ggctgggtgt ggcagggcaa ctccatcgtg atcacataca 6780 ccggcgacga gggcatgacc agagtgatcc cagccaaccc caaggctgac ccaactaaca 6840 gagctaaggg cctggaggcc gtatctgtgg catcaatgaa tttgctcatt gataattgga 6900 ttccggtgcg cccccggaac ggtgggaaag tgcagatcat caatttgcaa agtctctact 6960 gttccaggga ccagtggaga ctcagcctgc cacgggatga tatggagctg gcggcgttgg 7020 ctctgctcgt atgcatcggc cagattattg cgccagcaaa ggatgacgtt gaattccggc 7080 atcggataat gaaccccctt actgaagatg agttccagca gcttatcgcc ccatggatcg 7140 acatgttcta cctcaaccac gccgagcatc cttttatgca gaccaaggga gtcaaggcga 7200 atgatgtgac tcccatggag aagctgctgg ccggtgtatc tggggcgacc aactgcgcat 7260 tcgtgaatca gcctggacag ggggaggccc tctgtggagg ctgcactgct atagcacttt 7320 ttaaccaagc taatcaagcc cccggctttg gtggagggtt taagagtgga ttgagggggg 7380 gcactcccgt aaccactttt gtgaggggaa ttgatctgag gtctactgtg ttgctgaacg 7440 tcctcacact cccaaggctc cagaagcagt tcccaaacga aagtcatacc gaaaaccagc 7500 ccacatggat caagcccatc aaatctaatg agagcatacc ggctagcagt attggatttg 7560 tacggggtct gttctggcag ccagctcaca tcgagctgtg tgatcctatt gggatcggca 7620 agtgctcttg ttgtgggcag gagtccaacc ttaggtatac tggatttctg aaagagaagt 7680 ttacctttac agtaaatggg ctctggcccc acccccactc accttgcctt gtgacagtga 7740 aaaaggggga agtcgaggag aagtttctgg cctttacaac ttctgcccct tcctggactc 7800 agatttccag agtggtggta gataagataa ttcaaaacga gaatggcaat agagtggccg 7860 ccgtggtgaa ccagtttcgc aacatcgccc ctcagtcccc cctggagctg attatgggcg 7920 gttatcggaa taaccaggcc agtatactcg agcgacggca cgatgtcctc atgttcaatc 7980 aaggttggca gcaatatggc aatgtgatta acgagatcgt aaccgtgggc ctgggatata 8040 agaccgccct gcggaaggcg ttgtatactt ttgcagaagg ctttaagaat aaggatttta 8100 agggtgccgg cgtgagtgtc catgaaacag ctgaacggca cttttatcgg cagtccgagc 8160 tgttgatacc agacgtgctg gctaatgtga acttctcaca ggccgacgaa gtgatcgctg 8220 atctgcggga taaactgcac caactgtgcg agatgctgtt taatcaaagc gtcgctcctt 8280 atgcccacca cccaaagctg atctccacgc tggccctggc gcgcgccaca ctttataaac 8340 atctccgcga actgaaaccc caggggggcc ccagcaatgg ctaataatct agagggccct 8400 attctatagt gtcacctaaa tgctagagct cgctgatcag cctcgactgt gccttctagt 8460 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 8520 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 8580 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 8640 aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac cagctggggc 8700 tctagggggt atccccacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 8760 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 8820 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 8880 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 8940 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 9000 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 9060 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 9120 atttaacaaa aatttaacgc gaattaattc tgtggaatgt gtgtcagtta gggtgtggaa 9180 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 9240 ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 9300 attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 9360 gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 9420 ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 9480 tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa gagacaggat 9540 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 9600 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 9660 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 9720 ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 9780 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 9840 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 9900 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 9960 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 10020 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 10080 cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 10140 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 10200 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 10260 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 10320 tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 10380 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 10440 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 10500 gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 10560 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 10620 gtccaaactc atcaatgtat cttatcatgt ctgtataccg tcgacctcta gctagagctt 10680 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 10740 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 10800 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 10860 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 10920 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 10980 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 11040 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 11100 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 11160 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 11220 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 11280 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 11340 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 11400 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 11460 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 11520 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 11580 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 11640 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 11700 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 11760 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 11820 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 11880 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 11940 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 12000 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 12060 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 12120 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 12180 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 12240 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 12300 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 12360 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 12420 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 12480 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 12540 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 12600 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 12660 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 12720 cctttttcat tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 12780 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 12840 acctgacgtc 12850 <210> 1876 <211> 12847 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas8-17aa-Cas3 fusion <400> 1876 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcagggg tctggggagg ggcgggggtc tttgttgact tgcggggatg 3420 ttgaggagaa tcctggacct cccaaaaaaa aacggaaggt gggctcaggc atgtatctgt 3480 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 3540 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 3600 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 3660 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 3720 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 3780 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 3840 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 3900 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 3960 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 4020 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctggga tccggagagg 4080 gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct cccaagaaaa 4140 agagaaaagt aggatcgggc aatttgctca ttgataattg gattccggtg cgcccccgga 4200 acggtgggaa agtgcagatc atcaatttgc aaagtctcta ctgttccagg gaccagtgga 4260 gactcagcct gccacgggat gatatggagc tggcggcgtt ggctctgctc gtatgcatcg 4320 gccagattat tgcgccagca aaggatgacg ttgaattccg gcatcggata atgaaccccc 4380 ttactgaaga tgagttccag cagcttatcg ccccatggat cgacatgttc tacctcaacc 4440 acgccgagca tccttttatg cagaccaagg gagtcaaggc gaatgatgtg actcccatgg 4500 agaagctgct ggccggtgta tctggggcga ccaactgcgc attcgtgaat cagcctggac 4560 agggggaggc cctctgtgga ggctgcactg ctatagcact ttttaaccaa gctaatcaag 4620 cccccggctt tggtggaggg tttaagagtg gattgagggg gggcactccc gtaaccactt 4680 ttgtgagggg aattgatctg aggtctactg tgttgctgaa cgtcctcaca ctcccaaggc 4740 tccagaagca gttcccaaac gaaagtcata ccgaaaacca gcccacatgg atcaagccca 4800 tcaaatctaa tgagagcata ccggctagca gtattggatt tgtacggggt ctgttctggc 4860 agccagctca catcgagctg tgtgatccta ttgggatcgg caagtgctct tgttgtgggc 4920 aggagtccaa ccttaggtat actggatttc tgaaagagaa gtttaccttt acagtaaatg 4980 ggctctggcc ccacccccac tcaccttgcc ttgtgacagt gaaaaagggg gaagtcgagg 5040 agaagtttct ggcctttaca acttctgccc cttcctggac tcagatttcc agagtggtgg 5100 tagataagat aattcaaaac gagaatggca atagagtggc cgccgtggtg aaccagtttc 5160 gcaacatcgc ccctcagtcc cccctggagc tgattatggg cggttatcgg aataaccagg 5220 ccagtatact cgagcgacgg cacgatgtcc tcatgttcaa tcaaggttgg cagcaatatg 5280 gcaatgtgat taacgagatc gtaaccgtgg gcctgggata taagaccgcc ctgcggaagg 5340 cgttgtatac ttttgcagaa ggctttaaga ataaggattt taagggtgcc ggcgtgagtg 5400 tccatgaaac agctgaacgg cacttttatc ggcagtccga gctgttgata ccagacgtgc 5460 tggctaatgt gaacttctca caggccgacg aagtgatcgc tgatctgcgg gataaactgc 5520 accaactgtg cgagatgctg tttaatcaaa gcgtcgctcc ttatgcccac cacccaaagc 5580 tgatctccac gctggccctg gcgcgcgcca cactttataa acatctccgc gaactgaaac 5640 cccagggggg ccccagcaat ggcgctgacc caactaacag agctaagggc ctggaggccg 5700 tatctgtggc atcaatggag cccttcaagt acatctgcca ctattggggc aagagctcca 5760 agagcctgac aaagggcaac gacatccacc tgctgatcta ccactgcctg gacgtggcag 5820 cagtggcaga ttgttggtgg gaccagtctg tggtgctgca gaataccttt tgtcggaacg 5880 agatgctgag caagcagaga gtgaaggcct ggctgctgtt ctttatcgcc ctgcacgaca 5940 tcggcaagtt cgacatcagg tttcagtata agtccgccga gtcttggctg aagctgaatc 6000 cagccacacc cagcctgaac ggcccttcca cccagatgtg caggaagttc aatcacggcg 6060 cagcaggact gtactggttt aaccaggact ctctgagcga gcagtccctg ggcgatttct 6120 tttctttctt tgacgcagca cctcacccct acgagagctg gttcccttgg gtggaggcag 6180 tgacaggaca ccacggcttt atcctgcaca gccaggacca ggataagtcc aggtgggaga 6240 tgccagccag cctggcctcc tacgccgcac aggataagca ggcccgcgag gagtggatct 6300 ccgtgctgga ggccctgttc ctgaccccag caggactgtc tatcaatgac atcccccctg 6360 actgctctag cctgctggcc ggcttttgtt ctctggccga ctggctgggc agctggacca 6420 caaccaatac attcctgttt aacgaggatg caccatccga catcaacgca ctgcgcacct 6480 acttccagga taggcagcag gacgccagcc gggtgctgga gctgtccggc ctggtgtcta 6540 ataagcggtg ctacgaggga gtgcacgcac tgctggataa cggctatcag cccagacagc 6600 tgcaggtgct ggtggacgca ctgcctgtgg caccaggact gacagtgatc gaggcaccta 6660 ccggctccgg caagacagag accgccctgg cctatgcctg gaagctgatc gatcagcaga 6720 tcgccgactc tgtgatcttc gccctgccaa cacaggccac cgccaatgcc atgctgacca 6780 ggatggaggc ctccgcctct cacctgtttt cctctcccaa cctgatcctg gcccacggca 6840 acagccggtt caatcacctg tttcagtcta tcaagagcag agccatcaca gagcagggac 6900 aggaggaggc ctgggtgcag tgctgtcagt ggctgagcca gtccaataag aaggtgttcc 6960 tgggccagat cggcgtgtgc accatcgatc aggtgctgat cagcgtgctg cctgtgaagc 7020 acaggtttat caggggactg ggaatcggcc gctccgtgct gatcgtggat gaggtgcacg 7080 cctacgacac atatatgaac ggcctgctgg aggccgtgct gaaggcacag gcagacgtgg 7140 gcggctctgt gatcctgctg agcgccaccc tgccaatgaa gcagaagcag aagctgctgg 7200 atacatacgg cctgcacacc gaccccgtgg agaacaattc tgcctatcct ctgatcaatt 7260 ggaggggagt gaacggagca cagcggttcg acctgctggc ccaccctgag cagctgccac 7320 cacggttttc catccagccc gagcctatct gcctggccga tatgctgcca gacctgacca 7380 tgctggagag aatgatcgct gccgccaatg caggagcaca ggtgtgcctg atctgtaacc 7440 tggtggatgt ggcccaggtg tgctaccagc ggctgaagga gctgaacaat acacaggtgg 7500 acatcgatct gttccacgcc aggtttaccc tgaatgaccg gagagagaag gagaaccgcg 7560 tgatcagcaa cttcggcaag aatggcaaga gaaacgtggg cagaatcctg gtggccacac 7620 aggtggtgga gcagtccctg gacgtggatt tcgactggct gatcacccag cactgccccg 7680 ccgatctgct gtttcagcgg ctgggcagac tgcacaggca ccaccgcaag tataggcctg 7740 caggattcga gatcccagtg gcaacaatcc tgctgcctga cggagaggga tacggccggc 7800 acgagcacat ctatagcaat gtgcgcgtga tgtggcggac ccagcagcac atcgaggagc 7860 tgaacggcgc cagcctgttc tttccagatg cctacagaca gtggctggac tccatctatg 7920 acgatgccga gatggatgag cccgagtggg tgggcaatgg catggacaag ttcgagtccg 7980 ccgagtgtga gaagcggttc aaggccagga aggtgctgca gtgggccgag gagtactctc 8040 tgcaggataa cgacgagaca atcctggccg tgacccggga cggagagatg agcctgccac 8100 tgctgcctta tgtgcagaca agctccggca agcagctgct ggatggccag gtgtacgagg 8160 acctgagcca cgagcagcag tatgaggccc tggccctgaa cagggtgaat gtgcccttca 8220 cctggaagcg gagcttcagc gaagtggtgg atgaggacgg cctgctgtgg ctggagggca 8280 agcagaatct ggatggctgg gtgtggcagg gcaactccat cgtgatcaca tacaccggcg 8340 acgagggcat gaccagagtg atcccagcca accccaagta ataatctaga gggccctatt 8400 ctatagtgtc acctaaatgc tagagctcgc tgatcagcct cgactgtgcc ttctagttgc 8460 cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 8520 actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 8580 attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 8640 catgctgggg atgcggtggg ctctatggct tctgaggcgg aaagaaccag ctggggctct 8700 agggggtatc cccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 8760 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 8820 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 8880 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 8940 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 9000 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 9060 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 9120 taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg tcagttaggg tgtggaaagt 9180 ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 9240 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 9300 agtcagcaac catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt 9360 ccgcccattc tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg 9420 cctctgcctc tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt 9480 gcaaaaagct cccgggagct tgtatatcca ttttcggatc tgatcaagag acaggatgag 9540 gatcgtttcg catgattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg 9600 agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt 9660 tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc 9720 tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt 9780 gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag 9840 tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg 9900 ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag 9960 cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg 10020 atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc 10080 gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 10140 tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc 10200 gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 10260 ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 10320 atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga ccgaccaagc 10380 gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg aaaggttggg 10440 cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct 10500 ggagttcttc gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa 10560 tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc 10620 caaactcatc aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc 10680 gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa 10740 catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac 10800 attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 10860 ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 10920 ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 10980 aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 11040 aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 11100 gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 11160 gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 11220 tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 11280 ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 11340 ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 11400 tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 11460 tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 11520 ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 11580 aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 11640 ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 11700 tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 11760 atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 11820 aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 11880 ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 11940 tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 12000 ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 12060 tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 12120 aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 12180 gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 12240 tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 12300 cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 12360 tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 12420 ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 12480 cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 12540 actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 12600 ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 12660 aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 12720 ttttcattat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 12780 atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 12840 tgacgtc 12847 <210> 1877 <211> 12850 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas3-17aa-Cas5 fusion <400> 1877 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgga gcccttcaag tacatctgcc actattgggg caagagctcc aagagcctga 2760 caaagggcaa cgacatccac ctgctgatct accactgcct ggacgtggca gcagtggcag 2820 attgttggtg ggaccagtct gtggtgctgc agaatacctt ttgtcggaac gagatgctga 2880 gcaagcagag agtgaaggcc tggctgctgt tctttatcgc cctgcacgac atcggcaagt 2940 tcgacatcag gtttcagtat aagtccgccg agtcttggct gaagctgaat ccagccacac 3000 ccagcctgaa cggcccttcc acccagatgt gcaggaagtt caatcacggc gcagcaggac 3060 tgtactggtt taaccaggac tctctgagcg agcagtccct gggcgatttc ttttctttct 3120 ttgacgcagc acctcacccc tacgagagct ggttcccttg ggtggaggca gtgacaggac 3180 accacggctt tatcctgcac agccaggacc aggataagtc caggtgggag atgccagcca 3240 gcctggcctc ctacgccgca caggataagc aggcccgcga ggagtggatc tccgtgctgg 3300 aggccctgtt cctgacccca gcaggactgt ctatcaatga catcccccct gactgctcta 3360 gcctgctggc cggcttttgt tctctggccg actggctggg cagctggacc acaaccaata 3420 cattcctgtt taacgaggat gcaccatccg acatcaacgc actgcgcacc tacttccagg 3480 ataggcagca ggacgccagc cgggtgctgg agctgtccgg cctggtgtct aataagcggt 3540 gctacgaggg agtgcacgca ctgctggata acggctatca gcccagacag ctgcaggtgc 3600 tggtggacgc actgcctgtg gcaccaggac tgacagtgat cgaggcacct accggctccg 3660 gcaagacaga gaccgccctg gcctatgcct ggaagctgat cgatcagcag atcgccgact 3720 ctgtgatctt cgccctgcca acacaggcca ccgccaatgc catgctgacc aggatggagg 3780 cctccgcctc tcacctgttt tcctctccca acctgatcct ggcccacggc aacagccggt 3840 tcaatcacct gtttcagtct atcaagagca gagccatcac agagcaggga caggaggagg 3900 cctgggtgca gtgctgtcag tggctgagcc agtccaataa gaaggtgttc ctgggccaga 3960 tcggcgtgtg caccatcgat caggtgctga tcagcgtgct gcctgtgaag cacaggttta 4020 tcaggggact gggaatcggc cgctccgtgc tgatcgtgga tgaggtgcac gcctacgaca 4080 catatatgaa cggcctgctg gaggccgtgc tgaaggcaca ggcagacgtg ggcggctctg 4140 tgatcctgct gagcgccacc ctgccaatga agcagaagca gaagctgctg gatacatacg 4200 gcctgcacac cgaccccgtg gagaacaatt ctgcctatcc tctgatcaat tggaggggag 4260 tgaacggagc acagcggttc gacctgctgg cccaccctga gcagctgcca ccacggtttt 4320 ccatccagcc cgagcctatc tgcctggccg atatgctgcc agacctgacc atgctggaga 4380 gaatgatcgc tgccgccaat gcaggagcac aggtgtgcct gatctgtaac ctggtggatg 4440 tggcccaggt gtgctaccag cggctgaagg agctgaacaa tacacaggtg gacatcgatc 4500 tgttccacgc caggtttacc ctgaatgacc ggagagagaa ggagaaccgc gtgatcagca 4560 acttcggcaa gaatggcaag agaaacgtgg gcagaatcct ggtggccaca caggtggtgg 4620 agcagtccct ggacgtggat ttcgactggc tgatcaccca gcactgcccc gccgatctgc 4680 tgtttcagcg gctgggcaga ctgcacaggc accaccgcaa gtataggcct gcaggattcg 4740 agatcccagt ggcaacaatc ctgctgcctg acggagaggg atacggccgg cacgagcaca 4800 tctatagcaa tgtgcgcgtg atgtggcgga cccagcagca catcgaggag ctgaacggcg 4860 ccagcctgtt ctttccagat gcctacagac agtggctgga ctccatctat gacgatgccg 4920 agatggatga gcccgagtgg gtgggcaatg gcatggacaa gttcgagtcc gccgagtgtg 4980 agaagcggtt caaggccagg aaggtgctgc agtgggccga ggagtactct ctgcaggata 5040 acgacgagac aatcctggcc gtgacccggg acggagagat gagcctgcca ctgctgcctt 5100 atgtgcagac aagctccggc aagcagctgc tggatggcca ggtgtacgag gacctgagcc 5160 acgagcagca gtatgaggcc ctggccctga acagggtgaa tgtgcccttc acctggaagc 5220 ggagcttcag cgaagtggtg gatgaggacg gcctgctgtg gctggagggc aagcagaatc 5280 tggatggctg ggtgtggcag ggcaactcca tcgtgatcac atacaccggc gacgagggca 5340 tgaccagagt gatcccagcc aaccccaagg ctgacccaac taacagagct aagggcctgg 5400 aggccgtatc tgtggcatca atgcggagct atctcatcct gagactggcc ggaccaatgc 5460 aggcctgggg acagcctacc ttcgaaggta cacgccccac aggccgcttt cctaccagga 5520 gcggcctgct gggcctgctt ggcgcttgtc ttgggatcca gcgcgatgat actagctccc 5580 tgcaagcact gtcagagagc gtgcagtttg ccgtaagatg cgacgaactg atccttgatg 5640 ataggcgggt cagtgtcact ggtctccggg actaccacac ggtgctgggg gcccgggagg 5700 attatagggg cctgaaaagt cacgagacga ttcaaacctg gcgcgaatat ctgtgcgatg 5760 ccagcttcac cgtggccctg tggctgactc cacatgccac tatggtcatc agtgaactgg 5820 aaaaggctgt tcttaagcct cgatatactc cgtatctggg ccgccggagt tgtccactta 5880 cacacccact tttcctcggc acctgccagg ccagcgaccc tcaaaaggcc cttctgaatt 5940 acgagccagt tggcggtgac atatacagcg aagagtccgt gacgggacac catcttaagt 6000 tcaccgctcg ggacgagccc atgattaccc tcccacggca gttcgcatca agggagtggt 6060 acgtcataaa ggggggcatg gatgtgagtc aggggtctgg ggaggggcgg gggtctttgt 6120 tgacttgcgg ggatgttgag gagaatcctg gacctcccaa aaaaaaacgg aaggtgggct 6180 caggcatgta tctgtcaaag gttatcattg cacgcgcgtg gagtagggat ctgtatcagc 6240 tgcaccaggg tctgtggcat cttttcccga accgccccga cgcggcacga gactttctgt 6300 ttcacgttga aaaaagaaac acccccgagg gctgtcatgt gctcctgcag tctgcccaga 6360 tgccggtgag cacagctgtg gcgactgtga tcaagaccaa gcaggtcgag tttcagctcc 6420 aggtaggggt tccactgtat tttcgcctga gagctaatcc gatcaaaacc atactggata 6480 atcagaagag gctcgacagc aaaggaaata ttaaaaggtg ccgggtcccg ctcatcaaag 6540 aggctgagca aatcgcttgg cttcaacgga aactggggaa cgcagcccgc gtggaagacg 6600 tccacccgat tagtgaacgg ccccaatatt tttccggaga cggaaagagc ggcaagattc 6660 agacagtctg tttcgagggg gtgctcacca tcaatgatgc ccccgccctg atagacctgg 6720 tgcagcaggg cataggcccc gctaaaagca tgggatgcgg actgcttagt ctggcaccgc 6780 tgggatccgg agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg 6840 gacctcccaa gaaaaagaga aaagtaggat cgggcatgaa tttgctcatt gataattgga 6900 ttccggtgcg cccccggaac ggtgggaaag tgcagatcat caatttgcaa agtctctact 6960 gttccaggga ccagtggaga ctcagcctgc cacgggatga tatggagctg gcggcgttgg 7020 ctctgctcgt atgcatcggc cagattattg cgccagcaaa ggatgacgtt gaattccggc 7080 atcggataat gaaccccctt actgaagatg agttccagca gcttatcgcc ccatggatcg 7140 acatgttcta cctcaaccac gccgagcatc cttttatgca gaccaaggga gtcaaggcga 7200 atgatgtgac tcccatggag aagctgctgg ccggtgtatc tggggcgacc aactgcgcat 7260 tcgtgaatca gcctggacag ggggaggccc tctgtggagg ctgcactgct atagcacttt 7320 ttaaccaagc taatcaagcc cccggctttg gtggagggtt taagagtgga ttgagggggg 7380 gcactcccgt aaccactttt gtgaggggaa ttgatctgag gtctactgtg ttgctgaacg 7440 tcctcacact cccaaggctc cagaagcagt tcccaaacga aagtcatacc gaaaaccagc 7500 ccacatggat caagcccatc aaatctaatg agagcatacc ggctagcagt attggatttg 7560 tacggggtct gttctggcag ccagctcaca tcgagctgtg tgatcctatt gggatcggca 7620 agtgctcttg ttgtgggcag gagtccaacc ttaggtatac tggatttctg aaagagaagt 7680 ttacctttac agtaaatggg ctctggcccc acccccactc accttgcctt gtgacagtga 7740 aaaaggggga agtcgaggag aagtttctgg cctttacaac ttctgcccct tcctggactc 7800 agatttccag agtggtggta gataagataa ttcaaaacga gaatggcaat agagtggccg 7860 ccgtggtgaa ccagtttcgc aacatcgccc ctcagtcccc cctggagctg attatgggcg 7920 gttatcggaa taaccaggcc agtatactcg agcgacggca cgatgtcctc atgttcaatc 7980 aaggttggca gcaatatggc aatgtgatta acgagatcgt aaccgtgggc ctgggatata 8040 agaccgccct gcggaaggcg ttgtatactt ttgcagaagg ctttaagaat aaggatttta 8100 agggtgccgg cgtgagtgtc catgaaacag ctgaacggca cttttatcgg cagtccgagc 8160 tgttgatacc agacgtgctg gctaatgtga acttctcaca ggccgacgaa gtgatcgctg 8220 atctgcggga taaactgcac caactgtgcg agatgctgtt taatcaaagc gtcgctcctt 8280 atgcccacca cccaaagctg atctccacgc tggccctggc gcgcgccaca ctttataaac 8340 atctccgcga actgaaaccc caggggggcc ccagcaatgg ctaataatct agagggccct 8400 attctatagt gtcacctaaa tgctagagct cgctgatcag cctcgactgt gccttctagt 8460 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 8520 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 8580 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 8640 aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac cagctggggc 8700 tctagggggt atccccacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 8760 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 8820 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 8880 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 8940 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 9000 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 9060 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 9120 atttaacaaa aatttaacgc gaattaattc tgtggaatgt gtgtcagtta gggtgtggaa 9180 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 9240 ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 9300 attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 9360 gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 9420 ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 9480 tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa gagacaggat 9540 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 9600 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 9660 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 9720 ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 9780 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 9840 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 9900 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 9960 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 10020 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 10080 cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 10140 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 10200 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 10260 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 10320 tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 10380 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 10440 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 10500 gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 10560 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 10620 gtccaaactc atcaatgtat cttatcatgt ctgtataccg tcgacctcta gctagagctt 10680 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 10740 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 10800 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 10860 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 10920 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 10980 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 11040 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 11100 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 11160 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 11220 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 11280 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 11340 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 11400 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 11460 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 11520 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 11580 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 11640 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 11700 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 11760 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 11820 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 11880 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 11940 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 12000 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 12060 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 12120 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 12180 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 12240 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 12300 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 12360 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 12420 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 12480 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 12540 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 12600 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 12660 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 12720 cctttttcat tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 12780 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 12840 acctgacgtc 12850 <210> 1878 <211> 12850 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas5-17aa-Cas3 fusion <400> 1878 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcaggct gacccaacta acagagctaa gggcctggag gccgtatctg 3420 tggcatcaat ggagcccttc aagtacatct gccactattg gggcaagagc tccaagagcc 3480 tgacaaaggg caacgacatc cacctgctga tctaccactg cctggacgtg gcagcagtgg 3540 cagattgttg gtgggaccag tctgtggtgc tgcagaatac cttttgtcgg aacgagatgc 3600 tgagcaagca gagagtgaag gcctggctgc tgttctttat cgccctgcac gacatcggca 3660 agttcgacat caggtttcag tataagtccg ccgagtcttg gctgaagctg aatccagcca 3720 cacccagcct gaacggccct tccacccaga tgtgcaggaa gttcaatcac ggcgcagcag 3780 gactgtactg gtttaaccag gactctctga gcgagcagtc cctgggcgat ttcttttctt 3840 tctttgacgc agcacctcac ccctacgaga gctggttccc ttgggtggag gcagtgacag 3900 gacaccacgg ctttatcctg cacagccagg accaggataa gtccaggtgg gagatgccag 3960 ccagcctggc ctcctacgcc gcacaggata agcaggcccg cgaggagtgg atctccgtgc 4020 tggaggccct gttcctgacc ccagcaggac tgtctatcaa tgacatcccc cctgactgct 4080 ctagcctgct ggccggcttt tgttctctgg ccgactggct gggcagctgg accacaacca 4140 atacattcct gtttaacgag gatgcaccat ccgacatcaa cgcactgcgc acctacttcc 4200 aggataggca gcaggacgcc agccgggtgc tggagctgtc cggcctggtg tctaataagc 4260 ggtgctacga gggagtgcac gcactgctgg ataacggcta tcagcccaga cagctgcagg 4320 tgctggtgga cgcactgcct gtggcaccag gactgacagt gatcgaggca cctaccggct 4380 ccggcaagac agagaccgcc ctggcctatg cctggaagct gatcgatcag cagatcgccg 4440 actctgtgat cttcgccctg ccaacacagg ccaccgccaa tgccatgctg accaggatgg 4500 aggcctccgc ctctcacctg ttttcctctc ccaacctgat cctggcccac ggcaacagcc 4560 ggttcaatca cctgtttcag tctatcaaga gcagagccat cacagagcag ggacaggagg 4620 aggcctgggt gcagtgctgt cagtggctga gccagtccaa taagaaggtg ttcctgggcc 4680 agatcggcgt gtgcaccatc gatcaggtgc tgatcagcgt gctgcctgtg aagcacaggt 4740 ttatcagggg actgggaatc ggccgctccg tgctgatcgt ggatgaggtg cacgcctacg 4800 acacatatat gaacggcctg ctggaggccg tgctgaaggc acaggcagac gtgggcggct 4860 ctgtgatcct gctgagcgcc accctgccaa tgaagcagaa gcagaagctg ctggatacat 4920 acggcctgca caccgacccc gtggagaaca attctgccta tcctctgatc aattggaggg 4980 gagtgaacgg agcacagcgg ttcgacctgc tggcccaccc tgagcagctg ccaccacggt 5040 tttccatcca gcccgagcct atctgcctgg ccgatatgct gccagacctg accatgctgg 5100 agagaatgat cgctgccgcc aatgcaggag cacaggtgtg cctgatctgt aacctggtgg 5160 atgtggccca ggtgtgctac cagcggctga aggagctgaa caatacacag gtggacatcg 5220 atctgttcca cgccaggttt accctgaatg accggagaga gaaggagaac cgcgtgatca 5280 gcaacttcgg caagaatggc aagagaaacg tgggcagaat cctggtggcc acacaggtgg 5340 tggagcagtc cctggacgtg gatttcgact ggctgatcac ccagcactgc cccgccgatc 5400 tgctgtttca gcggctgggc agactgcaca ggcaccaccg caagtatagg cctgcaggat 5460 tcgagatccc agtggcaaca atcctgctgc ctgacggaga gggatacggc cggcacgagc 5520 acatctatag caatgtgcgc gtgatgtggc ggacccagca gcacatcgag gagctgaacg 5580 gcgccagcct gttctttcca gatgcctaca gacagtggct ggactccatc tatgacgatg 5640 ccgagatgga tgagcccgag tgggtgggca atggcatgga caagttcgag tccgccgagt 5700 gtgagaagcg gttcaaggcc aggaaggtgc tgcagtgggc cgaggagtac tctctgcagg 5760 ataacgacga gacaatcctg gccgtgaccc gggacggaga gatgagcctg ccactgctgc 5820 cttatgtgca gacaagctcc ggcaagcagc tgctggatgg ccaggtgtac gaggacctga 5880 gccacgagca gcagtatgag gccctggccc tgaacagggt gaatgtgccc ttcacctgga 5940 agcggagctt cagcgaagtg gtggatgagg acggcctgct gtggctggag ggcaagcaga 6000 atctggatgg ctgggtgtgg cagggcaact ccatcgtgat cacatacacc ggcgacgagg 6060 gcatgaccag agtgatccca gccaacccca aggggtctgg ggaggggcgg gggtctttgt 6120 tgacttgcgg ggatgttgag gagaatcctg gacctcccaa aaaaaaacgg aaggtgggct 6180 caggcatgta tctgtcaaag gttatcattg cacgcgcgtg gagtagggat ctgtatcagc 6240 tgcaccaggg tctgtggcat cttttcccga accgccccga cgcggcacga gactttctgt 6300 ttcacgttga aaaaagaaac acccccgagg gctgtcatgt gctcctgcag tctgcccaga 6360 tgccggtgag cacagctgtg gcgactgtga tcaagaccaa gcaggtcgag tttcagctcc 6420 aggtaggggt tccactgtat tttcgcctga gagctaatcc gatcaaaacc atactggata 6480 atcagaagag gctcgacagc aaaggaaata ttaaaaggtg ccgggtcccg ctcatcaaag 6540 aggctgagca aatcgcttgg cttcaacgga aactggggaa cgcagcccgc gtggaagacg 6600 tccacccgat tagtgaacgg ccccaatatt tttccggaga cggaaagagc ggcaagattc 6660 agacagtctg tttcgagggg gtgctcacca tcaatgatgc ccccgccctg atagacctgg 6720 tgcagcaggg cataggcccc gctaaaagca tgggatgcgg actgcttagt ctggcaccgc 6780 tgggatccgg agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg 6840 gacctcccaa gaaaaagaga aaagtaggat cgggcatgaa tttgctcatt gataattgga 6900 ttccggtgcg cccccggaac ggtgggaaag tgcagatcat caatttgcaa agtctctact 6960 gttccaggga ccagtggaga ctcagcctgc cacgggatga tatggagctg gcggcgttgg 7020 ctctgctcgt atgcatcggc cagattattg cgccagcaaa ggatgacgtt gaattccggc 7080 atcggataat gaaccccctt actgaagatg agttccagca gcttatcgcc ccatggatcg 7140 acatgttcta cctcaaccac gccgagcatc cttttatgca gaccaaggga gtcaaggcga 7200 atgatgtgac tcccatggag aagctgctgg ccggtgtatc tggggcgacc aactgcgcat 7260 tcgtgaatca gcctggacag ggggaggccc tctgtggagg ctgcactgct atagcacttt 7320 ttaaccaagc taatcaagcc cccggctttg gtggagggtt taagagtgga ttgagggggg 7380 gcactcccgt aaccactttt gtgaggggaa ttgatctgag gtctactgtg ttgctgaacg 7440 tcctcacact cccaaggctc cagaagcagt tcccaaacga aagtcatacc gaaaaccagc 7500 ccacatggat caagcccatc aaatctaatg agagcatacc ggctagcagt attggatttg 7560 tacggggtct gttctggcag ccagctcaca tcgagctgtg tgatcctatt gggatcggca 7620 agtgctcttg ttgtgggcag gagtccaacc ttaggtatac tggatttctg aaagagaagt 7680 ttacctttac agtaaatggg ctctggcccc acccccactc accttgcctt gtgacagtga 7740 aaaaggggga agtcgaggag aagtttctgg cctttacaac ttctgcccct tcctggactc 7800 agatttccag agtggtggta gataagataa ttcaaaacga gaatggcaat agagtggccg 7860 ccgtggtgaa ccagtttcgc aacatcgccc ctcagtcccc cctggagctg attatgggcg 7920 gttatcggaa taaccaggcc agtatactcg agcgacggca cgatgtcctc atgttcaatc 7980 aaggttggca gcaatatggc aatgtgatta acgagatcgt aaccgtgggc ctgggatata 8040 agaccgccct gcggaaggcg ttgtatactt ttgcagaagg ctttaagaat aaggatttta 8100 agggtgccgg cgtgagtgtc catgaaacag ctgaacggca cttttatcgg cagtccgagc 8160 tgttgatacc agacgtgctg gctaatgtga acttctcaca ggccgacgaa gtgatcgctg 8220 atctgcggga taaactgcac caactgtgcg agatgctgtt taatcaaagc gtcgctcctt 8280 atgcccacca cccaaagctg atctccacgc tggccctggc gcgcgccaca ctttataaac 8340 atctccgcga actgaaaccc caggggggcc ccagcaatgg ctaataatct agagggccct 8400 attctatagt gtcacctaaa tgctagagct cgctgatcag cctcgactgt gccttctagt 8460 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 8520 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 8580 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 8640 aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac cagctggggc 8700 tctagggggt atccccacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 8760 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 8820 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 8880 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 8940 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 9000 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 9060 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 9120 atttaacaaa aatttaacgc gaattaattc tgtggaatgt gtgtcagtta gggtgtggaa 9180 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 9240 ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 9300 attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 9360 gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 9420 ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 9480 tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa gagacaggat 9540 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 9600 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 9660 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 9720 ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 9780 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 9840 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 9900 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 9960 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 10020 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 10080 cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 10140 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 10200 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 10260 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 10320 tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 10380 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 10440 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 10500 gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 10560 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 10620 gtccaaactc atcaatgtat cttatcatgt ctgtataccg tcgacctcta gctagagctt 10680 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 10740 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 10800 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 10860 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 10920 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 10980 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 11040 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 11100 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 11160 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 11220 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 11280 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 11340 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 11400 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 11460 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 11520 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 11580 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 11640 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 11700 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 11760 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 11820 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 11880 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 11940 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 12000 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 12060 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 12120 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 12180 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 12240 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 12300 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 12360 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 12420 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 12480 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 12540 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 12600 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 12660 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 12720 cctttttcat tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 12780 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 12840 acctgacgtc 12850 <210> 1879 <211> 12850 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas3-17aa-Cas6 fusion <400> 1879 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcaggga tccggagaag gaaggggatc cctcctcaca tgtggagatg 3420 tcgaagaaaa tcctggacct cccaagaaaa agagaaaagt aggatcgggc atggagccct 3480 tcaagtacat ctgccactat tggggcaaga gctccaagag cctgacaaag ggcaacgaca 3540 tccacctgct gatctaccac tgcctggacg tggcagcagt ggcagattgt tggtgggacc 3600 agtctgtggt gctgcagaat accttttgtc ggaacgagat gctgagcaag cagagagtga 3660 aggcctggct gctgttcttt atcgccctgc acgacatcgg caagttcgac atcaggtttc 3720 agtataagtc cgccgagtct tggctgaagc tgaatccagc cacacccagc ctgaacggcc 3780 cttccaccca gatgtgcagg aagttcaatc acggcgcagc aggactgtac tggtttaacc 3840 aggactctct gagcgagcag tccctgggcg atttcttttc tttctttgac gcagcacctc 3900 acccctacga gagctggttc ccttgggtgg aggcagtgac aggacaccac ggctttatcc 3960 tgcacagcca ggaccaggat aagtccaggt gggagatgcc agccagcctg gcctcctacg 4020 ccgcacagga taagcaggcc cgcgaggagt ggatctccgt gctggaggcc ctgttcctga 4080 ccccagcagg actgtctatc aatgacatcc cccctgactg ctctagcctg ctggccggct 4140 tttgttctct ggccgactgg ctgggcagct ggaccacaac caatacattc ctgtttaacg 4200 aggatgcacc atccgacatc aacgcactgc gcacctactt ccaggatagg cagcaggacg 4260 ccagccgggt gctggagctg tccggcctgg tgtctaataa gcggtgctac gagggagtgc 4320 acgcactgct ggataacggc tatcagccca gacagctgca ggtgctggtg gacgcactgc 4380 ctgtggcacc aggactgaca gtgatcgagg cacctaccgg ctccggcaag acagagaccg 4440 ccctggccta tgcctggaag ctgatcgatc agcagatcgc cgactctgtg atcttcgccc 4500 tgccaacaca ggccaccgcc aatgccatgc tgaccaggat ggaggcctcc gcctctcacc 4560 tgttttcctc tcccaacctg atcctggccc acggcaacag ccggttcaat cacctgtttc 4620 agtctatcaa gagcagagcc atcacagagc agggacagga ggaggcctgg gtgcagtgct 4680 gtcagtggct gagccagtcc aataagaagg tgttcctggg ccagatcggc gtgtgcacca 4740 tcgatcaggt gctgatcagc gtgctgcctg tgaagcacag gtttatcagg ggactgggaa 4800 tcggccgctc cgtgctgatc gtggatgagg tgcacgccta cgacacatat atgaacggcc 4860 tgctggaggc cgtgctgaag gcacaggcag acgtgggcgg ctctgtgatc ctgctgagcg 4920 ccaccctgcc aatgaagcag aagcagaagc tgctggatac atacggcctg cacaccgacc 4980 ccgtggagaa caattctgcc tatcctctga tcaattggag gggagtgaac ggagcacagc 5040 ggttcgacct gctggcccac cctgagcagc tgccaccacg gttttccatc cagcccgagc 5100 ctatctgcct ggccgatatg ctgccagacc tgaccatgct ggagagaatg atcgctgccg 5160 ccaatgcagg agcacaggtg tgcctgatct gtaacctggt ggatgtggcc caggtgtgct 5220 accagcggct gaaggagctg aacaatacac aggtggacat cgatctgttc cacgccaggt 5280 ttaccctgaa tgaccggaga gagaaggaga accgcgtgat cagcaacttc ggcaagaatg 5340 gcaagagaaa cgtgggcaga atcctggtgg ccacacaggt ggtggagcag tccctggacg 5400 tggatttcga ctggctgatc acccagcact gccccgccga tctgctgttt cagcggctgg 5460 gcagactgca caggcaccac cgcaagtata ggcctgcagg attcgagatc ccagtggcaa 5520 caatcctgct gcctgacgga gagggatacg gccggcacga gcacatctat agcaatgtgc 5580 gcgtgatgtg gcggacccag cagcacatcg aggagctgaa cggcgccagc ctgttctttc 5640 cagatgccta cagacagtgg ctggactcca tctatgacga tgccgagatg gatgagcccg 5700 agtgggtggg caatggcatg gacaagttcg agtccgccga gtgtgagaag cggttcaagg 5760 ccaggaaggt gctgcagtgg gccgaggagt actctctgca ggataacgac gagacaatcc 5820 tggccgtgac ccgggacgga gagatgagcc tgccactgct gccttatgtg cagacaagct 5880 ccggcaagca gctgctggat ggccaggtgt acgaggacct gagccacgag cagcagtatg 5940 aggccctggc cctgaacagg gtgaatgtgc ccttcacctg gaagcggagc ttcagcgaag 6000 tggtggatga ggacggcctg ctgtggctgg agggcaagca gaatctggat ggctgggtgt 6060 ggcagggcaa ctccatcgtg atcacataca ccggcgacga gggcatgacc agagtgatcc 6120 cagccaaccc caaggctgac ccaactaaca gagctaaggg cctggaggcc gtatctgtgg 6180 catcaatgta tctgtcaaag gttatcattg cacgcgcgtg gagtagggat ctgtatcagc 6240 tgcaccaggg tctgtggcat cttttcccga accgccccga cgcggcacga gactttctgt 6300 ttcacgttga aaaaagaaac acccccgagg gctgtcatgt gctcctgcag tctgcccaga 6360 tgccggtgag cacagctgtg gcgactgtga tcaagaccaa gcaggtcgag tttcagctcc 6420 aggtaggggt tccactgtat tttcgcctga gagctaatcc gatcaaaacc atactggata 6480 atcagaagag gctcgacagc aaaggaaata ttaaaaggtg ccgggtcccg ctcatcaaag 6540 aggctgagca aatcgcttgg cttcaacgga aactggggaa cgcagcccgc gtggaagacg 6600 tccacccgat tagtgaacgg ccccaatatt tttccggaga cggaaagagc ggcaagattc 6660 agacagtctg tttcgagggg gtgctcacca tcaatgatgc ccccgccctg atagacctgg 6720 tgcagcaggg cataggcccc gctaaaagca tgggatgcgg actgcttagt ctggcaccgc 6780 tgggatccgg agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg 6840 gacctcccaa gaaaaagaga aaagtaggat cgggcatgaa tttgctcatt gataattgga 6900 ttccggtgcg cccccggaac ggtgggaaag tgcagatcat caatttgcaa agtctctact 6960 gttccaggga ccagtggaga ctcagcctgc cacgggatga tatggagctg gcggcgttgg 7020 ctctgctcgt atgcatcggc cagattattg cgccagcaaa ggatgacgtt gaattccggc 7080 atcggataat gaaccccctt actgaagatg agttccagca gcttatcgcc ccatggatcg 7140 acatgttcta cctcaaccac gccgagcatc cttttatgca gaccaaggga gtcaaggcga 7200 atgatgtgac tcccatggag aagctgctgg ccggtgtatc tggggcgacc aactgcgcat 7260 tcgtgaatca gcctggacag ggggaggccc tctgtggagg ctgcactgct atagcacttt 7320 ttaaccaagc taatcaagcc cccggctttg gtggagggtt taagagtgga ttgagggggg 7380 gcactcccgt aaccactttt gtgaggggaa ttgatctgag gtctactgtg ttgctgaacg 7440 tcctcacact cccaaggctc cagaagcagt tcccaaacga aagtcatacc gaaaaccagc 7500 ccacatggat caagcccatc aaatctaatg agagcatacc ggctagcagt attggatttg 7560 tacggggtct gttctggcag ccagctcaca tcgagctgtg tgatcctatt gggatcggca 7620 agtgctcttg ttgtgggcag gagtccaacc ttaggtatac tggatttctg aaagagaagt 7680 ttacctttac agtaaatggg ctctggcccc acccccactc accttgcctt gtgacagtga 7740 aaaaggggga agtcgaggag aagtttctgg cctttacaac ttctgcccct tcctggactc 7800 agatttccag agtggtggta gataagataa ttcaaaacga gaatggcaat agagtggccg 7860 ccgtggtgaa ccagtttcgc aacatcgccc ctcagtcccc cctggagctg attatgggcg 7920 gttatcggaa taaccaggcc agtatactcg agcgacggca cgatgtcctc atgttcaatc 7980 aaggttggca gcaatatggc aatgtgatta acgagatcgt aaccgtgggc ctgggatata 8040 agaccgccct gcggaaggcg ttgtatactt ttgcagaagg ctttaagaat aaggatttta 8100 agggtgccgg cgtgagtgtc catgaaacag ctgaacggca cttttatcgg cagtccgagc 8160 tgttgatacc agacgtgctg gctaatgtga acttctcaca ggccgacgaa gtgatcgctg 8220 atctgcggga taaactgcac caactgtgcg agatgctgtt taatcaaagc gtcgctcctt 8280 atgcccacca cccaaagctg atctccacgc tggccctggc gcgcgccaca ctttataaac 8340 atctccgcga actgaaaccc caggggggcc ccagcaatgg ctaataatct agagggccct 8400 attctatagt gtcacctaaa tgctagagct cgctgatcag cctcgactgt gccttctagt 8460 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 8520 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 8580 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 8640 aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac cagctggggc 8700 tctagggggt atccccacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 8760 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 8820 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 8880 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 8940 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 9000 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 9060 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 9120 atttaacaaa aatttaacgc gaattaattc tgtggaatgt gtgtcagtta gggtgtggaa 9180 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 9240 ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 9300 attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 9360 gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 9420 ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 9480 tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa gagacaggat 9540 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 9600 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 9660 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 9720 ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 9780 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 9840 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 9900 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 9960 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 10020 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 10080 cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 10140 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 10200 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 10260 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 10320 tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 10380 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 10440 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 10500 gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 10560 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 10620 gtccaaactc atcaatgtat cttatcatgt ctgtataccg tcgacctcta gctagagctt 10680 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 10740 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 10800 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 10860 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 10920 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 10980 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 11040 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 11100 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 11160 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 11220 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 11280 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 11340 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 11400 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 11460 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 11520 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 11580 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 11640 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 11700 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 11760 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 11820 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 11880 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 11940 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 12000 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 12060 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 12120 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 12180 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 12240 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 12300 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 12360 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 12420 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 12480 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 12540 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 12600 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 12660 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 12720 cctttttcat tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 12780 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 12840 acctgacgtc 12850 <210> 1880 <211> 12850 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas6-17aa-Cas3 fusion <400> 1880 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcaggga tccggagaag gaaggggatc cctcctcaca tgtggagatg 3420 tcgaagaaaa tcctggacct cccaagaaaa agagaaaagt aggatcgggc atgtatctgt 3480 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 3540 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 3600 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 3660 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 3720 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 3780 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 3840 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 3900 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 3960 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 4020 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctggct gacccaacta 4080 acagagctaa gggcctggag gccgtatctg tggcatcaat ggagcccttc aagtacatct 4140 gccactattg gggcaagagc tccaagagcc tgacaaaggg caacgacatc cacctgctga 4200 tctaccactg cctggacgtg gcagcagtgg cagattgttg gtgggaccag tctgtggtgc 4260 tgcagaatac cttttgtcgg aacgagatgc tgagcaagca gagagtgaag gcctggctgc 4320 tgttctttat cgccctgcac gacatcggca agttcgacat caggtttcag tataagtccg 4380 ccgagtcttg gctgaagctg aatccagcca cacccagcct gaacggccct tccacccaga 4440 tgtgcaggaa gttcaatcac ggcgcagcag gactgtactg gtttaaccag gactctctga 4500 gcgagcagtc cctgggcgat ttcttttctt tctttgacgc agcacctcac ccctacgaga 4560 gctggttccc ttgggtggag gcagtgacag gacaccacgg ctttatcctg cacagccagg 4620 accaggataa gtccaggtgg gagatgccag ccagcctggc ctcctacgcc gcacaggata 4680 agcaggcccg cgaggagtgg atctccgtgc tggaggccct gttcctgacc ccagcaggac 4740 tgtctatcaa tgacatcccc cctgactgct ctagcctgct ggccggcttt tgttctctgg 4800 ccgactggct gggcagctgg accacaacca atacattcct gtttaacgag gatgcaccat 4860 ccgacatcaa cgcactgcgc acctacttcc aggataggca gcaggacgcc agccgggtgc 4920 tggagctgtc cggcctggtg tctaataagc ggtgctacga gggagtgcac gcactgctgg 4980 ataacggcta tcagcccaga cagctgcagg tgctggtgga cgcactgcct gtggcaccag 5040 gactgacagt gatcgaggca cctaccggct ccggcaagac agagaccgcc ctggcctatg 5100 cctggaagct gatcgatcag cagatcgccg actctgtgat cttcgccctg ccaacacagg 5160 ccaccgccaa tgccatgctg accaggatgg aggcctccgc ctctcacctg ttttcctctc 5220 ccaacctgat cctggcccac ggcaacagcc ggttcaatca cctgtttcag tctatcaaga 5280 gcagagccat cacagagcag ggacaggagg aggcctgggt gcagtgctgt cagtggctga 5340 gccagtccaa taagaaggtg ttcctgggcc agatcggcgt gtgcaccatc gatcaggtgc 5400 tgatcagcgt gctgcctgtg aagcacaggt ttatcagggg actgggaatc ggccgctccg 5460 tgctgatcgt ggatgaggtg cacgcctacg acacatatat gaacggcctg ctggaggccg 5520 tgctgaaggc acaggcagac gtgggcggct ctgtgatcct gctgagcgcc accctgccaa 5580 tgaagcagaa gcagaagctg ctggatacat acggcctgca caccgacccc gtggagaaca 5640 attctgccta tcctctgatc aattggaggg gagtgaacgg agcacagcgg ttcgacctgc 5700 tggcccaccc tgagcagctg ccaccacggt tttccatcca gcccgagcct atctgcctgg 5760 ccgatatgct gccagacctg accatgctgg agagaatgat cgctgccgcc aatgcaggag 5820 cacaggtgtg cctgatctgt aacctggtgg atgtggccca ggtgtgctac cagcggctga 5880 aggagctgaa caatacacag gtggacatcg atctgttcca cgccaggttt accctgaatg 5940 accggagaga gaaggagaac cgcgtgatca gcaacttcgg caagaatggc aagagaaacg 6000 tgggcagaat cctggtggcc acacaggtgg tggagcagtc cctggacgtg gatttcgact 6060 ggctgatcac ccagcactgc cccgccgatc tgctgtttca gcggctgggc agactgcaca 6120 ggcaccaccg caagtatagg cctgcaggat tcgagatccc agtggcaaca atcctgctgc 6180 ctgacggaga gggatacggc cggcacgagc acatctatag caatgtgcgc gtgatgtggc 6240 ggacccagca gcacatcgag gagctgaacg gcgccagcct gttctttcca gatgcctaca 6300 gacagtggct ggactccatc tatgacgatg ccgagatgga tgagcccgag tgggtgggca 6360 atggcatgga caagttcgag tccgccgagt gtgagaagcg gttcaaggcc aggaaggtgc 6420 tgcagtgggc cgaggagtac tctctgcagg ataacgacga gacaatcctg gccgtgaccc 6480 gggacggaga gatgagcctg ccactgctgc cttatgtgca gacaagctcc ggcaagcagc 6540 tgctggatgg ccaggtgtac gaggacctga gccacgagca gcagtatgag gccctggccc 6600 tgaacagggt gaatgtgccc ttcacctgga agcggagctt cagcgaagtg gtggatgagg 6660 acggcctgct gtggctggag ggcaagcaga atctggatgg ctgggtgtgg cagggcaact 6720 ccatcgtgat cacatacacc ggcgacgagg gcatgaccag agtgatccca gccaacccca 6780 agggatccgg agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg 6840 gacctcccaa gaaaaagaga aaagtaggat cgggcatgaa tttgctcatt gataattgga 6900 ttccggtgcg cccccggaac ggtgggaaag tgcagatcat caatttgcaa agtctctact 6960 gttccaggga ccagtggaga ctcagcctgc cacgggatga tatggagctg gcggcgttgg 7020 ctctgctcgt atgcatcggc cagattattg cgccagcaaa ggatgacgtt gaattccggc 7080 atcggataat gaaccccctt actgaagatg agttccagca gcttatcgcc ccatggatcg 7140 acatgttcta cctcaaccac gccgagcatc cttttatgca gaccaaggga gtcaaggcga 7200 atgatgtgac tcccatggag aagctgctgg ccggtgtatc tggggcgacc aactgcgcat 7260 tcgtgaatca gcctggacag ggggaggccc tctgtggagg ctgcactgct atagcacttt 7320 ttaaccaagc taatcaagcc cccggctttg gtggagggtt taagagtgga ttgagggggg 7380 gcactcccgt aaccactttt gtgaggggaa ttgatctgag gtctactgtg ttgctgaacg 7440 tcctcacact cccaaggctc cagaagcagt tcccaaacga aagtcatacc gaaaaccagc 7500 ccacatggat caagcccatc aaatctaatg agagcatacc ggctagcagt attggatttg 7560 tacggggtct gttctggcag ccagctcaca tcgagctgtg tgatcctatt gggatcggca 7620 agtgctcttg ttgtgggcag gagtccaacc ttaggtatac tggatttctg aaagagaagt 7680 ttacctttac agtaaatggg ctctggcccc acccccactc accttgcctt gtgacagtga 7740 aaaaggggga agtcgaggag aagtttctgg cctttacaac ttctgcccct tcctggactc 7800 agatttccag agtggtggta gataagataa ttcaaaacga gaatggcaat agagtggccg 7860 ccgtggtgaa ccagtttcgc aacatcgccc ctcagtcccc cctggagctg attatgggcg 7920 gttatcggaa taaccaggcc agtatactcg agcgacggca cgatgtcctc atgttcaatc 7980 aaggttggca gcaatatggc aatgtgatta acgagatcgt aaccgtgggc ctgggatata 8040 agaccgccct gcggaaggcg ttgtatactt ttgcagaagg ctttaagaat aaggatttta 8100 agggtgccgg cgtgagtgtc catgaaacag ctgaacggca cttttatcgg cagtccgagc 8160 tgttgatacc agacgtgctg gctaatgtga acttctcaca ggccgacgaa gtgatcgctg 8220 atctgcggga taaactgcac caactgtgcg agatgctgtt taatcaaagc gtcgctcctt 8280 atgcccacca cccaaagctg atctccacgc tggccctggc gcgcgccaca ctttataaac 8340 atctccgcga actgaaaccc caggggggcc ccagcaatgg ctaataatct agagggccct 8400 attctatagt gtcacctaaa tgctagagct cgctgatcag cctcgactgt gccttctagt 8460 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 8520 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 8580 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 8640 aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac cagctggggc 8700 tctagggggt atccccacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 8760 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 8820 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 8880 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 8940 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 9000 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 9060 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 9120 atttaacaaa aatttaacgc gaattaattc tgtggaatgt gtgtcagtta gggtgtggaa 9180 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 9240 ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 9300 attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 9360 gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 9420 ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 9480 tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa gagacaggat 9540 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 9600 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 9660 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 9720 ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 9780 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 9840 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 9900 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 9960 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 10020 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 10080 cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 10140 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 10200 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 10260 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 10320 tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 10380 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 10440 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 10500 gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 10560 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 10620 gtccaaactc atcaatgtat cttatcatgt ctgtataccg tcgacctcta gctagagctt 10680 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 10740 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 10800 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 10860 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 10920 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 10980 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 11040 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 11100 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 11160 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 11220 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 11280 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 11340 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 11400 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 11460 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 11520 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 11580 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 11640 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 11700 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 11760 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 11820 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 11880 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 11940 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 12000 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 12060 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 12120 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 12180 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 12240 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 12300 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 12360 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 12420 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 12480 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 12540 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 12600 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 12660 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 12720 cctttttcat tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 12780 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 12840 acctgacgtc 12850 <210> 1881 <211> 2488 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas3-17aa-Cas8 fusion <400> 1881 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 370 375 380 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 385 390 395 400 Lys Val Gly Ser Gly Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 405 410 415 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 420 425 430 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 435 440 445 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 450 455 460 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 465 470 475 480 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 485 490 495 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 500 505 510 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 515 520 525 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 530 535 540 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 545 550 555 560 Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr 565 570 575 Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys 580 585 590 Val Gly Ser Gly Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro 595 600 605 Met Gln Ala Trp Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly 610 615 620 Arg Phe Pro Thr Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu 625 630 635 640 Gly Ile Gln Arg Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser 645 650 655 Val Gln Phe Ala Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg 660 665 670 Val Ser Val Thr Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg 675 680 685 Glu Asp Tyr Arg Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg 690 695 700 Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro 705 710 715 720 His Ala Thr Met Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro 725 730 735 Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro 740 745 750 Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu 755 760 765 Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr 770 775 780 Gly His His Leu Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu 785 790 795 800 Pro Arg Gln Phe Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met 805 810 815 Asp Val Ser Gln Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 820 825 830 Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 835 840 845 Gly Ser Gly Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser 850 855 860 Arg Asp Leu Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn 865 870 875 880 Arg Pro Asp Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn 885 890 895 Thr Pro Glu Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val 900 905 910 Ser Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln 915 920 925 Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile 930 935 940 Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile 945 950 955 960 Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp 965 970 975 Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro 980 985 990 Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys 995 1000 1005 Ile Gln Thr Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala 1010 1015 1020 Pro Ala Leu Ile Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys 1025 1030 1035 Ser Met Gly Cys Gly Leu Leu Ser Leu Ala Pro Leu Gly Ser Gly 1040 1045 1050 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn 1055 1060 1065 Pro Gly Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Glu 1070 1075 1080 Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys Ser 1085 1090 1095 Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 1100 1105 1110 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val 1115 1120 1125 Leu Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg 1130 1135 1140 Val Lys Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly 1145 1150 1155 Lys Phe Asp Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu 1160 1165 1170 Lys Leu Asn Pro Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln 1175 1180 1185 Met Cys Arg Lys Phe Asn His Gly Ala Ala Gly Leu Tyr Trp Phe 1190 1195 1200 Asn Gln Asp Ser Leu Ser Glu Gln Ser Leu Gly Asp Phe Phe Ser 1205 1210 1215 Phe Phe Asp Ala Ala Pro His Pro Tyr Glu Ser Trp Phe Pro Trp 1220 1225 1230 Val Glu Ala Val Thr Gly His His Gly Phe Ile Leu His Ser Gln 1235 1240 1245 Asp Gln Asp Lys Ser Arg Trp Glu Met Pro Ala Ser Leu Ala Ser 1250 1255 1260 Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu Glu Trp Ile Ser Val 1265 1270 1275 Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu Ser Ile Asn Asp 1280 1285 1290 Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe Cys Ser Leu 1295 1300 1305 Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe Leu Phe 1310 1315 1320 Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr Phe 1325 1330 1335 Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 1340 1345 1350 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu 1355 1360 1365 Asp Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala 1370 1375 1380 Leu Pro Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly 1385 1390 1395 Ser Gly Lys Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile 1400 1405 1410 Asp Gln Gln Ile Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln 1415 1420 1425 Ala Thr Ala Asn Ala Met Leu Thr Arg Met Glu Ala Ser Ala Ser 1430 1435 1440 His Leu Phe Ser Ser Pro Asn Leu Ile Leu Ala His Gly Asn Ser 1445 1450 1455 Arg Phe Asn His Leu Phe Gln Ser Ile Lys Ser Arg Ala Ile Thr 1460 1465 1470 Glu Gln Gly Gln Glu Glu Ala Trp Val Gln Cys Cys Gln Trp Leu 1475 1480 1485 Ser Gln Ser Asn Lys Lys Val Phe Leu Gly Gln Ile Gly Val Cys 1490 1495 1500 Thr Ile Asp Gln Val Leu Ile Ser Val Leu Pro Val Lys His Arg 1505 1510 1515 Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val Leu Ile Val Asp 1520 1525 1530 Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu Leu Glu Ala 1535 1540 1545 Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile Leu Leu 1550 1555 1560 Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp Thr 1565 1570 1575 Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 1580 1585 1590 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu 1595 1600 1605 Leu Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro 1610 1615 1620 Glu Pro Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu 1625 1630 1635 Glu Arg Met Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu 1640 1645 1650 Ile Cys Asn Leu Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu 1655 1660 1665 Lys Glu Leu Asn Asn Thr Gln Val Asp Ile Asp Leu Phe His Ala 1670 1675 1680 Arg Phe Thr Leu Asn Asp Arg Arg Glu Lys Glu Asn Arg Val Ile 1685 1690 1695 Ser Asn Phe Gly Lys Asn Gly Lys Arg Asn Val Gly Arg Ile Leu 1700 1705 1710 Val Ala Thr Gln Val Val Glu Gln Ser Leu Asp Val Asp Phe Asp 1715 1720 1725 Trp Leu Ile Thr Gln His Cys Pro Ala Asp Leu Leu Phe Gln Arg 1730 1735 1740 Leu Gly Arg Leu His Arg His His Arg Lys Tyr Arg Pro Ala Gly 1745 1750 1755 Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro Asp Gly Glu Gly 1760 1765 1770 Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg Val Met Trp 1775 1780 1785 Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser Leu Phe 1790 1795 1800 Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp Asp 1805 1810 1815 Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 1820 1825 1830 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val 1835 1840 1845 Leu Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr 1850 1855 1860 Ile Leu Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu 1865 1870 1875 Pro Tyr Val Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln 1880 1885 1890 Val Tyr Glu Asp Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala 1895 1900 1905 Leu Asn Arg Val Asn Val Pro Phe Thr Trp Lys Arg Ser Phe Ser 1910 1915 1920 Glu Val Val Asp Glu Asp Gly Leu Leu Trp Leu Glu Gly Lys Gln 1925 1930 1935 Asn Leu Asp Gly Trp Val Trp Gln Gly Asn Ser Ile Val Ile Thr 1940 1945 1950 Tyr Thr Gly Asp Glu Gly Met Thr Arg Val Ile Pro Ala Asn Pro 1955 1960 1965 Lys Ala Asp Pro Thr Asn Arg Ala Lys Gly Leu Glu Ala Val Ser 1970 1975 1980 Val Ala Ser Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg 1985 1990 1995 Pro Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu 2000 2005 2010 Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp 2015 2020 2025 Met Glu Leu Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile 2030 2035 2040 Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His Arg Ile Met 2045 2050 2055 Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp 2060 2065 2070 Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe Met Gln 2075 2080 2085 Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu 2090 2095 2100 Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln 2105 2110 2115 Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala 2120 2125 2130 Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe 2135 2140 2145 Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg 2150 2155 2160 Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 2165 2170 2175 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn 2180 2185 2190 Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro 2195 2200 2205 Ala Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala 2210 2215 2220 His Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys 2225 2230 2235 Cys Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu 2240 2245 2250 Lys Phe Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser 2255 2260 2265 Pro Cys Leu Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe 2270 2275 2280 Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg 2285 2290 2295 Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn Arg Val 2300 2305 2310 Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser Pro 2315 2320 2325 Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile 2330 2335 2340 Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln 2345 2350 2355 Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly 2360 2365 2370 Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly 2375 2380 2385 Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu 2390 2395 2400 Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 2405 2410 2415 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile 2420 2425 2430 Ala Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe 2435 2440 2445 Asn Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser 2450 2455 2460 Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu 2465 2470 2475 Leu Lys Pro Gln Gly Gly Pro Ser Asn Gly 2480 2485 <210> 1882 <211> 2487 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas8-17aa-Cas3 fusion <400> 1882 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 370 375 380 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 385 390 395 400 Lys Val Gly Ser Gly Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 405 410 415 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 420 425 430 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 435 440 445 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 450 455 460 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 465 470 475 480 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 485 490 495 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 500 505 510 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 515 520 525 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 530 535 540 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 545 550 555 560 Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr 565 570 575 Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys 580 585 590 Val Gly Ser Gly Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro 595 600 605 Met Gln Ala Trp Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly 610 615 620 Arg Phe Pro Thr Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu 625 630 635 640 Gly Ile Gln Arg Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser 645 650 655 Val Gln Phe Ala Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg 660 665 670 Val Ser Val Thr Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg 675 680 685 Glu Asp Tyr Arg Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg 690 695 700 Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro 705 710 715 720 His Ala Thr Met Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro 725 730 735 Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro 740 745 750 Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu 755 760 765 Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr 770 775 780 Gly His His Leu Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu 785 790 795 800 Pro Arg Gln Phe Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met 805 810 815 Asp Val Ser Gln Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 820 825 830 Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 835 840 845 Gly Ser Gly Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser 850 855 860 Arg Asp Leu Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn 865 870 875 880 Arg Pro Asp Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn 885 890 895 Thr Pro Glu Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val 900 905 910 Ser Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln 915 920 925 Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile 930 935 940 Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile 945 950 955 960 Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp 965 970 975 Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro 980 985 990 Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys 995 1000 1005 Ile Gln Thr Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala 1010 1015 1020 Pro Ala Leu Ile Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys 1025 1030 1035 Ser Met Gly Cys Gly Leu Leu Ser Leu Ala Pro Leu Gly Ser Gly 1040 1045 1050 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn 1055 1060 1065 Pro Gly Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Asn Leu 1070 1075 1080 Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly Gly Lys 1085 1090 1095 Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp Gln 1100 1105 1110 Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu 1115 1120 1125 Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp 1130 1135 1140 Asp Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp 1145 1150 1155 Glu Phe Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu 1160 1165 1170 Asn His Ala Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala 1175 1180 1185 Asn Asp Val Thr Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly 1190 1195 1200 Ala Thr Asn Cys Ala Phe Val Asn Gln Pro Gly Gln Gly Glu Ala 1205 1210 1215 Leu Cys Gly Gly Cys Thr Ala Ile Ala Leu Phe Asn Gln Ala Asn 1220 1225 1230 Gln Ala Pro Gly Phe Gly Gly Gly Phe Lys Ser Gly Leu Arg Gly 1235 1240 1245 Gly Thr Pro Val Thr Thr Phe Val Arg Gly Ile Asp Leu Arg Ser 1250 1255 1260 Thr Val Leu Leu Asn Val Leu Thr Leu Pro Arg Leu Gln Lys Gln 1265 1270 1275 Phe Pro Asn Glu Ser His Thr Glu Asn Gln Pro Thr Trp Ile Lys 1280 1285 1290 Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser Ser Ile Gly Phe 1295 1300 1305 Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu Leu Cys Asp 1310 1315 1320 Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu Ser Asn 1325 1330 1335 Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr Val 1340 1345 1350 Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val 1355 1360 1365 Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser 1370 1375 1380 Ala Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile 1385 1390 1395 Ile Gln Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln 1400 1405 1410 Phe Arg Asn Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly 1415 1420 1425 Gly Tyr Arg Asn Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp 1430 1435 1440 Val Leu Met Phe Asn Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile 1445 1450 1455 Asn Glu Ile Val Thr Val Gly Leu Gly Tyr Lys Thr Ala Leu Arg 1460 1465 1470 Lys Ala Leu Tyr Thr Phe Ala Glu Gly Phe Lys Asn Lys Asp Phe 1475 1480 1485 Lys Gly Ala Gly Val Ser Val His Glu Thr Ala Glu Arg His Phe 1490 1495 1500 Tyr Arg Gln Ser Glu Leu Leu Ile Pro Asp Val Leu Ala Asn Val 1505 1510 1515 Asn Phe Ser Gln Ala Asp Glu Val Ile Ala Asp Leu Arg Asp Lys 1520 1525 1530 Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln Ser Val Ala Pro 1535 1540 1545 Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala Leu Ala Arg 1550 1555 1560 Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln Gly Gly 1565 1570 1575 Pro Ser Asn Gly Ala Asp Pro Thr Asn Arg Ala Lys Gly Leu Glu 1580 1585 1590 Ala Val Ser Val Ala Ser Met Glu Pro Phe Lys Tyr Ile Cys His 1595 1600 1605 Tyr Trp Gly Lys Ser Ser Lys Ser Leu Thr Lys Gly Asn Asp Ile 1610 1615 1620 His Leu Leu Ile Tyr His Cys Leu Asp Val Ala Ala Val Ala Asp 1625 1630 1635 Cys Trp Trp Asp Gln Ser Val Val Leu Gln Asn Thr Phe Cys Arg 1640 1645 1650 Asn Glu Met Leu Ser Lys Gln Arg Val Lys Ala Trp Leu Leu Phe 1655 1660 1665 Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp Ile Arg Phe Gln 1670 1675 1680 Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro Ala Thr Pro 1685 1690 1695 Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe Asn His 1700 1705 1710 Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser Glu 1715 1720 1725 Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 1730 1735 1740 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His 1745 1750 1755 His Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp 1760 1765 1770 Glu Met Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln 1775 1780 1785 Ala Arg Glu Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr 1790 1795 1800 Pro Ala Gly Leu Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser 1805 1810 1815 Leu Leu Ala Gly Phe Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp 1820 1825 1830 Thr Thr Thr Asn Thr Phe Leu Phe Asn Glu Asp Ala Pro Ser Asp 1835 1840 1845 Ile Asn Ala Leu Arg Thr Tyr Phe Gln Asp Arg Gln Gln Asp Ala 1850 1855 1860 Ser Arg Val Leu Glu Leu Ser Gly Leu Val Ser Asn Lys Arg Cys 1865 1870 1875 Tyr Glu Gly Val His Ala Leu Leu Asp Asn Gly Tyr Gln Pro Arg 1880 1885 1890 Gln Leu Gln Val Leu Val Asp Ala Leu Pro Val Ala Pro Gly Leu 1895 1900 1905 Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys Thr Glu Thr Ala 1910 1915 1920 Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile Ala Asp Ser 1925 1930 1935 Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala Met Leu 1940 1945 1950 Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro Asn 1955 1960 1965 Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 1970 1975 1980 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala 1985 1990 1995 Trp Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val 2000 2005 2010 Phe Leu Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile 2015 2020 2025 Ser Val Leu Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile 2030 2035 2040 Gly Arg Ser Val Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr 2045 2050 2055 Tyr Met Asn Gly Leu Leu Glu Ala Val Leu Lys Ala Gln Ala Asp 2060 2065 2070 Val Gly Gly Ser Val Ile Leu Leu Ser Ala Thr Leu Pro Met Lys 2075 2080 2085 Gln Lys Gln Lys Leu Leu Asp Thr Tyr Gly Leu His Thr Asp Pro 2090 2095 2100 Val Glu Asn Asn Ser Ala Tyr Pro Leu Ile Asn Trp Arg Gly Val 2105 2110 2115 Asn Gly Ala Gln Arg Phe Asp Leu Leu Ala His Pro Glu Gln Leu 2120 2125 2130 Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro Ile Cys Leu Ala Asp 2135 2140 2145 Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met Ile Ala Ala Ala 2150 2155 2160 Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu Val Asp Val 2165 2170 2175 Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn Thr Gln 2180 2185 2190 Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp Arg 2195 2200 2205 Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 2210 2215 2220 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu 2225 2230 2235 Gln Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys 2240 2245 2250 Pro Ala Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His 2255 2260 2265 His Arg Lys Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr 2270 2275 2280 Ile Leu Leu Pro Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile 2285 2290 2295 Tyr Ser Asn Val Arg Val Met Trp Arg Thr Gln Gln His Ile Glu 2300 2305 2310 Glu Leu Asn Gly Ala Ser Leu Phe Phe Pro Asp Ala Tyr Arg Gln 2315 2320 2325 Trp Leu Asp Ser Ile Tyr Asp Asp Ala Glu Met Asp Glu Pro Glu 2330 2335 2340 Trp Val Gly Asn Gly Met Asp Lys Phe Glu Ser Ala Glu Cys Glu 2345 2350 2355 Lys Arg Phe Lys Ala Arg Lys Val Leu Gln Trp Ala Glu Glu Tyr 2360 2365 2370 Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu Ala Val Thr Arg Asp 2375 2380 2385 Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val Gln Thr Ser Ser 2390 2395 2400 Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp Leu Ser His 2405 2410 2415 Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn Val Pro 2420 2425 2430 Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp Gly 2435 2440 2445 Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 2450 2455 2460 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met 2465 2470 2475 Thr Arg Val Ile Pro Ala Asn Pro Lys 2480 2485 <210> 1883 <211> 2488 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas3-17aa-Cas5 fusion <400> 1883 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 370 375 380 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 385 390 395 400 Lys Val Gly Ser Gly Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 405 410 415 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 420 425 430 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 435 440 445 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 450 455 460 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 465 470 475 480 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 485 490 495 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 500 505 510 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 515 520 525 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 530 535 540 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 545 550 555 560 Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr 565 570 575 Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys 580 585 590 Val Gly Ser Gly Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly 595 600 605 Lys Ser Ser Lys Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile 610 615 620 Tyr His Cys Leu Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln 625 630 635 640 Ser Val Val Leu Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys 645 650 655 Gln Arg Val Lys Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile 660 665 670 Gly Lys Phe Asp Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu 675 680 685 Lys Leu Asn Pro Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met 690 695 700 Cys Arg Lys Phe Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln 705 710 715 720 Asp Ser Leu Ser Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp 725 730 735 Ala Ala Pro His Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val 740 745 750 Thr Gly His His Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser 755 760 765 Arg Trp Glu Met Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys 770 775 780 Gln Ala Arg Glu Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr 785 790 795 800 Pro Ala Gly Leu Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu 805 810 815 Leu Ala Gly Phe Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr 820 825 830 Thr Asn Thr Phe Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala 835 840 845 Leu Arg Thr Tyr Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu 850 855 860 Glu Leu Ser Gly Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His 865 870 875 880 Ala Leu Leu Asp Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val 885 890 895 Asp Ala Leu Pro Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr 900 905 910 Gly Ser Gly Lys Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile 915 920 925 Asp Gln Gln Ile Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala 930 935 940 Thr Ala Asn Ala Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu 945 950 955 960 Phe Ser Ser Pro Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn 965 970 975 His Leu Phe Gln Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln 980 985 990 Glu Glu Ala Trp Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys 995 1000 1005 Lys Val Phe Leu Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val 1010 1015 1020 Leu Ile Ser Val Leu Pro Val Lys His Arg Phe Ile Arg Gly Leu 1025 1030 1035 Gly Ile Gly Arg Ser Val Leu Ile Val Asp Glu Val His Ala Tyr 1040 1045 1050 Asp Thr Tyr Met Asn Gly Leu Leu Glu Ala Val Leu Lys Ala Gln 1055 1060 1065 Ala Asp Val Gly Gly Ser Val Ile Leu Leu Ser Ala Thr Leu Pro 1070 1075 1080 Met Lys Gln Lys Gln Lys Leu Leu Asp Thr Tyr Gly Leu His Thr 1085 1090 1095 Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro Leu Ile Asn Trp Arg 1100 1105 1110 Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu Ala His Pro Glu 1115 1120 1125 Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro Ile Cys Leu 1130 1135 1140 Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met Ile Ala 1145 1150 1155 Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu Val 1160 1165 1170 Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 1175 1180 1185 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn 1190 1195 1200 Asp Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys 1205 1210 1215 Asn Gly Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val 1220 1225 1230 Val Glu Gln Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln 1235 1240 1245 His Cys Pro Ala Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His 1250 1255 1260 Arg His His Arg Lys Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val 1265 1270 1275 Ala Thr Ile Leu Leu Pro Asp Gly Glu Gly Tyr Gly Arg His Glu 1280 1285 1290 His Ile Tyr Ser Asn Val Arg Val Met Trp Arg Thr Gln Gln His 1295 1300 1305 Ile Glu Glu Leu Asn Gly Ala Ser Leu Phe Phe Pro Asp Ala Tyr 1310 1315 1320 Arg Gln Trp Leu Asp Ser Ile Tyr Asp Asp Ala Glu Met Asp Glu 1325 1330 1335 Pro Glu Trp Val Gly Asn Gly Met Asp Lys Phe Glu Ser Ala Glu 1340 1345 1350 Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu Gln Trp Ala Glu 1355 1360 1365 Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu Ala Val Thr 1370 1375 1380 Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val Gln Thr 1385 1390 1395 Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp Leu 1400 1405 1410 Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 1415 1420 1425 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu 1430 1435 1440 Asp Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp 1445 1450 1455 Val Trp Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu 1460 1465 1470 Gly Met Thr Arg Val Ile Pro Ala Asn Pro Lys Ala Asp Pro Thr 1475 1480 1485 Asn Arg Ala Lys Gly Leu Glu Ala Val Ser Val Ala Ser Met Arg 1490 1495 1500 Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro Met Gln Ala Trp Gly 1505 1510 1515 Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly Arg Phe Pro Thr 1520 1525 1530 Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu Gly Ile Gln 1535 1540 1545 Arg Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser Val Gln 1550 1555 1560 Phe Ala Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg Val 1565 1570 1575 Ser Val Thr Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg 1580 1585 1590 Glu Asp Tyr Arg Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp 1595 1600 1605 Arg Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val Ala Leu Trp Leu 1610 1615 1620 Thr Pro His Ala Thr Met Val Ile Ser Glu Leu Glu Lys Ala Val 1625 1630 1635 Leu Lys Pro Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro 1640 1645 1650 Leu Thr His Pro Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp Pro 1655 1660 1665 Gln Lys Ala Leu Leu Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr 1670 1675 1680 Ser Glu Glu Ser Val Thr Gly His His Leu Lys Phe Thr Ala Arg 1685 1690 1695 Asp Glu Pro Met Ile Thr Leu Pro Arg Gln Phe Ala Ser Arg Glu 1700 1705 1710 Trp Tyr Val Ile Lys Gly Gly Met Asp Val Ser Gln Gly Ser Gly 1715 1720 1725 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn 1730 1735 1740 Pro Gly Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Tyr 1745 1750 1755 Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu Tyr 1760 1765 1770 Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp 1775 1780 1785 Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn Thr Pro 1790 1795 1800 Glu Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val Ser 1805 1810 1815 Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln 1820 1825 1830 Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro 1835 1840 1845 Ile Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly 1850 1855 1860 Asn Ile Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu Gln 1865 1870 1875 Ile Ala Trp Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu 1880 1885 1890 Asp Val His Pro Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp 1895 1900 1905 Gly Lys Ser Gly Lys Ile Gln Thr Val Cys Phe Glu Gly Val Leu 1910 1915 1920 Thr Ile Asn Asp Ala Pro Ala Leu Ile Asp Leu Val Gln Gln Gly 1925 1930 1935 Ile Gly Pro Ala Lys Ser Met Gly Cys Gly Leu Leu Ser Leu Ala 1940 1945 1950 Pro Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly 1955 1960 1965 Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 1970 1975 1980 Gly Ser Gly Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg 1985 1990 1995 Pro Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu 2000 2005 2010 Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp 2015 2020 2025 Met Glu Leu Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile 2030 2035 2040 Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His Arg Ile Met 2045 2050 2055 Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp 2060 2065 2070 Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe Met Gln 2075 2080 2085 Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu 2090 2095 2100 Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln 2105 2110 2115 Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala 2120 2125 2130 Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe 2135 2140 2145 Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg 2150 2155 2160 Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 2165 2170 2175 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn 2180 2185 2190 Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro 2195 2200 2205 Ala Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala 2210 2215 2220 His Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys 2225 2230 2235 Cys Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu 2240 2245 2250 Lys Phe Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser 2255 2260 2265 Pro Cys Leu Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe 2270 2275 2280 Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg 2285 2290 2295 Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn Arg Val 2300 2305 2310 Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser Pro 2315 2320 2325 Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile 2330 2335 2340 Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln 2345 2350 2355 Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly 2360 2365 2370 Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly 2375 2380 2385 Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu 2390 2395 2400 Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 2405 2410 2415 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile 2420 2425 2430 Ala Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe 2435 2440 2445 Asn Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser 2450 2455 2460 Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu 2465 2470 2475 Leu Lys Pro Gln Gly Gly Pro Ser Asn Gly 2480 2485 <210> 1884 <211> 2488 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas5-17aa-Cas3 fusion <400> 1884 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 370 375 380 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 385 390 395 400 Lys Val Gly Ser Gly Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 405 410 415 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 420 425 430 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 435 440 445 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 450 455 460 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 465 470 475 480 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 485 490 495 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 500 505 510 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 515 520 525 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 530 535 540 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 545 550 555 560 Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr 565 570 575 Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys 580 585 590 Val Gly Ser Gly Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro 595 600 605 Met Gln Ala Trp Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly 610 615 620 Arg Phe Pro Thr Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu 625 630 635 640 Gly Ile Gln Arg Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser 645 650 655 Val Gln Phe Ala Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg 660 665 670 Val Ser Val Thr Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg 675 680 685 Glu Asp Tyr Arg Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg 690 695 700 Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro 705 710 715 720 His Ala Thr Met Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro 725 730 735 Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro 740 745 750 Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu 755 760 765 Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr 770 775 780 Gly His His Leu Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu 785 790 795 800 Pro Arg Gln Phe Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met 805 810 815 Asp Val Ser Gln Ala Asp Pro Thr Asn Arg Ala Lys Gly Leu Glu Ala 820 825 830 Val Ser Val Ala Ser Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp 835 840 845 Gly Lys Ser Ser Lys Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu 850 855 860 Ile Tyr His Cys Leu Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp 865 870 875 880 Gln Ser Val Val Leu Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser 885 890 895 Lys Gln Arg Val Lys Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp 900 905 910 Ile Gly Lys Phe Asp Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp 915 920 925 Leu Lys Leu Asn Pro Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln 930 935 940 Met Cys Arg Lys Phe Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn 945 950 955 960 Gln Asp Ser Leu Ser Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe 965 970 975 Asp Ala Ala Pro His Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala 980 985 990 Val Thr Gly His His Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys 995 1000 1005 Ser Arg Trp Glu Met Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln 1010 1015 1020 Asp Lys Gln Ala Arg Glu Glu Trp Ile Ser Val Leu Glu Ala Leu 1025 1030 1035 Phe Leu Thr Pro Ala Gly Leu Ser Ile Asn Asp Ile Pro Pro Asp 1040 1045 1050 Cys Ser Ser Leu Leu Ala Gly Phe Cys Ser Leu Ala Asp Trp Leu 1055 1060 1065 Gly Ser Trp Thr Thr Thr Asn Thr Phe Leu Phe Asn Glu Asp Ala 1070 1075 1080 Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr Phe Gln Asp Arg Gln 1085 1090 1095 Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly Leu Val Ser Asn 1100 1105 1110 Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp Asn Gly Tyr 1115 1120 1125 Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro Val Ala 1130 1135 1140 Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys Thr 1145 1150 1155 Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 1160 1165 1170 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn 1175 1180 1185 Ala Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser 1190 1195 1200 Ser Pro Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His 1205 1210 1215 Leu Phe Gln Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln 1220 1225 1230 Glu Glu Ala Trp Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn 1235 1240 1245 Lys Lys Val Phe Leu Gly Gln Ile Gly Val Cys Thr Ile Asp Gln 1250 1255 1260 Val Leu Ile Ser Val Leu Pro Val Lys His Arg Phe Ile Arg Gly 1265 1270 1275 Leu Gly Ile Gly Arg Ser Val Leu Ile Val Asp Glu Val His Ala 1280 1285 1290 Tyr Asp Thr Tyr Met Asn Gly Leu Leu Glu Ala Val Leu Lys Ala 1295 1300 1305 Gln Ala Asp Val Gly Gly Ser Val Ile Leu Leu Ser Ala Thr Leu 1310 1315 1320 Pro Met Lys Gln Lys Gln Lys Leu Leu Asp Thr Tyr Gly Leu His 1325 1330 1335 Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro Leu Ile Asn Trp 1340 1345 1350 Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu Ala His Pro 1355 1360 1365 Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro Ile Cys 1370 1375 1380 Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met Ile 1385 1390 1395 Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 1400 1405 1410 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn 1415 1420 1425 Asn Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu 1430 1435 1440 Asn Asp Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly 1445 1450 1455 Lys Asn Gly Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln 1460 1465 1470 Val Val Glu Gln Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr 1475 1480 1485 Gln His Cys Pro Ala Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu 1490 1495 1500 His Arg His His Arg Lys Tyr Arg Pro Ala Gly Phe Glu Ile Pro 1505 1510 1515 Val Ala Thr Ile Leu Leu Pro Asp Gly Glu Gly Tyr Gly Arg His 1520 1525 1530 Glu His Ile Tyr Ser Asn Val Arg Val Met Trp Arg Thr Gln Gln 1535 1540 1545 His Ile Glu Glu Leu Asn Gly Ala Ser Leu Phe Phe Pro Asp Ala 1550 1555 1560 Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp Asp Ala Glu Met Asp 1565 1570 1575 Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys Phe Glu Ser Ala 1580 1585 1590 Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu Gln Trp Ala 1595 1600 1605 Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu Ala Val 1610 1615 1620 Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val Gln 1625 1630 1635 Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 1640 1645 1650 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val 1655 1660 1665 Asn Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp 1670 1675 1680 Glu Asp Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly 1685 1690 1695 Trp Val Trp Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp 1700 1705 1710 Glu Gly Met Thr Arg Val Ile Pro Ala Asn Pro Lys Gly Ser Gly 1715 1720 1725 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn 1730 1735 1740 Pro Gly Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Tyr 1745 1750 1755 Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu Tyr 1760 1765 1770 Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp 1775 1780 1785 Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn Thr Pro 1790 1795 1800 Glu Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val Ser 1805 1810 1815 Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln 1820 1825 1830 Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro 1835 1840 1845 Ile Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly 1850 1855 1860 Asn Ile Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu Gln 1865 1870 1875 Ile Ala Trp Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu 1880 1885 1890 Asp Val His Pro Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp 1895 1900 1905 Gly Lys Ser Gly Lys Ile Gln Thr Val Cys Phe Glu Gly Val Leu 1910 1915 1920 Thr Ile Asn Asp Ala Pro Ala Leu Ile Asp Leu Val Gln Gln Gly 1925 1930 1935 Ile Gly Pro Ala Lys Ser Met Gly Cys Gly Leu Leu Ser Leu Ala 1940 1945 1950 Pro Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly 1955 1960 1965 Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 1970 1975 1980 Gly Ser Gly Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg 1985 1990 1995 Pro Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu 2000 2005 2010 Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp 2015 2020 2025 Met Glu Leu Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile 2030 2035 2040 Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His Arg Ile Met 2045 2050 2055 Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp 2060 2065 2070 Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe Met Gln 2075 2080 2085 Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu 2090 2095 2100 Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln 2105 2110 2115 Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala 2120 2125 2130 Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe 2135 2140 2145 Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg 2150 2155 2160 Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 2165 2170 2175 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn 2180 2185 2190 Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro 2195 2200 2205 Ala Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala 2210 2215 2220 His Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys 2225 2230 2235 Cys Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu 2240 2245 2250 Lys Phe Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser 2255 2260 2265 Pro Cys Leu Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe 2270 2275 2280 Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg 2285 2290 2295 Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn Arg Val 2300 2305 2310 Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser Pro 2315 2320 2325 Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile 2330 2335 2340 Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln 2345 2350 2355 Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly 2360 2365 2370 Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly 2375 2380 2385 Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu 2390 2395 2400 Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 2405 2410 2415 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile 2420 2425 2430 Ala Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe 2435 2440 2445 Asn Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser 2450 2455 2460 Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu 2465 2470 2475 Leu Lys Pro Gln Gly Gly Pro Ser Asn Gly 2480 2485 <210> 1885 <211> 2488 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas3-17aa-Cas6 fusion <400> 1885 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 370 375 380 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 385 390 395 400 Lys Val Gly Ser Gly Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 405 410 415 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 420 425 430 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 435 440 445 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 450 455 460 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 465 470 475 480 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 485 490 495 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 500 505 510 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 515 520 525 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 530 535 540 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 545 550 555 560 Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr 565 570 575 Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys 580 585 590 Val Gly Ser Gly Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro 595 600 605 Met Gln Ala Trp Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly 610 615 620 Arg Phe Pro Thr Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu 625 630 635 640 Gly Ile Gln Arg Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser 645 650 655 Val Gln Phe Ala Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg 660 665 670 Val Ser Val Thr Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg 675 680 685 Glu Asp Tyr Arg Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg 690 695 700 Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro 705 710 715 720 His Ala Thr Met Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro 725 730 735 Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro 740 745 750 Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu 755 760 765 Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr 770 775 780 Gly His His Leu Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu 785 790 795 800 Pro Arg Gln Phe Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met 805 810 815 Asp Val Ser Gln Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 820 825 830 Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 835 840 845 Gly Ser Gly Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys 850 855 860 Ser Ser Lys Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr 865 870 875 880 His Cys Leu Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser 885 890 895 Val Val Leu Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln 900 905 910 Arg Val Lys Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly 915 920 925 Lys Phe Asp Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys 930 935 940 Leu Asn Pro Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys 945 950 955 960 Arg Lys Phe Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp 965 970 975 Ser Leu Ser Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala 980 985 990 Ala Pro His Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr 995 1000 1005 Gly His His Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser 1010 1015 1020 Arg Trp Glu Met Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp 1025 1030 1035 Lys Gln Ala Arg Glu Glu Trp Ile Ser Val Leu Glu Ala Leu Phe 1040 1045 1050 Leu Thr Pro Ala Gly Leu Ser Ile Asn Asp Ile Pro Pro Asp Cys 1055 1060 1065 Ser Ser Leu Leu Ala Gly Phe Cys Ser Leu Ala Asp Trp Leu Gly 1070 1075 1080 Ser Trp Thr Thr Thr Asn Thr Phe Leu Phe Asn Glu Asp Ala Pro 1085 1090 1095 Ser Asp Ile Asn Ala Leu Arg Thr Tyr Phe Gln Asp Arg Gln Gln 1100 1105 1110 Asp Ala Ser Arg Val Leu Glu Leu Ser Gly Leu Val Ser Asn Lys 1115 1120 1125 Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp Asn Gly Tyr Gln 1130 1135 1140 Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro Val Ala Pro 1145 1150 1155 Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys Thr Glu 1160 1165 1170 Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile Ala 1175 1180 1185 Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 1190 1195 1200 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser 1205 1210 1215 Pro Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu 1220 1225 1230 Phe Gln Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu 1235 1240 1245 Glu Ala Trp Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys 1250 1255 1260 Lys Val Phe Leu Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val 1265 1270 1275 Leu Ile Ser Val Leu Pro Val Lys His Arg Phe Ile Arg Gly Leu 1280 1285 1290 Gly Ile Gly Arg Ser Val Leu Ile Val Asp Glu Val His Ala Tyr 1295 1300 1305 Asp Thr Tyr Met Asn Gly Leu Leu Glu Ala Val Leu Lys Ala Gln 1310 1315 1320 Ala Asp Val Gly Gly Ser Val Ile Leu Leu Ser Ala Thr Leu Pro 1325 1330 1335 Met Lys Gln Lys Gln Lys Leu Leu Asp Thr Tyr Gly Leu His Thr 1340 1345 1350 Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro Leu Ile Asn Trp Arg 1355 1360 1365 Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu Ala His Pro Glu 1370 1375 1380 Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro Ile Cys Leu 1385 1390 1395 Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met Ile Ala 1400 1405 1410 Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu Val 1415 1420 1425 Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 1430 1435 1440 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn 1445 1450 1455 Asp Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys 1460 1465 1470 Asn Gly Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val 1475 1480 1485 Val Glu Gln Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln 1490 1495 1500 His Cys Pro Ala Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His 1505 1510 1515 Arg His His Arg Lys Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val 1520 1525 1530 Ala Thr Ile Leu Leu Pro Asp Gly Glu Gly Tyr Gly Arg His Glu 1535 1540 1545 His Ile Tyr Ser Asn Val Arg Val Met Trp Arg Thr Gln Gln His 1550 1555 1560 Ile Glu Glu Leu Asn Gly Ala Ser Leu Phe Phe Pro Asp Ala Tyr 1565 1570 1575 Arg Gln Trp Leu Asp Ser Ile Tyr Asp Asp Ala Glu Met Asp Glu 1580 1585 1590 Pro Glu Trp Val Gly Asn Gly Met Asp Lys Phe Glu Ser Ala Glu 1595 1600 1605 Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu Gln Trp Ala Glu 1610 1615 1620 Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu Ala Val Thr 1625 1630 1635 Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val Gln Thr 1640 1645 1650 Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp Leu 1655 1660 1665 Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 1670 1675 1680 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu 1685 1690 1695 Asp Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp 1700 1705 1710 Val Trp Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu 1715 1720 1725 Gly Met Thr Arg Val Ile Pro Ala Asn Pro Lys Ala Asp Pro Thr 1730 1735 1740 Asn Arg Ala Lys Gly Leu Glu Ala Val Ser Val Ala Ser Met Tyr 1745 1750 1755 Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu Tyr 1760 1765 1770 Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp 1775 1780 1785 Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn Thr Pro 1790 1795 1800 Glu Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val Ser 1805 1810 1815 Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln 1820 1825 1830 Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro 1835 1840 1845 Ile Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly 1850 1855 1860 Asn Ile Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu Gln 1865 1870 1875 Ile Ala Trp Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu 1880 1885 1890 Asp Val His Pro Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp 1895 1900 1905 Gly Lys Ser Gly Lys Ile Gln Thr Val Cys Phe Glu Gly Val Leu 1910 1915 1920 Thr Ile Asn Asp Ala Pro Ala Leu Ile Asp Leu Val Gln Gln Gly 1925 1930 1935 Ile Gly Pro Ala Lys Ser Met Gly Cys Gly Leu Leu Ser Leu Ala 1940 1945 1950 Pro Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly 1955 1960 1965 Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 1970 1975 1980 Gly Ser Gly Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg 1985 1990 1995 Pro Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu 2000 2005 2010 Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp 2015 2020 2025 Met Glu Leu Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile 2030 2035 2040 Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His Arg Ile Met 2045 2050 2055 Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp 2060 2065 2070 Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe Met Gln 2075 2080 2085 Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu 2090 2095 2100 Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln 2105 2110 2115 Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala 2120 2125 2130 Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe 2135 2140 2145 Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg 2150 2155 2160 Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 2165 2170 2175 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn 2180 2185 2190 Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro 2195 2200 2205 Ala Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala 2210 2215 2220 His Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys 2225 2230 2235 Cys Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu 2240 2245 2250 Lys Phe Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser 2255 2260 2265 Pro Cys Leu Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe 2270 2275 2280 Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg 2285 2290 2295 Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn Arg Val 2300 2305 2310 Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser Pro 2315 2320 2325 Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile 2330 2335 2340 Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln 2345 2350 2355 Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly 2360 2365 2370 Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly 2375 2380 2385 Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu 2390 2395 2400 Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 2405 2410 2415 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile 2420 2425 2430 Ala Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe 2435 2440 2445 Asn Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser 2450 2455 2460 Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu 2465 2470 2475 Leu Lys Pro Gln Gly Gly Pro Ser Asn Gly 2480 2485 <210> 1886 <211> 2488 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: EcoCascade with Cas6-17aa-Cas3 fusion <400> 1886 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 370 375 380 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 385 390 395 400 Lys Val Gly Ser Gly Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 405 410 415 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 420 425 430 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 435 440 445 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 450 455 460 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 465 470 475 480 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 485 490 495 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 500 505 510 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 515 520 525 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 530 535 540 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 545 550 555 560 Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr 565 570 575 Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys 580 585 590 Val Gly Ser Gly Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro 595 600 605 Met Gln Ala Trp Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly 610 615 620 Arg Phe Pro Thr Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu 625 630 635 640 Gly Ile Gln Arg Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser 645 650 655 Val Gln Phe Ala Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg 660 665 670 Val Ser Val Thr Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg 675 680 685 Glu Asp Tyr Arg Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg 690 695 700 Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro 705 710 715 720 His Ala Thr Met Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro 725 730 735 Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro 740 745 750 Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu 755 760 765 Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr 770 775 780 Gly His His Leu Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu 785 790 795 800 Pro Arg Gln Phe Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met 805 810 815 Asp Val Ser Gln Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 820 825 830 Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 835 840 845 Gly Ser Gly Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser 850 855 860 Arg Asp Leu Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn 865 870 875 880 Arg Pro Asp Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn 885 890 895 Thr Pro Glu Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val 900 905 910 Ser Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln 915 920 925 Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile 930 935 940 Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile 945 950 955 960 Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp 965 970 975 Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro 980 985 990 Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys 995 1000 1005 Ile Gln Thr Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala 1010 1015 1020 Pro Ala Leu Ile Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys 1025 1030 1035 Ser Met Gly Cys Gly Leu Leu Ser Leu Ala Pro Leu Ala Asp Pro 1040 1045 1050 Thr Asn Arg Ala Lys Gly Leu Glu Ala Val Ser Val Ala Ser Met 1055 1060 1065 Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1070 1075 1080 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys 1085 1090 1095 Leu Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val 1100 1105 1110 Val Leu Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln 1115 1120 1125 Arg Val Lys Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile 1130 1135 1140 Gly Lys Phe Asp Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp 1145 1150 1155 Leu Lys Leu Asn Pro Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr 1160 1165 1170 Gln Met Cys Arg Lys Phe Asn His Gly Ala Ala Gly Leu Tyr Trp 1175 1180 1185 Phe Asn Gln Asp Ser Leu Ser Glu Gln Ser Leu Gly Asp Phe Phe 1190 1195 1200 Ser Phe Phe Asp Ala Ala Pro His Pro Tyr Glu Ser Trp Phe Pro 1205 1210 1215 Trp Val Glu Ala Val Thr Gly His His Gly Phe Ile Leu His Ser 1220 1225 1230 Gln Asp Gln Asp Lys Ser Arg Trp Glu Met Pro Ala Ser Leu Ala 1235 1240 1245 Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu Glu Trp Ile Ser 1250 1255 1260 Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu Ser Ile Asn 1265 1270 1275 Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe Cys Ser 1280 1285 1290 Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe Leu 1295 1300 1305 Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 1310 1315 1320 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser 1325 1330 1335 Gly Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu 1340 1345 1350 Leu Asp Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp 1355 1360 1365 Ala Leu Pro Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr 1370 1375 1380 Gly Ser Gly Lys Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu 1385 1390 1395 Ile Asp Gln Gln Ile Ala Asp Ser Val Ile Phe Ala Leu Pro Thr 1400 1405 1410 Gln Ala Thr Ala Asn Ala Met Leu Thr Arg Met Glu Ala Ser Ala 1415 1420 1425 Ser His Leu Phe Ser Ser Pro Asn Leu Ile Leu Ala His Gly Asn 1430 1435 1440 Ser Arg Phe Asn His Leu Phe Gln Ser Ile Lys Ser Arg Ala Ile 1445 1450 1455 Thr Glu Gln Gly Gln Glu Glu Ala Trp Val Gln Cys Cys Gln Trp 1460 1465 1470 Leu Ser Gln Ser Asn Lys Lys Val Phe Leu Gly Gln Ile Gly Val 1475 1480 1485 Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu Pro Val Lys His 1490 1495 1500 Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val Leu Ile Val 1505 1510 1515 Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu Leu Glu 1520 1525 1530 Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile Leu 1535 1540 1545 Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 1550 1555 1560 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr 1565 1570 1575 Pro Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp 1580 1585 1590 Leu Leu Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln 1595 1600 1605 Pro Glu Pro Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met 1610 1615 1620 Leu Glu Arg Met Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys 1625 1630 1635 Leu Ile Cys Asn Leu Val Asp Val Ala Gln Val Cys Tyr Gln Arg 1640 1645 1650 Leu Lys Glu Leu Asn Asn Thr Gln Val Asp Ile Asp Leu Phe His 1655 1660 1665 Ala Arg Phe Thr Leu Asn Asp Arg Arg Glu Lys Glu Asn Arg Val 1670 1675 1680 Ile Ser Asn Phe Gly Lys Asn Gly Lys Arg Asn Val Gly Arg Ile 1685 1690 1695 Leu Val Ala Thr Gln Val Val Glu Gln Ser Leu Asp Val Asp Phe 1700 1705 1710 Asp Trp Leu Ile Thr Gln His Cys Pro Ala Asp Leu Leu Phe Gln 1715 1720 1725 Arg Leu Gly Arg Leu His Arg His His Arg Lys Tyr Arg Pro Ala 1730 1735 1740 Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro Asp Gly Glu 1745 1750 1755 Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg Val Met 1760 1765 1770 Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser Leu 1775 1780 1785 Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 1790 1795 1800 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp 1805 1810 1815 Lys Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys 1820 1825 1830 Val Leu Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu 1835 1840 1845 Thr Ile Leu Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu 1850 1855 1860 Leu Pro Tyr Val Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly 1865 1870 1875 Gln Val Tyr Glu Asp Leu Ser His Glu Gln Gln Tyr Glu Ala Leu 1880 1885 1890 Ala Leu Asn Arg Val Asn Val Pro Phe Thr Trp Lys Arg Ser Phe 1895 1900 1905 Ser Glu Val Val Asp Glu Asp Gly Leu Leu Trp Leu Glu Gly Lys 1910 1915 1920 Gln Asn Leu Asp Gly Trp Val Trp Gln Gly Asn Ser Ile Val Ile 1925 1930 1935 Thr Tyr Thr Gly Asp Glu Gly Met Thr Arg Val Ile Pro Ala Asn 1940 1945 1950 Pro Lys Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly 1955 1960 1965 Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 1970 1975 1980 Gly Ser Gly Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg 1985 1990 1995 Pro Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu 2000 2005 2010 Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp 2015 2020 2025 Met Glu Leu Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile 2030 2035 2040 Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His Arg Ile Met 2045 2050 2055 Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp 2060 2065 2070 Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe Met Gln 2075 2080 2085 Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu 2090 2095 2100 Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln 2105 2110 2115 Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala 2120 2125 2130 Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe 2135 2140 2145 Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg 2150 2155 2160 Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 2165 2170 2175 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn 2180 2185 2190 Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro 2195 2200 2205 Ala Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala 2210 2215 2220 His Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys 2225 2230 2235 Cys Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu 2240 2245 2250 Lys Phe Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser 2255 2260 2265 Pro Cys Leu Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe 2270 2275 2280 Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg 2285 2290 2295 Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn Arg Val 2300 2305 2310 Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser Pro 2315 2320 2325 Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile 2330 2335 2340 Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln 2345 2350 2355 Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly 2360 2365 2370 Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly 2375 2380 2385 Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu 2390 2395 2400 Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 2405 2410 2415 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile 2420 2425 2430 Ala Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe 2435 2440 2445 Asn Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser 2450 2455 2460 Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu 2465 2470 2475 Leu Lys Pro Gln Gly Gly Pro Ser Asn Gly 2480 2485 <210> 1887 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: sgRNA templating forward <400> 1887 agtaataata cgactcacta tag 23 <210> 1888 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: sgRNA templating oligo reverse <400> 1888 aaaaaagcac cgactcggtg ccactttttc aagttgataa cggactagcc ttattttaac 60 ttgctatttc tagctctaaa ac 82 <210> 1889 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock F1 <400> 1889 taatacgact cactatagtg gatatgggcg atgatctggt tttagagcta gaaatagc 58 <210> 1890 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock F2 <400> 1890 taatacgact cactataggt tgaagccctt ctggatatgt tttagagcta gaaatagc 58 <210> 1891 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock F3 <400> 1891 taatacgact cactatagag ttgaagccct tctggatagt tttagagcta gaaatagc 58 <210> 1892 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock F4 <400> 1892 taatacgact cactatagcc gtgtagttga agcccttcgt tttagagcta gaaatagc 58 <210> 1893 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock F5 <400> 1893 taatacgact cactataggt cacaaatttg gcgctgcagt tttagagcta gaaatagc 58 <210> 1894 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock F6 <400> 1894 taatacgact cactataggt cacaaatttg gcgctgcagt tttagagcta gaaatagc 58 <210> 1895 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock R1 <400> 1895 taatacgact cactatagga tcatcgccca tatccagagt tttagagcta gaaatagc 58 <210> 1896 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock R2 <400> 1896 taatacgact cactatagat catcgcccat atccagaagt tttagagcta gaaatagc 58 <210> 1897 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock R3 <400> 1897 taatacgact cactatagcc agaagggctt caactacagt tttagagcta gaaatagc 58 <210> 1898 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock R4 <400> 1898 taatacgact cactatagac acggtgtttg actgtaaggt tttagagcta gaaatagc 58 <210> 1899 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Roadblock R5 <400> 1899 taatacgact cactatagca gcgccaaatt tgtgaccagt tttagagcta gaaatagc 58 <210> 1900 <211> 888 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Eco-mCas3 (D452A) <400> 1900 Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys 1 5 10 15 Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 20 25 30 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu 35 40 45 Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys 50 55 60 Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp 65 70 75 80 Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro 85 90 95 Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe 100 105 110 Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser 115 120 125 Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His 130 135 140 Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His 145 150 155 160 Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met 165 170 175 Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu 180 185 190 Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu 195 200 205 Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe 210 215 220 Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe 225 230 235 240 Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr 245 250 255 Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 260 265 270 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp 275 280 285 Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro 290 295 300 Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys 305 310 315 320 Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile 325 330 335 Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala 340 345 350 Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro 355 360 365 Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln 370 375 380 Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp 385 390 395 400 Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu 405 410 415 Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu 420 425 430 Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val 435 440 445 Leu Ile Val Ala Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu 450 455 460 Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile 465 470 475 480 Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp 485 490 495 Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 500 505 510 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu 515 520 525 Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro 530 535 540 Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met 545 550 555 560 Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu 565 570 575 Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn 580 585 590 Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp 595 600 605 Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly 610 615 620 Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln 625 630 635 640 Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala 645 650 655 Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys 660 665 670 Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro 675 680 685 Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg 690 695 700 Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser 705 710 715 720 Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp 725 730 735 Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 740 745 750 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu 755 760 765 Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu 770 775 780 Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val 785 790 795 800 Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp 805 810 815 Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn 820 825 830 Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp 835 840 845 Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp 850 855 860 Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr 865 870 875 880 Arg Val Ile Pro Ala Asn Pro Lys 885 <210> 1901 <211> 2488 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: nCas3-17aa-EcoCascade <400> 1901 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 370 375 380 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 385 390 395 400 Lys Val Gly Ser Gly Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 405 410 415 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 420 425 430 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 435 440 445 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 450 455 460 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 465 470 475 480 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 485 490 495 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 500 505 510 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 515 520 525 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 530 535 540 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 545 550 555 560 Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr 565 570 575 Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys 580 585 590 Val Gly Ser Gly Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro 595 600 605 Met Gln Ala Trp Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly 610 615 620 Arg Phe Pro Thr Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu 625 630 635 640 Gly Ile Gln Arg Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser 645 650 655 Val Gln Phe Ala Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg 660 665 670 Val Ser Val Thr Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg 675 680 685 Glu Asp Tyr Arg Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg 690 695 700 Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro 705 710 715 720 His Ala Thr Met Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro 725 730 735 Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro 740 745 750 Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu 755 760 765 Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr 770 775 780 Gly His His Leu Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu 785 790 795 800 Pro Arg Gln Phe Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met 805 810 815 Asp Val Ser Gln Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 820 825 830 Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 835 840 845 Gly Ser Gly Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser 850 855 860 Arg Asp Leu Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn 865 870 875 880 Arg Pro Asp Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn 885 890 895 Thr Pro Glu Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val 900 905 910 Ser Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln 915 920 925 Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile 930 935 940 Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile 945 950 955 960 Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp 965 970 975 Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro 980 985 990 Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys 995 1000 1005 Ile Gln Thr Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala 1010 1015 1020 Pro Ala Leu Ile Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys 1025 1030 1035 Ser Met Gly Cys Gly Leu Leu Ser Leu Ala Pro Leu Gly Ser Gly 1040 1045 1050 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn 1055 1060 1065 Pro Gly Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Glu 1070 1075 1080 Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys Ser 1085 1090 1095 Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu 1100 1105 1110 Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val 1115 1120 1125 Leu Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg 1130 1135 1140 Val Lys Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly 1145 1150 1155 Lys Phe Asp Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu 1160 1165 1170 Lys Leu Asn Pro Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln 1175 1180 1185 Met Cys Arg Lys Phe Asn His Gly Ala Ala Gly Leu Tyr Trp Phe 1190 1195 1200 Asn Gln Asp Ser Leu Ser Glu Gln Ser Leu Gly Asp Phe Phe Ser 1205 1210 1215 Phe Phe Asp Ala Ala Pro His Pro Tyr Glu Ser Trp Phe Pro Trp 1220 1225 1230 Val Glu Ala Val Thr Gly His His Gly Phe Ile Leu His Ser Gln 1235 1240 1245 Asp Gln Asp Lys Ser Arg Trp Glu Met Pro Ala Ser Leu Ala Ser 1250 1255 1260 Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu Glu Trp Ile Ser Val 1265 1270 1275 Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu Ser Ile Asn Asp 1280 1285 1290 Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe Cys Ser Leu 1295 1300 1305 Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe Leu Phe 1310 1315 1320 Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr Phe 1325 1330 1335 Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly 1340 1345 1350 Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu 1355 1360 1365 Asp Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala 1370 1375 1380 Leu Pro Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly 1385 1390 1395 Ser Gly Lys Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile 1400 1405 1410 Asp Gln Gln Ile Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln 1415 1420 1425 Ala Thr Ala Asn Ala Met Leu Thr Arg Met Glu Ala Ser Ala Ser 1430 1435 1440 His Leu Phe Ser Ser Pro Asn Leu Ile Leu Ala His Gly Asn Ser 1445 1450 1455 Arg Phe Asn His Leu Phe Gln Ser Ile Lys Ser Arg Ala Ile Thr 1460 1465 1470 Glu Gln Gly Gln Glu Glu Ala Trp Val Gln Cys Cys Gln Trp Leu 1475 1480 1485 Ser Gln Ser Asn Lys Lys Val Phe Leu Gly Gln Ile Gly Val Cys 1490 1495 1500 Thr Ile Asp Gln Val Leu Ile Ser Val Leu Pro Val Lys His Arg 1505 1510 1515 Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val Leu Ile Val Ala 1520 1525 1530 Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu Leu Glu Ala 1535 1540 1545 Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile Leu Leu 1550 1555 1560 Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp Thr 1565 1570 1575 Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro 1580 1585 1590 Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu 1595 1600 1605 Leu Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro 1610 1615 1620 Glu Pro Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu 1625 1630 1635 Glu Arg Met Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu 1640 1645 1650 Ile Cys Asn Leu Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu 1655 1660 1665 Lys Glu Leu Asn Asn Thr Gln Val Asp Ile Asp Leu Phe His Ala 1670 1675 1680 Arg Phe Thr Leu Asn Asp Arg Arg Glu Lys Glu Asn Arg Val Ile 1685 1690 1695 Ser Asn Phe Gly Lys Asn Gly Lys Arg Asn Val Gly Arg Ile Leu 1700 1705 1710 Val Ala Thr Gln Val Val Glu Gln Ser Leu Asp Val Asp Phe Asp 1715 1720 1725 Trp Leu Ile Thr Gln His Cys Pro Ala Asp Leu Leu Phe Gln Arg 1730 1735 1740 Leu Gly Arg Leu His Arg His His Arg Lys Tyr Arg Pro Ala Gly 1745 1750 1755 Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro Asp Gly Glu Gly 1760 1765 1770 Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg Val Met Trp 1775 1780 1785 Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser Leu Phe 1790 1795 1800 Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp Asp 1805 1810 1815 Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys 1820 1825 1830 Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val 1835 1840 1845 Leu Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr 1850 1855 1860 Ile Leu Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu 1865 1870 1875 Pro Tyr Val Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln 1880 1885 1890 Val Tyr Glu Asp Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala 1895 1900 1905 Leu Asn Arg Val Asn Val Pro Phe Thr Trp Lys Arg Ser Phe Ser 1910 1915 1920 Glu Val Val Asp Glu Asp Gly Leu Leu Trp Leu Glu Gly Lys Gln 1925 1930 1935 Asn Leu Asp Gly Trp Val Trp Gln Gly Asn Ser Ile Val Ile Thr 1940 1945 1950 Tyr Thr Gly Asp Glu Gly Met Thr Arg Val Ile Pro Ala Asn Pro 1955 1960 1965 Lys Ala Asp Pro Thr Asn Arg Ala Lys Gly Leu Glu Ala Val Ser 1970 1975 1980 Val Ala Ser Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg 1985 1990 1995 Pro Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu 2000 2005 2010 Tyr Cys Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp 2015 2020 2025 Met Glu Leu Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile 2030 2035 2040 Ile Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His Arg Ile Met 2045 2050 2055 Asn Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp 2060 2065 2070 Ile Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe Met Gln 2075 2080 2085 Thr Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu 2090 2095 2100 Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln 2105 2110 2115 Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala 2120 2125 2130 Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe 2135 2140 2145 Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg 2150 2155 2160 Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu 2165 2170 2175 Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn 2180 2185 2190 Gln Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro 2195 2200 2205 Ala Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala 2210 2215 2220 His Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys 2225 2230 2235 Cys Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu 2240 2245 2250 Lys Phe Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser 2255 2260 2265 Pro Cys Leu Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe 2270 2275 2280 Leu Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg 2285 2290 2295 Val Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn Arg Val 2300 2305 2310 Ala Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser Pro 2315 2320 2325 Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile 2330 2335 2340 Leu Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln 2345 2350 2355 Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly 2360 2365 2370 Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly 2375 2380 2385 Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu 2390 2395 2400 Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro 2405 2410 2415 Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile 2420 2425 2430 Ala Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe 2435 2440 2445 Asn Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser 2450 2455 2460 Thr Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu 2465 2470 2475 Leu Lys Pro Gln Gly Gly Pro Ser Asn Gly 2480 2485 <210> 1902 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 1 spacer <400> 1902 tctgtctgcc tattcaccga ttttgattct ca 32 <210> 1903 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 2 spacer <400> 1903 taaggattct gatgtgtata tcacagacaa aa 32 <210> 1904 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 3 spacer <400> 1904 gattctgatg tgtatatcac agacaaaact gt 32 <210> 1905 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 4 spacer <400> 1905 tccatagacc tcatgtctag cacagttttg tc 32 <210> 1906 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 5 spacer <400> 1906 agcaacagtg ctgtggcctg gagcaacaaa tc 32 <210> 1907 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 6 spacer <400> 1907 tcagatttgt tgctccaggc cacagcactg tt 32 <210> 1908 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 7 spacer <400> 1908 gcgtttgcac atgcaaagtc agatttgttg ct 32 <210> 1909 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 8 spacer <400> 1909 gtgtcttctg gaataatgct gttgttgaag gc 32 <210> 1910 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 1 primer <400> 1910 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acactgagaa 60 tcaaaatcgg tgaataggca gacagacggt tcatccccgc aggtgcgggg aacactgaga 120 atcaaaatcg gtgaataggc agacagacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1911 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 2 primer <400> 1911 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacttttgt 60 ctgtgatata cacatcagaa tccttacggt tcatccccgc aggtgcgggg aacacttttg 120 tctgtgatat acacatcaga atccttacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1912 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 3 primer <400> 1912 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacacagtt 60 ttgtctgtga tatacacatc agaatccggt tcatccccgc aggtgcgggg aacacacagt 120 tttgtctgtg atatacacat cagaatccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1913 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 4 primer <400> 1913 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgacaaa 60 actgtgctag acatgaggtc tatggacggt tcatccccgc aggtgcgggg aacacgacaa 120 aactgtgcta gacatgaggt ctatggacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1914 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 5 primer <400> 1914 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgatttg 60 ttgctccagg ccacagcact gttgctcggt tcatccccgc aggtgcgggg aacacgattt 120 gttgctccag gccacagcac tgttgctcgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1915 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 6 primer <400> 1915 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacaacagt 60 gctgtggcct ggagcaacaa atctgacggt tcatccccgc aggtgcgggg aacacaacag 120 tgctgtggcc tggagcaaca aatctgacgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1916 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 7 primer <400> 1916 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacagcaac 60 aaatctgact ttgcatgtgc aaacgccggt tcatccccgc aggtgcgggg aacacagcaa 120 caaatctgac tttgcatgtg caaacgccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1917 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: TRAC 8 primer <400> 1917 cccagctggt tctttccgaa aaaaacggtt catccccgca ggtgcgggga acacgccttc 60 aacaacagca ttattccaga agacaccggt tcatccccgc aggtgcgggg aacacgcctt 120 caacaacagc attattccag aagacaccgg ttcatccccg caggtgcggg gaacacggtg 180 tttcgtcctt tccacaagat 200 <210> 1918 <211> 1685 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: PseCascade polycistronic plasmid <400> 1918 Met Gly Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Thr Arg Phe 1 5 10 15 Val Gln Leu His Leu Leu Thr Ser Tyr Pro Pro Ala Asn Leu Asn Arg 20 25 30 Asp Asp Leu Gly Asn Pro Lys Thr Ala Arg Leu Gly Gly Val Glu Arg 35 40 45 Leu Arg Val Ser Ser Gln Ser Leu Lys Arg Ala Trp Arg Thr Ser Glu 50 55 60 Leu Phe Gln Gln Gln Leu Ala Gly Thr Ile Gly Thr Arg Thr Lys Arg 65 70 75 80 Leu Gly Ile Glu Val Phe Glu Ala Leu Leu Gly Ala Gly Val Thr Glu 85 90 95 Lys Gln Ala Arg Glu Trp Ala Gly Gln Ile Ala Lys Val Tyr Gly Ala 100 105 110 Ala Lys Lys Asp Asn Pro Leu Glu Ile Glu Gln Leu Val His Ile Ala 115 120 125 Pro Glu Glu Arg Ala Ser Leu Asp Gln Leu Val Ala Thr Leu Ala Ala 130 135 140 Glu Lys Arg Gly Pro Thr Asp Glu Glu Leu Asp Ala Leu Leu His His 145 150 155 160 Gln Thr Ala Val Asp Ile Ala Met Phe Gly Arg Met Leu Ala Ser Lys 165 170 175 Thr Gln Phe Asn Gly Glu Ala Ala Val Gln Val Ala His Ala Ile Gly 180 185 190 Val His Ala Ser Ala Ile Glu Asp Asp Tyr Phe Thr Ala Val Asp Asp 195 200 205 Leu Asn Arg Asn Asp Pro Gly Ala Ala His Ile Gly Glu Ser Gly Phe 210 215 220 Ala Ala Ala Val Phe Tyr Gln Tyr Ile Cys Ile Asp Arg Asp Leu Leu 225 230 235 240 Lys Arg Asn Leu Gly Gly Asp Glu Val Leu Thr Gln Lys Ala Leu Arg 245 250 255 Ala Leu Thr Glu Ala Ala Leu Lys Val Gly Pro Ser Gly Lys Gln Asn 260 265 270 Ser Phe Ala Ser Arg Ala Phe Ala His Phe Ala Leu Ala Glu Lys Gly 275 280 285 Thr Asp Gln Pro Arg Ser Leu Ser Leu Ala Phe Val Lys Pro Val Ala 290 295 300 Gly Thr Asp Tyr Ala Gly Asp Ala Val Ala Ala Leu Gln Gln Val Arg 305 310 315 320 Asp Asn Met Asp Lys Val Tyr Gly Val Cys Ala Glu Ser Arg Cys Gln 325 330 335 Phe Asn Val Leu Thr Gly Glu Gly Ser Val Ala Asp Leu Leu Asp Phe 340 345 350 Val Ala Ala Glu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 355 360 365 Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 370 375 380 Gly Ser Gly Met Lys Pro Arg Lys Pro Arg Leu Asn Glu Ala Gln Gln 385 390 395 400 Arg Trp Val Arg Asp Trp Trp Arg Ala Leu Gln Pro Arg Ala Glu Gly 405 410 415 Asp Glu Pro Ile Pro Gly Glu Leu Ser Val Met Gly Arg Gly Glu Arg 420 425 430 Ala Gln Leu Arg Arg Cys Thr Asp Ala Asp Glu Leu Leu Thr Gln Ser 435 440 445 Ala Thr Leu Leu Leu Ala His Arg Leu Val Ala Leu Asn Gly Glu Arg 450 455 460 Gly Pro Leu Pro Asp Asn Ser Leu Ser Tyr Glu Arg Met Ala Trp Val 465 470 475 480 Ala Gly Val Leu Ala Asn Val Lys Asp Asp Leu Arg Asp Gly Lys Ser 485 490 495 Leu Ala Thr His Leu Gly Gln Ala Ala Asp Ala Glu Arg Pro Pro Met 500 505 510 Ser Glu Leu Arg Phe Arg Ala Met Gln Arg Gly Thr Ala Met Gln Glu 515 520 525 Leu Phe Leu His Trp Arg Arg Ala Leu Gln Leu Ala Gly Gly Lys Thr 530 535 540 Asp Val Ala His Leu Ala Asp Asp Leu Leu Ser Trp Gln Ile Glu Gln 545 550 555 560 Gly Gln Ser Ala Ala Gln Ala Ser Asn Gly Val Lys Phe His Trp Ala 565 570 575 Tyr Asp Tyr Tyr Leu Ser Ala Arg Asp Arg Ala Ala Ala Lys Glu Pro 580 585 590 Glu Phe Asn Lys Glu Ile Ser Lys Gly Ser Gly Glu Gly Arg Gly Ser 595 600 605 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys 610 615 620 Lys Arg Lys Val Gly Ser Gly Met Thr Asp Tyr Leu Leu Leu Arg Leu 625 630 635 640 Tyr Gly Pro Leu Ala Ser Trp Gly Glu Ile Ala Val Gly Glu Ser Arg 645 650 655 His Ser Ala Val Gln Pro Ser Arg Ser Ala Leu Leu Gly Leu Leu Gly 660 665 670 Ala Ala Leu Gly Ile Glu Arg His Asp Asp Ala Ala Gln Gln Ala Leu 675 680 685 Val Asp Gly Tyr Arg Phe Ala Ile Lys Leu Glu Cys Ile Gly Ser Pro 690 695 700 Leu Arg Asp Tyr His Thr Val Gln Val Gly Val Pro Pro Arg Lys Phe 705 710 715 720 Gln Phe Arg Ser Arg Arg Gln Glu Leu Ala Ala Asp Lys Val Asp Thr 725 730 735 Ile Leu Ser Thr Arg Glu Tyr Arg Cys Asp Ser Leu Ala Leu Val Ala 740 745 750 Val Glu Ala Leu Pro Gly Ala Pro Val Asp Leu Ala Ser Leu Ala Glu 755 760 765 Ala Leu Arg Lys Pro Arg Phe Ala Leu Tyr Leu Gly Arg Lys Ser Cys 770 775 780 Pro Leu Ala Leu Pro Leu Ser Pro Lys Ile Leu Ala Ala Ser Ser Val 785 790 795 800 Arg Glu Val Phe Asp Asn Leu Glu Leu Pro Ser Leu Leu Gly Leu Leu 805 810 815 Asp Arg Tyr Gln Pro Glu Gln Ala Trp Pro Ser Arg Gln Asp Gln Gln 820 825 830 Ala Leu Arg Pro Gly Val Ala Arg Tyr Tyr Trp Glu Asp Gly Met Thr 835 840 845 Ala Gly Met Ala Pro Ser Phe Glu Ala Gln Arg His Asp Gln Pro Leu 850 855 860 Ser Arg Arg Arg Trp Gln Phe Ala Pro Arg Arg Glu Trp Val Ala Leu 865 870 875 880 Asn Asp Gly Gly Gln Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 885 890 895 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 900 905 910 Lys Val Gly Ser Gly Met Ser His Tyr Phe Ser Leu Val Arg Leu Ile 915 920 925 Gly Ser Pro Arg His Asp Ala Trp Leu Arg Asp Leu Ser Arg His Gly 930 935 940 Glu Ala Tyr Arg Asp His Ala Leu Ile Trp Arg Leu Phe Pro Gly Asp 945 950 955 960 Gly Ala Ala Arg Asp Phe Val Phe Arg Arg Leu Glu Asp Glu Lys Ser 965 970 975 Phe Tyr Val Val Ser Ala Arg Pro Pro Gln Ala Asp Ala Gly Leu Phe 980 985 990 His Ile Gln Ser Lys Ala Tyr Ser Pro Glu Leu Ala Glu Gly Asp Trp 995 1000 1005 Val Arg Phe Asp Leu Arg Ala Asn Pro Thr Val Ser Val Arg Arg 1010 1015 1020 Glu Asn Gly Arg Ser Gln Arg His Asp Val Leu Met His Ala Lys 1025 1030 1035 Gln Leu Ala Ser Thr Glu Lys Ser Ala Leu Pro Glu Arg Leu Glu 1040 1045 1050 Ala Ala Gly Arg Glu Trp Leu Lys Asp Arg Ala Glu Arg Trp Gly 1055 1060 1065 Leu Asp Leu Arg Thr Asp Ser Leu Met Gln Asn Gly Tyr Arg Gln 1070 1075 1080 Gln Arg Leu Lys Arg Lys Gly Lys His Ile Ala Phe Ser Thr Leu 1085 1090 1095 Asp Tyr Gln Gly Ile Ala Gln Val Thr Asp Pro Glu Gln Leu Arg 1100 1105 1110 Arg Ala Leu Leu Asp Gly Val Gly His Ser Lys Gly Phe Gly Cys 1115 1120 1125 Gly Leu Leu Leu Val Lys Arg Val Asp Gly Ser Gly Glu Gly Arg 1130 1135 1140 Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro 1145 1150 1155 Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Met Asp Leu Leu Ser 1160 1165 1170 Asp Thr Trp Leu Gln Cys Arg His Arg Asp Gly Thr Leu Lys Pro 1175 1180 1185 Ile Ala Ile Gly Gln Ile Gly Leu Glu Asp Cys Leu Glu Leu Val 1190 1195 1200 Ala Pro Arg Pro Asp Phe Arg Gly Ala Leu Tyr Gln Phe Leu Ile 1205 1210 1215 Gly Leu Leu Gln Thr Ala Tyr Ala Pro Glu Asp Leu Gln Glu Trp 1220 1225 1230 Arg Asp Arg Tyr Ala Asn Pro Pro Thr Ala Asp Asp Leu Ala Glu 1235 1240 1245 Val Phe Ala Pro Tyr Arg Asp Ala Phe Gln Leu Glu Asn Ser Gly 1250 1255 1260 Pro Thr Phe Met Gln Asp Leu Thr Leu Pro Asp Asp Val Asn Gln 1265 1270 1275 Leu Pro Val Leu Glu Leu Leu Ile Asp Ala Gly Ser Ser Ser Asn 1280 1285 1290 Gln Tyr Phe Asn Lys Pro Ala Val Glu His Gly Met Cys Glu Gly 1295 1300 1305 Cys Phe Thr Gln Ala Leu Leu Thr Met Gln Leu Asn Ala Pro Ser 1310 1315 1320 Gly Gly Arg Gly Ile Arg Thr Ser Leu Arg Gly Gly Gly Pro Leu 1325 1330 1335 Thr Thr Leu Leu Val Pro Ala Glu Gln Asn Ala Thr Leu Trp Gln 1340 1345 1350 Lys Leu Trp Leu Asn Val Leu Pro Leu Asp Ala Leu Asp His Pro 1355 1360 1365 Pro Ile Lys Met Leu Ser Asp Val Leu Pro Trp Leu Ala Pro Thr 1370 1375 1380 Arg Thr Ser Asp Asp Lys Gln Gly Gln Asp Thr Pro Pro Glu Ser 1385 1390 1395 Val His Pro Leu Gln Ala Tyr Trp Ser Met Pro Arg Arg Ile Arg 1400 1405 1410 Leu Asp Ala Ala Thr Leu Asp Gln Gly Asp Cys Ala Val Cys Gly 1415 1420 1425 Ala Gln Asn Val Lys Arg Ile Arg His Tyr Arg Thr Arg His Gly 1430 1435 1440 Gly Thr Asn Tyr Thr Gly Thr Trp Thr His Pro Leu Thr Pro Tyr 1445 1450 1455 Ser Leu Asp Ser Lys Gly Glu Lys Pro Pro Leu Ser Ile Lys Gly 1460 1465 1470 Arg Gln Ala Gly Arg Gly Tyr Arg Asp Trp Leu Gly Leu Val Leu 1475 1480 1485 Gly Asn Glu Asp His Gln Pro Asp Ala Ala Gln Val Val Arg His 1490 1495 1500 Phe Thr Ala Lys Leu Gly Lys Pro Ser Val Arg Leu Trp Cys Phe 1505 1510 1515 Gly Phe Asp Met Ser Asn Met Lys Ala Leu Cys Trp Tyr Asp Ser 1520 1525 1530 Leu Leu Pro Val His Gly Val Ala Pro Asp Val Gln Arg Lys Phe 1535 1540 1545 Thr Arg Ser Val Lys Gln Val Leu Asp Ser Ala Asn Asp Met Ala 1550 1555 1560 Ser Val Leu His Lys Gln Val Lys Ala Ala Trp Phe Arg Arg Pro 1565 1570 1575 Gly Asp Ala Gly Gln Glu Pro Ala Val Thr Gln Ser Phe Trp Gln 1580 1585 1590 Gly Ser Glu Thr Ala Phe Tyr Gln Val Leu Glu Gln Leu Ser Lys 1595 1600 1605 Leu Asp Phe Asp Ser Ala Ala Glu Leu Ala Ala Ile Tyr Arg Ala 1610 1615 1620 Trp Leu Gln Ala Thr Arg Arg Leu Val Leu Ser Leu Phe Asp His 1625 1630 1635 Trp Val Leu Ser Gly Pro Leu Glu Asp Met Asp Met Gln Arg Val 1640 1645 1650 Val Lys Ala Arg Ala Asp Leu Ala Lys Glu Leu Asn Thr Gly Lys 1655 1660 1665 Ala Gln Lys Pro Leu Trp Thr Ile Val Asn Gln His Leu Lys Glu 1670 1675 1680 Gln Ala 1685 <210> 1919 <211> 911 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: D448A Cas3 variant (mCas3) <400> 1919 Met Pro Asn Gln Ala Ser Tyr Phe Ser Tyr Trp Gly Lys Ala Ser Pro 1 5 10 15 Leu Ser Gln Ala Gly Glu Arg Phe His Leu Leu Pro Phe His Cys Leu 20 25 30 Asp Val Ala Ala Cys Gly Gln Ala Leu Ile Ser Leu Pro Ser Phe Ser 35 40 45 Leu Lys Pro Leu Ala Glu Glu Leu Gly Trp Thr Gln Pro Gln Val Glu 50 55 60 Ser Leu Phe Thr Phe Phe Leu Thr Leu His Asp Leu Gly Lys Phe Ala 65 70 75 80 Arg Ala Phe Gln Gly Leu Val Pro Asp Leu Ser Pro Asp Leu Val Pro 85 90 95 Ala Glu Pro Gly Lys Cys Tyr Asp Arg Arg His Asp Thr Leu Gly Trp 100 105 110 Leu Leu Trp Ser Gln Asp Leu Ala Ala Asp Asp Pro Ile Asp Asn Leu 115 120 125 Pro Gln Pro Glu His Glu Phe Trp Ala Val Trp Val Arg Ser Val Val 130 135 140 Gly His His Gly Lys Pro Pro Glu Glu Val Ala Asp Ala Gly Leu Thr 145 150 155 160 Ala Leu Glu Leu Thr Asp Phe Phe Leu Arg Ala Asp Arg Arg Ala Ala 165 170 175 Arg Glu Phe Val Gln Ala Leu Ala Gly Trp Met Leu Pro Ala Asp Leu 180 185 190 Pro Val Pro Asp Arg Glu Gln Leu Lys Ile Leu Arg Arg His Ala Trp 195 200 205 Arg Leu Ala Gly Leu Ala Val Leu Ala Asp Trp Leu Gly Ser Asn Gln 210 215 220 Gly Tyr Phe Pro Tyr Arg Ser Leu Pro Met Ser Leu Pro Glu Tyr Trp 225 230 235 240 Glu Leu Ala Arg Gln Gln Ala Glu His Ala Val Ile Ala Ser Gly Leu 245 250 255 Arg Trp Gln Pro Leu Arg Pro Trp Ser Asn Pro Leu Glu Leu Phe Asp 260 265 270 Tyr Leu Arg Glu Pro Thr Pro Leu Gln Ala Tyr Ala Ala Thr Val Pro 275 280 285 Leu Glu His Gly Pro Gln Leu Phe Leu Leu Glu Asp Val Thr Gly Ala 290 295 300 Gly Lys Thr Glu Ala Ala Leu Ile Leu Ala Gln Arg Leu Met Gln Ala 305 310 315 320 Asn Leu Ala His Gly Leu Tyr Phe Ala Leu Pro Ser Met Ala Thr Ala 325 330 335 Asn Gln Met Tyr Gln Arg Val Gly Gly Val Tyr Arg Arg Leu Tyr Glu 340 345 350 Pro Gln Ala Lys Pro Ser Leu Ile Leu Ser His Gly Ala Arg Gln Leu 355 360 365 Ile Glu Gly Phe Arg Gln Ser Ile Leu Gln Ser Ala Glu Gln Ala Glu 370 375 380 Asp Cys Arg Tyr Gln Pro Asp Glu Gly Ser Ala Ser Val Gln Cys Asn 385 390 395 400 Ala Trp Leu Ala Asp Asn Arg Lys Lys Ala Leu Leu Ala Glu Val Gly 405 410 415 Val Gly Thr Leu Asp Gln Ala Leu Leu Ala Val Leu Pro Ala Arg His 420 425 430 Gln Ser Leu Arg Leu Leu Gly Leu Ala Gly Lys Val Leu Leu Val Ala 435 440 445 Glu Val His Ala Tyr Asp Pro Tyr Met Met Thr Val Leu Lys Thr Leu 450 455 460 Leu Ile Ala His Ala Arg Gln Gly Gly Ser Val Ile Leu Leu Ser Ala 465 470 475 480 Thr Leu Pro Leu Ala Ala Arg Glu Glu Leu Leu Ala Ala Tyr Arg Phe 485 490 495 Gly Leu Gly Val Thr Ala Glu Thr Val Val Asp Asp Arg Arg Tyr Pro 500 505 510 Leu Ala Thr Gln Ala Gly Lys Ser Leu Asn Ser His Ala Cys Glu Thr 515 520 525 Arg Pro Gln Leu Arg Arg Ser Val Ala Val Arg Pro Leu His Asp Glu 530 535 540 Ala Ser Val Val Glu Leu Ile Val Ala Gln Ala Arg Val Gly Arg Cys 545 550 555 560 Val Cys Trp Ile Arg Asn Thr Val Asp Asp Ala Arg Arg Ala Asn Gln 565 570 575 Leu Leu Ala Glu His Leu Pro Glu Glu Gln Arg Ile Leu Phe His Ser 580 585 590 Arg Phe Ala Met Gly His Arg Leu Asp Ile Glu Ala Gln Val Leu Ala 595 600 605 Arg Phe Gly Lys Ala Ser Thr Gly Gln Val Arg Ala Gly Gln Val Leu 610 615 620 Val Gly Thr Gln Val Leu Glu Gln Ser Leu Asp Phe Asp Val Asp Leu 625 630 635 640 Met Val Ser Asp Leu Ala Pro Val Asp Leu Leu Ile Gln Arg Ala Gly 645 650 655 Arg Leu Gln Arg His Ala Arg Gln Ala Ser Gly Asp Leu Ala Val Asp 660 665 670 Ala Val Glu Arg Arg Glu Pro Pro Val Leu Tyr Leu Leu Thr Pro Glu 675 680 685 Pro Val Glu Asn Pro Pro Ala Asp Trp Tyr Ala Ser Leu Phe Pro Lys 690 695 700 Ala Cys Tyr Val Tyr Pro Asp Ala Gly Arg Leu Trp Leu Gly Ala Arg 705 710 715 720 Ala Leu Leu Gln Ala Gly Cys Ile Val Thr Pro Gly Glu Gln Gly Gln 725 730 735 Thr Gly Ala Val Arg Glu Leu Val Glu Ala Val Tyr Gly Ser Glu Val 740 745 750 Asp Asp Val Pro Asn Ala Leu Lys Lys Ala Ser Gln Asp Gln Leu Gly 755 760 765 Lys Asp Met Ala Met Gln Ser Gln Ala His Phe Asn Gly Leu Arg Leu 770 775 780 Asp Lys Gly Tyr Cys Ile Asp Ser Ser Ala Arg Trp Tyr Glu Asp His 785 790 795 800 Ala Val Pro Thr Arg Leu Gly Asp Glu Thr Gln Ala Leu Tyr Leu Ala 805 810 815 Leu Trp Thr Asp Gly Glu Leu Gln Pro Leu Cys Ala Asp Ala Ala Tyr 820 825 830 Pro Trp Glu Glu Ser Ala Val Arg Ile Ala Ala His Arg Ala Arg Glu 835 840 845 Leu Ala Pro Asp Trp Gln Gln Gln Phe Ala Ala Pro Leu Glu Gln Leu 850 855 860 Arg Asn Arg Tyr Arg Leu Leu Glu Glu Pro Ala Phe Ile Leu Pro Leu 865 870 875 880 Val Thr Ser Gly Thr Ala Leu Val Gly Lys Val Leu Asp Glu Lys Gly 885 890 895 Arg Val Leu Asp Met Arg Tyr Asp Arg Gln Gln Gly Leu Ser Trp 900 905 910 <210> 1920 <211> 911 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: D75A Cas3 variant (dCas3) <400> 1920 Met Pro Asn Gln Ala Ser Tyr Phe Ser Tyr Trp Gly Lys Ala Ser Pro 1 5 10 15 Leu Ser Gln Ala Gly Glu Arg Phe His Leu Leu Pro Phe His Cys Leu 20 25 30 Asp Val Ala Ala Cys Gly Gln Ala Leu Ile Ser Leu Pro Ser Phe Ser 35 40 45 Leu Lys Pro Leu Ala Glu Glu Leu Gly Trp Thr Gln Pro Gln Val Glu 50 55 60 Ser Leu Phe Thr Phe Phe Leu Thr Leu His Ala Leu Gly Lys Phe Ala 65 70 75 80 Arg Ala Phe Gln Gly Leu Val Pro Asp Leu Ser Pro Asp Leu Val Pro 85 90 95 Ala Glu Pro Gly Lys Cys Tyr Asp Arg Arg His Asp Thr Leu Gly Trp 100 105 110 Leu Leu Trp Ser Gln Asp Leu Ala Ala Asp Asp Pro Ile Asp Asn Leu 115 120 125 Pro Gln Pro Glu His Glu Phe Trp Ala Val Trp Val Arg Ser Val Val 130 135 140 Gly His His Gly Lys Pro Pro Glu Glu Val Ala Asp Ala Gly Leu Thr 145 150 155 160 Ala Leu Glu Leu Thr Asp Phe Phe Leu Arg Ala Asp Arg Arg Ala Ala 165 170 175 Arg Glu Phe Val Gln Ala Leu Ala Gly Trp Met Leu Pro Ala Asp Leu 180 185 190 Pro Val Pro Asp Arg Glu Gln Leu Lys Ile Leu Arg Arg His Ala Trp 195 200 205 Arg Leu Ala Gly Leu Ala Val Leu Ala Asp Trp Leu Gly Ser Asn Gln 210 215 220 Gly Tyr Phe Pro Tyr Arg Ser Leu Pro Met Ser Leu Pro Glu Tyr Trp 225 230 235 240 Glu Leu Ala Arg Gln Gln Ala Glu His Ala Val Ile Ala Ser Gly Leu 245 250 255 Arg Trp Gln Pro Leu Arg Pro Trp Ser Asn Pro Leu Glu Leu Phe Asp 260 265 270 Tyr Leu Arg Glu Pro Thr Pro Leu Gln Ala Tyr Ala Ala Thr Val Pro 275 280 285 Leu Glu His Gly Pro Gln Leu Phe Leu Leu Glu Asp Val Thr Gly Ala 290 295 300 Gly Lys Thr Glu Ala Ala Leu Ile Leu Ala Gln Arg Leu Met Gln Ala 305 310 315 320 Asn Leu Ala His Gly Leu Tyr Phe Ala Leu Pro Ser Met Ala Thr Ala 325 330 335 Asn Gln Met Tyr Gln Arg Val Gly Gly Val Tyr Arg Arg Leu Tyr Glu 340 345 350 Pro Gln Ala Lys Pro Ser Leu Ile Leu Ser His Gly Ala Arg Gln Leu 355 360 365 Ile Glu Gly Phe Arg Gln Ser Ile Leu Gln Ser Ala Glu Gln Ala Glu 370 375 380 Asp Cys Arg Tyr Gln Pro Asp Glu Gly Ser Ala Ser Val Gln Cys Asn 385 390 395 400 Ala Trp Leu Ala Asp Asn Arg Lys Lys Ala Leu Leu Ala Glu Val Gly 405 410 415 Val Gly Thr Leu Asp Gln Ala Leu Leu Ala Val Leu Pro Ala Arg His 420 425 430 Gln Ser Leu Arg Leu Leu Gly Leu Ala Gly Lys Val Leu Leu Val Asp 435 440 445 Glu Val His Ala Tyr Asp Pro Tyr Met Met Thr Val Leu Lys Thr Leu 450 455 460 Leu Ile Ala His Ala Arg Gln Gly Gly Ser Val Ile Leu Leu Ser Ala 465 470 475 480 Thr Leu Pro Leu Ala Ala Arg Glu Glu Leu Leu Ala Ala Tyr Arg Phe 485 490 495 Gly Leu Gly Val Thr Ala Glu Thr Val Val Asp Asp Arg Arg Tyr Pro 500 505 510 Leu Ala Thr Gln Ala Gly Lys Ser Leu Asn Ser His Ala Cys Glu Thr 515 520 525 Arg Pro Gln Leu Arg Arg Ser Val Ala Val Arg Pro Leu His Asp Glu 530 535 540 Ala Ser Val Val Glu Leu Ile Val Ala Gln Ala Arg Val Gly Arg Cys 545 550 555 560 Val Cys Trp Ile Arg Asn Thr Val Asp Asp Ala Arg Arg Ala Asn Gln 565 570 575 Leu Leu Ala Glu His Leu Pro Glu Glu Gln Arg Ile Leu Phe His Ser 580 585 590 Arg Phe Ala Met Gly His Arg Leu Asp Ile Glu Ala Gln Val Leu Ala 595 600 605 Arg Phe Gly Lys Ala Ser Thr Gly Gln Val Arg Ala Gly Gln Val Leu 610 615 620 Val Gly Thr Gln Val Leu Glu Gln Ser Leu Asp Phe Asp Val Asp Leu 625 630 635 640 Met Val Ser Asp Leu Ala Pro Val Asp Leu Leu Ile Gln Arg Ala Gly 645 650 655 Arg Leu Gln Arg His Ala Arg Gln Ala Ser Gly Asp Leu Ala Val Asp 660 665 670 Ala Val Glu Arg Arg Glu Pro Pro Val Leu Tyr Leu Leu Thr Pro Glu 675 680 685 Pro Val Glu Asn Pro Pro Ala Asp Trp Tyr Ala Ser Leu Phe Pro Lys 690 695 700 Ala Cys Tyr Val Tyr Pro Asp Ala Gly Arg Leu Trp Leu Gly Ala Arg 705 710 715 720 Ala Leu Leu Gln Ala Gly Cys Ile Val Thr Pro Gly Glu Gln Gly Gln 725 730 735 Thr Gly Ala Val Arg Glu Leu Val Glu Ala Val Tyr Gly Ser Glu Val 740 745 750 Asp Asp Val Pro Asn Ala Leu Lys Lys Ala Ser Gln Asp Gln Leu Gly 755 760 765 Lys Asp Met Ala Met Gln Ser Gln Ala His Phe Asn Gly Leu Arg Leu 770 775 780 Asp Lys Gly Tyr Cys Ile Asp Ser Ser Ala Arg Trp Tyr Glu Asp His 785 790 795 800 Ala Val Pro Thr Arg Leu Gly Asp Glu Thr Gln Ala Leu Tyr Leu Ala 805 810 815 Leu Trp Thr Asp Gly Glu Leu Gln Pro Leu Cys Ala Asp Ala Ala Tyr 820 825 830 Pro Trp Glu Glu Ser Ala Val Arg Ile Ala Ala His Arg Ala Arg Glu 835 840 845 Leu Ala Pro Asp Trp Gln Gln Gln Phe Ala Ala Pro Leu Glu Gln Leu 850 855 860 Arg Asn Arg Tyr Arg Leu Leu Glu Glu Pro Ala Phe Ile Leu Pro Leu 865 870 875 880 Val Thr Ser Gly Thr Ala Leu Val Gly Lys Val Leu Asp Glu Lys Gly 885 890 895 Arg Val Leu Asp Met Arg Tyr Asp Arg Gln Gln Gly Leu Ser Trp 900 905 910 <210> 1921 <211> 911 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: D448A D75A Cas3 variant (dblmCas3) <400> 1921 Met Pro Asn Gln Ala Ser Tyr Phe Ser Tyr Trp Gly Lys Ala Ser Pro 1 5 10 15 Leu Ser Gln Ala Gly Glu Arg Phe His Leu Leu Pro Phe His Cys Leu 20 25 30 Asp Val Ala Ala Cys Gly Gln Ala Leu Ile Ser Leu Pro Ser Phe Ser 35 40 45 Leu Lys Pro Leu Ala Glu Glu Leu Gly Trp Thr Gln Pro Gln Val Glu 50 55 60 Ser Leu Phe Thr Phe Phe Leu Thr Leu His Ala Leu Gly Lys Phe Ala 65 70 75 80 Arg Ala Phe Gln Gly Leu Val Pro Asp Leu Ser Pro Asp Leu Val Pro 85 90 95 Ala Glu Pro Gly Lys Cys Tyr Asp Arg Arg His Asp Thr Leu Gly Trp 100 105 110 Leu Leu Trp Ser Gln Asp Leu Ala Ala Asp Asp Pro Ile Asp Asn Leu 115 120 125 Pro Gln Pro Glu His Glu Phe Trp Ala Val Trp Val Arg Ser Val Val 130 135 140 Gly His His Gly Lys Pro Pro Glu Glu Val Ala Asp Ala Gly Leu Thr 145 150 155 160 Ala Leu Glu Leu Thr Asp Phe Phe Leu Arg Ala Asp Arg Arg Ala Ala 165 170 175 Arg Glu Phe Val Gln Ala Leu Ala Gly Trp Met Leu Pro Ala Asp Leu 180 185 190 Pro Val Pro Asp Arg Glu Gln Leu Lys Ile Leu Arg Arg His Ala Trp 195 200 205 Arg Leu Ala Gly Leu Ala Val Leu Ala Asp Trp Leu Gly Ser Asn Gln 210 215 220 Gly Tyr Phe Pro Tyr Arg Ser Leu Pro Met Ser Leu Pro Glu Tyr Trp 225 230 235 240 Glu Leu Ala Arg Gln Gln Ala Glu His Ala Val Ile Ala Ser Gly Leu 245 250 255 Arg Trp Gln Pro Leu Arg Pro Trp Ser Asn Pro Leu Glu Leu Phe Asp 260 265 270 Tyr Leu Arg Glu Pro Thr Pro Leu Gln Ala Tyr Ala Ala Thr Val Pro 275 280 285 Leu Glu His Gly Pro Gln Leu Phe Leu Leu Glu Asp Val Thr Gly Ala 290 295 300 Gly Lys Thr Glu Ala Ala Leu Ile Leu Ala Gln Arg Leu Met Gln Ala 305 310 315 320 Asn Leu Ala His Gly Leu Tyr Phe Ala Leu Pro Ser Met Ala Thr Ala 325 330 335 Asn Gln Met Tyr Gln Arg Val Gly Gly Val Tyr Arg Arg Leu Tyr Glu 340 345 350 Pro Gln Ala Lys Pro Ser Leu Ile Leu Ser His Gly Ala Arg Gln Leu 355 360 365 Ile Glu Gly Phe Arg Gln Ser Ile Leu Gln Ser Ala Glu Gln Ala Glu 370 375 380 Asp Cys Arg Tyr Gln Pro Asp Glu Gly Ser Ala Ser Val Gln Cys Asn 385 390 395 400 Ala Trp Leu Ala Asp Asn Arg Lys Lys Ala Leu Leu Ala Glu Val Gly 405 410 415 Val Gly Thr Leu Asp Gln Ala Leu Leu Ala Val Leu Pro Ala Arg His 420 425 430 Gln Ser Leu Arg Leu Leu Gly Leu Ala Gly Lys Val Leu Leu Val Ala 435 440 445 Glu Val His Ala Tyr Asp Pro Tyr Met Met Thr Val Leu Lys Thr Leu 450 455 460 Leu Ile Ala His Ala Arg Gln Gly Gly Ser Val Ile Leu Leu Ser Ala 465 470 475 480 Thr Leu Pro Leu Ala Ala Arg Glu Glu Leu Leu Ala Ala Tyr Arg Phe 485 490 495 Gly Leu Gly Val Thr Ala Glu Thr Val Val Asp Asp Arg Arg Tyr Pro 500 505 510 Leu Ala Thr Gln Ala Gly Lys Ser Leu Asn Ser His Ala Cys Glu Thr 515 520 525 Arg Pro Gln Leu Arg Arg Ser Val Ala Val Arg Pro Leu His Asp Glu 530 535 540 Ala Ser Val Val Glu Leu Ile Val Ala Gln Ala Arg Val Gly Arg Cys 545 550 555 560 Val Cys Trp Ile Arg Asn Thr Val Asp Asp Ala Arg Arg Ala Asn Gln 565 570 575 Leu Leu Ala Glu His Leu Pro Glu Glu Gln Arg Ile Leu Phe His Ser 580 585 590 Arg Phe Ala Met Gly His Arg Leu Asp Ile Glu Ala Gln Val Leu Ala 595 600 605 Arg Phe Gly Lys Ala Ser Thr Gly Gln Val Arg Ala Gly Gln Val Leu 610 615 620 Val Gly Thr Gln Val Leu Glu Gln Ser Leu Asp Phe Asp Val Asp Leu 625 630 635 640 Met Val Ser Asp Leu Ala Pro Val Asp Leu Leu Ile Gln Arg Ala Gly 645 650 655 Arg Leu Gln Arg His Ala Arg Gln Ala Ser Gly Asp Leu Ala Val Asp 660 665 670 Ala Val Glu Arg Arg Glu Pro Pro Val Leu Tyr Leu Leu Thr Pro Glu 675 680 685 Pro Val Glu Asn Pro Pro Ala Asp Trp Tyr Ala Ser Leu Phe Pro Lys 690 695 700 Ala Cys Tyr Val Tyr Pro Asp Ala Gly Arg Leu Trp Leu Gly Ala Arg 705 710 715 720 Ala Leu Leu Gln Ala Gly Cys Ile Val Thr Pro Gly Glu Gln Gly Gln 725 730 735 Thr Gly Ala Val Arg Glu Leu Val Glu Ala Val Tyr Gly Ser Glu Val 740 745 750 Asp Asp Val Pro Asn Ala Leu Lys Lys Ala Ser Gln Asp Gln Leu Gly 755 760 765 Lys Asp Met Ala Met Gln Ser Gln Ala His Phe Asn Gly Leu Arg Leu 770 775 780 Asp Lys Gly Tyr Cys Ile Asp Ser Ser Ala Arg Trp Tyr Glu Asp His 785 790 795 800 Ala Val Pro Thr Arg Leu Gly Asp Glu Thr Gln Ala Leu Tyr Leu Ala 805 810 815 Leu Trp Thr Asp Gly Glu Leu Gln Pro Leu Cys Ala Asp Ala Ala Tyr 820 825 830 Pro Trp Glu Glu Ser Ala Val Arg Ile Ala Ala His Arg Ala Arg Glu 835 840 845 Leu Ala Pro Asp Trp Gln Gln Gln Phe Ala Ala Pro Leu Glu Gln Leu 850 855 860 Arg Asn Arg Tyr Arg Leu Leu Glu Glu Pro Ala Phe Ile Leu Pro Leu 865 870 875 880 Val Thr Ser Gly Thr Ala Leu Val Gly Lys Val Leu Asp Glu Lys Gly 885 890 895 Arg Val Leu Asp Met Arg Tyr Asp Arg Gln Gln Gly Leu Ser Trp 900 905 910 <210> 1922 <211> 933 <212> PRT <213> Thermomonospora curvata <400> 1922 Met Trp Gly Lys Arg Asp Gly Leu Pro Gly Pro Tyr Pro Val Val Cys 1 5 10 15 His Leu Ile Asp Thr Ala Ala Ile Ala Gly Ala Leu Trp Asp Val Trp 20 25 30 Thr Ala Gly Leu Gly Val Leu Arg Ala Asp Val Leu Gly Glu Arg Val 35 40 45 Ala Ala His Met Arg Ser Leu Val Cys Phe Trp Ala Gly Leu His Asp 50 55 60 Ile Gly Lys Val Ser Pro Ser Phe Gln Val Leu Val Gly Asp Leu Tyr 65 70 75 80 Gln Lys Leu Val Thr Glu Ala Ser Glu Tyr Glu Gln Asp Glu Ala Ile 85 90 95 Ser Gly Leu Arg His Asn Glu Val Thr Gln Trp Val Leu Val Glu Ile 100 105 110 Phe Arg Ala Leu Gly Tyr Pro Ala Ala Asp Ser Ala Arg Arg Asp Val 115 120 125 Gly His Gln Ile Ala Gln Leu Leu Gly Gly His His Gly Arg Phe Cys 130 135 140 Ala Ala Met Arg Arg Pro Glu Leu Arg Ala Pro Arg Ser Arg Pro Gly 145 150 155 160 Val Gly Arg Gly Val Trp Glu Glu Gln Cys Arg Ala His Ala Ala Val 165 170 175 Leu Arg Glu Leu Thr Gly Ala Arg Glu Val Leu Arg Glu Arg Leu Pro 180 185 190 Val Pro Val Ala Val Val Val Leu Gly Ile Val Ile Val Ala Asp Trp 195 200 205 Leu Ala Ser Gln Glu Ser Phe Ile Val Ala Arg Met Pro Gly Glu Gly 210 215 220 Trp Glu Ala Ser Pro Glu Glu Leu Arg Ala His Trp Glu Arg Ala Val 225 230 235 240 Ala Asp Ala Pro Gln Val Val Arg Asp Ala Gly Leu Gly Arg Gly Leu 245 250 255 Leu Glu Asp Arg Thr Phe Arg Glu Leu Phe Gly Phe Asp Glu Pro Asn 260 265 270 Pro Leu Gln Ala Ser Val Met Lys Glu Leu Pro Glu Leu Val Asn Gly 275 280 285 Pro Gly Leu Val Leu Cys Thr Ala Pro Pro Gly Asp Gly Lys Thr Glu 290 295 300 Ala Ala Leu Tyr Ala Ala Gly Val Leu Ala Arg Ala Cys Gly Ala Asn 305 310 315 320 Gly Leu Gly Phe Cys Leu Pro Thr Met Ala Thr Thr Asp Ala Met His 325 330 335 Lys Arg Val Ser Arg Phe Ala Arg Arg Ala Leu Arg Glu Asp Ala Ala 340 345 350 Leu Thr Lys Val His Ser Met Ala Trp Leu Ser Ser Asp Ala Ala Gly 355 360 365 Asp Ala Ala Ala Gly Ala Ala Gly Gly Asp Ala Val Ile Thr Asp Ala 370 375 380 Glu Ala Ser Thr Glu Ala Ala Gln Trp Leu His Ala Gly Arg Arg Gly 385 390 395 400 Leu Leu Ala Pro Leu Thr Thr Phe Thr Ile Asp Gln Gly Leu Thr Gly 405 410 415 Val Leu Pro Val Lys Tyr Asn Val Leu Arg Leu Met Ala Met Ala Gly 420 425 430 Lys Val Val Val Ile Asp Glu Ala His Ser Tyr Asp Ala Trp Met His 435 440 445 Ala Leu Leu Leu Arg Trp Leu Glu Trp Leu Gly Ala Leu Arg Ala Pro 450 455 460 Val Ile Leu Leu Ser Ala Thr Leu Thr Gly Ala Ala Ala Arg Ser Leu 465 470 475 480 Val Glu Ala Tyr Leu Arg Gly Ala Gly His Thr Val Pro Gln Glu Leu 485 490 495 Arg Pro Cys Tyr Pro Gly Trp Leu Phe Ala Asp Ala Val Thr Gly Thr 500 505 510 Val His Pro Pro Arg Glu Val Thr Ser Glu Arg Glu Arg Ala Val Ala 515 520 525 Phe Glu Met Val Pro Val Arg Arg Gly Lys Asp Pro Ser Arg Pro Gly 530 535 540 His Arg Leu Ala Val Ile Lys Asp Leu Leu Ala Gln Val Val Asn Gly 545 550 555 560 Asp Arg Gly Cys Val Leu Val Cys Cys Thr Thr Val Pro Glu Ala Gln 565 570 575 Asp Thr Tyr Arg Tyr Leu Ala Asp Trp Phe Arg Arg Val Ala Glu Glu 580 585 590 Gly Gly Arg Pro Pro Glu Leu Arg Leu Leu His Ser Arg Tyr Arg Ala 595 600 605 Arg Asp Arg Ala Ala Ile Thr Glu Ala Cys Glu Arg Asp Phe Gly Lys 610 615 620 Glu Gly Gly Arg Pro Arg Thr Val Leu Val Ala Thr Gln Ile Val Glu 625 630 635 640 Gln Ser Leu Asp Leu Asp Phe Asp Leu Leu Ile Thr Asp Leu Ala Pro 645 650 655 Met Ala Leu Leu Leu Gln Arg Ser Gly Arg Cys Gln Arg His Arg Asp 660 665 670 Gly Arg Ile Asp Leu His Arg Glu Arg Arg Pro Asp Trp Ala Gly Ala 675 680 685 Ala Pro Arg Val Ile Val Leu Asn Pro Val Asp Asp Gln Gly Glu Phe 690 695 700 Ala Val Pro Glu Glu Trp Gly Gly Val Tyr Asp Glu Ser Leu Leu His 705 710 715 720 Arg Thr Ser Arg Leu Leu His Ala Arg Gly Ala Glu Pro Val Gln Ile 725 730 735 Pro Gly Asp Val Gln Ala Leu Val Asp Ala Val Tyr Ala Glu Asp Phe 740 745 750 Thr Ser Val Val Ala Leu Asp Glu Ala Asn Ala Arg Arg Ile Val Arg 755 760 765 Ala Asp Gly Glu Arg Leu Gly Gly Glu Ala Ala Gln Arg Gln Thr Ala 770 775 780 Asp Leu Val Met Ile Cys Ser Pro Arg Asp Gly Lys Leu Arg Asp Leu 785 790 795 800 Arg Asn Leu Ser Glu Ala Gln Ala Lys Val Ser Ser Ala Trp Leu Thr 805 810 815 Thr Arg Leu Gly Ala Asp Ser Glu Arg Leu Val Cys Val Tyr Glu Gln 820 825 830 Ser Pro Gly Val Trp Thr Leu Asp Glu Thr Gly Arg Ile Pro Val Pro 835 840 845 Gly Met Glu Gly Arg Ser Arg Val Thr Arg Asp Gln Ala Arg Leu Ile 850 855 860 Ala Glu Tyr Met Ile Pro Val Pro Gly Arg Tyr Cys Gly Glu Glu Ala 865 870 875 880 Glu Leu Leu Glu Pro Pro Pro Ser Trp Asp Lys Asn Ala Val Leu Arg 885 890 895 Asp Trp Lys Leu Leu Pro Met Arg Arg Ala Ser Asp Gly Gly Trp Tyr 900 905 910 Gly Arg Leu Arg Pro Gly Gln Val Thr Tyr Gln Ala Asn Val Gly Leu 915 920 925 Gln Met Leu Tyr Pro 930 <210> 1923 <211> 953 <212> PRT <213> Streptomyces bottropensis <400> 1923 Met Gly Val Arg Glu Asp Ala Arg Arg Asp Gly Ile Asn Leu Ser Pro 1 5 10 15 Trp Gly Lys Phe Asp Arg Gly Glu Arg Ala Val Tyr Ala Leu Leu Phe 20 25 30 His Leu Leu Asp Val Ala Ala Leu Ala Gly Ala Val Trp Asp Gly Tyr 35 40 45 Leu Thr Arg Gly Gln Arg Arg Leu Ile Ala Ala Gly Leu Gly Leu Thr 50 55 60 Leu Ala Gln Ala Arg Cys Gln Val Met Phe Ile Ala Gly Leu His Asp 65 70 75 80 Leu Gly Lys Leu Ser Ala Phe Gln Glu Gln Glu Ala His Pro Trp Ala 85 90 95 Arg Val Ser Asp Thr Leu Arg Ser Asp Thr Gly Asn Trp Arg Arg Met 100 105 110 Pro His Glu Arg Ala Ser Met His Ser Val Leu His Leu Leu Ala Glu 115 120 125 Ala Gly Tyr Pro Ala Asp Thr Ser Asp Ser Pro Gly Val Leu Ile Ala 130 135 140 Gln Ile Leu Gly Gly His His Gly Arg Phe Leu Gln Val Asp Ile Asp 145 150 155 160 Gly Ala Ala Lys Ala Ser Arg Val Asn Leu Ala Leu Gly Gly Ser Ala 165 170 175 Trp Gln Asp Val Arg Arg Arg Tyr Phe Ala Leu Leu Arg His Leu Thr 180 185 190 Gly Ala Thr Ala Val Pro Ser Asp Val Ser Val Pro Ala Ala Val Leu 195 200 205 Ile Thr Gly Val Gly Val Ile Ala Asp Arg Leu Ala Ser Gln Arg His 210 215 220 Tyr Trp Leu Pro Lys Ala Gln Ala Pro Ala Phe Gly Ala Gly Glu His 225 230 235 240 Phe Ser Leu Ala Val Arg Asp Ala Pro Gly Val Val Glu Glu Ser Gly 245 250 255 Leu Val Arg Ile Thr Leu Pro Gln Val Pro Phe Thr Gln Ala His Gly 260 265 270 Gly Leu Glu Arg Pro Asn Ala Leu Gln Ala Ser Met Ile Gly Gln Leu 275 280 285 Pro Ala Val Val Gly Glu Lys Gly Pro Gly Ile Leu Val Val Thr Asp 290 295 300 Ala Thr Gly Gly Gly Lys Ser Val Thr Ala Leu Glu Ala Ala Arg Ile 305 310 315 320 Phe Asn Ala Ser Gly Asp Thr Ser Gly Ile Leu Trp Leu Leu Pro Thr 325 330 335 Met Ala Thr Thr Asp Ala Ala Tyr Asp Leu Leu Glu Ala Tyr Val Ala 340 345 350 Ala His His Pro Glu His Ala Pro Val Ser Leu Val His Ser His Ser 355 360 365 Tyr Asn Asn Thr Ala Tyr Thr Asp His Arg Leu Ala Ala Arg Glu Pro 370 375 380 Ser Thr Ser Asp Ala Tyr Trp Pro Asp Ser Asp Asp Gly Tyr Gly Asp 385 390 395 400 Glu Gly Arg Pro Thr Ala Gly Glu Arg Pro Glu Glu Arg Val Thr Val 405 410 415 Pro Asp Gly Trp Leu Arg Gly Trp Asp Arg Ala Leu Leu Ala Gln Phe 420 425 430 Thr Val Ala Thr His Asp Gln Ala Leu Met Ala Ala Leu Pro Val Arg 435 440 445 Phe Ser Ala Leu Arg Met Leu Ala Leu Cys Gly Arg Thr Val Ile Val 450 455 460 Asp Glu Val His Ala Leu Pro Pro Phe Met Arg Gln Thr Leu Ser Arg 465 470 475 480 Leu Leu His Trp Leu Gly Ala Leu Gly Cys Pro Val Val Leu Leu Ser 485 490 495 Ala Thr Leu Pro Gly His Ile Ser Ser Gln Leu Val Arg Ser Tyr Leu 500 505 510 Asp Gly Ala Gly His Pro His Pro Ala Thr Ala His Leu Asp Cys Arg 515 520 525 Pro Pro Tyr Pro Gly Trp Leu Tyr Ala Ala Ala Ser Asp Ala Ser Leu 530 535 540 Thr Arg Ile Asp Pro Ala Ala Ala Asp Ala His Ala Asp Arg His Arg 545 550 555 560 Arg Arg Ala Asp Leu Arg Leu His Pro Val Arg His Pro Ser Cys Thr 565 570 575 Asp Pro Glu Asp Ala Pro Ala Arg Glu Ser Arg Leu Gly Arg Ile Thr 580 585 590 Gln Glu Ile Ala Pro Val Ala Arg Ser Gly Gly Cys Ala Ala Val Tyr 595 600 605 Cys Ala Thr Met Ala Asp Ala Gln Thr Thr Tyr Ala His Leu Thr Thr 610 615 620 Ala Leu Asn Trp Pro Asp Gly Gly Pro Asp Gly Gln Leu Leu Leu Leu 625 630 635 640 His Ala Arg Leu Pro Gly Phe Gln Arg Glu Ala Leu Thr Arg Arg Val 645 650 655 Arg Thr Ala Leu Ser Ala Thr Gly Glu Arg Pro Arg Arg Leu Val Val 660 665 670 Ile Thr Thr Ser Leu Leu Asp Met Ser Leu Asp Val Asp Val Asp Val 675 680 685 Met Val Ser Asp Leu Ala Pro Leu Gln Thr Leu Leu Gln Arg Leu Gly 690 695 700 Arg Leu Trp Arg Phe Asp His Ile Lys Arg Pro Asp Trp Leu Cys Gly 705 710 715 720 Asp Val Pro Arg Leu Ile Val Leu Glu Pro Thr Asp His Arg Gly Arg 725 730 735 Thr Leu Leu Pro Pro Ala Trp Arg Pro Leu Asp Ser Pro Phe Leu Pro 740 745 750 Leu Ala Thr Ala Ala Tyr Leu Ala Arg Arg Pro Glu Gln Pro Leu Thr 755 760 765 Leu Pro Asp Asp Val Gln Gln Leu Val Glu Ala Val His Gly Asp Ala 770 775 780 Asp Ala Leu Ala Arg Thr Asp Ala Ala Leu Arg Arg Ser His Thr Leu 785 790 795 800 His Gln Ala Arg Thr Arg Thr Glu Glu His His Ser Ala Leu His Leu 805 810 815 Val Pro Ala Trp His Asp Thr Leu Ser Leu Ser Asp Leu His Arg Gln 820 825 830 Asn Leu His Pro Arg Glu Ala Ala Thr Arg Leu Gly Ala Met Pro Arg 835 840 845 Arg Leu Leu Pro Val Tyr Arg Met Ser Gly Gly Arg Leu Thr Leu Asp 850 855 860 Ala Ala Gly Thr Arg Pro Leu Pro Glu His Arg Lys Pro Thr Thr Ala 865 870 875 880 Gln Ile Arg Thr Ile Leu Gln His Thr Leu Pro Val Pro Ala Ala Trp 885 890 895 Val Ala Gly Arg Thr Arg Asp His His Ile Pro Ala Ser Trp Arg Ser 900 905 910 His Ala Leu Leu Ala Asp Leu Val Leu Leu Pro Gln Asp Ala Gly Asp 915 920 925 Pro Ser Arg Pro Val Arg Phe Gly Arg His Arg Leu His Leu Asp Asp 930 935 940 Ala Leu Gly Leu Val His Thr Glu Asp 945 950 <210> 1924 <211> 920 <212> PRT <213> Thermus thermophilus <400> 1924 Met Ser Val Glu Glu Ala Ala Leu Ala Leu Trp Ala Lys Ser Gly Asn 1 5 10 15 Pro Phe His Pro Leu Leu Ala His Met Leu Asp Thr Ala Ala Val Ala 20 25 30 Leu Ala Val Leu Arg Met Glu Pro Pro Arg Thr Arg Ala Leu Tyr Ala 35 40 45 Glu Asp Trp Gly Leu Pro Glu Glu Gly Ala Leu Ala Trp Ala Ala Ala 50 55 60 Leu Val Gly Leu His Asp Leu Gly Lys Ala Ser Pro Val Phe Gln Ala 65 70 75 80 Gly Trp Glu Glu Gly Lys Glu Arg Val Gln Arg Ala Gly Leu Pro Phe 85 90 95 Gly Glu Leu Leu Asp Trp Val Ala His Gly Val Phe Thr Glu Leu Phe 100 105 110 Leu Arg Arg Leu Leu Lys Glu Lys Gly Leu Pro Glu Arg Ala Ala Asn 115 120 125 Asp Leu Ala Ala Ala Leu Gly Ala His His Gly Phe Pro Ala Asn Ala 130 135 140 Glu Glu Lys Ser Arg Ala Arg Arg His Leu Arg Thr Glu Asp Pro Leu 145 150 155 160 Trp Lys Glu Ala Arg Arg Trp Leu Leu Glu Glu Val Phe Arg Arg Leu 165 170 175 Gly Ala Pro Leu Pro Pro Ser Gln Gly Asn Gly Glu Ala Arg Pro Glu 180 185 190 Ala Val Leu Arg Val Met Ala Leu Ala Ser Phe Ala Asp Trp Val Ala 195 200 205 Ser Asp Pro Ser Leu Phe Pro Tyr Gly Arg Asp Pro Arg Arg Gly Asp 210 215 220 Tyr Leu Lys Glu Ala Leu Arg Leu Ala Gln Glu Ala Leu Asn Arg Leu 225 230 235 240 Gly Trp Pro Ala Phe Ala Lys Ala Gln Arg Arg Glu Phe Gly Glu Leu 245 250 255 Phe Pro Tyr Ile Pro Lys Pro Asn Ala Leu Gln Glu Ser Val Pro Ala 260 265 270 Leu Leu Glu Gly Ala Cys Thr Pro Val Leu Leu Leu Val Glu Ala Pro 275 280 285 Met Gly Met Gly Lys Thr Glu Ala Ala Leu Tyr Ala His His Leu Leu 290 295 300 Gln Ala Gly Leu Gly His Arg Gly Leu Tyr Val Ala Leu Pro Thr Gln 305 310 315 320 Ala Thr Ala Asn Gly Leu Phe Pro Arg Val Arg Gly Phe Leu Glu Arg 325 330 335 Leu Gly Glu Gly Ser Arg Leu Glu Leu Gln Leu Gln His Gly Thr Ala 340 345 350 Leu Leu Asn Pro His Tyr Ala Gly Leu Leu Glu Arg Ala Ala Pro Arg 355 360 365 Gln Val Gly Glu Glu Glu Glu Gly Gly Ala Val Ala Ser Ala Trp Phe 370 375 380 Ser Ala Arg Lys Arg Ala Met Leu Ala Pro Tyr Gly Val Gly Thr Leu 385 390 395 400 Asp Gln Ala Leu Leu Gly Val Leu Arg Val Lys His His Phe Val Arg 405 410 415 Leu Trp Gly Leu Met Asn Arg Val Val Val Leu Asp Glu Val His Ala 420 425 430 Tyr Asp Val Tyr Thr Ser Gly Leu Leu Gln Ala Leu Leu Arg Trp Leu 435 440 445 Arg Ala Leu Gly Ser Ser Ala Val Val Met Thr Ala Thr Leu Pro Pro 450 455 460 Ser Arg Arg Arg Ala Leu Leu Glu Ala Trp Ala Gly Glu Glu Val Glu 465 470 475 480 Gly Gln Asp Leu Gly Pro Tyr Pro Arg Val Val Leu Val Gly Glu Gly 485 490 495 Val Lys Ala Arg Ser Leu Pro Pro Ala Arg Glu Val Glu Val Ala Leu 500 505 510 Glu Val Leu Arg Glu Val Asp Val Glu Pro Leu Ala Gln Arg Leu Lys 515 520 525 Gly Ala Leu Pro Gly Ala Val Gly Ala Ile Val Asn Thr Val Asp Arg 530 535 540 Ala Gln Asp Leu Tyr Arg Ala Leu Gly Glu Gly Thr Pro Leu Thr Leu 545 550 555 560 Glu Glu Leu Ala Arg Arg Leu Gly Gly Ile Ser Gly Gly Gln Ala Trp 565 570 575 Glu Glu Val Arg Gln Ala Leu Pro Glu Arg Gly Gly Glu Val Val Gly 580 585 590 Lys Val Leu Thr Asp Gly Thr Leu Val Phe Leu Leu His Ala Arg Phe 595 600 605 Pro Ala Glu Glu Arg Ala Leu Arg Gly Ser Val Val Leu Ala Leu Phe 610 615 620 Gly Lys Gly Gly Pro Arg Pro Pro Arg Ala Ile Leu Val Ala Thr Gln 625 630 635 640 Val Ala Glu Gln Ser Leu Asp Leu Asp Phe Asp Leu Leu Tyr Thr Asp 645 650 655 Leu Ala Pro Ile Asp Leu Leu Phe Gln Arg Ser Gly Arg Leu His Arg 660 665 670 His Glu Arg Pro Arg Pro Glu Glu His Ala Arg Pro Arg Leu Leu Leu 675 680 685 Gly Val Pro Glu Asp Leu Asp Phe Gly Lys Pro Leu Tyr Trp Asp Lys 690 695 700 Val Tyr Glu Asp Tyr Val Leu Leu Ala Thr Trp Arg Ala Leu Ser Gly 705 710 715 720 Arg Asp Arg Leu Arg Val Pro Gly Asp Leu Glu Ala Leu Leu Glu Glu 725 730 735 Ile Tyr Glu Gly Glu Asn Pro Glu Ser Phe Pro Glu Gly Leu Arg Glu 740 745 750 Arg Ala Lys Lys Ser Leu Lys Ala Leu Gln Glu Arg Arg Asp Arg Glu 755 760 765 Ala Asn Thr Ala Arg Arg Leu Ser Leu Ser Glu Leu Asp Arg Leu Leu 770 775 780 Ala Tyr Trp Asp Glu Gly Ala Leu Val Ala Gln Glu Arg Leu Glu Asp 785 790 795 800 Asp Glu Glu Lys Ala Glu Thr Gln Arg Leu Leu Thr Arg Leu Gly Asp 805 810 815 Pro Ser Val Ala Val Val Pro Leu Phe Arg Val Gly Glu Gly Leu Phe 820 825 830 Leu Asp Arg Glu Gly Arg Arg Arg Ala Pro Leu Lys Gly Glu Val Ser 835 840 845 Arg Glu Glu Ala Glu Ala Leu Phe Arg Arg Ala Val Arg Leu Ser Arg 850 855 860 Phe Pro Leu Pro Gln Glu Leu Leu Lys Glu Glu Pro Pro Pro Ala Trp 865 870 875 880 Arg Lys Ser Gly Leu Leu Arg Gly Leu Arg Pro Leu Glu Val Gly Arg 885 890 895 Val Phe Arg Ser Gly Glu Arg Ala Phe Gln Val Glu Leu Asp Pro Glu 900 905 910 Leu Gly Val Val Tyr Leu Pro Val 915 920 <210> 1925 <211> 981 <212> PRT <213> Streptomyces avermitilis <400> 1925 Met Gly Ser Val Leu Val Ser Val Gln Val Arg Met Arg Cys Gln Trp 1 5 10 15 Gly Leu Leu Cys Met Ala Val Met Met Lys Arg Glu Ser Val Ser Pro 20 25 30 Gly His Val Pro Val Asp Thr Arg Phe Trp Gly Lys Glu His Gly Leu 35 40 45 Pro Arg Pro Tyr Pro Val Leu Cys His Leu Leu Asp Thr Ala Gly Val 50 55 60 Phe Gly Ala Leu Trp Asp Val Leu Leu Ser Asp Gln Met Arg Glu Lys 65 70 75 80 Val Ala Arg Ala Leu Gly Leu Thr Val Ala Glu Ala Arg Arg Val Leu 85 90 95 Ala Phe Trp Ala Gly Leu His Asp Leu Gly Lys Ile Thr Pro Pro Phe 100 105 110 Gln Ala Gln Val Pro Glu Ala Phe Ala Ala Val Arg Asn Asp Pro Ala 115 120 125 Tyr Val Phe Ala Pro Gly Ala Glu Arg Glu Arg Ala Phe Arg His Glu 130 135 140 Met Ala Thr His Trp Ala Leu Val Gln Leu Leu Gly Glu Ala Gly Tyr 145 150 155 160 Pro Gly Gly Gly Arg Val Met Arg Ser Ala Val Ser His Gln Val Ala 165 170 175 Gln Leu Leu Gly Gly His His Gly Cys Phe Gly Val Val Leu Lys Ala 180 185 190 Lys Glu Val Ala His Ala Ser Ala Tyr Gln Pro Gly Leu Gly Gly Asp 195 200 205 Gly Trp Ala Val Gln Arg Arg Ala His Phe Gly Glu Leu Arg Arg Val 210 215 220 Thr Gly Gly Trp Ala Val Pro Glu Arg Gly Leu Pro Ala Glu Leu Ala 225 230 235 240 Val Ile Val Ala Gly Leu Val Val Val Ala Asp Trp Leu Ala Ser Gln 245 250 255 Glu Glu Ala Ile Ile Pro Leu Leu Pro Pro Lys Gly Trp Arg Ala Thr 260 265 270 Pro Glu Glu Val Asp Met His Trp Glu Arg Thr Gln Lys Ala Ala Pro 275 280 285 Gly Leu Val Ala Gly Ala Gln Leu Gly Arg Ala Arg Phe Asp Ala Glu 290 295 300 Gly Phe Glu Glu Met Phe Ser Phe Ala Pro Asn Ala Leu Gln Ala Asp 305 310 315 320 Leu Val Ala Arg Leu Pro Arg Met Val Glu Glu Lys Gly Pro Gly Leu 325 330 335 Leu Leu Val Thr Ala Pro Thr Gly Asp Gly Lys Thr Glu Ala Ala Leu 340 345 350 Tyr Ala Ala Ser Val Leu Gly His Ala Ala Gly Ala Arg Gly Leu Phe 355 360 365 Phe Ala Leu Pro Thr Met Ala Thr Ala Asp Ala Met Tyr Pro Arg Val 370 375 380 Ser Ala Phe Thr Glu Arg Ala Leu Ser Gly Glu Arg Ala Leu Thr Leu 385 390 395 400 Leu His Ser Met Ala Trp Leu Ser Pro Ala Tyr Ala Gly Ala Gly Gln 405 410 415 Ser Ala Gly Pro Pro Pro Ala Ala Gly Asp Val Ser Ala Asp Pro Ala 420 425 430 Thr Val Thr Glu Ala Gly Val Trp Leu Arg Gly His Arg Arg Gly Leu 435 440 445 Leu Ala Pro Leu Gly Ala Gly Thr Ile Asp Gln Ala Leu Ser Ala Val 450 455 460 Leu Pro Leu Thr His Asn Ala Leu Arg Leu Phe Gly Leu Ser Asp Lys 465 470 475 480 Val Leu Val Val Asp Glu Ala His Ala Tyr Gly Pro Trp Met His Gln 485 490 495 Leu Leu Ser Arg Leu Leu Glu Trp Leu Gly Ala Phe Gly Ala Pro Val 500 505 510 Val Leu Leu Ser Ala Thr Leu Ser Gly Arg Thr Ala Ser Ser Leu Val 515 520 525 Asp Ala Tyr Arg Arg Gly Ala Gly Phe Leu Glu Pro Ser Ala Val Glu 530 535 540 Pro Cys Tyr Pro Gly Trp Met Phe Thr Gly Ala Ala Thr Gly Glu Val 545 550 555 560 Cys Val Pro Arg Glu Thr Asp Ser Glu Arg Arg Arg Thr Leu Asp Val 565 570 575 Arg Met Leu Pro Val Val Trp Asp Thr Ala Pro Ala Ala Gly Ser Pro 580 585 590 Val Cys Ala Gly Gly Arg Arg Gln Ala Leu Arg Glu Ala Leu Glu Pro 595 600 605 Val Val Ala Gln Ser Gly Thr Ala Leu Val Cys Cys Thr Thr Val Ala 610 615 620 Glu Ala Gln Gln Thr Phe Arg Asp Leu Arg Ala Ala Phe Pro Glu Leu 625 630 635 640 Ser Thr Gly Glu Gly Gly Leu Arg Leu Leu His Ser Arg Tyr Pro Ala 645 650 655 Asn Thr Arg Gln His Ile Thr Ser Ala Cys Glu Arg Ala Tyr Gly Lys 660 665 670 Pro Arg Ser Pro Gln Asp Val Ala Leu Pro Arg Pro Ala Ser Val Leu 675 680 685 Val Ala Thr Gln Val Val Glu Gln Ser Leu Asp Leu Asp Phe Asp Leu 690 695 700 Ile Val Thr Asp Leu Ala Pro Leu Ala Gln Leu Leu Gln Arg Ala Gly 705 710 715 720 Arg Gly Arg Arg His Ala Arg Gly Ala Ser Gly Arg Pro Pro Trp Ala 725 730 735 Leu Pro Glu Asp Ala Pro Arg Leu Val Val Leu Glu Pro Val Gly Glu 740 745 750 Ser Gly Ala Thr Gln Val Pro Arg Thr Trp Gly Ser Val Tyr Asp Ala 755 760 765 Gly Leu Leu Gln Arg Thr Ala His Leu Leu Arg Glu Arg Ala Ala Ser 770 775 780 Gly Ile Ala Val Pro Gly Asp Val Gln Glu Leu Ile Asp Ala Val Tyr 785 790 795 800 Ala Glu Asp Phe Val Asp Arg Leu Glu Gly Ala Val Gln Arg Glu Leu 805 810 815 Ala Arg Met Asp Ser Ala Arg Gln Ala Asp Glu Ala Ala Glu Ala His 820 825 830 Leu Ala Asp Met Val Ala Ile Cys Ala Pro Ala Asp Val Ala Gly Asp 835 840 845 Leu Gln Arg Leu Ser Arg Arg Glu Ala Gly Val Thr Glu Glu Leu Leu 850 855 860 Thr Thr Arg Leu Gly Ala Asp Ser Gly Arg Val Leu Cys Leu Tyr Glu 865 870 875 880 Gln Gln Asp Asn Thr Leu Thr Leu Asp Glu Gly Gly Thr Leu Pro Leu 885 890 895 Pro Thr Gly Asn Gln Asn Gly Leu Leu His Ala Glu Leu Arg Gln Val 900 905 910 Met Ala His Met Ala Pro Val Pro Gly Ala Trp Leu Arg Gly Ala Glu 915 920 925 Gly His Pro Ala Pro Pro Gly Trp Gly Lys His Pro Val Leu Arg Asp 930 935 940 Leu Val Leu Leu Arg Met Gln Pro Ala Gly Gln Asp Gly Ala Ala Ala 945 950 955 960 Val Trp Ser Cys Arg His Gly Thr Arg Thr Ile Arg Ile Ser Gly Val 965 970 975 Gly Leu Glu Thr Ser 980 <210> 1926 <211> 11587 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: single-chain FokI fusion to EcoCascade <400> 1926 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gcttggtacc 900 gagctcggat cgccaccatg cctaagaaga aaagaaaggt tggatcgggc atgtcaaatt 960 ttattaatat tcatgttctg atcagtcata gcccgagttg cctgaataga gacgacatga 1020 atatgcagaa agacgcaatt ttcggtggca agaggcgagt ccgaataagc agccaaagtc 1080 ttaagcgagc catgaggaag agcggctatt atgcccagaa tatcggcgag tcctcattgc 1140 ggaccatcca cctcgcccag ttgagagacg tcttgaggca gaaactgggg gaaagattcg 1200 accagaaaat cattgacaag acccttgccc tccttagtgg gaagagcgtg gacgaggctg 1260 aaaaaatctc tgccgacgcc gtaacgccct gggttgtggg tgagattgct tggttttgtg 1320 aacaggtggc gaaggcggag gccgataacc tggatgacaa gaagctgctg aaggtcctta 1380 aggaggacat agctgccatt cgggtcaatt tgcagcaggg agtggatatc gcattgtccg 1440 gaagaatggc tacatcaggc atgatgaccg agctgggcaa ggtagacgga gccatgagta 1500 tcgcacacgc catcaccacc caccaagtcg actcagacat cgactggttc acagcagtag 1560 atgacctcca ggagcagggg tctgcccacc ttgggacaca ggagttctct tccggggtgt 1620 tttatcgcta tgctaatatc aatctggcgc agctgcaaga aaacctgggg ggagcctctc 1680 gagagcaggc cctggagatt gcaactcacg tcgtgcatat gcttgcgaca gaggtacctg 1740 gcgccaagca gaggacatac gctgctttta atccagcaga tatggtcatg gtaaatttct 1800 ctgatatgcc tctctccatg gccaacgcat tcgagaaggc agtgaaggca aaggacgggt 1860 tcctgcagcc atcaattcaa gcgtttaatc agtattggga cagagtggcg aacggctatg 1920 gactgaacgg agccgcagct cagtttagcc tcagcgatgt cgatcccata actgcacagg 1980 tgaaacagat gcctacgttg gaacagctga agtcatgggt aagaaataac ggcgaagccg 2040 gcagcggcga gggcagaggc agcctgctga cctgcggcga cgtggaggag aatcctggac 2100 ctccaaaaaa gaaaagaaag gtcggatcgg gcatggccga cgagattgac gcaatggcac 2160 tttaccgggc ctggcagcag ttggataatg gttcatgtgc ccagattcgc agagttagtg 2220 aacctgacga actgagagat atccccgcgt tttacagact tgtccaaccg ttcggatggg 2280 agaacccacg gcaccaacaa gcactccttc gaatggtctt ctgtttgtcc gcaggaaaaa 2340 atgtaatcag acaccaagac aaaaagagcg agcaaaccac aggtatcagc ctgggcaggg 2400 cacttgccaa ctctgggcgg atcaacgaaa ggagaatttt tcagctgata cgcgctgatc 2460 ggactgcgga catggtgcag ctgcgcagac tccttactca tgccgaacct gtcctggatt 2520 ggcccctgat ggcacgcatg ctgacttggt ggggaaagag agaaagacag caactgcttg 2580 aagacttcgt gctcactaca aataagaatg ccggatccgg agaaggaagg ggatccctcc 2640 tcacatgtgg agatgtcgaa gaaaatcctg gacctcccaa gaaaaagaga aaagtaggat 2700 cgggcatgcg gagctatctc atcctgagac tggccggacc aatgcaggcc tggggacagc 2760 ctaccttcga aggtacacgc cccacaggcc gctttcctac caggagcggc ctgctgggcc 2820 tgcttggcgc ttgtcttggg atccagcgcg atgatactag ctccctgcaa gcactgtcag 2880 agagcgtgca gtttgccgta agatgcgacg aactgatcct tgatgatagg cgggtcagtg 2940 tcactggtct ccgggactac cacacggtgc tgggggcccg ggaggattat aggggcctga 3000 aaagtcacga gacgattcaa acctggcgcg aatatctgtg cgatgccagc ttcaccgtgg 3060 ccctgtggct gactccacat gccactatgg tcatcagtga actggaaaag gctgttctta 3120 agcctcgata tactccgtat ctgggccgcc ggagttgtcc acttacacac ccacttttcc 3180 tcggcacctg ccaggccagc gaccctcaaa aggcccttct gaattacgag ccagttggcg 3240 gtgacatata cagcgaagag tccgtgacgg gacaccatct taagttcacc gctcgggacg 3300 agcccatgat taccctccca cggcagttcg catcaaggga gtggtacgtc ataaaggggg 3360 gcatggatgt gagtcagggg tctggggagg ggcgggggtc tttgttgact tgcggggatg 3420 ttgaggagaa tcctggacct cccaaaaaaa aacggaaggt gggctcaggc atgtatctgt 3480 caaaggttat cattgcacgc gcgtggagta gggatctgta tcagctgcac cagggtctgt 3540 ggcatctttt cccgaaccgc cccgacgcgg cacgagactt tctgtttcac gttgaaaaaa 3600 gaaacacccc cgagggctgt catgtgctcc tgcagtctgc ccagatgccg gtgagcacag 3660 ctgtggcgac tgtgatcaag accaagcagg tcgagtttca gctccaggta ggggttccac 3720 tgtattttcg cctgagagct aatccgatca aaaccatact ggataatcag aagaggctcg 3780 acagcaaagg aaatattaaa aggtgccggg tcccgctcat caaagaggct gagcaaatcg 3840 cttggcttca acggaaactg gggaacgcag cccgcgtgga agacgtccac ccgattagtg 3900 aacggcccca atatttttcc ggagacggaa agagcggcaa gattcagaca gtctgtttcg 3960 agggggtgct caccatcaat gatgcccccg ccctgataga cctggtgcag cagggcatag 4020 gccccgctaa aagcatggga tgcggactgc ttagtctggc accgctggga tccggagagg 4080 gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct cccaagaaaa 4140 agagaaaagt aggcggctca caattggtca aaagcgaact ggaagagaaa aaatctgagc 4200 tcagacacaa gctgaagtat gtgccccatg aatacataga actcatagaa atagctcgaa 4260 accccacgca ggaccggatc cttgaaatga aagttatgga gttttttatg aaagtgtatg 4320 ggtatcgagg agagcatctt ggtggaagtc ggaaaccgga tggggcaata tacactgttg 4380 ggagccccat tgactatggt gtgatagtgg acaccaaggc atacagcggg ggatacaatc 4440 tgccgatcgg gcaggcagat gagatgcagc gctatgtgga ggagaatcaa actaggaaca 4500 aacatattaa cccaaacgaa tggtggaaag tgtatccctc atctgttacg gagttcaagt 4560 tcctttttgt atctggccac tttaaaggaa actataaagc acagctcacg cgacttaacc 4620 acatcaccaa ttgtaacggt gctgtactca gtgttgagga actcctgatc ggtggtgaaa 4680 tgataaaagc tggaaccttg acattggagg aagtaaggag aaagtttaat aatggtgaga 4740 tcaatttcgg gggtggtgga tctggaggtg gcggatcggg aggtggcgga tcgggaggtg 4800 gcggatcggg aggtggcgga tcgggaggtg gcggatcggg aggtggcgga tcgggaggtg 4860 gcggatcggg aggtggcgga tcgggaggtg gcggatcggg aggtggcgga tcgggaggtg 4920 gcggatcggg aggtggcgga tcgggaggtg gcggatcggg cggcggcggc tcacaattgg 4980 tcaaaagcga actggaagag aaaaaatctg agctcagaca caagctgaag tatgtgcccc 5040 atgaatacat agaactcata gaaatagctc gaaaccccac gcaggaccgg atccttgaaa 5100 tgaaagttat ggagtttttt atgaaagtgt atgggtatcg aggagagcat cttggtggaa 5160 gtcggaaacc ggatggggca atatacactg ttgggagccc cattgactat ggtgtgatag 5220 tggacaccaa ggcatacagc gggggataca atctgccgat cgggcaggca gatgagatgc 5280 agcgctatgt ggaggagaat caaactagga acaaacatat taacccaaac gaatggtgga 5340 aagtgtatcc ctcatctgtt acggagttca agttcctttt tgtatctggc cactttaaag 5400 gaaactataa agcacagctc acgcgactta accacatcac caattgtaac ggtgctgtac 5460 tcagtgttga ggaactcctg atcggtggtg aaatgataaa agctggaacc ttgacattgg 5520 aggaagtaag gagaaagttt aataatggtg agatcaattt cgctgaccca actaacagag 5580 ctaagggcct ggaggccgta tctgtggcat caatgaattt gctcattgat aattggattc 5640 cggtgcgccc ccggaacggt gggaaagtgc agatcatcaa tttgcaaagt ctctactgtt 5700 ccagggacca gtggagactc agcctgccac gggatgatat ggagctggcg gcgttggctc 5760 tgctcgtatg catcggccag attattgcgc cagcaaagga tgacgttgaa ttccggcatc 5820 ggataatgaa cccccttact gaagatgagt tccagcagct tatcgcccca tggatcgaca 5880 tgttctacct caaccacgcc gagcatcctt ttatgcagac caagggagtc aaggcgaatg 5940 atgtgactcc catggagaag ctgctggccg gtgtatctgg ggcgaccaac tgcgcattcg 6000 tgaatcagcc tggacagggg gaggccctct gtggaggctg cactgctata gcacttttta 6060 accaagctaa tcaagccccc ggctttggtg gagggtttaa gagtggattg agggggggca 6120 ctcccgtaac cacttttgtg aggggaattg atctgaggtc tactgtgttg ctgaacgtcc 6180 tcacactccc aaggctccag aagcagttcc caaacgaaag tcataccgaa aaccagccca 6240 catggatcaa gcccatcaaa tctaatgaga gcataccggc tagcagtatt ggatttgtac 6300 ggggtctgtt ctggcagcca gctcacatcg agctgtgtga tcctattggg atcggcaagt 6360 gctcttgttg tgggcaggag tccaacctta ggtatactgg atttctgaaa gagaagttta 6420 cctttacagt aaatgggctc tggccccacc cccactcacc ttgccttgtg acagtgaaaa 6480 agggggaagt cgaggagaag tttctggcct ttacaacttc tgccccttcc tggactcaga 6540 tttccagagt ggtggtagat aagataattc aaaacgagaa tggcaataga gtggccgccg 6600 tggtgaacca gtttcgcaac atcgcccctc agtcccccct ggagctgatt atgggcggtt 6660 atcggaataa ccaggccagt atactcgagc gacggcacga tgtcctcatg ttcaatcaag 6720 gttggcagca atatggcaat gtgattaacg agatcgtaac cgtgggcctg ggatataaga 6780 ccgccctgcg gaaggcgttg tatacttttg cagaaggctt taagaataag gattttaagg 6840 gtgccggcgt gagtgtccat gaaacagctg aacggcactt ttatcggcag tccgagctgt 6900 tgataccaga cgtgctggct aatgtgaact tctcacaggc cgacgaagtg atcgctgatc 6960 tgcgggataa actgcaccaa ctgtgcgaga tgctgtttaa tcaaagcgtc gctccttatg 7020 cccaccaccc aaagctgatc tccacgctgg ccctggcgcg cgccacactt tataaacatc 7080 tccgcgaact gaaaccccag gggggcccca gcaatggcta ataatctaga gggccctatt 7140 ctatagtgtc acctaaatgc tagagctcgc tgatcagcct cgactgtgcc ttctagttgc 7200 cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 7260 actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 7320 attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 7380 catgctgggg atgcggtggg ctctatggct tctgaggcgg aaagaaccag ctggggctct 7440 agggggtatc cccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 7500 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 7560 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 7620 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 7680 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 7740 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 7800 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 7860 taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg tcagttaggg tgtggaaagt 7920 ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 7980 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 8040 agtcagcaac catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt 8100 ccgcccattc tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg 8160 cctctgcctc tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt 8220 gcaaaaagct cccgggagct tgtatatcca ttttcggatc tgatcaagag acaggatgag 8280 gatcgtttcg catgattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg 8340 agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt 8400 tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc 8460 tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt 8520 gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag 8580 tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg 8640 ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag 8700 cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg 8760 atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc 8820 gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 8880 tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc 8940 gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 9000 ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 9060 atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga ccgaccaagc 9120 gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg aaaggttggg 9180 cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct 9240 ggagttcttc gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa 9300 tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc 9360 caaactcatc aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc 9420 gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa 9480 catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac 9540 attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 9600 ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 9660 ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 9720 aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 9780 aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 9840 gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 9900 gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 9960 tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 10020 ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 10080 ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 10140 tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 10200 tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 10260 ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 10320 aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 10380 ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 10440 tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 10500 atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 10560 aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 10620 ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 10680 tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 10740 ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 10800 tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 10860 aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 10920 gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 10980 tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 11040 cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 11100 tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 11160 ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 11220 cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 11280 actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 11340 ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 11400 aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 11460 ttttcattat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 11520 atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 11580 tgacgtc 11587 <210> 1927 <211> 2067 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: single-chain FokI fusion to EcoCascade <400> 1927 Met Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Met Ser Asn Phe Ile 1 5 10 15 Asn Ile His Val Leu Ile Ser His Ser Pro Ser Cys Leu Asn Arg Asp 20 25 30 Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly Gly Lys Arg Arg Val 35 40 45 Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met Arg Lys Ser Gly Tyr 50 55 60 Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg Thr Ile His Leu Ala 65 70 75 80 Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly Glu Arg Phe Asp Gln 85 90 95 Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser Gly Lys Ser Val Asp 100 105 110 Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr Pro Trp Val Val Gly 115 120 125 Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys Ala Glu Ala Asp Asn 130 135 140 Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys Glu Asp Ile Ala Ala 145 150 155 160 Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile Ala Leu Ser Gly Arg 165 170 175 Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly Lys Val Asp Gly Ala 180 185 190 Met Ser Ile Ala His Ala Ile Thr Thr His Gln Val Asp Ser Asp Ile 195 200 205 Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu Gln Gly Ser Ala His 210 215 220 Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe Tyr Arg Tyr Ala Asn 225 230 235 240 Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly Gly Ala Ser Arg Glu 245 250 255 Gln Ala Leu Glu Ile Ala Thr His Val Val His Met Leu Ala Thr Glu 260 265 270 Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala Phe Asn Pro Ala Asp 275 280 285 Met Val Met Val Asn Phe Ser Asp Met Pro Leu Ser Met Ala Asn Ala 290 295 300 Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe Leu Gln Pro Ser Ile 305 310 315 320 Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala Asn Gly Tyr Gly Leu 325 330 335 Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp Val Asp Pro Ile Thr 340 345 350 Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln Leu Lys Ser Trp Val 355 360 365 Arg Asn Asn Gly Glu Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 370 375 380 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg 385 390 395 400 Lys Val Gly Ser Gly Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr 405 410 415 Arg Ala Trp Gln Gln Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg 420 425 430 Val Ser Glu Pro Asp Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu 435 440 445 Val Gln Pro Phe Gly Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu 450 455 460 Arg Met Val Phe Cys Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln 465 470 475 480 Asp Lys Lys Ser Glu Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu 485 490 495 Ala Asn Ser Gly Arg Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg 500 505 510 Ala Asp Arg Thr Ala Asp Met Val Gln Leu Arg Arg Leu Leu Thr His 515 520 525 Ala Glu Pro Val Leu Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp 530 535 540 Trp Gly Lys Arg Glu Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr 545 550 555 560 Thr Asn Lys Asn Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr 565 570 575 Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys 580 585 590 Val Gly Ser Gly Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro 595 600 605 Met Gln Ala Trp Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly 610 615 620 Arg Phe Pro Thr Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu 625 630 635 640 Gly Ile Gln Arg Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser 645 650 655 Val Gln Phe Ala Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg 660 665 670 Val Ser Val Thr Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg 675 680 685 Glu Asp Tyr Arg Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg 690 695 700 Glu Tyr Leu Cys Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro 705 710 715 720 His Ala Thr Met Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro 725 730 735 Arg Tyr Thr Pro Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro 740 745 750 Leu Phe Leu Gly Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu 755 760 765 Asn Tyr Glu Pro Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr 770 775 780 Gly His His Leu Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu 785 790 795 800 Pro Arg Gln Phe Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met 805 810 815 Asp Val Ser Gln Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 820 825 830 Gly Asp Val Glu Glu Asn Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 835 840 845 Gly Ser Gly Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser 850 855 860 Arg Asp Leu Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn 865 870 875 880 Arg Pro Asp Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn 885 890 895 Thr Pro Glu Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val 900 905 910 Ser Thr Ala Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln 915 920 925 Leu Gln Val Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile 930 935 940 Lys Thr Ile Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile 945 950 955 960 Lys Arg Cys Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp 965 970 975 Leu Gln Arg Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro 980 985 990 Ile Ser Glu Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys 995 1000 1005 Ile Gln Thr Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala 1010 1015 1020 Pro Ala Leu Ile Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys 1025 1030 1035 Ser Met Gly Cys Gly Leu Leu Ser Leu Ala Pro Leu Gly Ser Gly 1040 1045 1050 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn 1055 1060 1065 Pro Gly Pro Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gln Leu 1070 1075 1080 Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys 1085 1090 1095 Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala 1100 1105 1110 Arg Asn Pro Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu 1115 1120 1125 Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Glu His Leu Gly Gly 1130 1135 1140 Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 1145 1150 1155 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr 1160 1165 1170 Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 1175 1180 1185 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp 1190 1195 1200 Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val 1205 1210 1215 Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu 1220 1225 1230 Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu 1235 1240 1245 Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 1250 1255 1260 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Gly 1265 1270 1275 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1280 1285 1290 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1295 1300 1305 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1310 1315 1320 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1325 1330 1335 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln 1340 1345 1350 Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His 1355 1360 1365 Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile 1370 1375 1380 Ala Arg Asn Pro Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met 1385 1390 1395 Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Glu His Leu Gly 1400 1405 1410 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro 1415 1420 1425 Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 1430 1435 1440 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val 1445 1450 1455 Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp 1460 1465 1470 Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe 1475 1480 1485 Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg 1490 1495 1500 Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 1505 1510 1515 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr 1520 1525 1530 Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1535 1540 1545 Ala Asp Pro Thr Asn Arg Ala Lys Gly Leu Glu Ala Val Ser Val 1550 1555 1560 Ala Ser Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro 1565 1570 1575 Arg Asn Gly Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr 1580 1585 1590 Cys Ser Arg Asp Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met 1595 1600 1605 Glu Leu Ala Ala Leu Ala Leu Leu Val Cys Ile Gly Gln Ile Ile 1610 1615 1620 Ala Pro Ala Lys Asp Asp Val Glu Phe Arg His Arg Ile Met Asn 1625 1630 1635 Pro Leu Thr Glu Asp Glu Phe Gln Gln Leu Ile Ala Pro Trp Ile 1640 1645 1650 Asp Met Phe Tyr Leu Asn His Ala Glu His Pro Phe Met Gln Thr 1655 1660 1665 Lys Gly Val Lys Ala Asn Asp Val Thr Pro Met Glu Lys Leu Leu 1670 1675 1680 Ala Gly Val Ser Gly Ala Thr Asn Cys Ala Phe Val Asn Gln Pro 1685 1690 1695 Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr Ala Ile Ala Leu 1700 1705 1710 Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly Gly Phe Lys 1715 1720 1725 Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val Arg Gly 1730 1735 1740 Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu Pro 1745 1750 1755 Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln 1760 1765 1770 Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala 1775 1780 1785 Ser Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His 1790 1795 1800 Ile Glu Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys 1805 1810 1815 Gly Gln Glu Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys 1820 1825 1830 Phe Thr Phe Thr Val Asn Gly Leu Trp Pro His Pro His Ser Pro 1835 1840 1845 Cys Leu Val Thr Val Lys Lys Gly Glu Val Glu Glu Lys Phe Leu 1850 1855 1860 Ala Phe Thr Thr Ser Ala Pro Ser Trp Thr Gln Ile Ser Arg Val 1865 1870 1875 Val Val Asp Lys Ile Ile Gln Asn Glu Asn Gly Asn Arg Val Ala 1880 1885 1890 Ala Val Val Asn Gln Phe Arg Asn Ile Ala Pro Gln Ser Pro Leu 1895 1900 1905 Glu Leu Ile Met Gly Gly Tyr Arg Asn Asn Gln Ala Ser Ile Leu 1910 1915 1920 Glu Arg Arg His Asp Val Leu Met Phe Asn Gln Gly Trp Gln Gln 1925 1930 1935 Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val Gly Leu Gly Tyr 1940 1945 1950 Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala Glu Gly Phe 1955 1960 1965 Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His Glu Thr 1970 1975 1980 Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro Asp 1985 1990 1995 Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala 2000 2005 2010 Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn 2015 2020 2025 Gln Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr 2030 2035 2040 Leu Ala Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu 2045 2050 2055 Lys Pro Gln Gly Gly Pro Ser Asn Gly 2060 2065

Claims (27)

  1. 하기를 포함하는 조성물로서:
    제1 Cse2 서브유닛 단백질, 제1 Cas5 서브유닛 단백질, 제1 Cas6 서브유닛 단백질, 및 제1 Cas7 서브유닛 단백질,
    제1 Cas8 서브유닛 단백질 및 제1 FokI를 포함하며, 여기서 제1 Cas8 서브유닛 단백질의 N-말단 또는 제1 Cas8 서브유닛 단백질의 C-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 여기서 제1 링커 폴리펩티드가 10개 아미노산 내지 40개 아미노산의 길이를 갖는 것인 제1 융합 단백질, 및
    제1 핵산 표적 서열에 결합할 수 있는 제1 스페이서를 포함하는 제1 가이드 폴리뉴클레오티드
    를 포함하는 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체; 및
    제2 Cse2 서브유닛 단백질, 제2 Cas5 서브유닛 단백질, 제2 Cas6 서브유닛 단백질, 및 제2 Cas7 서브유닛 단백질,
    제2 Cas8 서브유닛 단백질 및 제2 FokI를 포함하며, 여기서 제2 Cas8 서브유닛 단백질의 N-말단 또는 제2 Cas8 서브유닛 단백질의 C-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단 또는 N-말단에 각각 공유적으로 연결되고, 여기서 제2 링커 폴리펩티드가 10개 아미노산 내지 40개 아미노산의 길이를 갖는 것인 제2 융합 단백질, 및
    제2 핵산 표적 서열에 결합할 수 있는 제2 스페이서를 포함하는 제2 가이드 폴리뉴클레오티드
    를 포함하는 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체;
    여기서 제2 핵산 표적 서열의 프로토스페이서 인접 모티프 (PAM)와 제1 핵산 표적 서열의 PAM이 20개 염기 쌍 내지 42개 염기 쌍의 인터스페이서 거리를 갖는 것인
    조성물.
  2. 제1항에 있어서, 제1 링커 폴리펩티드가 15개 아미노산 내지 30개 아미노산, 또는 17개 아미노산 내지 20개 아미노산의 길이를 갖는 것인 조성물.
  3. 제1항 또는 제2항에 있어서, 제2 링커 폴리펩티드가 15개 아미노산 내지 30개 아미노산, 또는 17개 아미노산 내지 20개 아미노산의 길이를 갖는 것인 조성물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 제1 링커 폴리펩티드의 길이와 제2 링커 폴리펩티드의 길이가 동일한 길이인 조성물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 제2 핵산 표적 서열 및 제1 핵산 표적 서열이 각각 22개 염기 쌍 내지 40개 염기 쌍의 인터스페이서 거리를 갖거나, 각각 26개 염기 쌍 내지 36개 염기 쌍의 인터스페이서 거리를 갖거나, 각각 29개 염기 쌍 내지 34개 염기 쌍의 인터스페이서 거리를 갖거나, 또는 각각 30개 염기 쌍 내지 32 염기 쌍의 인터스페이서 거리를 갖는 것인 조성물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 FokI 및 제2 FokI가 연합하여 동종이량체를 형성할 수 있는 단량체성 서브유닛인 조성물.
  7. 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 FokI 및 제2 FokI가 연합하여 이종이량체를 형성할 수 있는 별개의 단량체성 서브유닛인 조성물.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 제1 Cas8 서브유닛 단백질의 N-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 C-말단에 공유적으로 연결되고/거나, 제1 Cas8 서브유닛 단백질의 C-말단이 제1 링커 폴리펩티드에 의해 제1 FokI의 N-말단에 공유적으로 연결되는 것인 조성물.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 제2 Cas8 서브유닛 단백질의 N-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 C-말단에 공유적으로 연결되고/거나, 제2 Cas8 서브유닛 단백질의 C-말단이 제2 링커 폴리펩티드에 의해 제2 FokI의 N-말단에 공유적으로 연결되는 것인 조성물.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 제1 Cas8 서브유닛 단백질 및 제2 Cas8 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하는 것인 조성물.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 제1 Cse2 서브유닛 단백질 및 제2 Cse2 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하고, 제1 Cas5 서브유닛 단백질 및 제2 Cas5 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하고, 제1 Cas6 서브유닛 단백질 및 제2 Cas6 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하고, 제1 Cas7 서브유닛 단백질 및 제2 Cas7 서브유닛 단백질이 각각 동일한 아미노산 서열을 포함하는 것인 조성물.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 제1 가이드 폴리뉴클레오티드가 RNA를 포함하고/거나, 제2 가이드 폴리뉴클레오티드가 RNA를 포함하는 것인 조성물.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 게놈 DNA가 제2 핵산 표적 서열의 PAM 및 제1 핵산 표적 서열의 PAM을 포함하는 것인 조성물.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체가 살모넬라 엔테리카(Salmonella enterica), 게오써모박터(Geothermobacter) 종 (균주 EPR-M), 메타노셀라 아르보리자에(Methanocella arvoryzae) MRE50, 스트렙토코쿠스 써모필루스(Streptococcus thermophilus), 슈도모나스(Pseudomonas) 종 S-6-2, 및 에스케리키아 콜라이(Escherichia coli)로 이루어진 군으로부터 선택된 하나 이상의 유기체의 유형 I CRISPR-Cas 이펙터 복합체에 기반한 것인 조성물.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체가 살모넬라 엔테리카, 게오써모박터 종 (균주 EPR-M), 메타노셀라 아르보리자에 MRE50, 스트렙토코쿠스 써모필루스, 슈도모나스 종 S-6-2, 및 에스케리키아 콜라이로 이루어진 군으로부터 선택된 하나 이상의 유기체의 유형 I CRISPR-Cas 이펙터 복합체에 기반한 것인 조성물.
  16. 제1항 내지 제15항 중 어느 한 항의 조성물을 포함하는 숙주 세포.
  17. 제16항에 있어서, 세포가 진핵 세포인 숙주 세포.
  18. 제1항 내지 제15항 중 어느 한 항의 제1 Cse2 서브유닛 단백질, 제1 Cas5 서브유닛 단백질, 제1 Cas6 서브유닛 단백질, 제1 Cas7 서브유닛 단백질, 제1 융합 단백질 및 제1 가이드 폴리뉴클레오티드를 코딩하는 하나 이상의 핵산 서열; 및/또는 제1항 내지 제15항 중 어느 한 항의 제2 Cse2 서브유닛 단백질, 제2 Cas5 서브유닛 단백질, 제2 Cas6 서브유닛 단백질, 제2 Cas7 서브유닛 단백질, 제2 융합 단백질 및 제2 가이드 폴리뉴클레오티드를 코딩하는 하나 이상의 핵산 서열.
  19. 하기 단계를 포함하는, 숙주 세포 또는 생화학적 반응에서 제1 핵산 표적 서열 및 제2 핵산 표적 서열을 포함하는 폴리뉴클레오티드를 커팅하는 방법으로서:
    제1항 내지 제15항 중 어느 한 항의 조성물을 숙주 세포 또는 생화학적 반응 내로 도입하며, 이로써 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제1 핵산 표적 서열의 접촉 및 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체와 제2 핵산 표적 서열의 접촉을 용이하게 하여, 제1 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체에 의한 제1 핵산 표적 서열의 커팅 및 제2 조작된 클래스 1 유형 I CRISPR-Cas 이펙터 복합체에 의한 제2 핵산 표적 서열의 커팅을 초래하는 단계;
    임의적으로 여기서 방법은 숙주 세포 내에서 이루어지고, 숙주 세포는 인체 외부의 인간 세포인
    방법.
  20. 제19항에 있어서, 숙주 세포가 공여자 폴리뉴클레오티드를 추가로 포함하고, 공여자 폴리뉴클레오티드의 적어도 일부분이 dsDNA에 통합되는 것인 방법.
  21. 야생형 유형 I CRISPR Cas3 단백질 ("wtCas3 단백질")에 비해 DNA를 따라 이동하는 것을 감소시킬 수 있는 조작된 유형 I CRISPR Cas3 돌연변이체 단백질 ("mCas3 단백질")로서, mCas3 단백질은
    상응하는 wtCas3 단백질과의 95% 이상의 서열 동일성을 포함하고,
    아미노 말단, 카르복시 말단, 또는 아미노 말단과 카르복시 말단 둘 다에 공유적으로 연결된 핵 국재화 시그널을 포함하고,
    헬리카제 활성을 하향-조정하는 하나 이상의 돌연변이를 포함하며, 여기서 조작된 유형 I CRISPR Cas3 돌연변이체 단백질이 뉴클레아제 활성을 보유하고;
    여기서 DNA는 핵산 표적 서열을 포함하는 표적 영역을 포함하는 이중-가닥 DNA (dsDNA)이고;
    여기서 wtCas3 단백질이 상응하는 캐스케이드 핵단백질 복합체와 연합되고 ("캐스케이드 NP 복합체/wtCas3 단백질"), 캐스케이드 NP 복합체가 핵산 표적 서열에 상보적인 스페이서를 포함하는 가이드를 포함하는 경우에, 핵산 표적 서열에 대한 캐스케이드 NP 복합체/wtCas3 단백질의 결합은 DNA의 표적 영역에서의 절단을 용이하게 하며, 이로써 결실 ("wtCas3-결실)을 초래하고;
    여기서 mCas3 단백질이 캐스케이드 NP 복합체와 연합되고 ("캐스케이드 NP 복합체/mCas3 단백질") 핵산 표적 서열에 결합하는 경우에, 이는 DNA의 표적 영역에서의 절단을 용이하게 하며, 이로써 wtCas3-결실에 비해 더 짧은 결실을 초래하는 것인
    mCas3 단백질.
  22. 제21항에 있어서, 하나 이상의 돌연변이가 wtCas3 단백질에 비해 단일-가닥 DNA (ssDNA)에 대한 mCas3 단백질의 결합을 하향-조정하는 것인 mCas3 단백질.
  23. 제21항 또는 제22항에 있어서, 하나 이상의 돌연변이가 wtCas3 단백질에 비해 mCas3 단백질에 의한 아데노신 트리포스페이트 (ATP)의 가수분해를 하향-조정하거나 또는 mCas3 단백질에 대한 ATP의 결합을 하향-조정하는 것인 mCas3 단백질.
  24. 제21항 내지 제23항 중 어느 한 항에 있어서, mCas3 단백질에 대한 코딩 서열이 캐스케이드 NP 복합체의 Cas 단백질의 코딩 서열의 아미노 말단 또는 카르복시 말단에 공유적으로 연결되는 것인 mCas3 단백질.
  25. 제21항 내지 제24항 중 어느 한 항에 있어서, DNA가 세포 내에 있는 것인 mCas3 단백질.
  26. 제21항 내지 제25항 중 어느 한 항에 있어서, 세포가 진핵 세포인 mCas3 단백질.
  27. 제21항 내지 제26항 중 어느 한 항의 mCas3 단백질을 포함하는 유형 I CRISPR 캐스케이드 핵단백질 복합체.
KR1020207035239A 2018-06-13 2019-06-12 조작된 캐스케이드 구성성분 및 캐스케이드 복합체 KR102516697B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237007018A KR20230035689A (ko) 2018-06-13 2019-06-12 조작된 캐스케이드 구성성분 및 캐스케이드 복합체

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201862684735P 2018-06-13 2018-06-13
US62/684,735 2018-06-13
US16/104,875 2018-08-17
US16/104,875 US10227576B1 (en) 2018-06-13 2018-08-17 Engineered cascade components and cascade complexes
US16/262,773 US10329547B1 (en) 2018-06-13 2019-01-30 Engineered cascade components and cascade complexes
US16/262,773 2019-01-30
US201962807717P 2019-02-19 2019-02-19
US62/807,717 2019-02-19
US16/420,061 US10457922B1 (en) 2018-06-13 2019-05-22 Engineered cascade components and cascade complexes
US16/420,061 2019-05-22
PCT/US2019/036864 WO2019241452A1 (en) 2018-06-13 2019-06-12 Engineered cascade components and cascade complexes

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020237007018A Division KR20230035689A (ko) 2018-06-13 2019-06-12 조작된 캐스케이드 구성성분 및 캐스케이드 복합체

Publications (2)

Publication Number Publication Date
KR20210006966A true KR20210006966A (ko) 2021-01-19
KR102516697B1 KR102516697B1 (ko) 2023-03-31

Family

ID=68843611

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020207035239A KR102516697B1 (ko) 2018-06-13 2019-06-12 조작된 캐스케이드 구성성분 및 캐스케이드 복합체
KR1020237007018A KR20230035689A (ko) 2018-06-13 2019-06-12 조작된 캐스케이드 구성성분 및 캐스케이드 복합체

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020237007018A KR20230035689A (ko) 2018-06-13 2019-06-12 조작된 캐스케이드 구성성분 및 캐스케이드 복합체

Country Status (10)

Country Link
EP (2) EP3601574A4 (ko)
JP (1) JP6965466B2 (ko)
KR (2) KR102516697B1 (ko)
CN (1) CN112272704A (ko)
AU (2) AU2019284926C1 (ko)
CA (2) CA3102148A1 (ko)
MX (1) MX2020013579A (ko)
SG (1) SG11202010182SA (ko)
WO (1) WO2019241452A1 (ko)
ZA (1) ZA202006880B (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115369098A (zh) * 2021-05-17 2022-11-22 中国科学院分子植物科学卓越创新中心 一种新型crispr相关转座酶
CA3222023A1 (en) 2021-06-01 2022-12-08 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
WO2022253277A1 (zh) * 2021-06-03 2022-12-08 中国农业大学 Type I-C CRISPR-Cas3系统及其应用
CN115011581A (zh) * 2022-04-14 2022-09-06 吉林大学 使cas3系统可以精确敲除的方法
CN116987699A (zh) * 2023-09-05 2023-11-03 深圳市艾迪贝克生物医药有限公司 用于制备通用型car-t细胞的基因片段、其工具系统及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
US20160355796A1 (en) * 2013-12-12 2016-12-08 The Broad Institute Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
WO2017066497A2 (en) * 2015-10-13 2017-04-20 Duke University Genome engineering with type i crispr systems in eukaryotic cells

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7446190B2 (en) 2002-05-28 2008-11-04 Sloan-Kettering Institute For Cancer Research Nucleic acids encoding chimeric T cell receptors
US7435596B2 (en) 2004-11-04 2008-10-14 St. Jude Children's Research Hospital, Inc. Modified cell line and method for expansion of NK cell
GB201122458D0 (en) * 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
ES2901396T3 (es) 2013-03-14 2022-03-22 Caribou Biosciences Inc Composiciones y métodos de ácidos nucleicos dirigidos a ácido nucleico

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
US20160355796A1 (en) * 2013-12-12 2016-12-08 The Broad Institute Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
WO2017066497A2 (en) * 2015-10-13 2017-04-20 Duke University Genome engineering with type i crispr systems in eukaryotic cells

Also Published As

Publication number Publication date
KR20230035689A (ko) 2023-03-14
MX2020013579A (es) 2021-05-12
ZA202006880B (en) 2021-10-27
CA3163768A1 (en) 2019-12-19
AU2019284926C1 (en) 2023-04-27
AU2022200903B2 (en) 2023-12-21
EP4219720A2 (en) 2023-08-02
KR102516697B1 (ko) 2023-03-31
SG11202010182SA (en) 2020-11-27
JP2021520844A (ja) 2021-08-26
AU2019284926B2 (en) 2023-01-12
EP3601574A1 (en) 2020-02-05
AU2019284926A1 (en) 2020-11-05
WO2019241452A1 (en) 2019-12-19
AU2022200903A1 (en) 2022-03-03
EP3601574A4 (en) 2020-03-18
CN112272704A (zh) 2021-01-26
JP6965466B2 (ja) 2021-11-10
CA3102148A1 (en) 2019-12-19
EP4219720A3 (en) 2023-08-30

Similar Documents

Publication Publication Date Title
CN112673092B (zh) 工程化的免疫刺激性细菌菌株及其用途
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
AU2022200903B2 (en) Engineered Cascade components and Cascade complexes
KR20230019843A (ko) 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
KR20210143230A (ko) 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
AU2022275537A1 (en) Nuclease systems for genetic engineering
KR101666228B1 (ko) 생물치료학적 분자를 발현시키기 위한 치료학적 유전자-스위치 작제물 및 생물반응기, 및 이의 용도
KR20210091740A (ko) 세포-매개된 종양용해 바이러스 요법용 향상된 시스템
US20030119104A1 (en) Chromosome-based platforms
KR20220004959A (ko) 종양, 종양-상주 면역 세포, 및 종양 미세환경을 콜로니화하기 위해 조작된 면역자극성 박테리아
KR20220113943A (ko) 면역자극성 박테리아 전달 플랫폼 및 치료 제품의 전달을 위한 이의 용도
DK2623594T3 (da) Antistof mod human prostaglandin-E2-receptor EP4
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20220090512A (ko) 액체암의 치료를 위한 조성물 및 방법
KR20230066000A (ko) 면역자극성 박테리아-기초 백신, 치료제, 및 rna 전달 플랫폼
KR20200126997A (ko) 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법
KR102652494B1 (ko) 전장 t-세포 수용체 오픈 리딩 프레임의 신속한 조립 및 다양화를 위한 2-성분 벡터 라이브러리 시스템
KR20220038362A (ko) 재조합 ad35 벡터 및 관련 유전자 요법 개선
KR20210080375A (ko) 암 면역요법을 위한 재조합 폭스바이러스
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포
KR20160002880A (ko) 엔도솜 포집을 극복하기 위해 설계된 인공 전사 인자
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
CN112877292A (zh) 产生人抗体的细胞
KR20230031929A (ko) 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도
KR20220157944A (ko) 인간 대상체에서 비-연령-연관 청각 장애를 치료하기 위한 조성물 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E701 Decision to grant or registration of patent right
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant