KR20230054457A - 카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법 - Google Patents

카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법 Download PDF

Info

Publication number
KR20230054457A
KR20230054457A KR1020237010115A KR20237010115A KR20230054457A KR 20230054457 A KR20230054457 A KR 20230054457A KR 1020237010115 A KR1020237010115 A KR 1020237010115A KR 20237010115 A KR20237010115 A KR 20237010115A KR 20230054457 A KR20230054457 A KR 20230054457A
Authority
KR
South Korea
Prior art keywords
sequence
leu
seq
lys
glu
Prior art date
Application number
KR1020237010115A
Other languages
English (en)
Inventor
브라이언 토마스
크리스토퍼 브라운
다니엘라 에스.에이. 골츠만
크리스티나 버터필드
리사 알렉산더
제이슨 리우
Original Assignee
메타지노미, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메타지노미, 인크. filed Critical 메타지노미, 인크.
Publication of KR20230054457A publication Critical patent/KR20230054457A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템 및 방법을 제공한다. 이 시스템 및 방법은 재조합효소 또는 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; Cas 이펙터, 및 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 카고 뉴클레오타이드를 표적 핵산 부위로 끌어들이도록 구성된 재조합효소 또는 전위효소 복합체를 포함할 수 있다.

Description

카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법
관련 출원
본원은 2020년 8월 24일자로 출원된 미국 가출원 제63/069,703호(발명의 명칭: "SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES"), 2021년 5월 10일자로 출원된 미국 가출원 제63/186,698호(발명의 명칭: "SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES"), 및 2021년 8월 12일자로 출원된 미국 가출원 제63/232,593호(발명의 명칭: "SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES")의 이익을 주장하고, 이 출원들 각각은 전체적으로 본원에 참고로 포함된다.
Cas 효소는 그와 관련된 클러스터링된 규칙적으로 이격된 짧은 팔린드로믹 반복부(CRISPR) 가이드 리보핵산(RNA)과 함께 CRISPR-RNA 가이딩 핵산 절단을 통해 감염성 바이러스 및 플라스미드와 같은 비-자가 핵산으로부터 미생물을 보호하는 역할을 하는, 원핵생물 면역 시스템의 널리 보급된(박테리아의 약 45%, 고세균의 약 84%) 구성요소인 것으로 보인다. CRISPR RNA 요소를 코딩하는 데옥시리보핵산(DNA) 요소는 구조와 길이가 비교적 보존되어 있을 수 있지만, 그의 CRISPR 관련(Cas) 단백질은 매우 다양하며 다양한 핵산 상호작용 도메인을 함유한다. CRISPR DNA 요소는 1987년에 이미 관찰되었지만, CRISPR/Cas 복합체의 프로그래밍 가능한 엔도뉴클레아제(endonuclease) 절단 능력은 비교적 최근에야 인식되어, 다양한 DNA 조작 및 유전자 편집 응용분야에서 재조합 CRISPR/Cas 시스템의 사용으로 이어졌다.
서열목록
본원은 ASCII 형식으로 전자적으로 제출되었고 전체적으로 본원에 참고로 포함되는 서열목록을 함유한다. 2021년 8월 20일자로 생성된 상기 ASCII 사본은 명칭이 55921-714_601_SL.txt이고 크기가 488,452 바이트이다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, 재조합효소(recombinase) 또는 전위효소(transposase) 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 II 타입 II Cas 이펙터, 및 상기 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 카고 뉴클레오타이드 서열을 상기 표적 핵산 부위로 끌어들이도록 구성된 상기 재조합효소 또는 전위효소 복합체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 3'에 위치한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 Tn7 타입 전위효소 복합체이다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 클래스 II 타입 II Cas 이펙터는 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개 또는 4개의 폴리펩티드(들)를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 19 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 II Cas 이펙터 및 상기 재조합효소 또는 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 측면 또는 실시양태 중 임의의 측면 또는 실시양태의 시스템을 발현시키거나 본원에 기재된 측면 또는 실시양태 중 임의의 측면 또는 실시양태의 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터가 아니다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 5'에 위치한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 TnsA 서브유닛은 서열번호 7 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 20 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 21 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터가 아니다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 측면 또는 실시양태 중 어느 한 측면 또는 실시양태의 시스템을 발현시키거나 본원에 기재된 측면 또는 실시양태 중 어느 한 측면 또는 실시양태의 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서, 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을, 클래스 II 타입 II Cas 이펙터, 및 상기 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 상기 카고 뉴클레오타이드를 상기 표적 핵산 부위로 끌어들이도록 구성된 재조합효소 또는 전위효소 복합체; 및 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산과 접촉시키는 단계를 포함하는 방법을 제공한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 표적 핵산은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 3'에 위치한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 Tn7 타입 전위효소 복합체이다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 클래스 II 타입 II Cas 이펙터는 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개 또는 4개의 폴리펩티드(들)를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 19 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 II Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서, 상기 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을, 클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체; 및 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산과 접촉시키는 단계를 포함하는 방법을 제공한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 표적 핵산 부위는 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 3'에 위치한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 TnsA 서브유닛은 서열번호 7 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 20 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 21 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터가 아니다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 I 타입 I-F Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 3'에 위치한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 5'에 위치한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 I 타입 I-F Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 클래스 I 타입 I-F Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 44 내지 46 또는 51 내지 53 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 측면 또는 실시양태 중 어느 한 측면 또는 실시양태의 시스템을 발현시키거나 본원에 기재된 측면 또는 실시양태 중 어느 한 측면 또는 실시양태의 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsB, TnsC 및 TniQ 구성요소를 포함하는 Tn7 타입 전위효소 복합체를 포함하는 시스템을 제공하는 것으로, 이때 (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 폴리펩티드를 포함하거나; (b) 상기 Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 TnsB, TnsC 또는 TniQ 구성요소를 포함한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 TnsB, TnsC 또는 TniQ 구성요소를 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터이다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 5'에 위치한다. 일부 실시양태에서, 상기 PAM 서열은 5'-nGTn-3' 또는 5'-nGTt-3'을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 TnsB, TnsC 및 TniQ 구성요소는 각각 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 125, 127, 123, 129, 131, 133, 153 또는 134 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 126, 155, 128, 124, 130, 132 또는 154 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 22 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 125 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 126 또는 155, 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 90의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 94, 112 또는 202 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 23 내지 25 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 26 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 127 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 128 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드 (i) 서열번호 91, 156 또는 209 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 95, 113 또는 203 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 27 내지 29 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 60 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 131 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 132 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 117, 161 또는 214 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 119의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 101 내지 103 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 147 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 153 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 154 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 151, 181 또는 234 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 152 또는 254의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 148 내지 150 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 34 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 129 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 130 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 93, 157 또는 210 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 97, 114 또는 204 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 148 내지 150 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 30 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 123 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 124 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 92의 적어도 약 46개 내지 80개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 111 또는 201의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 31, 32 및 33 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하거나; (f) 상기 PAM 서열은 5'-nGTn-3' 또는 5'-nGTt-3'을 포함한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsB 및 TnsC 구성요소를 포함하지만 TnsA 및/또는 TniQ 구성요소를 포함하지 않는 Tn7 타입 전위효소 복합체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 TnsB 구성요소는 서열번호 40 또는 109에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 TnsC 구성요소는 서열번호 39 또는 110에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터이다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 서열번호 38 또는 서열번호 108에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 표적 핵산 부위를 포함하는 상기 이중 가닥 핵산 또는 상기 시스템은 세포 내부에 있다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 5'에 위치한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 TnsB 및 TnsC 구성요소는 각각 서열번호 40 및 39 또는 109 및 110에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 115, 116, 205, 206, 261, 235, 260 또는 236 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 134에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 135 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 38 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 134 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 135 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 182 또는 235의 적어도 약 46개 내지 80개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 98, 115, 116, 205 또는 206의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB 및 TnsC 구성요소는 서열번호 40 및 39 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다.
일부 측면에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래하고 상기 엔도뉴클레아제는 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 클래스 II 타입 II 엔도뉴클레아제이고, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 폴리뉴클레오타이드는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다.
일부 측면에서, 본 개시내용은 RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제는 서열번호 5에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V 엔도뉴클레아제이고, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 측면에서, 본 개시내용은 RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V-K 엔도뉴클레아제이고, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다.
일부 측면에서, 본 개시내용은 RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제는 서열번호 38 또는 서열번호 108 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V-K 엔도뉴클레아제이고, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210, 115, 116, 205, 206, 261, 235, 260 또는 236 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함한다.
일부 측면에서, 본 개시내용은 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 하나의 Cas6, Cas7 또는 Cas8 폴리펩티드를 포함하는 클래스 I 타입 I-F Cas 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 121, 122, 207 또는 208 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함한다.
본 개시내용의 추가 측면 및 장점은 본 개시내용의 예시적인 실시양태만이 제시되고 기재되어 있는 하기 상세한 설명으로부터 당분야에서 숙련된 자에게 용이하게 명백해질 것이다. 인식될 바와 같이, 본 개시내용은 다른 상이한 실시양태를 가능하게 하고, 이의 여러 세부사항은 모두 본 개시내용을 벗어나지 않으면서 다양한 자명한 관점에서 변형될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로서 간주되어야 하며, 제한적인 것으로서 간주되어서는 안 된다.
참고에 의한 포함
본 명세서에서 언급된 모든 간행물, 특허 및 특허 출원은, 각각의 개별 간행물, 특허 또는 특허 출원이 참고로 포함되는 것으로 구체적 및 개별적으로 표시된 것처럼 동일한 정도로 본원에 참고로 포함된다.
본 발명의 신규 특징은 첨부된 청구범위에 구체적으로 기재되어 있다. 본 발명의 특징 및 장점은 본 발명의 원리가 활용되는 예시적인 실시양태를 설명하는 하기 상세한 설명 및 첨부된 도면(본원에서 "도면" 및 "도"로서도 기재됨)을 참조함으로써 더 잘 이해될 것이다:
도 1은 상이한 클래스 및 타입의 CRISPR/Cas 유전자좌의 전형적인 조직화를 도시한다.
도 2는 crRNA와 tracrRNA가 연결되어 있는 하이브리드 sgRNA에 비해 천연 클래스 II 타입 II crRNA/tracrRNA 쌍의 구조를 도시한다.
도 3은 Tn7 및 Tn7 유사 요소에서 발견되는 2개의 경로를 도시한다.
도 4는 패밀리 MG36의 타입 II Tn7 환원 CAST의 게놈 환경을 도시한다. 도 4A는 MG36-5 CAST 시스템이 CRISPR 어레이(CRISPR 반복부), RuvC 및 HNH 엔도뉴클레아제 도메인을 가진 타입 II 뉴클레아제, 및 4개의 예측된 전위효소 단백질 오픈 리딩 프레임으로 구성됨을 보여준다. 촉매 전위효소 TnsB는 2개의 서브유닛으로서 코딩된다. 도 4B는 MG36-1 CAST 시스템에 대해 2개의 트랜스포존 말단(TIR-1 및 TIR-2)이 예측됨을 보여준다. 도 4C는 주석이 달린 반복부가 화살표로 표시되어 있는, 예측된 타입 II Tn7 환원 CAST 트랜스포존 좌측 말단(LE) 및 우측 말단(RE) 서열의 정렬을 보여준다. 좌측 말단 및 우측 말단은 이들의 배향으로 표지부착되었다.
도 5는 패밀리 MG39의 타입 V Tn7 CAST의 게놈 환경을 보여준다. 도 5A는 MG39-1 CAST 시스템이 타입 V 뉴클레아제, 4개의 예측된 트랜스포존 단백질(TnsABC 및 TniQ) 및 CRISPR 어레이로 구성됨을 보여준다. MG39-1 CAST 시스템(TIR-1)에 대해 트랜스포존 말단이 예측되었다. 도 5B는 주석이 달린 역반복부가 화살표로 표시되어 있는, 예측된 타입 V Tn7 CAST 트랜스포존 좌측 말단(LE) 및 우측 말단(RE) 서열의 정렬을 보여준다.
도 6 및 도 7은 본원에 기재된 CAST 시스템의 상응하는 sgRNA의 예측된 구조(예를 들어, 실시예 3에서 예측됨)를 도시한다.
도 8은 본원에 기재된 시스템인 MG108-1의 게놈 환경을 도시한다. 이 후보는 천연적으로 TniQ를 결여하는 Cas12K CAST이다. 게놈 단편 내의 유전자는 화살표로 표시되어 있다.
도 9는 Cas12k 이펙터 서열의 계통발생학적 유전자 트리(tree)를 도시한다. 이 트리는 여기서 회수된 64개의 Cas12k 서열(주황색 및 흑색 분지)과 공개 데이터베이스로부터의 229개의 기준 Cas12k 서열(회색 분지)의 다중 서열 정렬로부터 유추되었다. 주황색 분지는 CAST 트랜스포존 구성요소와의 연관성이 확인된 Cas12k 이펙터를 표시한다.
도 10은 MG110 캐스케이드 CAST를 도시한다. A) MG110-1 캐스케이드 CAST의 게놈 환경. 완전한 Tn7 스위트(suite)(TnsA, TnsB, TnsC/TniB, TniQ) 및 결함 캐스케이드 스위트(Cas6, Cas7, 융합된 Cas5-Cas8)는 주황색 화살표로 표시되어 있다. CAST 트랜스포존을 플랭킹하는 TIR은 연결된 화살표로 표시되어 있다. B) 반복부 2차 구조는 crRNA의 스템-루프 구조를 표시한다. C) 아스퍼길루스 우다니스(A. wodanis), 비브리오 콜레라(V. cholerae)로부터의 CRISPR 반복부와 MG110 패밀리 CAST의 서열 정렬은 crRNA 스템-루프 2차 구조를 표시하는 보존된 모티프를 표시한다.
도 11a는 MG64-3 CRISPR 유전자좌를 도시한다. tracrRNA는 CRISPR 어레이로부터 업스트림에 코딩되어 있는 반면, 트랜스포존 말단은 다운스트림에 코딩되어 있다(내부 흑색 상자). 부분적 3' CRISPR 반복부 및 부분적 스페이서에 상응하는 서열은 트랜스포존 내부에 코딩되어 있다(바깥쪽 상자). 자가 일치 스페이서는 트랜스포존 말단의 외부에 코딩되어 있다. 도 11b는 본원에서 제공된 다양한 CAST에 대한 tracrRNA 서열 정렬을 도시한다. tracrRNA 서열의 정렬은 보존 영역을 보여준다. 구체적으로, 서열 위치 92 내지 98(상단 상자)에 있는 서열 "TGCTTTC"는 sgRNA 3 차 구조 및 crRNA와의 비-연속 반복부-항-반복부 페어링에 중요한 것으로 제안된다. 본 발명자들은 또한 위치 265 내지 278(하단 상자)에 있는 헤어핀 "CYCC(n6) GGRG"가 기능에 중요하며, 아마도 crRNA 페어링을 위한 다운스트림 서열을 위치시키는 데 중요하다고 제안한다. 도 11c는 예를 들어, MG64-2, MG64-4, MG64-5, MG64-6, MG64-7 및 MG108-1 패밀리에서 다른 중요한 반복부-항-반복부(RAR) 모티브의 존재를 보여준다.
도 12a는 MG64-2 sgRNA의 예측된 구조를 도시한다. 도 12b는 MG64-4 sgRNA의 예측된 구조를 도시한다. 도 12c는 MG64-6 sgRNA의 예측된 구조를 도시한다. 도 12d는 MG64-7 sgRNA의 예측된 구조를 도시한다. 도 12e는 MG108-1 sgRNA의 예측된 구조를 도시한다.
도 13은 MG64-6이 시험관내에서 활성을 나타냄을 입증하는 PCR, PAM 및 생거(Sanger) 시퀀싱 데이터를 도시한다. 시험관내 표적화된 인테그라제(integrase) 활성에 대해 기재된 프로토콜을 이용하여, 이펙터 단백질 및 이의 TnsB, TnsC 및 TniQ 단백질을 시험관내 전사/번역 시스템에서 발현시켰다. 번역 후, 표적 DNA, 카고 DNA 및 sgRNA를 반응 완충제에 첨가하였다. 표적/기증자(donor) 연접부 전체에 걸쳐 PCR로 통합을 어세이하였다. 도 13a는 apo(sgRNA 없음), 및 sgRNA 64-6 sgRNA를 가진 64-6을 보여주는 전위의 PCR의 겔 이미지를 도시한다. PCR 3은 PAM으로부터 먼 RE 연접부를 검출한다. PCR 4는 PAM으로부터 먼 LE 연접부이다. PCR 5는 PAM에 가까운 RE 연접부이다. PCR 6은 PAM에 가까운 LE 연접부이다. PCR은 상이한 가능한 배향에 걸쳐 페어링된다(PCR 3 및 6 대 PCR 4 및 5). LE-PAM 근위 및 RE-PAM 원위 배향이 바람직하다. 도 13b는 시험관내 전위 어세이, 시퀀싱 PCR 5 및 6으로부터의 PAM을 도시한다. 도 13c는 기증자 DNA에서 절제가 일어나는 전위의 연접부를 보여주는 생거 데이터를 도시한다. 첫 번째 패널은 PCR 3 및 5(RE)를 보여준다. 두 번째 패널은 PCR 4 및 6(LE)을 보여준다. 생거 시퀀싱 반응은 기증자-표적 생성물의 생거 시퀀싱 반응이므로, 시퀀싱이 기증자 DNA와 일치하지 않는 시점은 연접이 일어나는 때이다(시퀀싱 피크 아래의 어두운 막대).
도 14는 삽입 부위 선호도를 보여주는, 시험관내 전위 생성물의 차세대 시퀀싱(NGS) 결과를 도시한다. NGS 리드는 위치 60에서 전위를 가진 기준 서열에 비해 CRISPResso2에서 프로세싱되었다. 이것으로부터의 삽입결실(Indel)은 이 임의 기준 서열보다 더 빠르거나 더 늦은 전위에 상응한다.
도 15는 64-2 TnsB 및 이의 RE DNA 서열의 전기영동 이동성 변위 어세이(EMSA) 결과를 도시한다. EMSA 결과는 결합 및 TnsB 인식을 확인시켜준다. TnsB 단백질을 시험관내 전사/번역 시스템에서 발현시키고, RE 서열을 함유하는 FAM 표지부착된 DNA와 함께 인큐베이션한 다음, 천연 5% TBE 겔에서 분리하였다. 결합은 표지부착된 밴드에서 상향변위로서 관찰된다. 다수의 TnsB 결합 부위는 EMSA에서 다수의 변위로 이어진다. 레인 1: FAM 표지부착된 DNA 단독. 레인 2: FAM DNA와 시험관내 전사/번역 시스템(TnsB 단백질 없음). 레인 3: FAM DNA와 TnsB. 레인 3에서 표지부착된 밴드의 상향변위는 TnsB에 의한 RE 서열의 결합을 표시하고, 이는 이 밴드가 활성 RE 전위 서열을 함유함을 표시한다.
서열목록의 간단한 설명
본원과 함께 출원된 서열목록은 본 개시내용에 따른 방법, 조성물 및 시스템에 사용하기 위한 예시적인 폴리뉴클레오타이드 및 폴리펩티드 서열을 제공한다. 서열목록 내의 서열의 예시적인 설명은 이하에 제공된다.
MG36
서열번호 1은 MG36 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 2 내지 5는 MG36 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG36 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -B1, -B2, -T1 및 -C의 추가는 각각 Tn7 유사 시스템의 TnsB1, TnsB2, TnsT1 및 TniC 단백질과의 유사성을 표시한다.
서열번호 11은 MG36 Cas 이펙터와 함께 작용하도록 조작된 sgRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 12는 MG36 Cas 이펙터와 동일한 유전자좌로부터 유래한 MG36 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 17 및 18은 MG36 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 19는 MG36 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG39
서열번호 6은 MG39-1 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 7 내지 10은 MG39-1 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG39-1 전위 단백질의 펩티드 서열을 보여준다.
서열번호 13 내지 16은 MG39 Cas 이펙터와 동일한 유전자좌로부터 유래한 MG39 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 20은 MG39 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 21은 MG39 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG64
서열번호 22, 26, 30, 34, 55 내지 89, 104 및 147은 MG64 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107, 및 148 내지 150은 MG64 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG64 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 90 내지 93, 117, 151, 156 내지 181, 및 209 내지 234는 MG64 이펙터와 동일한 유전자좌로부터 유래한 MG64 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 94 내지 97, 119, 152, 및 184 내지 200은 MG64 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 237 내지 259는 MG64 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 111 내지 114 및 201 내지 204는 MG64 Cas 이펙터와 함께 작용하도록 조작된 단일 가이드 RNA의 뉴클레오타이드 서열을 보여준다.
서열번호 123, 125, 127, 129, 131, 133 및 153은 MG64 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 124, 126, 128, 130, 132, 154 및 155는 MG64 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG108
서열번호 38 및 108은 MG108 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 39, 40, 109 및 110은 MG108 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG108 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 98 및 120은 MG108 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 260 및 261은 MG108 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 115, 116, 205 및 206은 MG108 Cas 이펙터와 함께 작용하도록 조작된 단일 가이드 RNA의 뉴클레오타이드 서열을 보여준다.
서열번호 118, 182, 183, 235 및 236은 MG108 이펙터와 동일한 유전자좌로부터 유래한 MG108 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 134는 MG108 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 135는 MG108 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG110
서열번호 41 내지 43 및 48 내지 50은 MG110 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다. 표지 말단에의 -6, -7 및 -8의 추가는 각각 클래스 I 타입 I-F 시스템의 cas6, cas7 및 cas8 단백질과의 유사성을 표시한다.
서열번호 44 내지 47 및 51 내지 54는 MG110 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG110 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 99 및 100은 MG110 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 121, 122, 207 및 208은 MG110 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 136 및 138은 MG110 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 137 및 139는 MG110 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
다른 서열
서열번호 140 및 141은 핵 국소화 신호의 펩티드 서열을 보여준다.
서열번호 142 및 143은 링커의 펩티드 서열을 보여준다.
서열번호 144 내지 146은 에피토프 태그의 펩티드 서열을 보여준다.
본 발명의 다양한 실시양태가 본원에 제시되고 기재되었지만, 이러한 실시양태가 단지 예시로서만 제공된다는 것은 당분야에서 숙련된 자에게 자명할 것이다. 본 발명을 벗어나지 않으면서 수많은 변경, 변화 및 치환이 당분야에서 숙련된 자에게 인식될 수 있다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있다는 것을 이해해야 한다.
달리 표시되지 않는 한, 본원에 개시된 일부 방법의 실시는 면역학, 생화학, 화학, 분자생물학, 미생물학, 세포생물학, 유전체학 및 재조합 DNA의 기법을 이용한다. 예를 들어, 문헌[Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))](이들은 전체적으로 본원에 참고로 포함됨)을 참조한다.
본원에서 사용된 바와 같이, 문맥이 달리 명시하지 않는 한, 단수 형태는 복수 형태도 포함하기 위한 것이다. 더욱이, 용어 "포함하는", "포함한다", "가진", "가진다", "와 함께" 또는 이들의 파생어가 상세한 설명 및/또는 청구범위에서 사용되는 범위에서, 이러한 용어들은 용어 "포함하는"과 유사한 방식으로 포괄하기 위한 것이다.
용어 "약" 또는 "대략"은 부분적으로 값이 측정되거나 결정되는 방법, 즉 측정 시스템의 한계에 의해 좌우될 수 있는, 당분야에서 통상의 기술을 가진 자에 의해 결정된 특정 값에 대한 허용되는 오차 범위 내에 있음을 의미한다. 예를 들어, "약"은 당분야의 관행에 따라 하나 또는 하나 초과의 표준 편차 이내에 있음을 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 15%, 최대 10%, 최대 5% 또는 최대 1%의 범위를 의미할 수 있다.
본원에서 사용된 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본 구조적, 기능적 및/또는 생물학적 유닛일 수 있다. 세포는 하나 이상의 세포를 가진 임의의 유기체로부터 유래할 수 있다. 일부 비제한적 예는 원핵세포, 진핵세포, 박테리아 세포, 고세균 세포, 단세포 진핵생물 유기체의 세포, 원생동물 세포, 식물의 세포(예를 들어, 식물 작물, 과일, 채소, 곡물, 대두, 옥수수, 수수, 밀, 종자, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 목화, 대마초, 담배, 개화 식물, 침엽수, 겉씨식물, 양치류, 클럽모스, 뿔풀, 간풀, 이끼), 조류 세포(예를 들어, 보트리오코커스 브라우니(Botryococcus braunii), 클라미도모나스 레인하르티(Chlamydomonas reinhardtii), 난노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가섬 파텐스 씨. 아가드(Sargassum patens C. Agardh) 등), 해조류(예를 들어, 다시마), 진균 세포(예를 들어, 효모 세포, 버섯의 세포), 동물 세포, 무척추 동물의 세포(예를 들어, 초파리, 자포동물, 극피동물, 선충 등), 척추 동물의 세포(예를 들어, 어류, 양서류, 파충류, 조류, 포유류), 포유류(예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 비인간 영장류, 인간 등)의 세포 등을 포함한다. 종종 세포는 천연 유기체로부터 유래하지 않는다(예를 들어, 세포는 합성에 의해 만들어질 수 있고 종종 인공 세포로서 지칭된다).
본원에서 사용된 바와 같이, 용어 "뉴클레오타이드"는 일반적으로 염기-당-포스페이트 조합을 의미한다. 뉴클레오타이드는 합성 뉴클레오타이드를 포함할 수 있다. 뉴클레오타이드는 합성 뉴클레오타이드 유사체를 포함할 수 있다. 뉴클레오타이드는 핵산 서열(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))의 단량체 유닛일 수 있다. 용어 뉴클레오타이드는 리보뉴클레오사이드 트리포스페이트 아데노신 트리포스페이트(ATP), 우리딘 트리포스페이트(UTP), 사이토신 트리포스페이트(CTP), 구아노신 트리포스페이트(GTP) 및 데옥시리보뉴클레오사이드 트리포스페이트, 예컨대, dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이를 함유하는 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오타이드 유도체를 포함할 수 있다. 본원에서 사용된 용어 뉴클레오타이드는 디데옥시리보뉴클레오사이드 트리포스페이트(ddNTP) 및 이의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오사이드 트리포스페이트의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP 및 ddTTP를 포함될 수 있으나 이들로 제한되지 않는다. 뉴클레오타이드는 표지부착되지 않을 수 있거나, 예컨대, 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)를 포함하는 모이어티를 사용함으로써 검출 가능하게 표지부착될 수 있다. 표지부착은 양자 점을 사용함으로써 수행될 수도 있다. 검출 가능한 표지는 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생체발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오타이드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'-디메틸아미노페닐아조)벤조산(DABCYL), 캐스케이드 블루(Cascade Blue), 오레곤 그린(Oregon Green), 텍사스 레드(Texas Red), 시아닌(Cyanine) 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있으나 이들로 제한되지 않는다. 형광 표지부착된 뉴클레오타이드의 구체적인 예는 퍼킨 엘머(Perkin Elmer)(캘리포니아주 포스터 시티 소재)로부터 입수될 수 있는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP 및 [dROX]ddTTP; 아머샴(Amersham)(일리노이주 알링턴 하이츠 소재)으로부터 입수될 수 있는 플루오로링크(FluoroLink) 데옥시뉴클레오타이드인 플루오로링크 Cy3-dCTP, 플루오로링크 Cy5-dCTP, 플루오로링크 플루오르 X-dCTP, 플루오로링크 Cy3-dUTP 및 플루오로링크 Cy5-dUTP; 뵈링거 만하임(Boehringer Mannheim)(인디애나주 인디애나폴리스 소재)으로부터 입수될 수 있는 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP 및 플루오레세인-15-2'-dATP; 및 몰레큘라 프로브스(Molecular Probes)(오레곤주 유진 소재)로부터 입수될 수 있는 염색체 표지부착된 뉴클레오타이드인 BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP 및 텍사스 레드-12-dUTP를 포함할 수 있다. 뉴클레오타이드는 화학적 변형에 의해 표지부착될 수 있거나 표시될 수도 있다. 화학적으로 변형된 단일 뉴클레오타이드는 바이오틴-dNTP일 수 있다. 바이오티닐화된 dNTP의 일부 비제한적 예는 바이오틴-dATP(예를 들어, 바이오-N6-ddATP, 바이오틴-14-dATP), 바이오틴-dCTP(예를 들어, 바이오틴-11-dCTP, 바이오틴-14-dCTP), 및 바이오틴-dUTP(예를 들어, 바이오틴-11-dUTP, 바이오틴-16-dUTP, 바이오틴-20-dUTP)를 포함할 수 있다.
용어 "폴리뉴클레오타이드", "올리고뉴클레오타이드" 및 "핵산"은 일반적으로 단일, 이중 또는 다중 가닥 형태로 존재하는, 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드인 임의의 길이의 뉴클레오타이드 또는 이의 유사체의 중합체 형태를 지칭하기 위해 상호교환 가능하게 사용된다. 폴리뉴클레오타이드는 세포에 대한 외생성 또는 내생성 폴리뉴클레오타이드일 수 있다. 폴리뉴클레오타이드는 무세포 환경에 존재할 수 있다. 폴리뉴클레오타이드는 유전자 또는 이의 단편일 수 있다. 폴리뉴클레오타이드는 DNA일 수 있다. 폴리뉴클레오타이드는 RNA일 수 있다. 폴리뉴클레오타이드는 임의의 3차원 구조를 가질 수 있고 임의의 기능을 수행할 수 있다. 폴리뉴클레오타이드는 하나 이상의 유사체(예를 들면, 변경된 골격, 당 또는 핵염기)를 포함할 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 중합체의 어셈블리 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적 예는 5-브로모우라실, 펩티드 핵산, 제노(xeno) 핵산, 모르폴리노, 잠긴 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오타이드, 코르디셉핀(cordycepin), 7-데아자-GTP, 형광단(예를 들면, 당에 연결된 로다민 또는 플루오레세인), 티올 함유 뉴클레오타이드, 바이오틴 연결된 뉴클레오타이드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오타이드, 이노신, 티오우리딘, 슈도우리딘, 디하이드로우리딘, 퀴오신 및 와이오신을 포함한다. 폴리뉴클레오타이드의 비제한적 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연관 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보좀 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지된 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오타이드, 핵산 프로브, 및 프라이머를 포함한다. 뉴클레오타이드의 서열은 비-뉴클레오타이드 구성요소에 의해 불연속될 수 있다.
용어 "형질감염" 또는 "형질감염된"은 일반적으로 핵산이 비-바이러스 또는 바이러스 기반 방법에 의해 세포에 도입되는 것을 의미한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 코딩하는 유전자 서열일 수 있다. 예를 들면, 문헌[Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88]을 참조한다.
용어 "펩티드", "폴리펩티드" 및 "단백질"은 일반적으로 펩티드 결합(들)에 의해 연결된 적어도 2개의 아미노산 잔기로 이루어진 중합체를 지칭하기 위해 본원에서 상호교환 가능하게 사용된다. 이 용어들은 특정 길이의 중합체를 의미하지 않으며, 펩티드가 재조합 기법, 화학적 또는 효소적 합성을 이용함으로써 생성되는지 아니면 천연적으로 생성되는지를 암시하거나 구분하기 위한 것도 아니다. 상기 용어들은 천연 생성 아미노산 중합체뿐만 아니라, 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 경우, 중합체는 비-아미노산에 의해 불연속될 수 있다. 상기 용어들은 전체 길이 단백질, 및 2차 및/또는 3차 구조(예를 들어, 도메인)을 갖거나 갖지 않은 단백질을 비롯한 임의의 길이의 아미노산 쇄를 포함한다. 상기 용어들은 예를 들어, 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 산화 및 임의의 다른 조작, 예컨대, 표지부착 구성요소와의 접합에 의해 변형된 아미노산 중합체도 포괄한다. 본원에서 사용된 바와 같이, 용어 "아미노산" 및 "아미노산들"은 일반적으로 변형된 아미노산 및 아미노산 유사체를 포함하나 이들로 제한되지 않는 천연 아미노산 및 비천연 아미노산을 지칭한다. 변형된 아미노산은 천연 아미노산, 및 아미노산에 천연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 비천연 아미노산을 포함할 수 있다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산 및 L-아미노산 둘 다를 포함한다.
본원에서 사용된 바와 같이, "비천연"은 일반적으로 천연 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비천연은 친화성 태그를 지칭할 수 있다. 비천연은 융합을 지칭할 수 있다. 비천연은 돌연변이, 삽입 및/또는 결실을 포함하는 천연 생성 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비천연 서열은 비천연 서열에 융합되어 있는 핵산 및/또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낼 수 있고/있거나 코딩할 수 있다. 비천연 핵산 또는 폴리펩티드 서열은 키메라 핵산 및/또는 폴리펩티드를 코딩하는 키메라 핵산 및/또는 폴리펩티드 서열을 생성하기 위해 유전적 조작에 의해 천연 생성 핵산 또는 폴리펩티드 서열(또는 이의 변이체)에 연결될 수 있다.
본원에서 사용된 바와 같이, 용어 "프로모터"는 일반적으로 유전자의 전사 또는 발현을 조절하고 RNA 전사가 시작되는 뉴클레오타이드 또는 뉴클레오타이드 영역에 인접하거나 중첩되어 위치할 수 있는 조절 DNA 영역을 지칭한다. 프로모터는 유전자 전사로 이어지는, RNA 중합효소와 DNA의 결합을 용이하게 하는, 종종 전사 인자로서도 지칭되는 단백질 인자에 결합하는 특정 DNA 서열을 함유할 수 있다. '코어 프로모터'로서도 지칭되는 '기본 프로모터'는 일반적으로 작동 가능하게 연결된 폴리뉴클레오타이드의 전사 발현을 촉진하는 데 필요한 모든 기본 요소들을 함유하는 프로모터를 지칭할 수 있다. 진핵생물 기본 프로모터는 전형적으로 TATA 박스 및/또는 CAAT 박스를 함유하지만, 반드시 함유하지는 않는다.
본원에서 사용된 바와 같이, 용어 "발현"은 일반적으로 핵산 서열 또는 폴리뉴클레오타이드가 DNA 주형으로부터 (예를 들어, mRNA 또는 다른 RNA 전사체로) 전사되는 과정, 및/또는 전사된 mRNA가 펩티드, 폴리펩티드 또는 단백질로 후속 번역되는 과정을 지칭한다. 전사체 및 코딩된 폴리펩티드는 "유전자 생성물"로서 통칭될 수 있다. 폴리뉴클레오타이드가 게놈 DNA로부터 유래한 경우, 발현은 진핵 세포에서의 mRNA의 스플라이싱을 포함할 수 있다.
본원에서 사용된 바와 같이, "작동 가능하게 연결된", "작동 가능한 연결", "작동 가능하게 연결되어 있는" 또는 이들의 문법적으로 동등한 표현은 일반적으로 유전적 요소, 예를 들어, 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 지칭하고, 이때 상기 요소들은 이들이 예상된 방식으로 작동할 수 있게 하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소는, 조절 요소가 코딩 서열의 전사를 시작하는 데 도움이 되는 경우, 코딩 영역에 작동 가능하게 연결되어 있다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재 잔기가 있을 수 있다.
본원에서 사용된 바와 같이, "벡터"는 일반적으로 폴리뉴클레오타이드를 포함하거나 폴리뉴클레오타이드와 회합하고 세포로의 폴리뉴클레오타이드의 전달을 매개하는 데 사용될 수 있는 거대분자 또는 거대분자의 회합을 의미한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포좀 및 다른 유전자 전달 비히클을 포함한다. 벡터는 일반적으로 표적에서 유전자의 발현을 용이하게 하기 위해 유전자에 작동 가능하게 연결된 유전적 요소, 예를 들어, 조절 요소를 포함한다.
본원에서 사용된 바와 같이, "발현 카세트" 및 "핵산 카세트"는 일반적으로 함께 발현되거나 발현을 위해 작동 가능하게 연결되어 있는 핵산 서열 또는 요소의 조합을 지칭하기 위해 상호교환 가능하게 사용된다. 일부 경우, 발현 카세트는 조절 요소와, 발현을 위해 이 조절 요소에 작동 가능하게 연결되어 있는 유전자 또는 유전자들의 조합을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 일반적으로 전체 길이 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적(기능적 또는 구조적) 활성을 보유하는 단편을 지칭한다. DNA 서열의 생물학적 활성은 전체 길이 서열에 기인하는 것으로 알려져 있는 방식으로 발현에 영향을 미치는 그의 능력일 수 있다.
본원에서 사용된 바와 같이, "조작된" 객체는 일반적으로 객체가 인간 개입에 의해 변형되었음을 표시한다. 비제한적 예에 따르면, 핵산은 그의 서열을 자연계에 존재하지 않는 서열로 변경함으로써 변형될 수 있고; 핵산은 라이게이션된 생성물이 원래 핵산에 존재하지 않는 기능을 갖도록 핵산을 자연계에서 그와 연관되어 있지 않은 핵산에 라이게이션시킴으로써 변형될 수 있고; 조작된 핵산은 자연계에 존재하지 않는 서열을 사용함으로써 시험관내에서 합성될 수 있고; 단백질은 그의 아미노산 서열을 자연계에 존재하지 않는 서열로 변경함으로써 변형될 수 있으며; 조작된 단백질은 새로운 기능 또는 성질을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에서 사용된 바와 같이, "합성" 및 "인공"은 천연 생성 인간 단백질에 대해 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 가진 단백질 또는 이의 도메인을 지칭하기 위해 상호교환 가능하게 사용된다. 예를 들어, VPR 및 VP64 도메인은 합성 트랜스활성화 도메인이다.
본원에서 사용된 바와 같이, 용어 "tracrRNA" 또는 "tracr 서열"은 일반적으로 야생형 예시적인 tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스(S. pyogenes), 스타필로코커스 아우레우스(S. aureus) 등으로부터의 tracrRNA 또는 서열번호 *_*)에 대해 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성 및/또는 서열 유사성을 가진 핵산을 지칭할 수 있다. tracrRNA는 야생형 예시적인 tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 등으로부터의 tracrRNA)에 대해 최대 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 서열 동일성 및/또는 서열 유사성을 가진 핵산을 지칭할 수 있다. tracrRNA는 뉴클레오타이드 변화, 예컨대, 결실, 삽입 또는 치환, 변이체, 돌연변이 또는 키메라를 포함할 수 있는 변형된 형태의 tracrRNA를 지칭할 수 있다. tracrRNA는 적어도 6개의 연속 뉴클레오타이드의 스트레치에 걸쳐 야생형 예시적인 tracrRNA(예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 등으로부터의 tracrRNA) 서열과 적어도 약 60% 동일할 수 있는 핵산을 지칭할 수 있다. 예를 들어, tracrRNA 서열은 적어도 6개의 연속 뉴클레오타이드의 스트레치에 걸쳐 야생형 예시적인 tracrRNA(예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 등으로부터의 tracrRNA) 서열과 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일 또는 100% 동일할 수 있다. 인접한 CRISPR 어레이에서 반복부 서열의 일부에 대해 상보성을 가진 영역을 식별함으로써 게놈 서열에서 타입 II tracrRNA 서열을 예측할 수 있다.
본원에서 사용된 바와 같이, "가이드 핵산"은 일반적으로 또 다른 핵산에 하이브리드화할 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 핵산 부위 서열에 특이적으로 결합하도록 프로그래밍될 수 있다. 표적화될 핵산 또는 표적 핵산은 뉴클레오타이드를 포함할 수 있다. 가이드 핵산은 뉴클레오타이드를 포함할 수 있다. 표적 핵산의 일부는 가이드 핵산의 일부에 상보적일 수 있다. 가이드 핵산에 상보적이고 하이브리드화하는 이중 가닥 표적 폴리뉴클레오타이드의 가닥은 상보적 가닥으로서 지칭될 수 있다. 상보적 가닥에 상보적이므로 가이드 핵산에 상보적이지 않을 수 있는 이중 가닥 표적 폴리뉴클레오타이드의 가닥은 비상보적 가닥으로서 지칭될 수 있다. 가이드 핵산은 폴리뉴클레오타이드 쇄를 포함할 수 있으며 "단일 가이드 핵산"으로서 지칭될 수 있다. 가이드 핵산은 2개의 폴리뉴클레오타이드 쇄를 포함될 수 있고 "이중 가이드 핵산"으로서 지칭될 수 있다. 달리 특정되지 않는 한, 용어 "가이드 핵산"은 단일 가이드 핵산 및 이중 가이드 핵산 둘 다를 지칭하는 포괄적인 용어일 수 있다. 가이드 핵산은 "핵산 표적화 분절" 또는 "핵산 표적화 서열"로서 지칭될 수 있는 분절을 포함할 수 있다. 핵산 표적화 분절은 "단백질 결합 분절" 또는 "단백질 결합 서열" 또는 "Cas 단백질 결합 분절"로서 지칭될 수 있는 하위분절을 포함할 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 용어 "서열 동일성" 또는 "퍼센트 동일성"은 일반적으로 서열 비교 알고리즘을 사용하여 측정하였을 때 국소 또는 전체 비교 윈도우에 걸쳐 최대 상응에 대해 비교되고 정렬될 때, 동일하거나 특정된 퍼센트의 동일한 아미노산 잔기 또는 뉴클레오타이드를 가진 2개의(예를 들어, 쌍별 정렬) 또는 더 많은(예를 들어, 다중 서열 정렬) 서열을 의미한다. 폴리펩티드 서열에 적합한 서열 비교 알고리즘은 예를 들어, 30개 잔기보다 더 긴 폴리펩티드 서열에 대해 3의 단어길이(W), 10의 기대치(E), 및 갭 비용을 11의 존재 및 1의 연장으로 설정하는 BLOSUM62 점수화 매트릭스를 파라미터로서 사용하고 조건부 구성 점수 매트릭스 조절을 이용하는 BLASTP; 30개 잔기 미만의 서열에 대해 2의 단어길이(W), 1000000의 기대치(E), 및 갭 비용을 갭 개방에 대해 9 및 갭 연장에 대해 1로 설정하는 PAM30 점수화 매트릭스를 사용하는 BLASTP(이들은 https://blast.ncbi.nlm.nih.gov에서 입수될 수 있는 BLAST 스위트의 BLASTP에 대한 디폴트 파라미터임); 파라미터를 사용하는 CLUSTALW; 2의 일치, -1의 불일치 및 -1의 갭을 파라미터로서 사용하는 스위스-워터만(Smith-Waterman) 상동성 검색 알고리즘; 디폴트 파라미터를 사용하는 MUSCLE; 2의 리트리(retree) 및 1000의 최대화(maxiteration)를 파라미터로서 사용하는 MAFFT; 디폴트 파라미터를 사용하는 Novafold; 디폴트 파라미터를 사용하는 HMMER hmmalign을 포함한다.
본 개시내용은 하나 이상의 보존적 아미노산 치환을 가진, 본원에 기재된 효소들 중 임의의 효소의 변이체를 포함한다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 파괴하지 않으면서 폴리펩티드의 아미노산 서열에서 만들어질 수 있다. 보존적 치환은 유사한 소수성, 극성 및 R 쇄 길이를 가진 아미노산들을 서로 치환함으로써 달성될 수 있다. 추가로 또는 대안적으로, 상이한 종으로부터의 정렬된 상동성 단백질 서열들을 비교함으로써, 코딩된 단백질의 기본 기능을 변경하지 않으면서 종 사이에 돌연변이된 아미노산 잔기(예를 들어, 보존되지 않은 잔기)를 찾아냄으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기재된 시스템들 중 어느 하나(예를 들어, 본원에 기재된 MG36 또는 MG39 시스템)에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 변이체를 포함할 수 있다. 일부 실시양태에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 엔도뉴클레아제의 중요 활성 부위 잔기의 활성이 파괴되지 않도록 치환된 서열을 포함할 수 있다. 일부 실시양태에서, 본원에 기재된 시스템들 중 임의의 시스템의 기능적 변이체는 도 4 및 도 5에 표시된 보존된 또는 기능적 잔기들 중 적어도 하나의 치환을 결여한다. 일부 실시양태에서, 본원에 기재된 시스템들 중 임의의 시스템의 기능적 변이체는 도 4 및 도 5에 표시된 모든 보존된 또는 기능적 잔기들의 치환을 결여한다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참고문헌들(예를 들어, 문헌[Creighton, Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2nd Edition (December1993))] 참조)로부터 입수될 수 있다. 하기 8개의 군은 서로에 대해 보존적 치환인 아미노산을 각각 함유한다:
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 라이신(K);
5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M).
본원에서 사용된 바와 같이, 용어 "RuvC_III 도메인"은 일반적으로 RuvC 엔도뉴클레아제 도메인의 세 번째 불연속 분절을 지칭한다(RuvC 뉴클레아제 도메인은 3개의 불연속 분절인 RuvC_I, RuvC_II 및 RuvC_III으로 구성된다). RuvC 도메인 또는 이의 분절은 일반적으로 알려져 있는 도메인 서열과의 정렬, 주석이 달린 도메인을 가진 단백질과의 구조적 정렬, 또는 알려져 있는 도메인 서열을 기반으로 구축된 히든 마르코브 모델(Hidden Markov Model)(HMM)(예를 들어, RuvC_III의 경우 Pfam HMM PF18541)과의 비교에 의해 식별될 수 있다.
본원에서 사용된 바와 같이, 용어 "HNH 도메인"은 일반적으로 특징적인 히스티딘 및 아스파라긴 잔기를 가진 엔도뉴클레아제 도메인을 지칭한다. HNH 도메인은 일반적으로 알려져 있는 도메인 서열과의 정렬, 주석이 달린 도메인을 가진 단백질과의 구조적 정렬, 또는 알려져 있는 도메인 서열을 기반으로 구축된 히든 마르코브 모델(HMM)(예를 들어, 도메인 HNH의 경우 Pfam HMM PF01844)과의 비교에 의해 식별될 수 있다.
본원에서 사용된 바와 같이, 용어 "재조합효소"는 일반적으로 재조합효소 인식 서열들 사이에 DNA의 재조합을 매개하여, 재조합효소 인식 서열들 사이에 DNA 단편의 절제, 통합, 역위 또는 교환(예컨대, 전위)을 야기하는 부위 특이적 효소를 지칭한다.
본원에서 사용된 바와 같이, 핵산 변형(예를 들어, 게놈 변형)과 관련하여 용어 "재조합한다" 또는 "재조합"은 일반적으로 2개 이상의 핵산 분자, 또는 단일 핵산 분자의 2개 이상의 영역이 재조합효소 단백질의 작용에 의해 변형되는 과정을 지칭한다. 재조합은 특히, 하나 이상의 핵산 분자 내에서 또는 사이에 핵산 서열의 삽입, 역위, 절제 또는 전위를 야기할 수 있다.
본원에서 바와 같이, 용어 "트랜스포존"은 일반적으로 "카고 DNA"를 운반하면서 게놈 안팎으로 이동하는 이동성 요소를 지칭한다. 일부 경우, 이 트랜스포존은 전위될 핵산의 타입, 트랜스포존 말단에 있는 반복부의 타입, 운반될 카고의 타입 또는 전위 방식(즉, 자가 복구 또는 숙주 복구)에 따라 상이할 수 있다. 본원에서 사용된 바와 같이, 용어 "전위효소" 또는 "전위효소들"은 일반적으로 트랜스포존의 말단에 결합하여 이를 게놈의 또 다른 부분으로 이동시키는 것을 촉매하는 효소를 지칭한다. 일부 경우, 이동은 잘라내기 및 붙여넣기 기작 또는 복제적 전위에 의해 달성될 수 있다.
본원에서 사용된 바와 같이, 용어 "Tn7" 또는 "Tn7 유사 전위효소"는 일반적으로 3종의 주요 구성요소들, 즉 헤테로머성 전위효소(TnsA 및/또는 TnsB) 및 조절제 단백질(TnsC)을 포함하는 전위효소 패밀리를 지칭한다. Tn7 요소는 TnsABC 전위 단백질 외에도 전용 표적 부위 선택 단백질인 TnsD 및 TnsE를 코딩할 수 있다. 서열 특이적 DNA 결합 단백질인 TnsD는 TnsABC와 함께 "Tn7 부착 부위"로서 지칭되는 보존된 부위인 attTn7 내로의 전위를 유도한다. TnsD는 TniQ도 포함하는 큰 단백질 패밀리의 구성원이다. TniQ는 플라스미드의 분해 부위 내로의 전위를 표적화하는 것으로 밝혀졌다.
일부 경우, 본원에 기재된 CAST 시스템은 하나 이상의 Tn7 또는 Tn7 유사 전위효소를 포함할 수 있다. 특정 예시적인 실시양태에서, Tn7 또는 Tn7 유사 전위효소는 다량체성 단백질 복합체를 포함한다. 특정 예시적인 실시양태에서, 상기 다량체성 단백질 복합체는 TnsA, TnsB, TnsC 또는 TniQ를 포함한다. 이 조합에서, 전위효소(TnsA, TnsB, TnsC, TniQ)는 서로 복합체 또는 융합 단백질을 형성할 수 있다.
본원에서 사용된 바와 같이, 용어 "Cas12k"(대안적으로, "클래스 II 타입 V-K")는 일반적으로 뉴클레아제 활성에 결함이 있는 것으로 발견된 타입 V CRISPR 시스템의 서브타입을 지칭한다(예를 들어, 이들은 DNA 절단에 중요한 적어도 하나의 촉매 잔기를 결여하는 적어도 하나의 결함 RuvC 도메인을 포함할 수 있다). 이러한 서브타입의 이펙터는 일반적으로 CAST 시스템과 회합된다.
본원에서 사용된 바와 같이, 용어 "타입 I-F"(대안적으로, 클래스 I 타입 I-F CRISPR)는 일반적으로 클래스 I 타입 I CRISPR 시스템의 서브타입을 지칭한다. 이러한 시스템은 일반적으로 Cas8, Cas7 및 Cas6 단백질을 포함하는 다중구성요소 CRISPR 이펙터를 포함한다. 일부 경우, 이러한 시스템은 CAST 시스템과 회합된 상태로 발견된다. 일부 경우, 타입 I-F CRISPR 시스템은 Cas8 및/또는 Cas5 결합을 위한 8-nt 5' 핸들, 표적 인식을 위한 Cas7의 6개 카피에 의해 결합된 32-nt 스페이서, 또는 Cas6 결합 및 전구-crRNA 프로세싱을 위한 20-nt 3' 헤어핀을 포함하는 crRNA를 포함한다. 일부 경우, 타입 F 시스템은 표적 결합을 위해 비-표적 가닥의 5'-CC PAM을 이용한다.
개요
독특한 기능과 구조를 가진 새로운 Cas 효소의 발견은 데옥시리보핵산(DNA) 편집 기술을 더 혁신하여, 속도, 특이성, 기능 및 사용 편의성을 개선할 수 있는 잠재력을 제공할 수 있다. 미생물에서 클러스터링된 규칙적으로 이격된 짧은 팔린드로믹 반복부(CRISPR) 시스템의 예측된 보급률 및 미생물 종의 엄청난 다양성에 비해, 기능적으로 특징규명된 CRISPR/Cas 효소는 문헌에 비교적 적게 존재한다. 이것은 부분적으로는 수많은 미생물 종을 실험실 조건에서 쉽게 배양할 수 없기 때문이다. 수많은 미생물 종을 대표하는 천연 환경 니치(nich)로부터의 메타게놈 시퀀싱은 알려진 새로운 CRISPR/Cas 시스템의 수를 현저히 증가시키고 새로운 올리고뉴클레오타이드 편집 기능의 발견을 가속화할 수 있는 잠재력을 제공할 수 있다. 이러한 접근법의 결실을 보여주는 최근 사례는 2016년에 천연 미생물 군집의 메타게놈 분석으로부터 CasX/CasY CRISPR 시스템을 발견한 것에 의해 입증된다.
CRISPR/Cas 시스템은 미생물에서 적응 면역 시스템으로서 작용하는 것으로 기재된 RNA 유도 뉴클레아제 복합체이다. 그의 천연 환경에서, CRISPR/Cas 시스템은 일반적으로 2개의 부분, 즉 (i) RNA 기반 표적화 요소를 코딩하는, 동등하게 짧은 스페이서 서열에 의해 분리된 짧은 반복 서열(30 내지 40 bp)의 어레이, 및 (ii) 보조 단백질/효소와 함께 RNA 기반 표적화 요소에 의해 유도되는 뉴클레아제 폴리펩티드를 코딩하는 Cas를 코딩하는 ORF를 포함하는 CRISPR(클러스터링된 규칙적으로 이격된 짧은 팔린드로믹 반복부) 오페론 또는 유전자좌에서 생성된다. 특정 표적 핵산 서열의 효율적인 뉴클레아제 표적화는 일반적으로 (i) 표적(표적 시드)의 처음 6개 내지 8개의 핵산과 crRNA 가이드 사이의 상보적 하이브리드화; 및 (ii) 표적 시드의 정의된 근처 내부의 프로토스페이서 인접 모티브(PAM) 서열의 존재 둘 다를 요구한다(PAM은 일반적으로 숙주 게놈 내에서 통상적으로 나타나지 않는 서열이다). 시스템의 정확한 기능과 조직화에 따라, CRISPR-Cas 시스템은 통상적으로 공유된 기능적 특성 및 진화적 유사성을 기반으로 2개의 클래스, 5개의 타입 및 16개의 서브타입으로 분류된다(도 1 참조).
클래스 I CRISPR-Cas 시스템은 큰 다중서브유닛 이펙터 복합체를 갖고, 타입 I, III 및 IV를 포함한다.
타입 I CRISPR-Cas 시스템은 구성요소의 관점에서 중간 정도의 복잡성을 가진 것으로 간주된다. 타입 I CRISPR-Cas 시스템에서, RNA 표적화 요소들의 어레이는 반복부 요소에서 프로세싱되어 짧은 성숙 crRNA를 유리시키는 긴 전구체 crRNA(전구-crRNA)로서 전사되고, 이 짧은 성숙 crRNA는 프로토스페이서 인접 모티프(PAM)로서 지칭되는 적합한 짧은 컨센서스 서열이 핵산 표적을 뒤따를 때 뉴클레아제 복합체를 이 핵산 표적으로 향하게 한다. 이 프로세싱은 crRNA 유도 뉴클레아제 복합체의 뉴클레아제(Cas3) 단백질 구성요소도 포함하는, 캐스케이드(Cascade)로서 지칭되는 큰 엔도뉴클레아제 복합체의 엔도리보뉴클레아제 서브유닛(Cas6)을 통해 일어난다. Cas I 뉴클레아제는 주로 DNA 뉴클레아제로서 작용한다.
타입 III CRISPR 시스템은 Csm 또는 Cmr 단백질 서브유닛을 포함하는 반복부 관련 신비스러운 단백질(RAMP)과 함께 Cas10으로서 알려진 중심 뉴클레아제의 존재를 특징으로 할 수 있다. 타입 I 시스템에서와 마찬가지로, 성숙 crRNA는 Cas6 유사 효소를 사용함으로써 전구-crRNA로부터 프로세싱된다. 타입 I 및 II 시스템과 달리, 타입 III 시스템은 DNA-RNA 이중체를 표적화하고 절단하는 것으로 보인다(예컨대, DNA 가닥은 RNA 중합효소에 대한 주형으로서 사용된다).
타입 IV CRISPR-Cas 시스템은 고도로 환원된 큰 서브유닛 뉴클레아제(csf1), Cas5(csf3) 및 Cas7(csf2) 군의 RAMP 단백질에 대한 2개의 유전자, 및 일부 경우 예측된 작은 서브유닛에 대한 유전자로 구성된 이펙터 복합체를 갖고; 이러한 시스템은 내생성 플라스미드에서 통상적으로 발견된다.
클래스 II CRISPR-Cas 시스템은 일반적으로 단일 폴리펩티드 다중도메인 뉴클레아제 이펙터를 가지며, 타입 II, V 및 VI을 포함한다.
타입 II CRISPR-Cas 시스템은 구성요소의 관점에서 가장 단순한 것으로서 간주된다. 타입 II CRISPR-Cas 시스템에서, CRISPR 어레이를 성숙 crRNA로 프로세싱하는 것은 특별한 엔도뉴클레아제 서브유닛의 존재를 요구하는 것이 아니라, 어레이 반복부 서열에 상보적인 영역을 가진 작은 트랜스 코딩된 crRNA(tracrRNA)를 요구하고; tracrRNA는 그의 상응하는 이펙터 뉴클레아제(예를 들어, Cas9) 및 반복부 서열 둘 다와 상호작용하여 전구체 dsRNA 구조를 형성하고, 전구체 dsRNA 구조는 내생성 RNAse III에 의해 절단되어, tracrRNA 및 crRNA 둘 다가 로딩된 성숙 이펙터 효소를 생성한다. Cas II 뉴클레아제는 DNA 뉴클레아제로서 알려져 있다. 타입 2 이펙터는 일반적으로 RuvC 유사 뉴클레아제 도메인의 폴드(fold) 내에 삽입된 관련 없는 HNH 뉴클레아제 도메인과 함께 RNase H 폴드를 채택하는 RuvC 유사 엔도뉴클레아제 도메인으로 구성된 구조를 나타낸다. RuvC 유사 도메인은 표적(예를 들어, crRNA 상보적) DNA 가닥의 절단을 담당하는 반면, HNH 도메인은 이탈된 DNA 가닥의 절단을 담당한다.
타입 V CRISPR-Cas 시스템은 RuvC 유사 도메인을 포함하는 타입 II 이펙터와 유사한 뉴클레아제 이펙터(예를 들어, Cas12) 구조를 특징으로 한다. 타입 II와 유사하게, (모두는 아니지만) 대다수의 타입 V CRISPR 시스템은 tracrRNA를 사용하여 전구-crRNA를 성숙 crRNA로 프로세싱하나; 전구-crRNA를 다수의 crRNA로 절단하기 위해 RNAse III을 요구하는 타입 II 시스템과 달리, 타입 V 시스템은 이펙터 뉴클레아제 그 자체를 사용하여 전구-crRNA를 절단할 수 있다. 타입 II CRISPR-Cas 시스템처럼, 타입 V CRISPR-Cas 시스템은 DNA 뉴클레아제로서도 알려져 있다. 타입 II CRISPR-Cas 시스템과 달리, 일부 타입 V 효소(예를 들어, Cas12a)는 이중 가닥 표적 서열의 첫 번째 crRNA 유도 절단에 의해 활성화되는 강력한 단일 가닥 비특이적 데옥시리보뉴클레아제 활성을 가진 것으로 보인다.
타입 VI CRIPSR-Cas 시스템은 RNA 가이딩 RNA 엔도뉴클레아제를 가진다. 타입 VI 시스템의 단일 폴리펩티드 이펙터(예를 들어, Cas13)는 RuvC 유사 도메인 대신에 2개의 HEPN 리보뉴클레아제 도메인을 포함한다. 타입 II 및 타입 V 시스템과 달리, 타입 VI 시스템은 또한 전구-crRNA를 crRNA로 프로세싱하기 위해 tracrRNA를 필요로 하지 않는 것으로 보인다. 그러나, 타입 V 시스템과 유사하게, 일부 타입 VI 시스템(예를 들어, C2C2)은 표적 RNA의 첫 번째 crRNA 유도 절단에 의해 활성화되는 강력한 단일 가닥 비특이적 뉴클레아제(리보뉴클레아제) 활성을 가진 것으로 보인다.
클래스 II CRISPR-Cas는 그들의 더 단순한 구조로 인해 설계자 뉴클레아제/게놈 편집 애플리케이션으로서 조작 및 개발을 위해 가장 널리 채택되어 왔다.
시험관내 사용을 위한 이러한 시스템의 초기 개량 중 하나는 지넥 연구진(Jinek et al.)의 문헌(전체적으로 본원에 참고로 포함되는 문헌[Science. 2012 Aug 17;337(6096):816-21])에서 발견될 수 있다. 지넥 연구는 (i) 스트렙토코커스 피오게네스 SF370으로부터 단리된 재조합 발현 정제된 전체 길이 Cas9(예를 들어, 클래스 II 타입 II Cas 효소), (ii) 절단하고자 하는 표적 DNA 서열에 상보적인 약 20 nt 5' 서열에 이어 3' tracr 결합 서열을 가진 정제된 성숙 약 42 nt crRNA(전체 crRNA는 T7 프로모터 서열을 가진 합성 DNA 주형으로부터 시험관내 전사됨), (iii) T7 프로모터 서열을 가진 합성 DNA 주형으로부터 시험관내 전사된 정제된 tracrRNA, 및 (iv) Mg2+을 포함하는 시스템을 처음으로 기술하였다. 그 후, 지넥은 개선되고 조작된 시스템을 기술하였는데, 이 시스템에서 (ii)의 crRNA는 링커(예를 들어, GAAA)에 의해 (iii)의 5' 말단에 연결되어, Cas9를 스스로 표적으로 향하게 할 수 있는 단일 융합된 합성 가이드 RNA(sgRNA)를 형성한다(도 2의 상단과 하단 패널의 비교).
그 후, 말리 연구진(Mali et al.)(전체적으로 본원에 참고로 포함되는 문헌[Science. 2013 Feb 15; 339(6121): 823-826])은 (i) C-말단 핵 국소화 서열(예를 들어, SV40 NLS) 및 적합한 폴리아데닐화 신호(예를 들어, TK pA 신호)를 가진 적합한 포유류 프로모터 하에 코돈 최적화된 Cas9(예를 들어, 클래스 II 타입 II Cas 효소)를 코딩하는 ORF; 및 (ii) 적합한 중합효소 III 프로모터(예를 들어, U6 프로모터) 하에 sgRNA(G로 시작하는 5' 서열에 이어, 3' tracr 결합 서열에 연결된 20 nt의 상보적 표적화 핵산 서열, 링커 및 tracrRNA 서열을 가짐)를 코딩하는 ORF를 코딩하는 DNA 벡터를 제공함으로써 포유류 세포에서 사용하기 위해 이 시스템을 개량하였다.
트랜스포존은 게놈 내의 위치 사이에 이동할 수 있는 이동성 요소이다. 이러한 트랜스포존은 그가 숙주에 발휘하는 부정적인 영향을 제한하도록 진화해 왔다. 다양한 조절 기작을 이용하여 전위를 낮은 빈도로 유지하고 종종 전위를 다양한 세포 과정과 조화시킨다. 일부 원핵생물 트랜스포존은 숙주에 유익하거나 그 요소를 유지하는 데 도움이 되는 기능을 동원할 수도 있다. 특정 트랜스포존은 표적 부위 선택을 엄격하게 제어하는 기작을 진화시켰을 수도 있는데, 가장 주목할 만한 예는 Tn7 패밀리이다.
트랜스포존 Tn7 및 유사한 요소는 임상 환경에서 항생제 내성 및 발병 기능을 위한 저장소일 수 있을 뿐만 아니라, 천연 환경에서 다른 적응 기능을 코딩할 수도 있다. 예를 들어, Tn7 시스템은 중요한 숙주 유전자 내로 통합되는 것을 거의 완전히 피할 뿐만 아니라, 숙주 박테리아 사이에 Tn7을 이동시킬 수 있는 이동성 플라스미드 및 박테리오파지를 인식함으로써 상기 요소의 분산을 최대화하는 기작을 진화시켜 왔다.
박테리아 게놈 내의 단일 보존된 위치 내로의 삽입을 유도하는 하나의 경로 및 박테리아 사이에 요소를 전달할 수 있는 이동성 플라스미드 내로의 표적화를 최대화하도록 적응된 것으로 보이는 제2 경로를 보유하는 Tn7 및 Tn7 유사 요소는 이들이 삽입되는 위치와 시기를 제어할 수 있다(도 3 참조). Tn7 유사 트랜스포존과 CRISPR-Cas 시스템 사이의 연관성은 트랜스포존이 CRISPR 이펙터를 탈취하여 표적 부위에서 R-루프를 생성하고 플라스미드 및 파지를 통한 트랜스포존의 확산을 용이하게 하였을 수 있음을 암시한다.
MG36 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 제1 이중 가닥 핵산을 포함할 수 있다. 제1 이중 가닥 핵산은 카고 뉴클레오타이드 서열을 포함할 수 있으며, 이때 카고 뉴클레오타이드 서열은 재조합효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. 이 Cas 이펙터 복합체는 클래스 II 타입 II Cas 이펙터, 및 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 클래스 II 타입 II Cas 이펙터는 RuvC 도메인 및 HNH 도메인을 포함할 수 있다. 상기 시스템은 재조합효소 또는 전위효소 복합체를 포함할 수 있고, 이때 재조합효소 또는 전위효소 복합체는 카고 뉴클레오타이드 서열을 표적 핵산 부위로 끌어들이도록 구성된다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 Tn7 타입 전위효소 복합체이다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 II 타입 II Cas 이펙터는 서열번호 1 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 폴리펩티드를 포함한다. 일부 경우, 클래스 II 타입 II Cas 이펙터는 서열번호 1과 실질적으로 동일한 폴리펩티드를 포함한다.
일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 상기 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 4개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 4개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB1 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB1 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 3 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB2 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 3 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB2 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 4 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsT1 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 4 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsT1 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 5 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsC 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 5 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsC 폴리펩티드를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 11 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 19 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다.
일부 경우, 클래스 II 타입 II Cas 이펙터 및 재조합효소 또는 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 시스템을 발현시키거나 본원에 기재된 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
MG39 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 포함할 수 있다. 이 카고 뉴클레오타이드 서열은 Tn7 타입 전위효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. Cas 이펙터 복합체는 클래스 II 타입 V Cas 이펙터, 및 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 클래스 II 타입 V Cas 이펙터는 RuvC 도메인을 포함할 수 있다. 상기 시스템은 Cas 이펙터 복합체에 결합하도록 구성된 Tn7 타입 전위효소 복합체를 포함할 수 있으며, 이때 Tn7 타입 전위효소 복합체는 TnsA 서브유닛을 포함한다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 5 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 5 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, TnsA 서브유닛은 서열번호 7 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 경우, TnsA 서브유닛은 서열번호 7 또는 이의 변이체와 실질적으로 동일한 서열을 가진 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 7 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsA 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 7 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsA 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 9 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsC 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 9 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsC 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 10 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TniQ 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 10 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TniQ 폴리펩티드를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 20 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 좌측 재조합효소 서열은 서열번호 20 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 우측 재조합효소 서열은 서열번호 21 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 21 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 클래스 II 타입 V Cas 이펙터 및 Tn7 타입 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 시스템을 발현시키거나 본원에 기재된 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서, 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 Cas 이펙터 복합체와 접촉시키는 단계를 포함하는 방법을 제공한다. Cas 이펙터 복합체는 클래스 II 타입 II Cas 이펙터, 및 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 이 방법은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을, 카고 뉴클레오타이드를 표적 핵산 부위로 끌어들이도록 구성된 재조합효소 또는 전위효소 복합체와 접촉시키는 단계를 포함할 수 있다. 이 방법은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을, 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산과 접촉시키는 단계를 포함할 수 있다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, Cas 이펙터 복합체는 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다. 일부 경우, PAM 서열은 표적 핵산 부위의 5'에 위치한다.
MG64 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 포함할 수 있다. 이 카고 뉴클레오타이드 서열은 Tn7 타입 전위효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. Cas 이펙터 복합체는 클래스 II 타입 V Cas 이펙터, 및 표적 뉴클레오타이드 서열에 하이브리드화하록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 상기 시스템은 Cas 이펙터 복합체에 결합하도록 구성된 Tn7 타입 전위효소 복합체를 포함할 수 있다. 클래스 II 타입 V Cas 이펙터는 RuvC 도메인을 포함할 수 있다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다. 일부 경우, PAM 서열은 표적 핵산 부위의 5'에 위치한다. 일부 경우, PAM 서열은 5'-nGTn-3' 또는 5'-nGTt-3'을 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB, TnsC 및 TniQ 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB, TnsC 및 TniQ 폴리펩티드를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 204 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 204 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 125, 127, 123, 129, 131, 133, 153 또는 134 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 좌측 재조합효소 서열은 서열번호 125, 127, 123, 129, 131, 133, 153 또는 134 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 우측 재조합효소 서열은 서열번호 126, 155, 128, 124, 130, 132 또는 154 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 126, 155, 128, 124, 130, 132 또는 154 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 클래스 II 타입 V Cas 이펙터 및 Tn7 타입 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
MG108 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 포함할 수 있다. 이 카고 뉴클레오타이드 서열은 Tn7 타입 전위효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. Cas 이펙터 복합체는 클래스 II 타입 V Cas 이펙터, 및 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 클래스 II 타입 V Cas 이펙터는 RuvC 도메인을 포함할 수 있다. 상기 시스템은 Cas 이펙터 복합체에 결합하도록 구성된 Tn7 타입 전위효소 복합체를 포함할 수 있다. 일부 경우, Tn7 타입 전위효소 복합체는 TnsB 및 TnsC 구성요소를 포함하지만, TnsA 및/또는 TniQ 구성요소를 포함하지 않는다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다. 일부 경우, PAM 서열은 표적 핵산 부위의 5'에 위치한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 38 또는 서열번호 108, 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 38 또는 서열번호 108, 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 40 또는 109 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB 구성요소를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 40 또는 109 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB 구성요소를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39 또는 110 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsC 구성요소를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 39 또는 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsC 구성요소를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 각각 서열번호 40 및 39 또는 109 및 110, 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB 및 TnsC 구성요소를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 각각 서열번호 40 및 39 또는 109 및 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB 및 TnsC 구성요소를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 115, 116, 205 또는 206 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 115, 116, 205 또는 206 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 134 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 좌측 재조합효소 서열은 서열번호 134 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 우측 재조합효소 서열은 서열번호 135 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 135 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 클래스 II 타입 V Cas 이펙터 및 Tn7 타입 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
MG110 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 포함할 수 있다. 이 카고 뉴클레오타이드 서열은 Tn7 타입 전위효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. Cas 이펙터 복합체는 클래스 I 타입 I Cas 이펙터, 및 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 상기 시스템은 Cas 이펙터 복합체에 결합하도록 구성된 Tn7 타입 전위효소 복합체를 포함할 수 있다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 I 타입 I Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 I 타입 I Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, 클래스 I 타입 I Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 폴리펩티드를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 I 타입 I Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 I 타입 I Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 Cas6, Cas7 및 Cas8 이펙터를 포함한다. 일부 경우, 클래스 I 타입 I Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 Cas6, Cas7 및 Cas8 이펙터를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 4개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 4개의 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 각각 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsA, TnsB, TnsC 및 TniQ 구성요소를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 121, 122, 207 또는 208 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 121, 122, 207 또는 208 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 136 또는 138, 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 좌측 재조합효소 서열은 서열번호 136 또는 138, 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 우측 재조합효소 서열은 서열번호 137 또는 139, 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 137 또는 139, 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 클래스 I 타입 I Cas 이펙터 및 Tn7 타입 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 시스템을 발현시키거나 본원에 기재된 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
IUPAC 관례에 따라, 하기 약어가 실시예 전체에서 사용된다:
A = 아데닌
C = 사이토신
G = 구아닌
T = 타이민
R = 아데닌 또는 구아닌
Y = 사이토신 또는 타이민
S = 구아닌 또는 사이토신
W = 아데닌 또는 타이민
K = 구아닌 또는 타이민
M = 아데닌 또는 사이토신
B = C, G 또는 T
D = A, G 또는 T
H = A, C 또는 T
V = A, C 또는 G
실시예
실시예 1 - (일반 프로토콜) 본원에 기재된 시스템을 위한 PAM 서열 식별/확인
추정 엔도뉴클레아제를 대장균 용해물 기반 발현 시스템(myTXTL, 아버 바이오사이언스(Arbor Biosciences))에서 발현시켰다. 추정 뉴클레아제에 의해 절단될 수 있는 무작위로 생성된 잠재적 PAM 서열을 함유하는 플라스미드를 시퀀싱하여 PAM 서열을 확인하였다. 이 시스템에서, 추정 뉴클레아제를 코딩하는 대장균 코돈 최적화된 뉴클레오타이드 서열을 T7 프로모터의 제어 하에 시험관내에서 PCR 단편으로부터 전사하고 번역하였다. T7 프로모터 및 이를 뒤따르는 반복부-스페이서-반복부 서열로 구성된 최소 CRISPR 어레이를 가진 제2 PCR 단편을 동일한 반응에서 전사하였다. TXTL 시스템에서의 성공적인 엔도뉴클레아제 및 반복부-스페이서-반복부 서열의 발현에 이은 CRISPR 어레이 프로세싱은 활성 시험관내 CRISPR 뉴클레아제 복합체를 제공하였다.
최소 어레이에서 8N 혼합된 염기(잠재적 PAM 서열) 및 이를 뒤따르는 스페이서 서열 일치를 함유하는 표적 플라스미드의 라이브러리를 TXTL 반응의 결과물과 함께 인큐베이션하였다. 1시간 내지 3시간 후, 반응을 중단하고 DNA 클린업 키트, 예를 들어, Zymo DCC, AMPure XP 비드, QiaQuick 등을 통해 DNA를 회수하였다. 어댑터 서열은 엔도뉴클레아제에 의해 절단된 활성 PAM 서열을 가진 DNA에 블런트-말단 라이게이션된 반면, 절단되지 않은 DNA는 라이게이션을 위해 접근될 수 없다. 그 다음, 활성 PAM 서열을 포함하는 DNA 분절을, 상기 라이브러리 및 어댑터 서열에 특이적인 프라이머를 사용한 PCR로 증폭하였다. PCR 증폭 생성물을 겔에서 해상하여, 절단 사건에 상응하는 앰플리콘을 식별하였다. 절단 반응의 증폭된 분절은 NGS 라이브러리의 제조를 위한 주형, 또는 생거 시퀀싱을 위한 기질로서도 사용되었다. 출발 8N 라이브러리의 서브세트인 이 생성된 라이브러리의 시퀀싱은 CRISPR 복합체와 호환되는 PAM 활성을 가진 서열을 보여주었다. 프로세싱된 RNA 구축물을 사용한 PAM 시험을 위해, 시험관내 전사된 RNA를 플라스미드 라이브러리와 함께 첨가하고 최소 CRISPR 어레이 주형을 생략한다는 점을 제외하고 상기 절차를 반복하였다.
결합 능력을 갖지만 뉴클레아제가 결핍된 엔도뉴클레아제의 경우, 상기 절차의 변형을 통해 PAM을 확인하였다. TXTL에서 발현시킨 후, sgRNA 또는 crRNA 및 PAM 라이브러리를 첨가하였다. 이펙터가 sgRNA 의존적 방식으로 스페이서 서열에 결합하였을 때, 스페이서 서열은 이펙터 단백질 내에서 격리되었다. 스페이서 서열 내부를 표적화하는 적절한 제한 효소를 첨가하였고 라이브러리 내의 모든 보호되지 않은 플라스미드를 절단하였다. 밴드의 PCR 및 후속 NGS 라이브러리 제조를 통해 PAM을 함유하는 라이브러리의 절단되지 않은(엔도뉴클레아제 결합된) 구성원을 식별하였다.
실시예 2 - 시험관내 표적화된 인테그라제 활성
이전에 식별된 PAM을 사용하여 인테그라제 활성을 우선적으로 어세이하였지만, PAM 라이브러리 기질을 대신 사용하여 수행할 수 있고, 이때 효율은 감소된다. 시험관내 시험을 위한 구성요소의 한 배열은 기증자 서열을 함유하는 플라스미드 이외의 3개의 플라스미드를 포함하였다: (1) T7 프로모터 하에 이펙터(또는 이펙터들)를 가진 발현 플라스미드; (2) T7 프로모터 하에 인테그라제 유전자를 가진 발현 플라스미드; sgRNA 또는 crRNA 및 tracrRNA; (3) 스페이서 부위 및 적절한 PAM을 함유하는 표적 플라스미드; 및 (4) 카고 유전자(예를 들어, Tet 내성 유전자와 같은 선택 마커) 주변에서의 전위에 필요한 좌측 말단(LE) 및 우측 말단(RE) DNA 서열을 함유하는 기증자 플라스미드. 시험관내 전사/번역(TXTL) 시스템(예를 들어, 대장균 용해물 또는 망상적혈구 용해물 기반 시스템)을 사용하여 이펙터 및 인테그라제 유전자를 발현시켰다. 발현 후, 전위가 일어날 수 있도록 RNA, 표적 DNA 및 기증자 DNA를 첨가하고 인큐베이션하였다. 표적 DNA에 대한 하나의 프라이머 및 기증자 DNA에 대한 하나의 프라이머를 사용하여 인테그라제 부위의 연접부에 걸쳐 PCR을 통해 전위를 검출하였다. 생성된 PCR 생성물을, NGS를 통해 시퀀싱하여 sgRNA/crRNA 표적화된 부위에 대한 정확한 삽입 토폴로지(topology)를 확인하였다. 상기 프라이머들은 다양한 삽입 부위가 수용되고 검출될 수 있도록 다운스트림에 위치하였다. 처음에 삽입 방향도 알지 못했기 때문에, 카고의 어느 한 배향 또는 스페이서의 어느 한 측면에서 통합이 검출되도록 프라이머를 설계하였다.
통합된 카고를 가진 표적 DNA의 실험 결과물의 정량적 PCR(qPCR) 측정을 통해 통합 효율을 측정하였고, 마찬가지로 qPCR을 통해 측정된 비변형 표적 DNA의 양으로 정규화하였다.
이 어세이는 용해물 기반 발현보다는 정제된 단백질 구성요소의 사용을 통해 수행될 수 있다. 이 경우, T7 유도성 프로모터 하에 대장균 프로테아제 결핍 B 균주에서 단백질을 발현시켰고, 초음파처리를 이용하여 세포를 용해시켰으며, AKTA 아반트(Avant) FPLC(지이 라이프사이언스(GE Lifescience))에서 HisTrap FF(지이 라이프사이언스) Ni-NTA 친화성 크로마토그래피를 이용하여 관심 있는 His-태그부착된 단백질을 정제하였다. SDS-PAGE 및 인스탄트블루 울트라패스트(InstantBlue Ultrafast)(시그마-알드리치(Sigma-Aldrich)) 쿠마시(coomassie) 염색된 아크릴아미드 겔(바이오-라드(Bio-Rad))에서 해상된 단백질 밴드의 순도를, 이미지랩(ImageLab) 소프트웨어(바이오-라드)에서 밀도측정을 이용하여 측정하였다. 50 mM Tris-HCl, 300 mM NaCl, 1 mM TCEP 및 5% 글리세롤로 구성된 저장 완충제(pH 7.5)(또는 최대 안정성에 대해 확인된 다른 완충제)에서 단백질을 탈염하고 -80℃에서 저장하였다. 정제 후 이펙터(들) 및 인테그라제(들)를, 예를 들어, 26 mM HEPES pH 7.5, 4.2 mM TRIS pH 8, 50 ㎍/㎖ BSA, 2 mM ATP, 2.1 mM DTT, 0.05 mM EDTA, 0.2 mM MgCl2, 28 mM NaCl, 21 mM KCl 및 1.35% 글리세롤로 구성되고 15 mM Mg(OAc)2로 보충된 반응 완충제(최종 pH 7.5) 중의 전술된 sgRNA, 표적 DNA 및 기증자 DNA에 첨가하였다.
실시예 3 - 예측된 RNA 폴딩
안드로네스쿠(Andronescu) 2007의 방법을 이용하여 활성 단일 RNA 서열의 예측된 RNA 폴딩을 37˚에서 계산하였다. 모든 헤어핀-루프 2차 구조를 구조로부터 단독으로 삭제하고 더 작은 단일 가이드로 반복적으로 컴파일링하였다. 제2 접근법에서, MG64-1의 tracrRNA를 알려져 있는 타입 V-k tracrRNA에 정렬하고 단일 가이드로부터 고유 삽입 영역을 돌연변이시키고 57개 염기까지 최소화하였다. 도 12a는 MG64-2 sgRNA(서열번호 202)의 예측된 구조를 도시한다. 도 12b는 MG64-4 sgRNA(서열번호 203)의 예측된 구조를 도시한다. 도 12c는 MG64-6 sgRNA(서열번호 201)의 예측된 구조를 도시한다. 도 12d는 MG64-7 sgRNA(서열번호 204)의 예측된 구조를 도시한다. 도 12e는 MG108-1 sgRNA(서열번호 206)의 예측된 구조를 도시한다. 염기의 음영은 그 염기의 염기 페어링 확률에 상응한다.
실시예 4 - 겔 변위를 통한 트랜스포존 말단 검증
전기영동 이동성 변위 어세이(EMSA)를 통해 TnsB 결합에 대해 트랜스포존 말단을 시험하였다. 이 경우, 잠재적 LE 또는 RE를 DNA 단편(100 내지 500 bp)으로서 합성하고 FAM-표지부착된 프라이머를 사용한 PCR을 통해 FAM으로 말단-표지부착하였다. 시험관내 전사/번역 시스템(예를 들어, PURExpress)에서 TnsB 단백질을 합성하였다. 합성 후, 1 ㎕의 TnsB 단백질을 결합 완충제(20 mM HEPES pH 7.5, 2.5 mM Tris pH 7.5, 10 mM NaCl, 0.0625 mM EDTA, 5 mM TCEP, 0.005% BSA, 1 ㎍/㎖ 폴리(dI-dC) 및 5% 글리세롤)에서 10 ㎕ 반응물 중의 50 nM의 표지부착된 RE 또는 LE에 첨가하였다. 결합을 40분 동안 30˚에서 인큐베이션한 다음, 2 ㎕의 6X 로딩 완충제(60 mM KCl, 10 mM Tris pH 7,6, 50% 글리세롤)를 첨가하였다. 결합 반응물을 5% TBE 겔에서 분리하고 시각화하였다. TnsB의 존재 하에 LE 또는 RE의 변위는 성공적인 결합에 기인하였고 전위효소 활성을 표시하였다.
도 15는 이 실험의 예를 보여주는데, 이때 MG64-2에 대한 RE DNA 서열(예를 들어, 서열번호 155)을 상기 절차를 통해 FAM으로 말단-표지부착하고 상응하는 MG64-2 TnsB 유사 구성요소(예를 들어, 서열번호 23)와 함께 인큐베이션하였다. 레인 3에서 표지부착된 밴드의 상향변위는 이것이 활성 RE 전위 서열을 함유함을 표시하는, TnsB에 의한 RE 서열의 결합을 표시한다.
실시예 5 - 대장균에서의 인테그라제 활성(예측)
대장균은 게놈 이중 가닥 DNA 절단을 효율적으로 복구하는 능력을 결여하기 때문에, 대장균 게놈에서 이중 가닥 절단을 야기할 수 있는 작용제에 의한 대장균의 형질전환은 세포 사멸을 야기한다. 이 현상을 이용하여, 스페이서/표적 및 PAM 서열이 게놈 DNA 내로 통합되어 있는 표적 균주에서 엔도뉴클레아제 또는 이펙터 보조 인테그라제 및 가이드 RNA(예를 들어, 실시예 3에서와 같이 확인됨)를 재조합적으로 발현시킴으로써 대장균에서 엔도뉴클레아제 또는 이펙터 보조 인테그라제 활성을 시험한다.
그 다음, 단일 가이드 RNA와 함께 뉴클레아제 또는 이펙터를 함유하는 플라스미드, 인테그라제 및 보조 유전자를 발현하는 플라스미드, 및 통합을 위해 좌측 말단(LE) 및 우측 말단(RE) 트랜스포존 모티프에 의해 플랭킹된 선택 마커와 함께 온도 민감성 복제 기점을 함유하는 플라스미드를 사용하여 조작된 균주를 형질전환시킨다. 이어서, 플라스미드 복제를 위한 제한 온도에서 선택함으로써, 이 유전자들의 발현을 위해 유도된 형질전환체를, 게놈 표적으로의 상기 마커의 전달에 대해 스크리닝하고, 게놈 내로의 마커 통합을 PCR로 확인한다.
비편향 접근법을 이용하여 오프-표적 통합을 스크리닝한다. 요약하면, 정제된 gDNA를 Tn5 인테그라제 또는 전단으로 단편화한 다음, 라이게이션된 어댑터 및 선택 마커에 특이적인 프라이머를 사용하여 관심 있는 DNA를 PCR 증폭한다. 그 후, NGS 시퀀싱을 위해 앰플리콘을 준비한다. 생성된 서열의 분석을 통해 트랜스포존 서열을 트리밍하고, 플랭킹 서열을 게놈에 맵핑하여 삽입 위치를 확인하고, 오프-표적 삽입률을 측정한다.
실시예 6 - 전위효소 활성의 콜로니 PCR 스크린(예측)
박테리아 세포에서 뉴클레아제 또는 이펙터 보조 인테그라제 활성을 시험하기 위해, MG64_1에 특이적인 표적 및 상응하는 PAM 서열을 함유하도록 조작된 BL21(DE3) 대장균 세포로부터 균주 MGB0032를 구축한다. 그 다음, pJL56(MG64_1 이펙터 및 헬퍼 스위트를 발현하는 플라스미드, 암피실린 내성), 및 T7 프로모터에 의해 유도되는 관심 있는 조작된 표적에 대한 단일 가이드 RNA 서열을 발현하는 클로람페니콜 내성 플라스미드인 pTCM 64_1 sg로 MGB0032 대장균 세포를 형질전환시킨다.
이어서, 상기 두 플라스미드를 함유하는 MGB0032 배양물을 포화 상태까지 생장시키고, 적절한 항생제를 가진 생장 배지에 적어도 1:10으로 희석하고, 대략 1의 OD까지 37℃에서 인큐베이션한다. 이 생장 단계의 세포를 전기적격(electrocompetent) 세포로 만들고, 통합을 위해 좌측 말단(LE) 및 우측 말단(RE) 트랜스포존 모티프에 의해 플랭킹된 테트라사이클린 내성 마커를 가진 플라스미드인 간소화된 64_1 pDonor로 형질전환시킨다. 그 다음, 전기천공된 세포를 최종 농도 100 μM의 IPTG의 존재 또는 부재 하에 LB 배지에서 2시간 동안 회복시킨 후, LB-한천-암피실린-클로람페니콜-테트라사이클린에 플레이트하고 37℃에서 4일 동안 인큐베이션한다. 멸균 이쑤시개를 이용하여 각각의 생성된 CFU를 샘플링하고, 이를 물에 혼합한다. 이 용액에 Q5 고충실도(High Fidelity) PCR 마스터믹스(뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 프라이머 LA155(5'-GCTCTTCCGATCTNNNNGATGAGCGCATTGTTAGATTTCAT-3') 및 oJL50(5'-AAACCGACATCGCAGGCTTC-3')을 첨가한다. 이 프라이머들은 예측된 삽입 연접부를 플랭킹한다. 예측된 생성물 크기는 609 bp이다. DNA 증폭 PCR 생성물을 2% 아가로스 겔에서 시각화한다. PCR 생성물의 생거 시퀀싱은 전위 사건을 확인시켜준다.
실시예 7 - 세포내 발현/시험관내 어세이(예측)
생리학적으로 적절한 환경에서 NLS 구축물의 기능을 시험하기 위해, 렌티바이러스 형질도입을 이용하여 활성 NLS-태그부착된 CAST 구성요소를 가진 클로닝된 구축물을 K562 세포 내로 통합한다. 요약하건대, 렌티바이러스 전달 플라스미드 내로 클로닝된 구축물을 외피 및 팩키징 플라스미드와 함께 293T 세포 내로 형질감염시키고, 72시간 인큐베이션 후 배지로부터 바이러스 함유 상청액을 수거한다. 이어서, 바이러스를 함유하는 배지를 8 ㎍/㎖의 폴리브렌과 함께 K562 세포주와 72시간 동안 인큐베이션한 다음, 통합을 위해 4일 동안 1 ㎍/㎖의 푸로마이신을 사용하여 형질감염된 세포를 대량으로 선택한다. 선택된 세포주를 4일 기간의 말기에 수거하고 핵 분획 및 세포질 분획을 위해 차등적으로 용해시킨다. 그 다음, 시험관내 발현된 구성요소의 상보적 세트를 사용하여 전위 능력에 대해 후속 분획을 시험한다.
1,000만 개의 세포를 원심분리하고 1xPBS(pH 7.4)로 한 번 세척한다. 상청액 세척제를 완전히 흡인하여 세포 펠릿을 얻고 -80℃에서 16시간 동안 급속 냉동한다. 얼음 위에서 해동한 후, 세포 펠릿 크기를 질량으로 측정하고, 적절한 추출 부피의 세포 분획화 및 핵 추출 시약(NE-PER)을 사용하여 세포 분획에서 단백질을 천연적으로 추출한다. 요약하면, 세포질 추출 시약을 1:10의 세포 질량 대 추출 시약 부피로 사용한다. 세포 현탁액을 볼텍싱으로 혼합하고 비이온성 세제로 용해시킨다. 이어서, 세포를 4℃에서 5분 동안 16,000xg로 원심분리한다. 그 다음, 세포질 추출 상청액을 기울여 따라내고 시험관내 시험을 위해 보관한다. 그 후, 핵 추출 시약을 1:2의 원래 세포 질량 대 핵 추출 시약으로 첨가하고 간헐적으로 볼텍싱하면서 얼음 위에서 1시간 동안 인큐베이션한다. 이어서, 핵 현탁액을 4℃에서 10분 동안 16,000xg로 원심분리하고 상청액 핵 추출물을 기울여 따라내고 시험관내 전위 활성에 대해 시험한다. 본 발명자들은 시험관내 발현된 단백질, 기증자 DNA, pTarget 및 완충제의 상보적 세트와 함께 각각의 조건에 대해 각각의 세포 및 핵 추출물 4 ㎕를 사용하여 시험관내 전위 반응을 수행한다. 전위 활성의 증거는 기증자-표적 연접부의 PCR 증폭에 의해 어세이된다.
실시예 8 - 포유류 세포에서의 활성(예측)
포유류 세포에서 표적화 및 절단 활성을 보여주기 위해, 핵 국소화 서열을 각각의 뉴클레아제 또는 이펙터 단백질 및 인테그라제 단백질의 C 말단에 융합시키고, 융합 단백질을 정제한다. 관심 있는 게놈 유전자좌를 표적화하는 단일 가이드 RNA를 합성하고 뉴클레아제/이펙터 단백질과 함께 인큐베이션하여 리보핵단백질 복합체를 형성한다. 좌측 말단(LE) 및 우측 말단(RE) 모티프에 의해 플랭킹된 선택 네오마이신 내성 마커(NeoR) 또는 형광 마커를 함유하는 플라스미드로 세포를 형질감염시키고 4시간 내지 6시간 동안 회복시킨 후, 뉴클레아제 RNP 및 인테그라제 단백질로 전기천공시킨다. G418 내성 콜로니의 계수 또는 형광 활성화된 세포 세포분석법으로 게놈 내로의 플라스미드의 통합을 정량한다. 게놈 DNA를 전기천공 후 72시간에서 추출하고 NGS 라이브러리의 제조에 사용한다. 게놈을 단편화하고 NGS 라이브러리 제조를 위해 트랜스포존 마커 및 플랭킹 DNA의 앰플리콘을 제조함으로써 오프-표적 빈도를 어세이한다. 각각의 표적화 시스템의 활성을 시험하기 위해 적어도 40개의 상이한 표적 부위를 선택한다.
실시예 9 - 표적화된 뉴클레아제의 활성
제자리 발현 및 단백질 서열 분석은 일부 RNA 가이딩 이펙터가 활성 뉴클레아제임을 암시한다. 이들은 예측된 엔도뉴클레아제 관련 도메인(일치하는 RuvC 및 HNH_엔도뉴클레아제 도메인) 및 예측된 HNH와 RuvC 촉매 잔기를 함유한다(예를 들어, MG36-5 이펙터의 예측된 촉매 잔기를 보여주는 도 4A 참조).
myTXTL 시스템 및 시험관내 전사된 RNA를 사용하여 조작된 단일 가이드 RNA 서열로 후보 활성을 시험한다. 활성 단백질은 라이브러리를 성공적으로 절단하여 아가로스 겔 전기영동에서 약 170 bp의 밴드를 생성하는 단백질로서 식별된다.
실시예 10 - 트랜스포존의 식별
트랜스포존은 트랜스포존의 좌측 말단과 우측 말단 사이에 인테그라제 및/또는 인테그라제 기능을 가진 하나 이상의 단백질 서열을 함유할 때 활성을 나타낼 것으로 예측된다. 전형적인 Tn7 트랜스포존은 일반적으로 촉매 인테그라제 TnsB를 포함하지만, TnsA, TnsC, TnsD, TnsE, TniQ 및/또는 다른 인테그라제 또는 인테그라제를 함유할 수도 있다. 트랜스포존 말단은 인테그라제 단백질 및 다른 '카고' 유전자를 플랭킹하는 15 bp 내지 150 bp 길이의 직접 반복부 및/또는 역반복부를 함유하는 예측된 인테그라제 결합 부위를 포함한다. 단백질 서열 분석은 인테그라제가 인테그라제 도메인, 인테그라제 도메인 및/또는 인테그라제 촉매 잔기를 함유함을 표시하였는데, 이는 인테그라제가 활성 상태임을 암시한다(예를 들어, TnsB 요소를 함유하는 예시적인 MG36-5 이펙터 기반 CAST 시스템에 대한 유전자좌 도표를 보여주는 도 4A; 및 TnsA, TnsB, TnsC 및 TniQ 요소를 함유하는 예시적인 MG39-1 이펙터 기반 CAST 시스템에 대한 유전자좌 도표를 보여주는 도 5A).
실시예 11 - CRISPR 관련 트랜스포존의 식별
추정 CRISPR 관련 트랜스포존(CAST)은 DNA 및/또는 RNA 표적화 CRISPR 이펙터, 및 CRISPR 어레이의 근처에서 예측된 인테그라제 기능을 가진 단백질을 함유한다. 일부 시스템에서, 이펙터는 엔도뉴클레아제 관련 촉매 도메인 및/또는 촉매 잔기의 존재를 기반으로 뉴클레아제 활성을 가질 것으로 예측된다(예를 들어, TnsB 요소를 함유하는 CAST 시스템 유전자좌와 관련하여 MG36-5 이펙터의 예측된 촉매 잔기를 보여주는 도 4A). 인테그라제는 CRISPR 유전자좌(CRISPR 뉴클레아제 및 어레이) 및 인테그라제 단백질이 예측된 트랜스포존 좌측 말단과 우측 말단 사이에 위치할 때 활성 뉴클레아제와 회합될 것으로 예측되었다(예를 들어, 도 4B 및 4C). 이 경우, 이펙터는 가이드 RNA를 기반으로 특정 게놈 위치로의 DNA 통합을 유도할 것으로 예측되었다.
일부 시스템에서, 이펙터는 알려져 있는 CRISPR 이펙터 단백질과 상동성을 갖지만, 엔도뉴클레아제 도메인 및/또는 촉매 잔기의 부재를 기반으로 비활성 상태일 것으로 예측되었다(도 5A). 인테그라제는 CRISPR 유전자좌(비활성 CRISPR 뉴클레아제 및 어레이) 및 인테그라제 단백질이 예측된 트랜스포존 좌측 말단 및 우측 말단 내에 위치할 때 이펙터와 회합될 것으로 예측된다(도 5A 및 5B).
실시예 12 - CAST 발견
CRISPR 관련 트랜스포존(CAST)은 DNA 카고의 표적화된 통합을 촉진하기 위해 CRISPR 시스템과 상호작용하도록 진화된 트랜스포존을 포함하는 시스템이다.
CAST는 트랜스포존의 시그니처 좌측 말단 및 우측 말단 내에서의 DNA 전위에 관여하는 하나 이상의 단백질 서열을 코딩하는 게놈 서열이다. 전형적인 Tn7 트랜스포존은 일반적으로 촉매 전위효소 TnsB를 포함하지만, 촉매 전위효소 TnsA, 로더(loader) 단백질 TnsC 또는 TniB, 및 표적 인식 단백질 TnsD, TnsE, TniQ 및/또는 다른 트랜스포존 관련 구성요소도 함유할 수 있다. 트랜스포존 말단은 트랜스포존 기구 및 다른 '카고' 유전자를 플랭킹하는 15 bp 내지 150 bp 길이의 직접 반복부 및/또는 역반복부를 함유하는 예측된 전위효소 결합 부위를 포함한다.
또한, CAST는 CRISPR 어레이의 근처에서 DNA 및/또는 RNA 표적화 CRISPR 뉴클레아제 또는 이펙터도 코딩한다. 일부 시스템에서, 이펙터는 엔도뉴클레아제 관련 촉매 도메인 및/또는 촉매 잔기의 존재를 기반으로 활성 뉴클레아제일 것으로 예측된다. 일부 시스템에서, 이펙터는 알려져 있는 CRISPR 이펙터 단백질과 서열 유사성을 갖지만, 엔도뉴클레아제 도메인 및/또는 촉매 잔기의 부재를 기반으로 비활성 상태일 것으로 예측되었다. CRISPR 유전자좌 및 트랜스포존 관련 단백질이 예측된 트랜스포존 좌측 말단 및 우측 말단 내에 위치할 때, 트랜스포존은 이펙터와 회합될 것으로 예측된다. 이 경우, 이펙터는 가이드 RNA를 기반으로 특정 게놈 위치로의 DNA 통합을 유도할 것으로 예측된다.
실시예 13a - Cas12k CAST
Cas12k CAST 시스템은 뉴클레아제 결함 CRISPR Cas12k 이펙터, CRISPR 어레이, tracrRNA 및 Tn7 유사 전위 단백질을 코딩한다(예를 들어, Cas12k를 함유하는 MG108-1 CAST 시스템에 대한 유전자좌 조직화 도표를 보여주는 도 8 참조). Cas12k 이펙터는 계통발생학적으로 다양하며 이들과 CAST의 회합을 확인시켜주는 특징은 여러 경우에서 확인되었다(예를 들어, MG64-1, MG64-2, MG64-3, MG64-5, MG64-6, MG64-7, MG64-13, MG64-54, MG64-56, MG108-1 및 MG108-2 이펙터가 어떻게 이 군의 일부인지를 보여주는 도 9 참조). 이러한 특징적인 특징 중 하나는 MG64-3 CRISPR 유전자좌와 관련하여 확인된 트랜스포존 말단이었고; 트랜스포존 좌측 말단은 말단 역반복부 및 자가 일치 스페이서 서열에 의해 표시된 바와 같이 MG64-3 CRISPR 유전자좌로부터 다운스트림에서 식별되었다(도 11a). 식별된 또 다른 이러한 특징은 보존된 모티프 5'-GNNGGNNTGAAAG-3'을 함유하는 Cas12k CAST CRISPR 반복부(crRNA)를 포함한다(예를 들어, MG64-2, MG64-4, MG64-5, MG64-6, MG64-7 및 MG108-1, 및 도 11b 참조). crRNA 모티프 내의 짧은 반복부-항-반복부(RAR)는 tracrRNA의 상이한 영역들과 정렬되었고, RAR 모티프는 tracrRNA의 시작 및 말단을 정의하는 것으로 보였다. 도 13c는 예를 들어, MG64-2, MG64-4, MG64-5, MG64-6, MG64-7 및 MG108-1 패밀리에서 이러한 RAR 모티프의 존재를 보여준다.
실시예 13b - 클래스 I 타입 I-F CAST
일부 CAST는 뉴클레아제 결함 CRISPR 타입 I-F 캐스케이드 이펙터 단백질, CRISPR 어레이 및 Tn7 유사 전위 단백질을 코딩한다(예를 들어, MG110-1 이펙터 기반 타입 I-F CAST 시스템의 유전자좌 조직화 도표를 보여주는 도 10A 참조). 타입 I-F 캐스케이드 CAST는 스템-루프 구조의 형성에 관여할 가능성이 있는 보존된 모티프 5'-CTGCCGNTAGGNAGC-3'를 함유하는, crRNA에 의해 코딩된 단일 가이드 RNA를 사용하여 작용할 것으로 예측되었다(예를 들어, MG110-1 및 MG110-2 패밀리 crRNA(서열번호 207 및 208)에서 이 특징의 정렬을 보여주는 도 10B 및 10C 참조). 부분적으로 이 동일한 특징을 가진다는 점을 기반으로, MG110-2 이펙터 함유 패밀리도 타입 I-F CAST 시스템으로서 식별되었다.
실시예 14 - 트랜스포존 말단 예측
이펙터 및 트랜스포존 기구를 플랭킹하는 유전자간 영역으로부터 트랜스포존 말단을 추정하였다. 예를 들어, Cas12k CAST의 경우, TnsB로부터 바로 업스트림에 위치하며 CRISPR 유전자좌로부터 바로 다운스트림에 위치한 유전자간 영역은 Tn7 트랜스포존 좌측 말단 및 우측 말단(LE 및 RE)을 함유하는 것으로서 예측되었다(예를 들어, MG64-3 패밀리 CAST 유전자좌 도표와 관련하여 LE 및 RE 분석을 보여주는 도 11a 참조).
최대 2개의 불일치가 있는 약 12 bp의 직접 반복부 및 역반복부(DR/IR)를 콘티그(contig)에서 예측하였다. 또한, 도트플롯(Dotplot) 알고리즘을 이용하여 CAST 트랜스포존을 플랭킹하는 짧은(약 10 내지 20 bp) DR/IR을 찾았다. CAST 이펙터 및 트랜스포존 유전자를 플랭킹하는 유전자간 영역에 위치한 일치하는 DR/IR은 트랜스포존 결합 부위를 코딩할 것으로 예측되었다. 추정 트랜스포존 결합 부위를 코딩하는, 유전자간 영역으로부터 추출된 LE 및 RE를 정렬하여 트랜스포존 말단 경계를 정의하였다. 추정 트랜스포존 LE 및 RE 말단은 a) 첫 번째로 예측된 트랜스포존 코딩 유전자 및 마지막 예측된 트랜스포존 코딩 유전자로부터 400 bp 업스트림 및 다운스트림 내에 위치하고; b) 다수의 짧은 역반복부를 공유하고; c) 65% 초과의 뉴클레오타이드 동일성을 공유하는 영역으로서 식별된다. 이 과정을 반복하여, MG36-5(서열번호 17 및 18), MG39-1(서열번호 20 및 21), MG64-2(서열번호 125 및 126), MG64-4(서열번호 127 및 128), MG64-6(서열번호 123 및 124), MG64-7(서열번호 129 및 130), MG64-13(서열번호 131 및 132), MG64-54(서열번호 133), MG108-1(서열번호 134 및 135), MG110-1(서열번호 136 및 137) 및 MG110-2(서열번호 138 및 139)에 대한 추정 LE/RE 서열을 식별하였다.
실시예 15 - 클래스 II 타입 V CAST 시스템을 위한 단일 가이드 설계
MG64 서브패밀리에 대한 Cas 이펙터 및 CRISPR 어레이를 둘러싼 유전자간 영역의 분석은 잠재적 항-반복부 서열, 및 tracrRNA의 서열에 상응하는 항-반복부에 인접하는 보존된 "CYCC(N6)GGRG" 스템-루프 구조를 식별하였다(도 11b). sgRNA를 생성하기 위해, 테트라루프 서열인 GAAA를 추가하여 crRNA-tracrRNA 상보적 서열의 스템-루프 영역을 유지하면서, tracrRNA 및 crRNA 반복부를 폴딩하고 트리밍하였다. 이 서열들은 아래 표 1에 요약되어 있다.
Figure pct00001
Figure pct00002
실시예 16 - 표적화된 뉴클레아제를 사용한 시험관내 통합 활성
제자리 발현 및 단백질 서열 분석은 일부 RNA 가이딩 이펙터들이 활성 뉴클레아제임을 시사하였다. 이 이펙터들은 예측된 엔도뉴클레아제 관련 도메인(일치하는 RuvC 및 HNH_엔도뉴클레아제 도메인), 및/또는 예측된 HNH 및 RuvC 촉매 잔기를 함유한다. myTXTL 시스템 및 시험관내 전사된 RNA를 사용하여 조작된 단일 가이드 RNA 서열로 후보 활성을 시험하였다. 활성 단백질은 라이브러리를 성공적으로 절단하여 아가로스 겔 전기영동에서 약 170 bp의 밴드를 생성하는 단백질로서 식별되었다.
실시예 17 - 프로그래밍 가능한 DNA 통합
단일 반응에서 5종의 구성요소들을 조합하여 CAST 활성을 시험하였다: (1) myTXTL 또는 PURExpress에 의해 발현된 Cas 이펙터 단백질; (2) Cas 효소에상응하는 표적 서열 및 PAM을 함유하는 표적 DNA 단편 또는 플라스미드; (3) DNA 단편 또는 플라스미드에서 전위효소 시스템의 예측된 LE 및 RE에 의해 플랭킹된 DNA 마커 또는 단편을 함유하는 기증자 DNA 단편; (4) myTXTL 또는 PURExpress를 사용함으로써 발현된 어레이의 일부인 것으로 예측된 추가 전위효소 단백질의 임의의 조합; 및 (5) 조작된 시험관내 전사된 단일 가이드 RNA 서열. 기증자 단편을 성공적으로 전위시킨 활성 시스템을 기증자-표적 연접부의 PCR 증폭으로 어세이하였다.
도 13은 예측된 LE/RE 기증자 서열(서열번호 123 및 124) 및 인실리코(in silico) 설계된 sgRNA(서열번호 201)를 사용하여 MG64-6 이펙터, TnsB, TnsC 및 TniQ 단백질(서열번호 30 내지 33)을 포함하는 MG64-6 시스템이 활성을 나타냄을 입증하는 예시적인 데이터를 보여준다. 모든 MG64-6 구성요소들을 조합하여 전위 반응을 수행한 후, 연접부의 PCR 증폭은 적절한 기증자-표적 형성이 일어났고 전위 반응이 sg 의존적이었음을 보여주었다(도 13a). (각각 LE/RE가 PAM에 원위로 삽입될 때 LE/RE 연접부에 걸쳐 있는) PCR 반응 #3 및 #4에서 증폭된 밴드의 존재는 표적에 대한 기증자의 두 가지 배향, 즉 LE가 PAM에 더 가까운 배향, 및 RE가 PAM에 더 가까운 배향이 만들어짐을 시사하였다. 두 가지 전위 배향이 만들어졌지만, LE가 PAM에 더 가까운 경우 표적 내로의 기증자 통합에 대한 선호가 있었고, 이는 (각각 PAM에 원위 삽입된 LE 연접부 및 PAM에 근위 삽입된 RE 연접부에 걸쳐 있는) 반응 #4 및 #5의 경우 존재하는 강한 밴드에 의해 표시된다.
바람직한 배향 생성물의 생거 시퀀싱을 수행하였다. LE가 PAM에 더 가까운 경우 일어나는 통합 중에서, 표적/기증자 연접부에 걸쳐 정방향 또는 역방향으로부터 시퀀싱 크로마토그램 신호의 분명한 저하가 있었다(도 13c). 이것은 LE가 PAM에 더 가까운 경우 배향된 생성물의 통합이 다양한 뉴클레오타이드에 걸쳐 일어났고, 이때 LE가 PAM에 더 가까운 경우 생성물들 중 주요 생성물은 PAM으로부터의 61 bp 통합이었다(도 14). 기증자-표적 연접부에 걸쳐 기증자로부터 유래한 시퀀싱은 LE 및 RE 서열의 필수 외부 경계의 조성을 정의하였다. LE 및 RE 도메인의 추가 조사는 LE 및 RE 서열의 내부 한계를 확인함으로써, 전위에 필수적인 최소 LE/RE를 확인할 것이다. LE가 PAM에 더 가까운 경우 생성물에 대한 RE의 시퀀싱은 기증자 RE의 다운스트림에서 3 bp 중복을 보여주었다. 이것은 부분적으로 엇갈린(staggered) 절단 부위에서 기증자 단편을 절단하고 라이게이션하는 Tn7 전위효소 통합 사건에 기인한다. 3 bp 중복은 다른 Tn7 전위효소로부터 예상된 5 bp의 중복보다 더 작다.
표적 플라스미드의 8N 라이브러리에 대한 PCR 증폭 생성물의 생거 시퀀싱은 또한 스페이서의 5' 말단에서 MG64-6 이펙터의 PAM 선호가 nGTn/nGTt임을 밝혔다. PAM 라이브러리 표적의 NGS 분석은 5' 말단에서 nGTn 모티프 선호를 확인시켜주었다(도 13b).
실시예 18 - 통합 윈도우 확인
상기 실시예 17에서 증폭된 PAM의 PCR 연접부를 NGS 라이브러리에 대해 인덱싱하고, V2 300 판독 키트를 사용하여 MiSeq에서 시퀀싱하였다. PAM으로부터 60 bp 통합 거리를 가진 추정 전위 서열의 앰플리콘 서열을 사용하는 CRISPResso를 사용하여 리드를 맵핑하고 정량하였다(guideseq = LE 또는 RE의 20 bp 3' 말단, 윈도우의 중심 = 0, 윈도우 크기 = 20). 삽입결실 히스토그램을 검출된 총 삽입결실 리드로 정규화하였고, 빈도를 60 bp 기준 서열과 비교하여 플롯팅하였다(도 14).
PCR 반응 5(PAM에 인접한 LE, 도 13a) 및 PCR 4(PAM으로부터 먼 RE, 도 13b) 둘 다를 MG64-6에 대한 서열 및 PAM으로부터의 거리에 대해 플롯팅하였다(도 14). 통합 윈도우의 분석은 스페이서 PAM 부위에서 일어난 통합의 95%가 PAM으로부터 58개 내지 68개의 뉴클레오타이드만큼 떨어진 10 bp 윈도우 내에 있음을 표시하였다. 원위 빈도와 근위 빈도 사이의 통합 거리의 차이는 통합 시 전위효소의 엇갈린 뉴클레아제 활성의 결과로서 3개 내지 5개의 염기쌍 중복인 통합 부위 중복을 반영하였다.
실시예 19 - 겔 변위를 통한 트랜스포존 말단 검증
예측된 트랜스포존 말단 서열에 대한 TnsB의 활성을 검증하기 위해, FAM 표지부착된 올리고를 사용하여 MG64-6의 RE를 증폭하였다. 무세포 전사/번역 시스템을 사용하여 MG64-6 TnsB 단백질을 발현시키고 RE FAM 표지부착된 생성물과 함께 인큐베이션하였다. 30분 동안 인큐베이션한 후, 천연 5% TBE 겔에서 결합을 관찰하였다(도 15). 함께 인큐베이션된 레인(도 15, 레인 3) 내의 형광 생성물의 다수의 밴드는 최소 3개의 TnsB 결합 부위를 표시하였다.
실시예 20 - 전위효소 활성의 콜로니 PCR 스크린(예측)
콜로니 PCR 스크린을 통해 전위 활성을 어세이한다. 대장균을 pDonor 플라스미드로 형질전환시킨 후, 암피실린, 클로람페니콜 및 테트라사이클린을 함유하는 LB 한천에 플레이트한다. 선택된 CFU를, PCR 시약 및 삽입 연접부를 플랭킹하는 프라이머를 함유하는 용액에 첨가한다.
실시예 22 - LE-RE 최소화(예측)
표적-전위 연접부의 시퀀싱은 표적 반응 내로 혼입되는 기증자 플라스미드로부터 가장 바깥쪽 서열을 식별함으로써 말단 역반복부를 식별하는 데 도움을 준다. 10%의 가변성으로 14 bp의 반복부 분석을 수행함으로써, 말단 내에 함유된 짧은 반복부를 식별하고; 불필요한 서열을 결실시키면서 반복부를 보존하는 이들의 절두(truncation)에 포함될 최소 서열을 식별한다. 예측 및 클로닝은 다회 반복을 통해 수행되고, 이때 각각의 상호작용을 시험관내 전위로 시험한다. 전위는 96 bp의 RE 영역과 조합된 68 bp의 LE 영역에 이르기까지 활성을 띨 것으로 예측된다.
실시예 23 - 전위의 오버행(overhang) 영향(예측)
TnsB 결합 모티프 외부의 불필요한 서열이 전위에 필요한지를 시험하기 위해, LE 및 RE 둘 다의 TGTACA 또는 TGTCGA 모티프용으로 설계된 올리고를, 0, 1, 2, 3, 5 및 10 bp 추가 염기쌍을 갖도록 설계하고 합성한다. 이 합성된 올리고를 사용하여 오버행을 가진 기증자 PCR 단편을 생성하고, 표적 부위 내로 전위하는 그의 능력에 대해 시험한다.
실시예 24 - CAST NLS 설계(예측)
치료 목적용 진핵생물 게놈 편집은 편집 효소를 핵 내로 가져오는 것에 의존한다. 더 큰 단백질의 작은 폴리펩티드 스트레치는 핵막을 가로질러 단백질을 가져오도록 세포 구성요소에 신호를 보낸다. 이 NLS 태그는 그 자신에 융합된 단백질의 기능도 유지하면서 가져오는 기능을 제공할 필요가 있기 때문에, 이 태그의 배치는 최적화를 요구할 수 있다. CAST 복합체의 각각의 구성요소에 대한 NLS의 기능적 배향을 시험하기 위해, 뉴클레오플라스민(Nucleoplasmin) NLS를 MG CAST의 각각의 구성요소의 N-말단에 융합시키고 SV40 NLS를 MG CAST의 각각의 구성요소의 C-말단에 융합시키는 구축물을 합성한다. 이러한 구축물의 단백질을 무세포 시험관내 전사/번역 반응에서 발현시키고, 태그부착되지 않은 구성요소의 상보적 세트를 사용하여 시험관내 전위 활성에 대해 시험한다. PCR 4(RE 원위 전위 평가) 및 동족 전위 사건인 PCR 5(LE 근위 전위 평가)를 사용하여 기증자-표적 연접부의 PCR을 통해 활성의 유지에 대해 NLS 태그부착된 구축물을 평가한다.
실시예 25 - Cas12k 및 TniQ 단백질 융합 구축물 설계 및 시험(예측)
단백질 구성요소의 발현을 단순화/최소화하고 이 구성요소를 세포 내로 전달하는 것을 용이하게 하기 위해, 다양한 링커, 링커 길이 및 도메인 경계를 사용하여 Cas12k 이펙터와 TniQ 단백질 사이의 융합 구축물을 설계하고 합성하고 시험한다. Cas12k에 융합된 TniQ의 두 가지 배향, 즉 C-말단 융합인 Cas-TniQ, 및 N-말단 융합인 TniQ-Cas를 설계하고 합성한다.
2개의 다른 링커도 사용하여 이펙터와 TniQ 유전자를 융합시킨다. 자가 중단 번역 서열인 P2A는 Cas-NLS-P2A-NLS-TniQ 구축물에서 활성을 띠고, MCV 내부 리보좀 진입 서열(IRES) mRNA 기반 링커는 세포에서 상기 두 구성요소들의 독립적인 번역을 가능하게 한다.
실시예 26 - 시험관내 전위 시험과 커플링된 세포내 발현(예측)
생리학적으로 적절한 환경에서 NLS 구축물의 기능을 시험하기 위해, 렌티바이러스 형질도입을 이용하여 활성 NLS 태그부착된 CAST 구성요소를 가진 클로닝된 구축물을 K562 세포 내로 통합한다. 요약하면, 렌티바이러스 전달 플라스미드 내로 클로닝된 구축물을 외피 및 팩키징 플라스미드와 함께 293T 세포 내로 형질감염시키고 72시간 인큐베이션 후 배지로부터 바이러스 함유 상청액을 수거한다. 그 다음, 바이러스를 함유하는 배지를 8 ㎍/㎖의 폴리브렌과 함께 72시간 동안 K562 세포주와 인큐베이션한 후, 4일 동안 1 ㎍/㎖의 푸로마이신을 사용하여 형질감염된 세포를 대량으로 통합을 위해 선택한다. 선택된 세포주를 4일 기간의 말기에 수거하고 핵 및 세포질 분획을 위해 차등적으로 용해시킨다. 그 다음, 시험관내 발현된 구성요소의 상보적 세트를 사용하여 전위 능력에 대해 후속 분획을 시험한다.
NLS-TnsB 및 TnsB-NLS 둘 다를 세포 분획화 및 시험관내 전위로 시험하고, 세포질 분획 및 핵 분획 둘 다에 대해 전위를 검출한다.
세포 내의 Cas12k 융합체를 유사하게 분획화하고 전위에 대해 시험한다. Cas-NLS Cas-NLS-P2A-NLS-TniQ를 세포 내로 형질도입하고, 분획화하고, 시험관내에서 하위세포 활성에 대해 시험한다. Cas-NLS-P2A-NLS-TniQ는 단일 가이드를 반응물에 첨가하였을 때 세포질에서 전위할 수 있다. 본 발명자들은 홀로(holo) Cas 단백질(+sgRNA) 또는 추가 TniQ를 sgRNA로 보충함으로써, 핵 분획에서 Cas-NLS-P2A-NLS-TniQ 구축물을 보완할 수 있었다.
본 개시내용의 시스템은 다양한 응용분야, 예를 들어, 핵산 편집(예를 들어, 유전자 편집) 또는 핵산 분자와의 결합(예를 들어, 서열 특이적 결합)에 사용될 수 있다. 이러한 시스템은 예를 들어, 대상체에서 질환을 야기할 수 있는 유전적으로 유전된 돌연변이의 교정(예를 들어, 제거 또는 대체)에 사용될 수 있고/있거나; 세포에서 유전자의 기능을 확인하기 위해 그 유전자를 비활성화시키는 데 사용될 수 있고/있거나; (예를 들어, 역전사된 바이러스 RNA 또는 질환 야기 돌연변이를 코딩하는 증폭된 DNA 서열의 절단을 통해) 질환 야기 유전적 요소를 검출하는 진단 수단으로서 사용될 수 있고/있거나; 특정 뉴클레오타이드 서열(예를 들어, 박테리아에 대한 항생제 내성을 코딩하는 서열)을 표적화하고 검출하기 위해 프로브와 함께 비활성화된 효소로서 사용될 수 있고/있거나; 바이러스 게놈을 표적화하여 바이러스를 비활성 상태로 만들거나 숙주 세포를 감염시킬 수 없게 만드는 데 사용될 수 있고/있거나; 유전자를 추가하거나 대사 경로를 수정함으로써, 유기체가 귀중한 소분자, 거대분자 또는 2차 대사산물을 생성하도록 조작하는 데 사용될 수 있고/있거나; 진화적 선택을 위한 유전자 유도 요소를 확립하는 데 사용될 수 있고/있거나; 바이오센서로서 외래 소분자 및 뉴클레오타이드에 의한 세포 교란을 검출하는 데 사용될 수 있다.
본 발명의 바람직한 실시양태들이 본원에 제시되고 설명되었지만, 이러한 실시양태들이 단지 예시로서만 제공된다는 것은 당분야에서 숙련된 자에게 자명할 것이다. 본 발명은 본 명세서에서 제공된 특정 실시예에 의해 제한되지 않는다. 본 발명이 상기 언급된 본 명세서를 참조함으로써 설명되었지만, 본원에서 실시양태의 설명 및 예시는 제한적인 의미로 해석되어서는 안 된다. 본 발명을 벗어나지 않으면서 수많은 변경, 변화 및 치환이 당분야에서 숙련된 자에게 인식될 것이다. 나아가, 본 발명의 모든 측면은 다양한 조건 및 변수에 의해 좌우되는, 본원에 기재된 특정 묘사, 구성 또는 상대적 비율로 제한되지 않음을 이해해야 한다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 본 발명의 실시에 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변형, 변경 또는 등가물도 커버하는 것으로 생각된다. 하기 청구범위는 본 발명의 범위를 정의하고, 이 청구범위 내의 방법과 구조 및 이들의 등가물도 이에 의해 커버된다.
SEQUENCE LISTING <110> METAGENOMI IP TECHNOLOGIES, LLC <120> SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES <130> 55921-714.601 <140> <141> <150> 63/232,593 <151> 2021-08-12 <150> 63/186,698 <151> 2021-05-18 <150> 63/069,703 <151> 2020-08-24 <160> 261 <170> PatentIn version 3.5 <210> 1 <211> 1424 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG36 effector sequence <220> <223> MG36-5 effector <400> 1 Met Lys Arg Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile Gly Trp 1 5 10 15 Ala Leu Val Asn Glu Ala Glu Thr Asp Glu Glu Val Ser Ser Ile Ile 20 25 30 Arg Leu Gly Val Arg Val Asn Pro Leu Thr Val Asp Glu Thr Gln Asn 35 40 45 Phe Glu Lys Gly Lys Ser Ile Thr Thr Asn Ala Glu Arg Thr Leu Lys 50 55 60 Arg Ser Met Arg Arg Asn Leu Gln Arg Tyr Lys Leu Arg Arg Asp Ala 65 70 75 80 Leu Val Glu Phe Leu Lys Glu Leu Gly Phe Ile Thr Asp Glu Thr Ile 85 90 95 Leu Ser Glu Gln Gly Asn Arg Thr Thr Phe Glu Thr Cys Arg Leu Arg 100 105 110 Ala Lys Ala Ala Glu Glu Glu Ile Ser Leu Glu Glu Leu Ser Arg Val 115 120 125 Leu Leu Met Ile Asn Lys Lys Arg Gly Tyr Lys Ser Ser Arg Lys Val 130 135 140 Lys Lys Glu Glu Asp Gly Val Leu Ile Asp Gly Met Glu Ile Ala Lys 145 150 155 160 Lys Leu Tyr Glu Glu Asp Leu Thr Pro Gly Gln Leu Cys Ser Gln Leu 165 170 175 Leu Glu Ser Gly Lys Lys Val Leu Pro Asp Phe Tyr Arg Ser Asp Leu 180 185 190 Gln Glu Glu Leu Asp Arg Ile Trp Ser Val Gln Lys Gln Phe His Pro 195 200 205 Asp Val Phe Cys Asp Ala Ala Lys Glu Glu Ile Lys Gly Lys Asn Arg 210 215 220 Ser Gln Thr Trp Ala Ile Leu Ala Asn Tyr Phe Val Trp Lys Glu Glu 225 230 235 240 Val Val Gly Trp Asn Asp Arg Glu Ala Lys Asn Glu Thr Ile Glu Lys 245 250 255 Glu Cys Lys Leu Val Gly Leu Lys Arg Thr Thr Lys Gly Tyr Glu Leu 260 265 270 Lys Lys Glu Asn Tyr Arg Trp Arg Ala Gln Ala Leu Thr Glu Gln Leu 275 280 285 Gly Leu Glu Glu Ile Ala Val Val Leu Gln Glu Ile Asn Gly Gln Ile 290 295 300 Asn Ala Ser Ser Gly Tyr Leu Gly Ala Ile Ser Asp Arg Ser Lys Val 305 310 315 320 Leu Tyr Phe Asn His Gln Thr Val Gly Gln Tyr Gln Met Ala Glu Leu 325 330 335 Asp Lys Asn Pro His Ala Ser Leu Arg Asn Met Val Phe Tyr Arg Gln 340 345 350 Asp Tyr Leu Asp Glu Phe Asp Arg Ile Trp Glu Lys Gln Ala Glu Phe 355 360 365 His Lys Glu Leu Thr Ala Glu Leu Lys Lys Glu Ile Arg Asp Met Ile 370 375 380 Ile Phe Tyr Gln Arg Arg Leu Lys Ser Gln Lys Gly Leu Ile Ser Phe 385 390 395 400 Cys Glu Phe Glu Arg Leu Glu Ile Val Val Glu Lys Asp Gly Lys Lys 405 410 415 Gln Thr Lys Val Ile Gly Cys Lys Val Ile Pro Arg Ser His Pro Leu 420 425 430 Phe Gln Glu Phe Lys Val Trp Gln Thr Leu Asn Asp Ile Lys Val Leu 435 440 445 Gly Arg Glu Lys Lys Arg Asn Ala Leu Ser Ala Ser Glu Ser Arg Ala 450 455 460 Leu Tyr Pro Glu Glu Lys Glu Ile Leu Ala Arg Glu Leu Ala Ile Lys 465 470 475 480 Glu Asn Met Lys Lys Ala Asp Val Leu Lys Leu Leu Phe Glu Asn Pro 485 490 495 Gln Glu Leu Asp Leu Asn Phe Lys Gln Ile Asp Gly Asn Arg Thr Gly 500 505 510 Phe Ser Leu Phe Ser Ala Tyr Ser Lys Met Ile Glu Lys Tyr Gly Tyr 515 520 525 Glu Pro Leu Asp Phe Lys Lys Pro Ala Asp Glu Ile Ile Gly Gln Leu 530 535 540 Arg Thr Ile Phe Thr Asp Leu Gly Trp Asn Thr Asn Leu Phe Thr Ile 545 550 555 560 Asp Leu Thr Lys Glu Gly Lys Glu Leu Glu Met Gln Pro Tyr Phe Arg 565 570 575 Leu Trp His Leu Leu Tyr Ser Phe Glu Gly Asp Asn Thr Ser Thr Gly 580 585 590 Asn Gly Lys Leu Ile Glu Lys Ile Met Gln Leu Cys Gly Val Glu Lys 595 600 605 Glu Tyr Ala Val Glu Leu Ala Ser Leu Ser Phe Gln Asp Asp Tyr Gly 610 615 620 Ser Leu Ser Ala Lys Ala Ile Lys Arg Ile Leu Pro Tyr Leu Lys Glu 625 630 635 640 Gly Asn Leu Tyr Asp Val Ala Cys Glu Tyr Ala Gly Tyr Arg His Ser 645 650 655 Lys Ser Ser Leu Thr Lys Glu Glu Ile Glu Asn Lys Val Leu Lys Gly 660 665 670 Lys Leu Glu Val Leu Pro Lys Asn Ser Leu Arg Asn Pro Val Val Glu 675 680 685 Lys Ile Leu Ser Gln Met Val Asn Val Ile Asn Thr Ile Ile Asp Thr 690 695 700 Tyr Gly Lys Pro Asp Glu Ile Arg Val Glu Leu Ala Arg Glu Leu Lys 705 710 715 720 Lys Ser Ala Lys Glu Arg Glu Glu Leu Thr Lys Ala Ile Ala Lys Ser 725 730 735 Thr Arg Glu His Glu Glu Ile Arg Lys Leu Leu Gln Asp Glu Phe Gly 740 745 750 Met Met Asn Val Ser Arg Asn Asp Ile Ile Arg Tyr Lys Leu Tyr Glu 755 760 765 Glu Leu Lys Asp Asn Gly Tyr Lys Thr Leu Tyr Ser Asn Gln Tyr Ile 770 775 780 Pro Lys Glu Lys Ile Phe Ser Lys Glu Ile Asp Ile Glu His Ile Ile 785 790 795 800 Pro Gln Ser Arg Leu Phe Asp Asp Ser Leu Ser Asn Lys Thr Leu Glu 805 810 815 Tyr Lys Ala Ile Asn Ile Glu Lys Gly Asn Lys Thr Ala Tyr Asp Phe 820 825 830 Val Lys Glu Lys Tyr Gly Glu Glu Gly Leu Gln Gln Tyr Ile Asn Arg 835 840 845 Cys Glu Ser Leu Phe Asn Asp Lys Lys Ala Lys Leu Arg Lys Leu Lys 850 855 860 Met Glu Gln Lys Asp Ile Pro Asp Gly Phe Ile Asp Arg Asp Leu Arg 865 870 875 880 Asn Thr Gln Tyr Ile Ala Lys Lys Ala Leu Ala Met Leu Asn Glu Ile 885 890 895 Cys Arg Arg Val Val Ala Thr Thr Gly Ser Ile Thr Asp Gln Leu Arg 900 905 910 Glu Asp Trp Gln Leu Val Asp Val Met Lys Glu Leu Asn Leu Pro Lys 915 920 925 Tyr Glu Ala Leu Gly Phe Val Glu Thr Tyr Glu Asp Lys Asp Gly Arg 930 935 940 Lys Ile Lys Arg Ile Lys Asp Trp Thr Lys Arg Asn Asp His Arg His 945 950 955 960 His Ala Met Asp Ala Leu Thr Val Ala Phe Thr Lys Asp Ala Phe Ile 965 970 975 Gln Tyr Phe Asn Asn Lys Asn Ala Ala Gln Asp Ser Gly Asn Arg Asn 980 985 990 His Thr Asn Ile Ile Gly Ile Lys Thr Arg Tyr Phe Asp Lys Gly Arg 995 1000 1005 Ala Leu Pro Pro Ile Pro Leu Glu Gln Phe Arg Ile Glu Ala Lys 1010 1015 1020 Gln His Leu Glu Lys Leu Leu Val Ser Ile Lys Ala Lys Asn Lys 1025 1030 1035 Val Val Thr Val Asn Val Asn Arg Thr Lys Lys Arg Lys Gly Glu 1040 1045 1050 Asn Thr Lys Ile Gln Gln Thr Pro Arg Gly Gln Leu His Leu Glu 1055 1060 1065 Thr Val Tyr Gly Ser His Lys Gln Tyr Val Thr Lys Ile Glu Lys 1070 1075 1080 Val Asn Ala Ser Phe Asp Ala Ala Lys Ile Ala Thr Val Ser Lys 1085 1090 1095 Arg Ala Tyr Arg Asn Ala Leu Leu Lys Arg Leu Glu Thr Phe Gly 1100 1105 1110 Asn Asp Pro Lys Lys Ala Phe Thr Gly Lys Asn Ala Leu Glu Lys 1115 1120 1125 Asn Pro Leu Tyr Ala Asp Lys Tyr Gln Thr Ile Arg Val Pro Glu 1130 1135 1140 Lys Val Gln Thr Val Glu Phe Glu Thr Ile Tyr Thr Ile Arg Lys 1145 1150 1155 Pro Val Asp Pro Ala Leu Asn Val Asp Lys Val Val Asp Val Lys 1160 1165 1170 Val Arg Ala Ile Leu Glu Arg Arg Leu Lys Glu Tyr Gly Gly Asp 1175 1180 1185 Pro Lys Lys Ala Phe Val Asn Phe Trp Glu Asn Pro Ile Trp Leu 1190 1195 1200 Asn Lys Glu Lys Gly Ile Ser Ile Lys Arg Val Ser Ile Arg Gly 1205 1210 1215 Ile Asn Asn Ala Gln Ser Ile His Val Lys Lys Asp Lys Asn Gly 1220 1225 1230 Asn Pro Ile Trp Asp Glu Asn Gly Lys Gln Ile Pro Val Asp Phe 1235 1240 1245 Val Asn Thr Gly Asn Asn His His Val Ala Ile Tyr Arg Lys Pro 1250 1255 1260 Val Leu Asp Lys Lys Gly Gln Val Thr Phe Asp Glu Asp Gly Asn 1265 1270 1275 Leu Met Tyr Glu Leu Asp Glu Val Val Val Pro Phe Phe Glu Ala 1280 1285 1290 Val Thr Arg Ala Asn Leu Gly Leu Pro Ile Ile Asp Lys Asp Tyr 1295 1300 1305 Arg Lys Ser Glu Gly Trp Gln Phe Leu Phe Ser Met Lys Gln Asn 1310 1315 1320 Glu Tyr Phe Val Phe Pro Asn Glu Lys Thr Gly Phe Asn Pro Lys 1325 1330 1335 Glu Val Asp Leu Leu Asn Pro Asp Asn Tyr Ala Met Ile Ser Pro 1340 1345 1350 Asn Leu Phe Arg Val Gln Thr Met Ser Lys Val Met Tyr Gly Asn 1355 1360 1365 Asn Val Val Arg Asp Tyr Lys Phe Arg His His Leu Glu Thr Thr 1370 1375 1380 Val Lys Asp Met Lys Glu Leu Lys Asp Ile Ala Tyr Lys Gln Tyr 1385 1390 1395 Lys Thr Leu Ser Phe Gly Asn Ser Val Val Lys Ile Arg Ile Asn 1400 1405 1410 His Ile Gly Gln Ile Val Ser Val Gly Glu Tyr 1415 1420 <210> 2 <211> 264 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG36 transposition protein sequence <220> <223> MG36-5-B1 transposition protein <400> 2 Met Lys Ala Asp Val Ser Glu Arg Gln Arg Val Lys Leu Leu Ala Asp 1 5 10 15 Met Ile Gly Tyr Tyr Arg Leu Cys Cys Pro Arg Ile Gly Gly Phe Lys 20 25 30 Leu Phe His Leu Leu Glu Lys Asp Leu Gly His Ala Val Thr Leu Gly 35 40 45 Arg Asp Ser Phe Leu Lys Val Tyr Glu Ser Lys Gly Phe Lys Leu Asn 50 55 60 Pro Asn Lys Arg Arg Arg Thr Thr Asp Ser Asn His Val Tyr Lys Arg 65 70 75 80 Tyr Pro Asn Leu Ile Lys Gly Lys Asp Ala Arg Tyr Ser Asn His Ile 85 90 95 Trp Val Ser Asp Ile Thr Tyr Val Trp Ile Leu Gly Asp Val Leu Tyr 100 105 110 Leu His Leu Val Thr Asp Ala Tyr Ser His Ala Val Leu Gly Trp Cys 115 120 125 Leu Ser Asp Ser Leu Ser Ala Ser His Thr Thr Glu Ala Leu Arg Met 130 135 140 Ala Ile Arg Ile Ala Gly Gly Gly Asn Leu Cys Gly Thr Ile His His 145 150 155 160 Ser Asp Arg Gly Ser Gln Tyr Ala Ser Glu Ala Tyr Val Ser Cys Leu 165 170 175 Met Glu His His Ile Arg Ile Ser Met Thr Glu Gly Tyr Glu Pro Thr 180 185 190 Asp Asn Ala Met Ala Glu Arg Gln Asn Gly Ile Phe Lys Val Glu Trp 195 200 205 Ile Tyr Glu Gln Glu Met Tyr Arg Asp Lys Glu Gln Ala Ile Asn Glu 210 215 220 Ile Asn Arg Met Ile Asp Phe Tyr Asn Asn Arg Arg Pro His Met Ser 225 230 235 240 Ile Gly Met Glu Cys Pro Met Glu Val Tyr Lys Gly Lys Leu Pro Gly 245 250 255 Lys Asn Leu Trp Arg Lys Arg Pro 260 <210> 3 <211> 126 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG36 transposition protein sequence <220> <223> MG36-5-B2 transposition protein <400> 3 Met Ile Lys Arg Lys Pro Lys Arg Val Phe Thr Glu Pro Phe Lys Leu 1 5 10 15 Ser Val Leu Arg Glu Tyr Tyr Ser Ser Gly Met Ser Lys Tyr Ala Ile 20 25 30 Thr Lys Lys Tyr Ser Leu Ser Pro Pro Cys Ile Tyr Arg Trp Leu Lys 35 40 45 Glu Tyr Pro Val Gly Ser Asp Gln Leu Pro Leu Pro Ser Glu Thr Lys 50 55 60 Glu Arg Leu Gln Met Val Pro Lys Gln Ser Asp Leu Thr Asp Met Glu 65 70 75 80 Ser Leu Gln Lys Arg Ile Glu Glu Leu Arg Arg Ser Leu Glu Leu Glu 85 90 95 Lys Met Arg Ser Arg Ala Phe Glu Lys Met Ile Glu Ile Ala Glu Glu 100 105 110 Glu Glu Gly Ile Ser Ile Phe Arg Lys Asp Gly Ala Lys Gln 115 120 125 <210> 4 <211> 286 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG36 transposition protein sequence <220> <223> MG36-5-T1 transposition protein <400> 4 Met Ala Arg Pro Asn Lys Glu Gly Leu Asp Tyr Phe Pro Phe Asp Val 1 5 10 15 Asp Phe Phe Ser Asp Glu Lys Ile Gly Ser Ile Ser Gly Glu Phe Gly 20 25 30 Ile Lys Gly Glu Ile Thr Ala Ile Lys Leu Leu Cys Ala Ile Tyr Arg 35 40 45 Asn Gly Tyr Phe Ile Leu Trp Asn Asp Ala Leu Lys Met Ser Leu Leu 50 55 60 Arg Gly Leu Pro Gly Ile Ser Leu Glu Leu Leu Glu Gln Ile Val Thr 65 70 75 80 Arg Leu Val Arg Trp Gly Phe Phe Glu Gln Thr Leu Phe Ser Thr Val 85 90 95 Ser Val Leu Thr Ser Lys Gly Ile Gln Glu Arg Tyr Phe Lys Ala Ile 100 105 110 Lys Arg Arg Lys Asp Ser Ser Asn Tyr Pro Tyr Leu Leu Val Asn Val 115 120 125 Asp Asn Asn Lys Val Asn Val Ser Asn Asn Asp Ile Asn Val Asn Thr 130 135 140 Asn Pro Ile Lys Glu Arg Lys Gly Asn Lys Asn Arg Glu Ser Leu Asn 145 150 155 160 Thr Arg Glu Thr Leu Phe Asp Asn Phe Lys Asn Glu Leu Leu Arg Asp 165 170 175 Glu Glu Trp Arg Arg Tyr Ala Cys Gln Ile Ser Gly Leu Ser Val Ala 180 185 190 Phe Asn Asp Leu Ile Pro Gly Glu Leu Asp Asn Phe Leu Ala Trp Met 195 200 205 Val Ser Thr Gly Glu Gly Asp Thr Leu Lys Thr Ile Asp Asp Val Lys 210 215 220 Arg Arg Phe Thr Tyr Trp Trp Gln Gly Thr Gly Leu Arg Ala Tyr Asn 225 230 235 240 Gln Arg Tyr Gly Gly Thr Arg Lys Glu Thr Phe Gly Gly Tyr Thr Ser 245 250 255 His Ala Gly Ala Tyr Gly Lys Arg Glu Ala Pro Ala Lys Thr Gly Val 260 265 270 Gln Pro Ser Glu Glu Ala Arg Lys Asp Tyr Thr Glu Arg Phe 275 280 285 <210> 5 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG36 transposition protein sequence <220> <223> MG36-5-C transposition protein <400> 5 Met Ile Lys Ala Leu Gly Cys Asn Tyr Leu Gly Ile Glu Arg Arg Gln 1 5 10 15 Phe Glu Thr Asp Arg Gly Asn Asp Lys Val Leu Arg Phe Leu Leu Tyr 20 25 30 Tyr Phe Asn Asp Cys Pro Leu Ala Glu Ser Val Phe Pro Glu Glu Asn 35 40 45 Tyr Lys Leu His Lys Asn Leu Leu Ile Val Gly Asp Pro Gly Thr Gly 50 55 60 Lys Thr Leu Met Met Gln Ile Phe Ala Asp Tyr Leu Lys Leu Thr Asp 65 70 75 80 Asn Pro Lys Arg Phe Val Asn Leu Ser Val Thr Gln Met Met Asn Tyr 85 90 95 Tyr Lys Ile His Gly His Ile Asp Arg Phe Thr Tyr Asn Glu Glu Ala 100 105 110 Gly Lys Gly Ser Met Glu Gly Asn Pro Phe Asp Ile Cys Leu Asn Asp 115 120 125 Ile Gly Leu Glu Thr Glu Asn Gln Lys Ser Tyr Gly Thr Ser Leu Asn 130 135 140 Ser Val Ile Asp Glu Phe Leu Tyr Ala Arg Tyr Glu Ile Tyr Gln Ser 145 150 155 160 His Gln Lys Lys Tyr His Ile Thr Ser Asn Leu Ser Val Thr Asp Phe 165 170 175 Lys Asn Arg Phe Gly Thr Arg Leu Val Asp Arg Phe Lys Ser Phe Asn 180 185 190 Val Ile Ile Leu Asn Gly Glu Ser Arg Arg Arg 195 200 <210> 6 <211> 724 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG39 effector sequence <220> <223> MG39-1 effector <400> 6 Val Lys Ile Ile Lys Arg Ser Gly Ala Glu Asn Thr Phe Asp Lys Glu 1 5 10 15 Lys Ile Glu Asn Ala Val Ala Lys Ala Asn Ile Thr Val Glu Glu Lys 20 25 30 Asp Arg Leu Ser Glu Gly Glu Ile Gly Glu Ile Ala Gln Asn Ile Glu 35 40 45 Asp Lys Cys Ser Glu Met Asn Arg Ala Met Asp Val Glu Thr Ile Gln 50 55 60 Asp Trp Val Glu Ala Asp Ile Met Arg His Gly Lys Tyr Thr Val Ala 65 70 75 80 Lys His Tyr Ile Thr Tyr Arg Tyr Glu Arg Ser Ile Val Arg Gln Ala 85 90 95 Asn Thr Thr Asp Lys Gln Ile Leu Ser Leu Leu Asn Phe Glu Asn Glu 100 105 110 Glu Val Lys Gln Glu Asn Ser Asn Lys Asn Pro Thr Val Asn Ser Val 115 120 125 Gln Arg Asp Tyr Met Ala Gly Glu Val Ser Lys Asp Ile Thr Arg Arg 130 135 140 Phe Leu Leu Pro Asp Asp Ile Val Glu Ala His Glu Lys Gly Leu Ile 145 150 155 160 His Phe His Asp Ala Asp Tyr Phe Ala Gln His Met His Asn Cys Cys 165 170 175 Leu Val Asn Leu Glu Asp Met Leu Gln Asn Gly Thr Val Ile Ser Glu 180 185 190 Val Met Ile Glu Lys Pro His Ser Phe Ser Thr Ala Cys Asn Ile Ala 195 200 205 Thr Gln Ser Ile Ala Gln Ile Ala Ser Ser Gln Tyr Gly Gly Gln Ser 210 215 220 Ile Thr Leu Ser His Leu Ala Pro Phe Val Gln Ile Ser Arg Asp Lys 225 230 235 240 Tyr Arg Arg Glu Val Lys Lys Glu Phe Ala Glu Leu Asn Ile Pro Ala 245 250 255 Asp Glu Asp Thr Ile Asn Lys Val Ala Glu Met Arg Val Lys Ala Glu 260 265 270 Ile Val Gln Gly Val Gln Met Ile Gln Tyr Gln Val Ile Thr Leu Met 275 280 285 Thr Thr Asn Gly Gln Ala Pro Phe Val Thr Val Phe Met Tyr Leu Asp 290 295 300 Glu Val Pro Glu Gly Gln Thr Arg Asp Asp Leu Ala Ala Ile Ile Glu 305 310 315 320 Glu Met Leu Arg Gln Arg Ile Gln Gly Val Lys Asn Glu Lys Gly Val 325 330 335 Tyr Ile Thr Pro Ala Phe Pro Lys Leu Ile Tyr Val Leu Glu Glu Asp 340 345 350 Asn Ile Arg Glu Gly Ser Lys Tyr Trp Glu Leu Thr Lys Leu Ala Ala 355 360 365 Lys Cys Thr Ala Lys Arg Met Val Pro Asp Tyr Ile Ser Glu Lys Lys 370 375 380 Met Lys Glu Leu Lys Val Asp Lys Asn Gly Asn Gly Gln Cys Tyr Pro 385 390 395 400 Cys Met Gly Cys Arg Ser Phe Leu Thr Thr Tyr Leu Asp Glu Asn Gly 405 410 415 Lys Pro Lys Tyr Tyr Gly Arg Phe Asn Gln Gly Val Val Thr Ile Asn 420 425 430 Leu Val Asp Val Ala Cys Ser Ser Tyr Lys Asp Met Asp Lys Phe Trp 435 440 445 Leu Ile Phe Asp Glu Arg Leu Glu Leu Cys Arg Arg Ala Leu Met Leu 450 455 460 Arg His Glu Arg Leu Lys Gly Thr Pro Ser Asp Val Ala Pro Ile Leu 465 470 475 480 Trp Gln Asn Gly Ala Leu Ala Arg Leu Lys Lys Gly Glu Thr Ile Asp 485 490 495 Lys Leu Leu Phe Gly Gly Tyr Ser Thr Ile Ser Leu Gly Tyr Ala Gly 500 505 510 Leu Cys Glu Cys Val Arg Tyr Met Thr Gly Lys Ser His Thr Asp Pro 515 520 525 Ser Ala Thr Pro Phe Ala Leu Glu Val Met Gln His Leu Asn Asp Ala 530 535 540 Cys Ala Lys Trp Arg Ala Glu Thr Asn Ile Asp Phe Ser Leu Tyr Gly 545 550 555 560 Thr Pro Leu Glu Ser Thr Thr Tyr Lys Phe Ala Arg Cys Leu Gln Lys 565 570 575 Arg Phe Gly Val Ile Glu Gly Val Thr Asp Arg Asn Tyr Ile Thr Asn 580 585 590 Ser Tyr His Ile His Val Thr Glu Asn Ile Asp Ala Phe Asp Lys Leu 595 600 605 Thr Phe Glu Ser Gln Phe Gln Ala Leu Ser Pro Gly Gly Ala Ile Ser 610 615 620 Tyr Val Glu Val Pro Asn Met Gln Asn Asn Ile Glu Ala Val Leu Ala 625 630 635 640 Val Met Gln His Ile Tyr Asp Asn Ile Met Tyr Ala Glu Leu Asn Thr 645 650 655 Lys Ser Asp Tyr Cys Gln Lys Cys Gly Phe Asp Gly Glu Ile Lys Ile 660 665 670 Val Glu Asp Asp Gly Lys Leu Val Trp Glu Cys Pro Asn Cys Gly Asn 675 680 685 Arg Asp Gln Asn Thr Leu Asn Val Ala Arg Arg Thr Cys Gly Tyr Ile 690 695 700 Gly Thr Gln Phe Trp Asn Gln Gly Arg Thr Gln Glu Ile Lys Glu Arg 705 710 715 720 Val Leu His Leu <210> 7 <211> 214 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG39 transposition protein sequence <220> <223> MG39-1-A transposition protein <400> 7 Met Ser Lys Arg Ile Ser Arg Ala Thr Lys Leu Ala Arg Gly Gln Gly 1 5 10 15 Ser Gly Glu Gly Ala Lys Tyr Lys Ser Tyr Val Met Thr Asn Glu Phe 20 25 30 Asn Ser Leu Gly Thr Thr Ser Val Ile Lys Asp Trp Lys Thr Gly Arg 35 40 45 Gly Val His Cys Leu Ser Gln Ala Glu Ala Leu Trp Phe Tyr Ile Leu 50 55 60 Arg Trp Asp Asp Asn Asn Ile Asp Ile Arg Glu Gln Tyr Pro Leu Asp 65 70 75 80 Arg Asn Ile Thr Ser Arg Ile Ala Asp Lys Tyr Gly Phe Lys His Pro 85 90 95 Gly Asn Ser Asp His Ile Met Thr Thr Asp Phe Leu Val Thr Lys Lys 100 105 110 Asn Asn Lys Leu His Ala Tyr Ser Val Lys Pro Asp Arg Asp Leu Ser 115 120 125 Lys Arg Thr Leu Glu Ile Leu Cys Ile Glu Lys Leu Tyr Trp Glu His 130 135 140 Asn Asn Ile Glu Phe Asp Met Leu Phe Lys Glu Asp Val Asn Thr Ile 145 150 155 160 Leu Ala Ser Asn Ile Arg Leu Val Thr Glu Tyr Tyr Asp Glu Ser Arg 165 170 175 Val Phe Asp Arg Tyr Ser Asn Ile Arg His Asn Ile Ala Thr Lys Lys 180 185 190 Ile Arg Cys Asp Met Glu His Lys Ile Leu Thr Asn Asp Asp Leu Asp 195 200 205 Arg Ile Trp Gly Glu Tyr 210 <210> 8 <211> 716 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG39 transposition protein sequence <220> <223> MG39-1-B transposition protein <400> 8 Met Thr Ile Leu Ile Glu Tyr Gly Val Asn Thr Glu Met Asn Asp Tyr 1 5 10 15 Val Leu Ala Ile Gly Asp Ile Leu Tyr Asp Lys Asp Asn Gln Asn Ser 20 25 30 Tyr Arg Ile Ile Ser Leu Ile Asp Asp His Leu Ile Leu Cys Glu Met 35 40 45 Glu Thr Thr Lys Leu Glu Leu Gln Gln Ile Lys Tyr Thr Ile Ile Ala 50 55 60 Asp Leu Val Leu Ser Asn Lys Ile Glu Ile Lys Lys Asp Gln Ala Leu 65 70 75 80 Val Tyr Asp Ile Asp Gln Leu Ser Glu Ser Val Arg Asn Arg Tyr Ile 85 90 95 Leu Lys Val His Ile Met Asn Asp Val Lys Ile Ala Tyr Gly Pro Ser 100 105 110 Tyr Leu Gly Leu Met Gly Lys Ser Ser Lys Ile Glu Leu Gln Lys Ile 115 120 125 Leu Ala Lys Tyr Asn Tyr Pro Ile Ser Ser Phe Trp Arg Met Cys Thr 130 135 140 Thr Tyr Phe Gln Ser Gly Met Lys Asn Tyr Ser Leu Ile Asn Ala Lys 145 150 155 160 Ser Phe Lys Ser Asn Glu Val Lys Thr Tyr Thr Tyr Lys Ala Arg Pro 165 170 175 Gly Ala Lys Ser Thr Tyr Asn Leu Asp Asn Val Val Lys Pro Asn Glu 180 185 190 Tyr Val Ile Tyr Phe Glu Glu Ala Leu Asn Glu Tyr Lys Ala Gly Arg 195 200 205 Glu Lys Thr Leu Lys Asn Ala Phe Ser Arg Met Asn Ile Leu His Phe 210 215 220 Thr Gln Ala Glu Ile Ile Asp Gly Val Ala Thr Arg Leu Leu Leu Pro 225 230 235 240 Glu Cys Gln Arg Pro Thr Tyr Lys Gln Phe Tyr Tyr Tyr Ala Gln Lys 245 250 255 His Leu Thr Lys Glu Glu Lys Asp Leu Ile Lys Thr Ser Ala Ala Glu 260 265 270 Gln Arg Asn Asn Lys Arg Leu Leu Ile Ser Asp Ser Leu Lys Asp Val 275 280 285 Tyr Gly Pro Ala Asp Met Val Glu Ile Asp Ala Cys Glu Ala Asp Val 290 295 300 Ser Leu Val Ser Glu Leu Asp Pro Asp Gln Ala Ile Gly Arg Pro Ile 305 310 315 320 Val Tyr Phe Met Ile Asp Val Tyr Ser Arg Ile Ile Leu Ala Val Ser 325 330 335 Val Ala Phe Asp Asn Asn Ser Ile Leu Gly Ile Thr Asn Leu Phe Leu 340 345 350 Asn Leu Ala Asp Asp Lys Gln Glu Tyr Cys Lys Lys Tyr Gly Ile Glu 355 360 365 Phe Asn Asp Lys Arg Leu Trp Pro Ser Gly Val Ile Pro Lys Arg Ile 370 375 380 Arg Val Asp Arg Gly Ser Glu Phe Lys Ser Tyr Glu Phe Asp Arg Ile 385 390 395 400 Cys Asn Glu Leu Gly Ile Glu Lys Gln Ile Val Ser Gly Ala Ser Gly 405 410 415 Ser Leu Lys Gly Val Val Glu Gln Ala Phe His Gln Met His Ala Lys 420 425 430 Gln Asn Val His Leu Glu Asn His Gly Leu Ile Glu Lys Arg Tyr Asp 435 440 445 Ser Leu His His Lys Glu Ala Ser Leu Thr Ile His Asp Tyr Thr Arg 450 455 460 Met Val Ile Asn Phe Val Leu Ala His Asn Gln Gln His Leu Glu Thr 465 470 475 480 Tyr Pro Leu Thr Lys Glu Met Ile Glu Lys Asn Ile Ala Pro Val Pro 485 490 495 Ala Ile Leu Trp Glu Tyr Gly Ser Lys Lys Tyr Gly Met Pro Gln Pro 500 505 510 Ile Pro Val Leu Glu Gln Tyr Leu Phe Ser Leu Met Thr Pro Ile Lys 515 520 525 Ala Lys Ile Ser Lys Arg Gly Ile Ser Tyr Lys Gly Leu Trp Tyr Phe 530 535 540 Ala Pro Asn Asp Lys Arg Leu Met Ser Glu Met Tyr Ala Ala Gly Thr 545 550 555 560 Arg Arg Met Pro Phe Glu Val Arg Met Asp Met Arg Asp Val Gly Ala 565 570 575 Ile Tyr Tyr Ile Arg Asn Ser Lys Leu Val Lys Ile Pro Leu Asn Val 580 585 590 Leu Ile Thr Gly Asn Ser Asp Tyr Lys Gly Leu Thr Met Lys Gln Tyr 595 600 605 Glu Glu Tyr Tyr Ser Ala Lys Lys Lys Met Gln Ala Lys Gly Arg Ile 610 615 620 Asp Asn Glu Lys Ile Asp Thr Ala Val Tyr Ala Asn Asn Glu Ser Ile 625 630 635 640 Val Lys Ser Ala Lys Lys Asn Val His Ser Arg Thr Lys Asp Ile Arg 645 650 655 Ser Ser Arg Glu Ile Asp Lys Gln Lys Val Ser Tyr Glu Gly Lys Ile 660 665 670 Ser Ala Arg Leu Glu Asn Lys Asp Glu Thr Ser Lys Asn Ile Ser Ser 675 680 685 Asp Glu Gln Lys Glu Asn Gly Val Thr Glu Tyr Arg Asp Tyr Ala Ser 690 695 700 Phe Glu Glu Ala Leu Gln Asp Phe Tyr Asp Asn Asn 705 710 715 <210> 9 <211> 534 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG39 transposition protein sequence <220> <223> MG39-1-C transposition protein <400> 9 Met Ala Lys Tyr Asn Tyr Val Thr Cys Glu Glu Val Val Ser Gln Tyr 1 5 10 15 Asp Asp Tyr Asp Leu Lys Glu Gln Arg Ile Val Pro Ala Arg Tyr Val 20 25 30 Glu Ala Lys Leu Ala Ile Asp Thr Gly Asn Pro Tyr Ile Glu Ala Leu 35 40 45 Pro Tyr Pro Arg Thr Gly Arg Asn Ile Ile Ser Ser Tyr Ser Gln Thr 50 55 60 Met Ala Asp Phe Asp Tyr Asp Lys Ile Lys Ser Met Ser Thr Ile Asp 65 70 75 80 Lys Ile Leu Gln Ile Arg Ser Leu Arg Ser Ile Arg Phe Pro Leu Pro 85 90 95 Phe His Ala Glu Leu Glu Leu Ser Phe Tyr Asn Ala Leu Ile Thr Ser 100 105 110 Tyr Arg Ser Arg His Ile Leu His Ser Asp Asn Asp Lys Val Ser Tyr 115 120 125 Ser Val Glu Asn Gln Glu Tyr Ala Ala Ser Asn Ile Leu Val Gly Asp 130 135 140 Ser Ser Ala Ser Thr Asp Ala Gly Phe Ser Leu Ile Gly Tyr Ser Gly 145 150 155 160 Cys Gly Lys Ser Ser Ala Ile Gln Met Leu Val Ser Tyr Tyr Pro Gln 165 170 175 Val Ile Met His Thr Thr Glu Asn Gly Glu Tyr Phe Pro Gln Ile Thr 180 185 190 Tyr Leu Val Val Asn Cys Ile Pro Asn Ser Asn Phe Ser Ala Leu Tyr 195 200 205 Asp Gly Ile Gly Asp Ala Ile Asp Lys Ala Leu Gly Asn Ile Lys Pro 210 215 220 Ile Tyr Ser Ala Glu Ile Met Lys Ile Arg Thr Leu Gly Ala Lys Ala 225 230 235 240 Glu Arg Ile Arg Glu Tyr Val Glu Lys Phe Ala Ile Gly Ile Ile Ile 245 250 255 Phe Asp Glu Ile Gln Leu Ile Asp Phe Ser His Thr Arg Glu Asn Ser 260 265 270 Phe Asp Ser Leu Leu Thr Leu Ser Asn Arg Thr Lys Val Ala Thr Ala 275 280 285 Ile Val Gly Thr Glu Asp Ala Lys Ala Lys Met Phe Lys Thr Leu Arg 290 295 300 Thr Ala Arg Arg Val Gly Asn Val Ile Asn Gly Asn Met Tyr Cys Met 305 310 315 320 Asp Lys Lys Phe Phe Tyr Phe Leu Val Asn Glu Leu Phe Arg Tyr Gln 325 330 335 Trp Phe Asp Lys Pro Val Thr Val Ser Glu Glu Ile Thr Asp Ala Leu 340 345 350 Tyr Asp Val Thr Lys Gly Ile Val Asp Gln Leu Ile Gly Ile Tyr Ile 355 360 365 Tyr Met Asn Ile Asp Tyr Leu Asn Lys Lys Lys Lys Pro Glu Ile Asn 370 375 380 Ser Lys Tyr Ile Tyr Ala Val Thr Asn Lys His Phe Ala Gly Leu Arg 385 390 395 400 Asp Val Leu Glu Asn Leu Asp Ser Asp Phe Asn Asn Glu Leu Met Gln 405 410 415 Glu Ile Asn Asp Asn Ala Lys Leu Glu Leu Asp Lys Ile Glu Asp Glu 420 425 430 Ala Lys Gln Leu Lys Glu Ala Glu Lys Ile Leu Asn Asn Asn Ser Ser 435 440 445 Glu Glu Lys Val Gln Ile Lys Asn Val Val Ala Asn Ile Thr Ala Ile 450 455 460 Tyr Asp Glu Tyr Thr Pro Thr Gln Ile Glu Asp Ala Phe Lys Lys Val 465 470 475 480 Ile Arg Lys Lys Ser Ser Val Gly Lys Ala Glu Arg Glu Ile Ser Lys 485 490 495 Leu Val Ile Glu Gln Leu Thr Lys Gln Gln Arg Thr Arg Ser Asp Leu 500 505 510 Cys Lys Lys Asn Thr Pro Ser Val Ile Gln Met Gln Asn Phe Leu Gly 515 520 525 Ile Asp Lys Glu Asp Lys 530 <210> 10 <211> 641 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG39 transposition protein sequence <220> <223> MG39-1-Q transposition protein <400> 10 Met Pro Val Ile Pro Val Tyr Ile Asn Pro Tyr Pro Asp Glu Leu Met 1 5 10 15 Tyr Ser Trp Ile His Arg Leu Ala Lys Lys Asn Gly Leu Pro Ile Thr 20 25 30 Thr Phe Ala Asp Ser Tyr Leu Asn Lys Phe Asn Ser Lys Ile Gly Ser 35 40 45 Leu Glu Tyr Asp Ile Arg Tyr Gly Leu Leu Cys Leu Asn Glu Ser Phe 50 55 60 Phe Ile Gln Lys Asp Leu Lys Glu Met Phe Leu Ser Met Ser Ile Phe 65 70 75 80 Pro Phe Glu Ala Met Phe Phe Ser Val Gly Gln Gln Thr Arg Tyr Val 85 90 95 Asn Asn Met Phe Arg Lys Pro Asp Pro Leu Asn Ala Pro Val Asn Thr 100 105 110 Met Ile Arg Glu Ile His Ile Cys Pro Gln Cys Ile Glu Asn Asp Ile 115 120 125 Glu Ile Phe Gly Glu Pro Tyr Ile His Arg Ala His Gln Leu Ser Gly 130 135 140 Val Cys Thr Cys His Lys His Lys Ala Pro Leu Tyr Lys Tyr Thr Gly 145 150 155 160 Ile Lys Gly His Glu Cys Glu Tyr Asp Leu Ser His Tyr Thr Glu Leu 165 170 175 Glu Ile Lys Asp Ile Ala Ile Glu Asn Glu Tyr Thr Asp Tyr Ala Gln 180 185 190 Ala Leu Phe Asn Ser Asn Thr Asn Cys Asn Ile Ala Asp Leu Lys His 195 200 205 Met Ile Tyr Asn Lys Leu Lys Glu Leu Gly His Lys Ala Thr Asn Gly 210 215 220 Tyr Glu Asp Phe Ile Ser Ala Phe Asn Asp Ser Lys Leu Val Thr Leu 225 230 235 240 Phe Asp Ala Asp Leu Lys Asn Phe Leu Leu Val Ser Ile Ile Ser Thr 245 250 255 Gln Ser Thr Ser Ala Arg Ser Met Leu Pro Leu Leu Met Tyr Leu Phe 260 265 270 Pro Asn Val Gln Glu Ile Ile His Arg Phe Glu Asn Ala Pro Pro Ile 275 280 285 Ile Gln Lys Tyr His Cys Ala Glu Cys Gly Lys Asn Phe Tyr Ala Thr 290 295 300 Pro Thr Ser Leu Thr Glu Gly Trp Gly Cys Thr Tyr Cys Asp Ala Asn 305 310 315 320 Lys Ser Ile Asp Glu Arg Tyr Lys Lys Leu Ile Asp Phe Ala Gly Lys 325 330 335 Gly Asn Tyr Glu Pro Leu Glu Pro Phe Arg Ser Leu Asn Ile Lys Ser 340 345 350 Lys Ile His His Lys Ile Cys Gly Glu Thr Ile Gln Ile Lys Pro Arg 355 360 365 Lys Phe Ile Phe Asp His Val Arg Cys Ile Cys Glu Ser Leu Leu Asn 370 375 380 Glu Trp Asp Val Arg Gln Lys Leu Glu Lys Phe Glu Asp Tyr Glu Phe 385 390 395 400 Ile Ser Tyr Asp Ser Glu Ser Ser Lys Ile Thr Met Arg Ser Lys Ala 405 410 415 Cys Gly His Val Phe Ser Cys Arg Phe His Lys Phe Ile Lys Tyr Pro 420 425 430 Ser Cys Arg Val Cys Arg Pro Lys Asn Met Thr Thr Glu Leu Tyr Thr 435 440 445 Glu Arg Val Tyr Asp Leu Val Gly Asp Asp Tyr Thr Val Leu Ser Glu 450 455 460 Phe Val Asp Gln Arg Thr Lys Ile Ala Ile Lys His Asn Lys Cys Gly 465 470 475 480 Gly Ile Gln Glu Tyr Lys Pro Ser Ala Phe Leu Asp Gly Gln Arg Cys 485 490 495 Asn Ala Cys Asn Ser Leu Ile Val Lys Lys Ala Asn Asp Ser Trp Glu 500 505 510 Lys Gly Tyr Ala Leu Leu Cys Glu Tyr Lys Glu Glu Cys Gly Thr Ala 515 520 525 Asn Ile Pro Lys Arg Asp His Tyr Lys Gly Val Phe Leu Gly Asn Trp 530 535 540 Leu Gln Ser Gln Arg Asp Lys Tyr Lys Ala Gly Lys Leu Thr Arg Ser 545 550 555 560 Gln Glu Asp Ala Leu Val Ser Leu Gly Ile Thr Leu Asp Pro Leu Ala 565 570 575 Ala Glu Trp Glu Arg Arg Tyr Glu Gln Tyr Lys Arg Tyr Ile Gln Gln 580 585 590 Asn Asn Gly Ser Ser Asp Ile Thr Lys Arg Thr Ile Phe Glu Gly Glu 595 600 605 Lys Leu Gly Val Trp Val Val Leu Gln Arg Arg Asn Tyr Asn Ile Gly 610 615 620 Lys Leu Ser Glu Glu Arg Tyr Lys Lys Leu Cys Asp Ile Asn Met Lys 625 630 635 640 Phe <210> 11 <211> 118 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG36-5 effector tested sgRNA sequence <220> <221> modified_base <222> (1)..(24) <223> a, c, u, g, unknown or other <400> 11 nnnnnnnnnn nnnnnnnnnn nnnnguugug auuugcuuuc agaaaaugaa gcaaaucaca 60 auaaggauua uuccguugug aaaacauuag guucccucgc ccuucugcgg gggauuuu 118 <210> 12 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG36-5 effector tracrRNA sequence <400> 12 uacuaaaaug aagcaaauca caauaaggau uauuccguug ugaaaacauu agguucccuc 60 gcccuucugc gggggauuuu 80 <210> 13 <211> 46 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG39-1 effector tracrRNA sequence 1 <400> 13 uuuuuguaaa aucauuuugu aaaauuacaa uucauaauga gauaug 46 <210> 14 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG39-1 effector tracrRNA sequence 2 <400> 14 uuuuuguaaa aucauuuugu aaaauuacaa uucauaauga gauaugacaa uucauaauga 60 gauauu 66 <210> 15 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG39-1 effector tracrRNA sequence 3 <400> 15 aaaauauagg auauuaaugu cagagauauc ucauuauaau uguaauuuug uuuuguguac 60 aagcuguuaa uaucucauua ugaauuguca uaucucauua ugaauugua 109 <210> 16 <211> 88 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG39-1 effector tracrRNA sequence 4 <400> 16 aaaauauagg auauuaaugu cagagauauc ucauuauaau uguaauuuug uuuuguguac 60 aagcuguuaa uaucucauua ugaauugu 88 <210> 17 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> putative MG36-5 transposon end LE1 <400> 17 ttaattgaaa attgaaaatt gagaattgaa aattaa 36 <210> 18 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> putative MG36-5 transposon end LE2 <400> 18 tgagaattga aaattgagaa ttgggaattg agaatt 36 <210> 19 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> putative MG36-5 transposon end RE1 <400> 19 ttaattttca attctcaatt ttcaatta 28 <210> 20 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> putative MG39-1 transposon end LE1 <400> 20 aaaagtattg acaaattgac aaaatggtgg tataat 36 <210> 21 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> putative MG39-1 transposon end RE1 <400> 21 attataacct atatttttga ttttgtcaat agtttt 36 <210> 22 <211> 637 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-2 effector <400> 22 Met Ser Gln Ile Thr Ile Gln Cys Gln Leu Val Ala Ser Ala Ser Thr 1 5 10 15 Arg Gln Gln Leu Trp Leu Leu Met Thr Gln Lys Asn Thr Pro Leu Ile 20 25 30 Asn Glu Leu Leu Gln Gln Val Gly Gln His Pro Glu Phe Glu Thr Trp 35 40 45 Arg Gln Lys Gly Lys Leu Gln Ala Gly Ile Val Lys Ala Leu Cys Gln 50 55 60 Pro Leu Lys Ala Asp Pro Arg Phe Met Gly Gln Pro Ala Arg Phe Tyr 65 70 75 80 Ala Ser Ala Ile Ala Val Val Asp Tyr Ile Tyr Arg Ser Trp Leu Ala 85 90 95 Leu Gln Lys Arg Leu Gln Tyr Gln Leu Glu Gly Gln Thr Arg Trp Tyr 100 105 110 Gln Met Leu Arg Ser Asp Ala Glu Leu Ile Glu Leu Tyr Gly Gly Ser 115 120 125 Leu Glu Thr Leu Arg Ser Lys Ala Ala Glu Ile Leu Ala Gln Phe Ala 130 135 140 Pro Glu Ser Ala Ser Val Asn Pro Gln Pro Thr Lys Gly Lys Lys Ser 145 150 155 160 Lys Lys Arg Lys Asn Ser Ser Asn Asn Pro Asn Leu Ser Thr Ala Leu 165 170 175 Phe Glu Ala Tyr Arg Gln Thr Glu Asp Ile Leu Ser Ser Cys Ala Ile 180 185 190 Asn Tyr Leu Leu Lys Asn Gly Cys Lys Val Ser Glu Lys Glu Glu Asp 195 200 205 Pro Glu Lys Phe Ala Lys Arg Arg Arg Ser Val Glu Ile Arg Ile Glu 210 215 220 Arg Leu Lys Glu Lys Leu Ala Ser Arg Met Pro Lys Gly Arg Asp Leu 225 230 235 240 Thr Asp Glu Lys Trp Leu Glu Thr Leu Met Val Ala Ser Thr Thr Val 245 250 255 Pro Ser Ser Glu Phe Gln Ala Lys Ser Trp Gln Asp Asn Leu Leu Arg 260 265 270 Lys Ser Ser Ala Ile Pro Phe Pro Val Ala Tyr Glu Thr Asn Glu Asp 275 280 285 Met Thr Trp Phe Lys Asn Ser Lys Gly Arg Ile Cys Val Lys Phe Asn 290 295 300 Gly Leu Ser Glu Gln Thr Phe Glu Val Tyr Cys Asp Ser Arg Gln Leu 305 310 315 320 Tyr Trp Phe Gln Arg Phe Leu Glu Asp Gln Gln Ile Lys Arg Asn Ser 325 330 335 Lys Asp Gln His Ser Ser Ser Leu Phe Thr Leu Arg Ser Gly Arg Ile 340 345 350 Ala Trp Ser Glu Gly Glu Gly Lys Gly Asp Pro Trp Asn Ile His Arg 355 360 365 Leu Thr Leu Tyr Cys Cys Val Asp Thr Arg Leu Trp Thr Ser Glu Gly 370 375 380 Thr Glu Gln Val Arg His Glu Lys Ala Asp Glu Ile Thr Gln Ile Ile 385 390 395 400 Thr Lys Thr Lys Gln Lys Thr Asp Leu Asn Glu Lys Gln Gln Ala Phe 405 410 415 Ile Lys Arg Lys Thr Ser Thr Leu Ala Arg Ile Asn Asn Pro Phe Pro 420 425 430 Arg Pro Ser Lys Pro Val Tyr Gln Gly His Ser His Ile Leu Val Gly 435 440 445 Val Ser Leu Gly Leu Asp Lys Pro Ala Thr Leu Ala Val Ile Asp Ala 450 455 460 Ile Ala Asn Lys Val Ile Thr Tyr Arg Ser Ile Arg Gln Leu Leu Gly 465 470 475 480 Asp Asn Tyr Gln Leu Leu Asn Arg Gln Arg Gln Gln Gln His Gln Asn 485 490 495 Ala His Lys Arg Gln Thr Ala Gln Arg Gln Asp Ala Pro His Gln Phe 500 505 510 Ser Glu Ser Glu Leu Gly Gln Tyr Ile Asp Arg Leu Leu Ala Lys Ala 515 520 525 Ile Val Ala Val Ala Lys Thr Tyr Gln Ala Gly Ser Ile Val Leu Pro 530 535 540 Gln Leu Gly Asp Val Arg Glu Ser Ile Glu Ser Glu Ile Lys Ala Arg 545 550 555 560 Ala Glu Gln Lys Cys Pro Asp Leu Val Glu Val Gln Lys Gln Tyr Ala 565 570 575 Lys Gln Tyr Arg Ser Ser Ile His Arg Trp Ser Tyr Ala Arg Leu Ile 580 585 590 Asp Ser Ile Lys Ser Gln Ala Ser Gln Val Gly Ile Phe Ile Glu Glu 595 600 605 Gly Lys Gln Pro Val Arg Gly Ser Pro Gln Asp Lys Ala Lys Asp Leu 610 615 620 Ala Ile Ala Val Tyr His Ser Arg Leu Asn Thr Lys Ser 625 630 635 <210> 23 <211> 560 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-2-B transposition protein <400> 23 Met Gln Asp Asp Arg Glu Ser Glu Val Pro Ile Pro Ala Glu Val Asn 1 5 10 15 Glu Ile Val Thr Asp Phe Ser Glu Asp Ala Lys Leu Met Gln Glu Val 20 25 30 Ile Gln Ser Leu Leu Glu Pro Cys Asp Arg Ile Thr Tyr Gly Gln Arg 35 40 45 Gln Arg Glu Ala Ala Ala Lys Leu Gly Lys Ser Val Arg Thr Ile Arg 50 55 60 Arg Leu Val Lys Lys Trp Glu Thr Glu Gly Leu Ser Ala Leu Gln Pro 65 70 75 80 Asn Lys Arg Thr Asp Lys Gly Lys His Arg Ile Asp Gln Glu Trp Gln 85 90 95 Glu Phe Ile Ile Lys Thr Tyr Lys Glu Gly Asn Lys Gly Ser Lys Arg 100 105 110 Ile Thr Pro Gln Gln Val Ala Val Arg Val Ala Ala Lys Ala Ala Asp 115 120 125 Leu Gly Gln Glu Lys Tyr Pro Ser Tyr Arg Thr Val Tyr Arg Val Leu 130 135 140 Gln Pro Ile Ile Glu Lys Gln Glu Lys Thr Gln Ser Val Arg Ser Arg 145 150 155 160 Gly Trp Arg Gly Ser Arg Leu Ser Val Lys Thr Arg Asp Gly Gln Asp 165 170 175 Leu Ser Val Glu Tyr Ser Asn His Val Trp Gln Cys Asp His Thr Arg 180 185 190 Ala Asp Ile Leu Leu Val Asp Gln Asp Gly Gln Leu Leu Gly Arg Pro 195 200 205 Trp Leu Thr Thr Val Ile Asp Thr Tyr Ser Arg Cys Ile Ile Gly Ile 210 215 220 Asn Leu Gly Tyr Asp Ala Pro Ser Ala Tyr Val Val Ala Leu Ala Leu 225 230 235 240 Arg His Ala Ile Leu Pro Lys Gln Tyr Ser Ser Glu Tyr Lys Leu His 245 250 255 Cys Gln Trp Gly Thr Tyr Gly Lys Pro Glu His Phe Tyr Thr Asp Gly 260 265 270 Gly Lys Asp Phe Arg Ser Asn His Leu Gln Gln Ile Gly Val Gln Leu 275 280 285 Gly Phe Val Cys His Leu Arg Asp Arg Pro Ser Glu Gly Gly Ile Val 290 295 300 Glu Arg Pro Phe Gly Thr Phe Asn Thr Asp Leu Phe Ser Thr Leu Pro 305 310 315 320 Gly Tyr Thr Gly Ser Asn Val Gln Glu Arg Pro Glu Glu Ala Glu Lys 325 330 335 Glu Ala Ser Leu Thr Leu Arg Glu Leu Glu Gln Leu Leu Val Arg Tyr 340 345 350 Ile Val Asp Lys Tyr Asn Gln Ser Ile Asp Ala Arg Met Gly Asp Gln 355 360 365 Thr Arg Phe Gln Arg Trp Glu Ala Gly Leu Ile Ala Ala Pro Asn Leu 370 375 380 Ile Ser Glu Arg Asp Leu Asp Ile Cys Leu Met Lys Gln Thr Arg Arg 385 390 395 400 Thr Ile Tyr Arg Gly Gly Tyr Leu Gln Phe Glu Asn Leu Thr Tyr Arg 405 410 415 Gly Asp Tyr Leu Glu Gly Tyr Ser Gly Glu Ser Val Val Leu Arg Tyr 420 425 430 Asp Pro Lys Asp Ile Thr Thr Ile Leu Val Tyr Arg Lys Glu Gly Asp 435 440 445 Lys Glu Val Phe Leu Ala Arg Ala Tyr Glu Gln Asp Leu Gln Thr Glu 450 455 460 Gln Leu Ser Phe Asp Glu Val Lys Ala Ile Ser Arg Lys Leu Arg Glu 465 470 475 480 Ala Lys Lys Ala Val Asn Ser Arg Ser Ile Leu Ala Glu Val Arg Asp 485 490 495 Arg Glu Thr Phe Leu Thr Gln Lys Lys Ser Lys Lys Gln Arg Gln Lys 500 505 510 Ser Glu Gln Ala Gln Ile His Arg Lys Lys Glu Leu Phe Pro Ile Glu 515 520 525 Ala Glu Ala Thr Glu Phe Glu Ser Pro Val Asn Glu Leu Glu Thr Glu 530 535 540 Ile Ile Glu Val Phe Asp Tyr Glu Gln Met Arg Glu Asp Tyr Gly Phe 545 550 555 560 <210> 24 <211> 287 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-2-C transposition protein <400> 24 Met Met Asn Gln Glu Lys Glu Ala Lys Ala Ile Ala Gln Lys Leu Gly 1 5 10 15 Asn Ile Pro Leu Asn Asp Glu Lys Ile Gln Ala Glu Ile Gln Arg Leu 20 25 30 Asn Arg Lys Asn Phe Val Pro Leu Glu Gln Val Lys Ala Leu His Asp 35 40 45 Trp Leu Glu Ser Lys Arg Gln Ala Arg Gln Cys Cys Arg Val Ile Gly 50 55 60 Glu Ser Arg Thr Gly Lys Thr Met Ala Cys Asn Ala Tyr Arg Leu Arg 65 70 75 80 Asn Lys Ala Ile Gln Ser Leu Gly Gln Pro Pro Thr Val Pro Val Val 85 90 95 Tyr Ile Gln Ile Pro Gln Glu Cys Thr Pro Lys Glu Leu Phe Ser Val 100 105 110 Leu Leu Glu His Leu Asn His Gln Met Thr Lys Gly Thr Thr Ala Glu 115 120 125 Met Arg Asn Arg Thr Leu Arg Val Leu Lys Ala Cys Arg Val Glu Met 130 135 140 Leu Ile Ile Asp Glu Ala Asp Arg Leu Lys Pro Lys Thr Phe Ala Asp 145 150 155 160 Val Arg Asp Ile Phe Asp Asn Leu Glu Ile Ser Val Val Leu Val Gly 165 170 175 Thr Val Arg Leu Glu Lys Val Met Thr Asp Asp Glu Gln Val Cys Asn 180 185 190 Arg Phe Ser Ala Cys Tyr Arg Tyr Gly Lys Leu Ser Val Glu Glu Phe 195 200 205 Lys Lys Thr Val Asn Ile Trp Glu Asn Gln Val Leu Lys Leu Pro Val 210 215 220 Ser Ser Asn Leu Thr Gln Ser Lys Met Leu Asp Ile Leu Lys Asp Lys 225 230 235 240 Thr Gln Cys Tyr Ile Gly Leu Met Asp Met Ile Leu Arg Asp Ala Ala 245 250 255 Ile Arg Ala Leu Asn Lys Gly Met Pro Lys Ile Asp Leu Glu Thr Leu 260 265 270 Lys Glu Val Thr Asn Glu Tyr Thr Ala Pro Pro Lys Arg Ser Lys 275 280 285 <210> 25 <211> 168 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-2-Q transposition protein <400> 25 Met Lys Ala Ser Asp Ile Gln Pro Trp Leu Phe Arg Val Glu Pro Phe 1 5 10 15 Glu Gly Glu Ser Ile Ser His Phe Leu Gly Arg Phe Gln Arg Ala Asn 20 25 30 Glu Leu Thr Pro Ser Gly Leu Ala Lys Ala Ala Gly Leu Gly Gly Ala 35 40 45 Ile Ala Arg Trp Glu Lys Phe Arg Phe Asn Pro Pro Pro Ser Pro Gln 50 55 60 Gln Leu Glu Ala Leu Ala Leu Val Val Glu Val Glu Ala Glu Arg Leu 65 70 75 80 Val Gln Met Leu Pro Pro Ala Gly Val Gly Met Lys Met Glu Pro Ile 85 90 95 Arg Leu Cys Gly Ala Cys Tyr Ala Glu Val Pro Cys His Lys Ile Glu 100 105 110 Trp Gln Phe Lys Thr Thr Gln Gly Cys Asp Arg His Gln Leu Ser Leu 115 120 125 Leu Ser Glu Cys Pro Asn Cys Gly Ala Arg Tyr Lys Val Pro Ala Leu 130 135 140 Trp Pro Asp Gly Trp Cys Ser Arg Cys Phe Leu Pro Phe Ala Asp Met 145 150 155 160 Val Lys Trp Gln Lys Leu Ile Val 165 <210> 26 <211> 637 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-4 effector <400> 26 Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Cys Cys Glu Ser Thr 1 5 10 15 Arg Ala Ser Leu Trp Lys Leu Met Ala Glu Lys Asn Thr Pro Leu Thr 20 25 30 Asn Glu Leu Leu His Gln Val Gly His His Cys Glu Phe Glu Ser Trp 35 40 45 Arg Lys Lys Gly Lys Ile Pro Ser Gly Ile Val Lys Glu Leu Cys Gln 50 55 60 Pro Leu Lys Thr Asp Pro Arg Phe Thr Gly Gln Pro Gly Arg Phe Tyr 65 70 75 80 Thr Ser Ala Ile Ala Leu Val Ser Tyr Ile Tyr Lys Ser Trp Leu Val 85 90 95 Leu Met Lys Arg Ser His Tyr Lys Leu Glu Gly Lys Thr Arg Trp Leu 100 105 110 Glu Met Leu Ser Ser Asp Ala Glu Leu Val Glu Arg Cys Gly Ile Ser 115 120 125 Val Asp Gly Ile Arg Ala Arg Ala Ser Glu Ile Leu Ala Gln Leu Ala 130 135 140 Leu Pro Asp Ser Ala Asp Thr Gly Gln Val Lys Gly Arg Lys Ala Lys 145 150 155 160 Lys Ser Lys Lys Phe Gln Gln Gln Gln Asp Arg Asp Arg Asn Leu Ser 165 170 175 Arg Thr Leu Phe Glu Ala Tyr Arg Asp Thr Glu Asp Ile Leu Thr Arg 180 185 190 Cys Ala Ile Cys Tyr Leu Leu Lys Asn Gly Cys Gln Val Ser Asp Arg 195 200 205 Glu Glu Asn Ser Glu Lys Phe Thr Gln Arg Arg Arg Gln Val Glu Ile 210 215 220 Gln Ile Glu Arg Leu Lys Glu Lys Leu Ala Ala Arg Ile Pro Lys Gly 225 230 235 240 Arg Asp Leu Thr Asp Ala Lys Trp Leu Glu Thr Leu Phe Leu Ala Thr 245 250 255 Ser His Ala Pro Glu Ser Glu Ala Glu Ala Lys Leu Trp Gln Asp Cys 260 265 270 Leu Leu Arg Gln Pro Ser Ser Val Pro Phe Pro Val Ala Tyr Glu Thr 275 280 285 Ser Glu Asp Met Thr Trp Phe Lys Asn His Lys Gly Arg Ile Ser Val 290 295 300 Lys Phe Asn Gly Leu Ser Glu His Thr Phe Glu Val Tyr Cys Asp Ser 305 310 315 320 Arg Gln Leu His Trp Phe Glu Arg Phe Leu Glu Asp Gln Gln Ile Lys 325 330 335 Arg Asn Asn Gln Asn Gln Tyr Ser Ser Ser Leu Phe Thr Leu Arg Ser 340 345 350 Ser Arg Ile Ala Trp Gln Glu Gly Lys Gly Lys Gly Glu Pro Trp Asn 355 360 365 Phe Asn His Leu Thr Leu Tyr Cys Ser Val Asp Thr Arg Leu Trp Thr 370 375 380 Ala Glu Gly Thr Gln Leu Val Ile Glu Glu Lys Val Glu Glu Ile Val 385 390 395 400 Lys Asn Ile Thr Asn Thr Lys Asp Lys Gly Asn Leu Asn Glu Lys Gln 405 410 415 Leu Ala His Ile Gln Arg Lys Asn Ser Thr Leu Ala Arg Ile Thr Asn 420 425 430 Pro Phe Pro Arg Pro Ser Lys Ser Ile Tyr Arg Gly Gln Ser His Ile 435 440 445 Leu Val Gly Val Ser Leu Gly Leu Glu Lys Pro Ala Thr Val Ala Val 450 455 460 Val Asp Ala Thr Thr Ser Asn Val Ile Ala Tyr Arg Ser Ile Lys Gln 465 470 475 480 Leu Leu Gly Asp Asn Tyr Arg Leu Leu Asn Arg Gln Arg Gln Gln Lys 485 490 495 Gln Val Leu Ser His Gln Arg His Leu Ala Gln Arg Leu Asp Ala Leu 500 505 510 Asn Ser Leu Gly Glu Ser Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu 515 520 525 Ala Lys Glu Ile Val Ala Ile Ala Gln Thr Tyr Cys Ala Gly Ser Ile 530 535 540 Val Leu Pro Ser Leu Gly Asp Met Arg Glu Gln Val Gln Ser Glu Ile 545 550 555 560 Gln Ala Lys Ala Glu Gln Lys Ser Asp Leu Ile Glu Val Gln Gln Lys 565 570 575 Tyr Ala Lys Gln Tyr Arg Ala Ser Val His Gln Trp Ser Tyr Gly Arg 580 585 590 Leu Ile Ser Ser Ile Gln Ser Gln Ala Lys Lys Ala Gly Ile Ala Ile 595 600 605 Glu Glu Ala Lys Gln Pro Ile Arg Gly Ser Pro Gln Gln Lys Ala Lys 610 615 620 Glu Leu Val Ile Ala Ala Tyr Asn Ala Arg Lys Thr Ser 625 630 635 <210> 27 <211> 563 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-4-B transposition protein <400> 27 Met Ser Lys Leu Ser Glu Asp Asn His Ile Asp Asn Gln Lys Pro Ala 1 5 10 15 Val Gly Glu Ile Val Pro Glu Ile Ala Asp Asp Asn Lys Gln Leu Leu 20 25 30 Glu Val Ile Gln Lys Leu Leu Glu Pro Cys Asp Arg Ile Thr Tyr Gly 35 40 45 Gln Arg Gln Arg Glu Ala Ala Ala Gln Leu Gly Lys Ser Val Arg Thr 50 55 60 Val Arg Arg Leu Val Lys Lys Trp Glu Glu Glu Gly Leu Ala Ala Leu 65 70 75 80 Ser Gln Thr Thr Arg Ala Asp Lys Gly Lys His Arg Ile Glu Gln Asp 85 90 95 Trp Gln Asp Phe Ile Ile Lys Thr Tyr Lys Glu Gly Asn Lys Gly Ser 100 105 110 Lys Arg Ile Thr Pro Lys Gln Val Ala Val Arg Val Gln Ala Lys Ala 115 120 125 Ala Glu Leu Gly Gln Asp Arg Tyr Pro Ser Tyr Arg Thr Val Tyr Arg 130 135 140 Val Leu Gln Pro Ile Ile Glu Arg Gln Glu Gln Gln Ala Ser Val Arg 145 150 155 160 Ser Arg Gly Trp Arg Gly Ser Arg Leu Ser Val Lys Thr Arg Asp Gly 165 170 175 Lys Asp Leu Ser Val Glu Tyr Ser Asn His Val Trp Gln Cys Asp His 180 185 190 Thr Arg Val Asp Val Leu Leu Val Asp Arg Asn Gly Ala Ile Leu Ser 195 200 205 Arg Pro Trp Leu Thr Thr Val Val Asp Thr Tyr Ser Arg Cys Ile Met 210 215 220 Gly Phe Asn Leu Gly Tyr Asp Ala Pro Ser Ser Gln Val Val Ala Leu 225 230 235 240 Ala Leu Arg His Ala Ile Leu Pro Lys Gln Tyr Asp Trp Glu Tyr Gln 245 250 255 Leu Asp Cys Asp Trp Gly Thr Tyr Gly Lys Pro Glu His Phe Tyr Thr 260 265 270 Asp Gly Gly Lys Asp Phe Arg Ser Asn His Leu Gln Gln Ile Gly Val 275 280 285 Gln Leu Gly Phe Ala Ser His Leu Arg Asp Arg Pro Ser Glu Gly Gly 290 295 300 Ile Val Glu Arg Pro Phe Gly Thr Phe Asn Thr Glu Phe Phe Ser Thr 305 310 315 320 Leu Pro Gly Tyr Thr Gly Ser Asn Val Gln Glu Arg Pro Glu Gln Ala 325 330 335 Glu Lys Glu Ala Arg Leu Thr Leu Arg Glu Leu Glu Arg Leu Leu Val 340 345 350 Arg Tyr Ile Val Asp Lys Tyr Asn Gln Ser Ile Asp Ala Arg Leu Gly 355 360 365 Asp Gln Thr Arg Phe Gln Arg Trp Glu Ala Gly Leu Ile Ala Ala Pro 370 375 380 Asn Pro Ile Ala Glu Arg Asp Leu Asp Ile Cys Leu Met Lys Gln Thr 385 390 395 400 Arg Arg Ser Ile Tyr Arg Gly Gly Tyr Leu Gln Phe Glu Asn Leu Thr 405 410 415 Tyr Arg Gly Glu Asn Leu Ala Gly Tyr Ala Gly Glu Ser Val Val Leu 420 425 430 Arg Tyr Asp Pro Arg Asp Ile Thr Thr Val Leu Val Tyr Arg Gln Glu 435 440 445 Ala Gly Lys Glu Val Phe Leu Ala Arg Ala Phe Ala Gln Asp Leu Glu 450 455 460 Thr Glu Gln Met Ser Leu Asp Glu Ala Lys Ala Ser Ser Arg Lys Leu 465 470 475 480 Arg Glu Thr Gly Lys Thr Ile Ser Asn Arg Ser Ile Leu Ala Glu Val 485 490 495 Arg Asp Arg Glu Thr Phe Leu Thr Gln Lys Lys Thr Lys Lys Glu Arg 500 505 510 Gln Lys Ala Glu Gln Ala Glu Val Lys Arg Ala Lys Gln Pro Phe Ser 515 520 525 Val Glu Arg Glu Glu Glu Ile Glu Ala Ala Ser Ile Pro Asn Gln Pro 530 535 540 Glu Pro Glu Met Pro Asp Val Phe Asp Tyr Glu Gln Met Arg Glu Asp 545 550 555 560 Tyr Gly Phe <210> 28 <211> 278 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-4-C transposition protein <400> 28 Met Ser Leu Lys Asp Ala Gln Ala Ile Ala Gln Gln Leu Gly Asn Ile 1 5 10 15 Gln Pro Asn Asp Ala Arg Leu Gln Thr Glu Ile Gln Arg Leu Asn Gly 20 25 30 Lys Ser Phe Val Pro Leu Glu Gln Val Lys Ile Leu His Asp Trp Leu 35 40 45 Asp Gly Lys Arg Gln Ala Arg Gln Gly Cys Arg Val Val Gly Glu Ser 50 55 60 Arg Thr Gly Lys Thr Ile Ala Cys Asp Ala Tyr Arg Leu Arg His Lys 65 70 75 80 Pro Ile Gln Glu Leu Gly Lys Pro Pro Ile Val Pro Val Ala Tyr Ile 85 90 95 Leu Val Pro Pro Asp Cys Gly Ser Lys Asp Leu Phe Gly Leu Ile Val 100 105 110 Glu His Leu Lys Tyr Gln Met Thr Lys Gly Thr Val Ala Glu Ile Arg 115 120 125 Glu Arg Thr Arg Arg Val Leu Lys Gly Cys Gly Val Glu Met Leu Ile 130 135 140 Ile Asp Glu Ala Asp Arg Leu Lys Pro Asn Thr Phe Arg Asp Val Arg 145 150 155 160 Asp Ile Gly Glu Asn Leu Gly Ile Thr Val Val Leu Val Gly Thr Asp 165 170 175 Arg Leu Asp Ala Val Ile Lys Lys Asp Pro Gln Val Tyr Asn Arg Phe 180 185 190 Arg Ala Cys His Arg Phe Gly Asn Leu Ser Gly Asp Asp Phe Lys Arg 195 200 205 Thr Val Glu Ile Trp Glu Lys Lys Val Leu Gln Leu Pro Val Ala Ser 210 215 220 Asn Leu Ser Gly Lys Thr Met Leu Lys Thr Leu Gly Glu Ala Thr Gly 225 230 235 240 Gly Tyr Ile Gly Leu Leu Asp Met Ile Leu Arg Glu Ala Ala Ile Arg 245 250 255 Ala Leu Lys Lys Gly Leu Gln Lys Ile Asp Leu Glu Thr Leu Lys Glu 260 265 270 Val Ala Gly Glu Tyr Arg 275 <210> 29 <211> 167 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-4-Q transposition protein <400> 29 Met Glu Ala Ser Asp Ile Gln Pro Trp Leu Phe Arg Ala Glu Pro Tyr 1 5 10 15 Glu Gly Glu Ser Ile Ser His Tyr Leu Gly Arg Phe Arg Arg Ala Asn 20 25 30 Asp Leu Thr Pro Thr Gly Leu Gly Lys Ala Thr Gly Leu Gly Gly Ala 35 40 45 Ile Ala Arg Trp Glu Lys Phe Arg Phe Asn Pro Pro Pro Ser Arg Lys 50 55 60 Gln Leu Glu Ala Leu Ala Val Val Val Gly Val Glu Ala Asp Arg Leu 65 70 75 80 Ala Gln Met Ile Pro Pro Ala Gly Val Gly Met Lys Leu Glu Pro Ile 85 90 95 Arg Leu Cys Ala Ala Cys Tyr Ala Gln Ala Pro Tyr His Arg Ile Glu 100 105 110 Trp Gln Phe Lys Val Thr Ala Gly Cys Asp His His Gln Leu Arg Leu 115 120 125 Leu Ser Glu Cys Pro Asn Cys Lys Ala Arg Phe Lys Ile Pro Ala Leu 130 135 140 Trp Val Asp Gly Trp Cys Gln Arg Cys Phe Thr Lys Phe Glu Glu Met 145 150 155 160 Thr Ser Asn Gln Ala Ala Leu 165 <210> 30 <211> 632 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-6 effector <400> 30 Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Ile Ala Lys Glu Ser Ser 1 5 10 15 Arg Gln Ala Leu Trp Arg Leu Met Ala Glu Leu Asn Thr Pro Leu Ile 20 25 30 Asn Asp Ile Leu Asn Gln Ile Ala Asn His Pro Asp Phe Glu Thr Trp 35 40 45 Arg Glu Lys Gly Lys Leu Pro Ala Gly Ile Val Lys Gln Leu Ser Asp 50 55 60 Ser Leu Lys Thr Asp Pro Arg Tyr Ile Gly Gln Pro Gly Arg Phe Tyr 65 70 75 80 Thr Ser Ala Ile Thr Leu Ile Ser Tyr Ile Tyr Lys Ser Trp Phe Lys 85 90 95 Val Gln Gln Arg Leu Gln Gln Arg Leu Val Gly Gln Thr Arg Trp Leu 100 105 110 Gly Ile Leu Lys Ser Asp Glu Glu Leu Val Ala Glu Ser Asp Arg Thr 115 120 125 Leu Glu Glu Ile Arg Ala Lys Ala Ile Gly Leu Leu Ala Ser Leu Thr 130 135 140 Pro Glu Asn Pro Ser Pro Glu Pro Lys Pro Ala Lys Lys Thr Lys Lys 145 150 155 160 Ala Lys Thr Ser Thr Asn Lys Pro Leu Leu Gly Ile Leu Phe Asp Asn 165 170 175 Tyr Glu Lys Thr Glu Asp Ile Leu Thr His Ala Ala Ile Cys Tyr Leu 180 185 190 Leu Lys Asn Gly Cys Lys Ile Pro Thr Lys Leu Glu Glu Pro Gln Glu 195 200 205 Phe Ala Lys Lys Arg Arg Lys Ala Glu Ile Lys Val Glu Arg Leu Gln 210 215 220 Glu Gln Leu Asn Ser Arg Lys Pro Lys Gly Arg Asp Leu Thr Gly Glu 225 230 235 240 Lys Trp Leu Gln Thr Leu Ile Thr Ala Ser Thr Thr Ala Pro Glu Asn 245 250 255 Glu Ala Gln Ala Lys Ser Trp Gln Asn Ile Leu Leu Thr Lys Ser Lys 260 265 270 Ser Ile Pro Phe Pro Val Ala Tyr Glu Thr Asn Glu Asp Leu Thr Trp 275 280 285 Ser Lys Asn Asp Lys Gly Arg Leu Cys Val His Phe Asn Gly Leu Gly 290 295 300 Glu His Glu Phe Glu Ile Tyr Cys Asp Gln Arg Gln Leu Lys Trp Leu 305 310 315 320 Gln Arg Phe Tyr Glu Asp Gln Glu Thr Lys Arg Ala Ser Lys Asp Gln 325 330 335 His Ser Ser Ala Leu Phe Thr Leu Arg Ser Gly Arg Ile Gly Trp Gln 340 345 350 Glu Gly Lys Gly Lys Gly Glu Pro Trp Asn Ile His Arg Leu Asn Leu 355 360 365 Phe Cys Thr Ile Asp Thr Arg Phe Trp Thr Ala Glu Gly Thr Glu Gln 370 375 380 Val Arg Gln Glu Lys Ala Thr Glu Ile Ala Gln Thr Ile Thr Lys Met 385 390 395 400 Glu Gln Lys Gly Asp Leu Asn Asp Lys Gln Gln Ala Phe Ile His Arg 405 410 415 Lys His Ser Thr Leu Ala Arg Ile Asn Asn Pro Phe Pro Arg Pro Ser 420 425 430 Gln Pro Leu Tyr Gln Gly Lys Ser His Ile Leu Ile Gly Ile Ala Met 435 440 445 Gly Leu Glu Asn Pro Ala Thr Ala Ala Ile Ile Asn Gly Thr Thr Gly 450 455 460 Glu Ala Leu Ala Tyr Arg Ser Ile Lys Gln Leu Leu Gly Asp Asn Tyr 465 470 475 480 Gln Leu Leu Thr Arg Gln Gln Lys Gln Lys Gln Arg Gln Ser His Gln 485 490 495 Arg His Lys Ala Gln Lys Asn Ala Ala Pro Asn Gln Phe Gly Glu Ser 500 505 510 Glu Leu Gly Glu Tyr Val Asp Arg Leu Leu Ala Lys Ala Ile Val Ala 515 520 525 Leu Ala Lys Thr Tyr Gln Ala Gly Ser Ile Val Val Pro Glu Leu Gly 530 535 540 Asp Met Arg Glu Leu Val Gln Ala Glu Val Lys Ala Lys Ala Glu Ala 545 550 555 560 Lys Ile Pro Gly Cys Ile Glu Ala Gln Glu Lys Tyr Ala Lys Gln Tyr 565 570 575 Arg Val Asn Thr His Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile 580 585 590 Gln Ala Gln Ala Ser Lys Ile Gly Ile Val Ile Glu Gln Gly Gln Gln 595 600 605 Pro Ile Arg Gly Ser Pro Gln Glu Lys Ala Lys Glu Met Ala Leu Leu 610 615 620 Ala Tyr His Ser Arg Ser Lys Ser 625 630 <210> 31 <211> 578 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-6-B transposition protein <400> 31 Met Lys Lys Leu Phe Ala Gln Asp Val Asn Ile Asp Thr Glu Val Ile 1 5 10 15 Ser Asn Gln Ile Pro Thr Ser Asp Pro Ser Gln Ser Asn Leu Ile Ala 20 25 30 Ser Glu Leu Pro Glu Glu Ala Arg Pro Lys Leu Glu Val Ile Gln Ser 35 40 45 Leu Leu Glu Pro Cys Asp Arg Val Thr Tyr Gly Glu Arg Leu Arg Glu 50 55 60 Gly Ala Glu Lys Leu Gly Leu Ser Val Arg Ser Val Gln Arg Leu Phe 65 70 75 80 Lys Lys Tyr Gln Glu Lys Gly Leu Ile Ala Leu Leu Ser Gly Ser Arg 85 90 95 Thr Asp Lys Gly Glu His Arg Ile Ser Glu Leu Trp Gln Asn Phe Ile 100 105 110 Val Lys Thr Tyr Gln Glu Gly Asn Lys Gly Ser Lys Arg Met Ser Pro 115 120 125 Lys Gln Val Ala Leu Lys Val Gln Ala Lys Ala Gly Ala Ile Ala Asp 130 135 140 Asp Asn Pro Pro Ser Tyr Arg Thr Val Leu Arg Val Leu Lys Pro Ile 145 150 155 160 Leu Glu Lys Gln Glu Lys Ala Lys Ser Ile Arg Ser Pro Gly Trp Arg 165 170 175 Gly Ser Thr Leu Ser Val Lys Thr Arg Asp Gly Asp Asp Leu Asp Ile 180 185 190 Ser Tyr Ser Asn Gln Val Trp Gln Cys Asp His Thr Arg Ala Asp Val 195 200 205 Leu Leu Val Asp Gln His Gly Lys Leu Leu Val Arg Pro Trp Leu Thr 210 215 220 Thr Val Ile Asp Ser Tyr Ser Arg Cys Ile Met Gly Ile Asn Leu Gly 225 230 235 240 Phe Asp Ala Pro Ser Ser Gln Val Val Ala Leu Ala Leu Arg His Ala 245 250 255 Ile Leu Pro Lys Arg Tyr Gly Thr Glu Tyr Lys Leu Asn Cys Asp Trp 260 265 270 Gly Thr Tyr Gly Thr Pro Glu Tyr Leu Phe Thr Asp Gly Gly Lys Asp 275 280 285 Phe Arg Ser Asn His Leu Ala Glu Ile Gly Leu Gln Leu Gly Phe Val 290 295 300 Cys Lys Leu Arg Asp Arg Pro Ser Glu Gly Gly Ile Val Glu Arg Pro 305 310 315 320 Phe Lys Thr Leu Asn Gln Ser Leu Phe Ser Thr Leu Pro Gly Tyr Thr 325 330 335 Gly Ser Asn Val Gln Glu Arg Pro Glu Asp Ala Glu Lys Asp Ala Gln 340 345 350 Leu Thr Leu Arg Asp Leu Glu Gln Leu Ile Val Arg Phe Ile Val Asp 355 360 365 Arg Tyr Asn Gln Ser Ile Asp Ala Arg Met Gly Asp Gln Thr Arg Tyr 370 375 380 Gln Arg Trp Glu Ala Gly Leu Gln Lys Glu Pro Asp Val Ile Ser Glu 385 390 395 400 Arg Asp Leu Asp Ile Cys Leu Met Lys Met Ser Arg Arg Thr Val Gln 405 410 415 Arg Gly Gly His Leu Gln Phe Glu Asn Val Met Tyr Leu Gly Glu Tyr 420 425 430 Leu Ala Gly Tyr Ala Gly Glu Val Val Ser Phe Arg Tyr Asp Pro Arg 435 440 445 Asp Ile Thr Thr Ile Trp Val Tyr Arg Gln Glu Asn Asp Arg Glu Val 450 455 460 Phe Leu Thr Arg Ala His Ala Gln Gly Leu Glu Thr Glu Gln Leu Ser 465 470 475 480 Val Asp Asp Ala Lys Ala Ser Ala Lys Arg Leu Arg Ala Ala Gly Lys 485 490 495 Thr Ile Ser Asn Gln Ser Ile Leu Gln Glu Thr Ile Glu Arg Glu Val 500 505 510 Leu Ala Glu Arg Thr Lys Ser Arg Lys His Arg Gln Lys Glu Glu Gln 515 520 525 Ser Tyr Lys Arg Ser Pro Ser Ala Ala Val Met Val Glu Val Glu Ser 530 535 540 Glu Gln Leu Glu Ile Glu Ser Ser Asn Glu Ala Asn Ala Asn Ser Val 545 550 555 560 Ser Ala Asp Ile Glu Val Trp Asp Tyr Asp Glu Met Arg Glu Gly Leu 565 570 575 Gly Trp <210> 32 <211> 284 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-6-C transposition protein <400> 32 Met Ile Lys Glu Asn Ser Ser Gln Glu Lys Pro Ala Ser Gln Ile Ala 1 5 10 15 Glu Glu Leu Gly Asp Phe Lys Val Asp Ser Gln Leu Leu Gln Ile Glu 20 25 30 Ile Ala Arg Leu Asn Lys Lys Ser Ile Val Pro Leu Glu His Ile Lys 35 40 45 Asp Leu His Asp Trp Leu Asp Glu Lys Arg Lys Ala Arg Gln Ser Cys 50 55 60 Arg Leu Val Gly Glu Ser Arg Thr Gly Lys Thr Val Ala Cys Glu Ala 65 70 75 80 Tyr Thr Phe Arg Asn Lys Pro Lys Gln Glu Gly Lys Gln Ala Pro Thr 85 90 95 Val Pro Val Val Tyr Ile Met Pro Pro Ala Lys Cys Gly Ala Lys Glu 100 105 110 Leu Phe Arg Glu Ile Ile Glu Tyr Leu Lys Tyr Arg Ala Val Arg Gly 115 120 125 Thr Val Ala Asp Phe Arg Ser Arg Ala Met Glu Val Leu Lys Gly Cys 130 135 140 Glu Val Glu Met Ile Ile Ile Asp Glu Ala Asp Arg Leu Lys Pro Glu 145 150 155 160 Thr Phe Ser Asp Val Arg Asp Ile Asn Asp Lys Leu Gly Ile Ala Val 165 170 175 Val Leu Val Gly Thr Asp Arg Leu Asp Ala Val Ile Lys Arg Asp Glu 180 185 190 Gln Val Tyr Asn Arg Phe Arg Ala Ser Arg Arg Phe Gly Lys Leu Thr 195 200 205 Gly Glu Asp Phe Lys Arg Thr Val Glu Ile Trp Glu Asp Lys Val Leu 210 215 220 Lys Met Pro Val Ala Ser Asn Leu Thr Asn Lys Glu Met Leu Lys Ile 225 230 235 240 Leu Leu Lys Ala Thr Glu Gly Tyr Ile Gly Arg Leu Asp Glu Ile Leu 245 250 255 Arg Glu Ala Ala Ile Lys Ser Leu Ser Arg Gly Phe Arg Lys Val Glu 260 265 270 Lys Ala Val Leu Gln Glu Val Ala Arg Glu Tyr Ser 275 280 <210> 33 <211> 167 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-6-Q transposition protein <400> 33 Met Thr Glu Asn Asp Ile Gln Pro Trp Leu Phe Ala Ile Ala Pro Leu 1 5 10 15 Pro Gly Glu Ser Leu Ser His Phe Leu Gly Arg Phe Arg Arg Arg Asn 20 25 30 His Leu Thr Pro Ser Ser Leu Gly Gln Ile Ala Lys Ile Gly Ala Val 35 40 45 Val Ala Arg Trp Glu Arg Phe His Phe Asn Pro Tyr Pro Thr Gln Gln 50 55 60 Glu Phe Glu Ala Leu Ala Glu Val Val Gly Val Glu Val Glu Arg Val 65 70 75 80 Trp Glu Met Leu Pro Pro Met Gly Glu Gly Met Lys Cys Glu Pro Ile 85 90 95 Arg Leu Cys Cys Ala Cys Tyr Ala Glu Ser Pro Cys His Arg Ile Glu 100 105 110 Trp Gln Phe Lys Ser Val Trp Lys Cys Asp Arg His Gln Leu Lys Leu 115 120 125 Leu Ala Lys Cys Pro Gln Cys Glu Ala Arg Phe Lys Ile Pro Ala Leu 130 135 140 Trp Glu Asn Gly Arg Cys Asp Arg Cys Gln Ile Thr Phe Gly Glu Leu 145 150 155 160 Ala Ala Tyr Gln Lys Ser Ala 165 <210> 34 <211> 713 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-7 effector <400> 34 Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Ser Ala Ser Thr 1 5 10 15 Arg Gln Lys Leu Trp Lys Leu Met Ala Glu Phe Asn Thr Pro Leu Ile 20 25 30 Asn Glu Leu Leu Ile Leu Ala Tyr Gln His Pro Asp Phe Lys Thr Trp 35 40 45 Gln His Lys Gly Ala Ile Pro Ala Gly Ile Ile Lys Gln Leu Cys Glu 50 55 60 Pro Leu Lys Thr Asp Ala Arg Phe Val Gly Gln Pro Gly Arg Phe Phe 65 70 75 80 Ala Ser Ala Ile Ala Thr Val Ser Tyr Ile Tyr Lys Ser Trp Val Lys 85 90 95 Val Gln Lys Arg Leu Gln Leu Gln Ile Asp Gly Lys Thr Arg Trp Leu 100 105 110 Glu Met Leu Asn Ser Asp Thr Glu Leu Val Glu Met Ala Gly Val Ala 115 120 125 Leu Asp Thr Leu Arg Ala Thr Ala Thr Glu Leu Leu Asn Gln Leu Asn 130 135 140 Pro Gln Pro Thr Thr Glu Glu Ser Pro Lys Lys Lys Gly Lys Lys Ala 145 150 155 160 Lys Lys Thr Gln Gln Pro Gln Gly Glu Arg Ser Leu Ser Lys Ile Leu 165 170 175 Phe Asp Thr Tyr Arg Asp Ala Glu Asp Ile Gln Thr Arg Cys Ala Ile 180 185 190 Ser Tyr Leu Leu Lys Asn Gly Cys Lys Ile Arg Ser Gln Glu Glu Asp 195 200 205 Ser Lys Lys Phe Ala Gln Arg Arg Arg Lys Val Glu Ile Gln Ile Gln 210 215 220 Arg Leu Thr Asp Gln Leu Ala Ser Arg Val Pro Lys Gly Arg Asp Leu 225 230 235 240 Thr Ala Thr Lys Trp Leu Glu Ser Leu Leu Glu Ala Thr Arg Lys Val 245 250 255 Pro Lys Asn Glu Ala Glu Ala Lys Ser Trp Gln Asp Ser Leu Asn Arg 260 265 270 Gln Ser Ser Thr Leu Pro Phe Pro Val Ala Phe Glu Ser Ser Glu Asp 275 280 285 Met Ile Trp Phe Arg Lys Leu Lys Leu Asn Asn Ile Pro Ile Lys Leu 290 295 300 Trp Thr Ile Leu Leu Tyr Ile Asp Tyr Leu Ile Val Ile Leu Phe Val 305 310 315 320 Arg Asp Ser Leu Gln Asn Glu Ala Leu Trp Phe Lys Asn Phe Lys Ile 325 330 335 Asn Asn Ile His Val Leu Thr Lys Leu Trp Met Ile Leu Leu Asn Ile 340 345 350 Asn Ser Phe Ala Gly Val Leu Tyr Leu Gly Gly Val Leu Lys Lys Tyr 355 360 365 Gln Gln Arg Ile Tyr Val His Phe Asn Gly Leu Ser Asp Cys Thr Phe 370 375 380 Glu Ile Tyr Cys Asp Ser Arg His Ile His Trp Phe Lys Arg Phe Leu 385 390 395 400 Glu Asp Gln Gln Ile Lys Arg Ser Ser Lys Asn Gln His Ser Ser Ser 405 410 415 Leu Phe Thr Ile Arg Ser Gly Arg Ile Ala Trp Lys Ser Ala Gln Gly 420 425 430 Lys Gly Lys Pro Trp Asn Val Asn Arg Leu Met Leu Tyr Cys Cys Val 435 440 445 Asp Thr Arg Leu Trp Thr Ala Glu Gly Thr Lys Leu Val Val Glu Glu 450 455 460 Lys Ala Glu Glu Ile Ala Lys Thr Ile Thr Arg Thr Lys Glu Lys Glu 465 470 475 480 Thr Lys Glu Lys Val Gln Leu Asn Asp Lys Gln Leu Ala Tyr Ile Lys 485 490 495 Arg Lys Asn Ala Thr Leu Thr Arg Ile Asn Asn Pro Phe Pro Arg Pro 500 505 510 Ser Lys Pro Leu Tyr Asn Gly Gln Ser His Ile Leu Val Ser Val Ser 515 520 525 Leu Gly Leu Glu Lys Pro Ala Thr Leu Ala Val Leu Asn Ala Met Thr 530 535 540 Gly Lys Ile Ile Ala Tyr Arg Ser Val Lys Gln Leu Leu Gly Lys Asn 545 550 555 560 Tyr Lys Leu Leu Asn Gln Gln Arg His Gln Lys Gln Ala Leu Ser His 565 570 575 Gln Arg Lys Ile Ala Gln Thr Leu Ala Ala Pro Asn Gln Phe Gly Asp 580 585 590 Ser Glu Leu Gly Glu His Ile Asp Arg Leu Leu Ala Lys Glu Ile Ile 595 600 605 Ala Val Ala Gln Lys Phe Asn Ala Gly Ser Ile Val Val Pro Asn Leu 610 615 620 Asp Asn Met Arg Glu Gln Val Asn Ser Glu Ile Gln Ala Lys Ala Glu 625 630 635 640 Glu Lys Cys Pro Glu Ser Ile Glu Ala Gln Lys Lys Tyr Ala Ser Ser 645 650 655 Tyr Arg Arg Ser Val Asn Gln Trp Ser Tyr Arg Arg Leu Ile Asp Cys 660 665 670 Ile Thr Asn Gln Ala Ala Lys Ala Gly Ile Val Ile Glu Glu Asn Lys 675 680 685 Gln Pro Ile Arg Ala Ser Pro Gln Asp Lys Ala Lys Gln Leu Ala Leu 690 695 700 Ser Ala Tyr His Ala Arg Lys Lys Ser 705 710 <210> 35 <211> 587 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-7-B transposition protein <400> 35 Met Lys Asp Ala Glu Ser Ala Thr Asn Ser Pro Met Thr His Ala Ser 1 5 10 15 Ile Ala Asp Ala Glu Asn Gly Lys Ala Glu Ala Asn Ile Ile Val Ser 20 25 30 Glu Leu Ser Asp Glu Ala Leu Leu Lys Met Glu Val Ile Gln Ser Leu 35 40 45 Leu Lys Asn Ser Asp Arg Ser Thr Tyr Gly Glu Leu Leu Lys Gln Ser 50 55 60 Ala Glu Lys Leu Gly Lys Ser Val Arg Thr Val Arg Arg Leu Val Asp 65 70 75 80 Lys Trp Glu Lys Glu Gly Leu Ala Gly Leu Val Gln Asn Gln Arg Asp 85 90 95 Asp Lys Gly Lys His Arg Val Asp Lys Tyr Trp Gln Glu Phe Val Leu 100 105 110 Thr Thr Tyr Lys Glu Asn Asn Lys Gly Ser Lys Arg Met Thr Arg Gln 115 120 125 Gln Val Phe Ile Arg Ala Lys Ala Arg Ala Asp Glu Leu Glu Ile Glu 130 135 140 Pro Pro Ser Arg Met Thr Val Tyr Arg Ile Leu Lys Pro Ile Ile Asp 145 150 155 160 Lys Gln Glu Gln Ala Lys Ser Ile Arg Ser Pro Gly Trp Arg Gly Ser 165 170 175 Arg Leu Ser Val Lys Thr Arg Asp Gly Lys Asp Leu Gln Val Glu His 180 185 190 Ser Asn Gln Val Trp Gln Cys Asp His Thr Arg Val Asp Val Leu Leu 195 200 205 Val Asp Gln His Gly Lys Ile Leu Ser Arg Pro Trp Leu Thr Thr Val 210 215 220 Ile Asp Ser Tyr Ser Arg Cys Ile Met Gly Ile Asn Leu Gly Tyr Asp 225 230 235 240 Thr Pro Ser Ser Thr Val Val Ala Leu Ala Leu Arg His Ala Ile Leu 245 250 255 Pro Lys Gln Tyr Ser Leu Glu Tyr Gly Leu His Glu Glu Trp Gly Thr 260 265 270 Ser Gly Leu Pro Gln Asn Phe Tyr Thr Asp Gly Gly Lys Asp Phe Arg 275 280 285 Ser Asn His Leu Gln Gln Ile Gly Val Gln Leu Gly Phe Val Cys His 290 295 300 Leu Arg Asp Arg Pro Ser Glu Gly Gly Ser Val Glu Arg Pro Phe Lys 305 310 315 320 Thr Leu Asn Thr Glu Leu Phe Ser Thr Leu Ala Gly Tyr Thr Gly Ser 325 330 335 Asn Val Gln Glu Arg Pro Glu Glu Ala Glu Lys Glu Ala Ser Phe Thr 340 345 350 Leu Arg Gln Leu Glu Lys Met Leu Val Arg Tyr Ile Val Asp Asn Tyr 355 360 365 Asn Gln Arg Ile Asp Ala Arg Met Gly Asp Gln Thr Arg Phe Gln Arg 370 375 380 Trp Glu Ser Gly Leu Ile Ala Met Pro Asp Leu Leu Ser Glu Arg Asp 385 390 395 400 Leu Asp Ile Cys Leu Met Lys Gln Thr Arg Arg Gln Val Gln Arg Gly 405 410 415 Gly Tyr Leu Gln Phe Glu Asn Leu Met Tyr Arg Gly Glu Leu Leu Ala 420 425 430 Gly Tyr Ala Gly Glu Ser Val Val Leu Arg Tyr Asp Pro Lys Asp Ile 435 440 445 Thr Thr Ile Leu Val Tyr Arg Ile Glu Glu Gly Lys Glu Ile Phe Leu 450 455 460 Ala Arg Ala Tyr Ala Gln Asp Leu Glu Thr Glu Glu Leu Ser Leu Asp 465 470 475 480 Glu Ala Lys Ala Ser Ser Arg Lys Val Arg Glu Ala Gly Lys Ala Ile 485 490 495 Ser Asn Arg Ser Ile Leu Ala Glu Ile Arg Glu Arg Glu Thr Phe Pro 500 505 510 Thr Gln Lys Lys Thr Arg Lys Glu Arg Gln Lys Leu Glu Gln Ala Glu 515 520 525 Val Lys Lys Ala Lys Gln Leu Thr Pro Ala Glu Thr Glu Glu Glu Ile 530 535 540 Ile Val Val Ser Ile Asp Ala Lys Pro Thr Ala Lys Asn Pro Leu Glu 545 550 555 560 Ser Glu Leu Cys Thr Glu Ser Gly Glu Pro Asp Met Pro Glu Val Leu 565 570 575 Asp Tyr Glu Gln Met Arg Glu Asp Tyr Gly Trp 580 585 <210> 36 <211> 278 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-7-C transposition protein <400> 36 Met Val Ala Lys Glu Ala Gln Glu Val Ala Lys Gln Leu Gly Asp Ile 1 5 10 15 Pro Val Asn Asp Glu Lys Leu Gln Ala Glu Ile His Arg Leu Asn Arg 20 25 30 Lys Gly Phe Val Pro Leu Glu Gln Val Gln Thr Leu His Asp Trp Leu 35 40 45 Glu Gly Lys Arg Gln Ser Arg Gln Ser Gly Arg Val Val Gly Glu Ser 50 55 60 Arg Thr Gly Lys Thr Met Gly Cys Asp Ala Tyr Arg Leu Arg Asn Lys 65 70 75 80 Pro Lys Gln Glu Ala Gly Lys Pro Pro Thr Val Pro Ile Ala Tyr Ile 85 90 95 Gln Ile Pro Gln Glu Cys Gly Ala Lys Glu Phe Phe Gly Val Ile Leu 100 105 110 Glu His Leu Lys Tyr Gln Val Thr Lys Gly Thr Val Ala Glu Val Arg 115 120 125 Asp Arg Ala Leu Arg Val Leu Lys Gly Cys Gly Val Glu Met Leu Ile 130 135 140 Ile Asp Glu Ala Asp Arg Phe Lys Pro Lys Thr Phe Ala Glu Val Arg 145 150 155 160 Asp Ile Phe Asp Lys Leu Glu Ile Pro Val Ile Leu Val Gly Thr Asp 165 170 175 Arg Leu Asp Ala Val Ile Lys Arg Asp Glu Gln Val Tyr Asn Arg Phe 180 185 190 Arg Ser Cys His Arg Phe Gly Lys Leu Ser Gly Glu Glu Phe Lys Arg 195 200 205 Thr Val Asp Ile Trp Glu Lys Lys Val Leu Gln Leu Pro Val Thr Ser 210 215 220 Asn Leu Ser Ser Lys Thr Met Leu Lys Thr Leu Gly Glu Ala Thr Gly 225 230 235 240 Gly Tyr Ile Gly Leu Met Asp Met Ile Leu Arg Glu Ser Ala Ile Arg 245 250 255 Ala Leu Lys Lys Gly Leu Gln Lys Ile Asp Leu Asn Thr Leu Lys Glu 260 265 270 Val Thr Ala Glu Tyr Arg 275 <210> 37 <211> 167 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-7-Q transposition protein <400> 37 Met Glu Ser Glu His Ile Lys Ala Trp Leu Phe Gln Val Glu Pro Phe 1 5 10 15 Glu Gly Glu Ser Leu Ser His Phe Leu Gly Arg Phe Arg Arg Ala Asn 20 25 30 Asp Leu Thr Pro Gly Gly Leu Gly Ser Gln Ala Gly Leu Gly Gly Ala 35 40 45 Ile Ala Arg Trp Glu Lys Phe Arg Phe Asn Pro Pro Pro Ser His Gln 50 55 60 Gln Leu Glu Lys Leu Ala Val Val Ala Gly Ile Asp Ala Gly Arg Leu 65 70 75 80 Val Gln Met Leu Ala Pro Ala Gly Val Ser Ile Lys Leu Glu Pro Ile 85 90 95 Arg Leu Cys Ala Ala Cys Tyr Ala Glu Ser Pro Cys His Lys Ile Glu 100 105 110 Trp Gln Phe Lys Glu Thr Arg Gly Cys Lys His His Lys Leu Arg Leu 115 120 125 Leu Ser Glu Cys Pro Asn Cys Gly Ala Ser Phe Lys Ile Pro Ala Leu 130 135 140 Trp Val Asp Gly Trp Cys His Arg Cys Phe Thr Leu Phe Gly Glu Met 145 150 155 160 Val Asn His Gln Lys Pro Cys 165 <210> 38 <211> 739 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG108 effector sequence <220> <223> MG108-1 effector <400> 38 Met Ser Phe Gln Thr Val Arg Cys Val Leu Cys Ala Ser Glu Glu Met 1 5 10 15 Arg Gln Lys Val Trp Leu Trp Thr Glu Lys Tyr Thr Leu Leu Val Asn 20 25 30 Glu Leu Leu Asp Gln Val Ala Ser His Glu Lys Phe Ser Glu Trp Gln 35 40 45 Ala Gln Gly Ser Ile Ala Arg Lys Glu Val Glu Ile Leu Leu Lys Ser 50 55 60 Leu Lys Ala Ser Asp Gln Phe Lys Gly Leu Pro Gly Arg Phe Tyr Thr 65 70 75 80 Ser Ala Val Leu Met Val Gln Tyr Thr Tyr Leu Ala Trp Leu Ala Leu 85 90 95 Gln Lys Lys Arg His Phe Lys Ile Ile Gly Lys Gln Arg Trp Leu Glu 100 105 110 Val Leu Glu Ala Asp Leu Glu Met Ala Ser Asn Thr Asp Phe Glu Trp 115 120 125 Gln Glu Ile Gln Ser Arg Ala Phe Glu Leu Leu Ala Gln Thr Lys Lys 130 135 140 Ser Ser Asp Thr Val Ser Ala Lys Pro Val Lys Lys Gly Ala Val Asn 145 150 155 160 Gln Glu Ala Ala Lys Ile Gln Lys Gln Thr Pro Phe Asn Ala Leu Leu 165 170 175 Glu Arg Phe Ser Ser Glu Lys Asp Leu Leu Asn Arg Arg Ala Ile Ala 180 185 190 His Leu Leu Arg Asn Asn Leu Gln Val Glu Glu Asn Glu Glu Ser Leu 195 200 205 Asp Lys Leu Leu Phe Arg Phe Glu Lys Lys Arg Ile Glu Ile Glu Arg 210 215 220 Ile Glu Lys Gln Leu Glu Ser Arg Arg Pro Lys Gly Arg Asp Pro Val 225 230 235 240 Gly Thr Arg Phe Met Glu Ser Leu Glu Glu Ala Thr Ala Leu Pro Glu 245 250 255 His Thr Lys Ser Glu Glu Ile Glu Ala Glu Leu Asn Gly Trp Lys His 260 265 270 Gln Lys Gln Val Arg Ser Leu Asn Asn Leu Pro Tyr Pro Val Leu Phe 275 280 285 Val Ser Ile Thr Asp Leu Ile Trp Ser Leu Gln Ser Asn Glu Asn Glu 290 295 300 Gln Glu Ser Val Lys Gly Asn Gln Val Gln Pro Ala Arg Arg Gly Lys 305 310 315 320 Cys Lys Lys Lys Gln Lys Arg Ser Ser Asp Arg Ile Cys Val Asn Phe 325 330 335 Asn Gly Phe Lys Lys Phe Leu Gly Glu Thr Gln Gly Val Phe Lys Ile 340 345 350 Gln Cys Asp Arg Arg Gln Leu Pro Ile Phe Arg Gln Ile Val Ser Asp 355 360 365 Trp Arg Ala Tyr Gln Gln Leu Pro Asp Asp Glu Lys Phe Gly Leu Gly 370 375 380 Leu Met Leu Leu Lys Ser Ala Gln Leu Ile Trp Lys Lys Asp Gln Gln 385 390 395 400 Lys Leu Tyr Lys Lys Lys Ala Lys Asn Asn Ser Thr Gln His Glu Thr 405 410 415 Ala Ser Gly Gly Gln Leu Val His Pro Trp Gln Thr His Arg Leu Tyr 420 425 430 Leu His Cys Cys Ile Asn Pro Asp Leu Leu Thr Ala Glu Gly Thr Glu 435 440 445 Val Val Arg Gln Lys Lys Leu Pro Ala Thr Ala Lys Lys Leu Glu Gly 450 455 460 Ser Lys Lys Arg Gln Ala Glu Val Ala Glu Arg Ile Gln Thr Ser Asp 465 470 475 480 Leu Gly Glu Asp Ser Thr Met Leu Lys Lys Leu His Thr Asn Leu Val 485 490 495 Asn Arg Ile Ser Ala Asn Ala Thr Ser Leu Asn Arg Leu Glu Asn Ala 500 505 510 Thr Pro Gln Arg Pro Ser Lys Pro Ala Tyr His Gly Gln Pro His Ile 515 520 525 Ile Val Gly Val Ser Phe Ser Arg Glu Gln Leu Val Gly Val Ala Val 530 535 540 Val Asp Thr Arg Thr Gly Arg Val Ile Glu Tyr Gln Ser Thr Arg Leu 545 550 555 560 Leu Leu Ser Asn Pro Ala Val Lys Ala Lys Arg Gly Gly Arg Thr Val 565 570 575 Thr Gln Leu Arg Leu Glu Lys Tyr Arg Leu Val Asn Arg Arg Gln Arg 580 585 590 Gln Gln Gln Gln Asn Ala Ile Arg Arg Ser Lys Glu Gln Lys Gln Asn 595 600 605 Arg Tyr Ala Arg Ser Lys Ser Glu Ser Asn Leu Gly Gln Tyr Leu Asp 610 615 620 Arg Leu Ile Ala Ser Lys Val Ile Lys Leu Ala Ile Lys Trp Gln Ala 625 630 635 640 Ser Ser Ile Val Val Pro Asn Leu Gly Asp Ile Arg Glu Ser Val Glu 645 650 655 Ala Ser Leu Lys Ala Glu Ala Glu Arg Lys Phe Pro Asn Glu Phe Glu 660 665 670 Arg Gln Lys Lys Tyr Ala Lys His Ile Arg Thr Ser Phe His Thr Trp 675 680 685 Ser Tyr Gly Arg Leu Thr Glu Cys Ile Arg Ser Cys Ala Ala Lys Ala 690 695 700 Gln Ile Pro Ile Glu Gln Gly His Gln Pro Ala Gln Gly Asp Leu Lys 705 710 715 720 Glu Lys Ala Met Gln Val Ala Leu His Ala Tyr Tyr Thr Arg Gln Ser 725 730 735 Pro Lys Gly <210> 39 <211> 302 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG108 transposition protein sequence <220> <223> MG108-1-C transposition protein <400> 39 Met Ser Gln Leu Gln Phe Ala Glu Pro Asp Arg Pro His Ser Ser Asn 1 5 10 15 Glu Glu Thr Leu Phe Leu Glu Glu Pro Arg Arg Ser Ile Glu Ala Gln 20 25 30 Ala Glu Val Glu Arg Ile Gly Lys Ala Asp Thr Tyr Leu Val Leu Asp 35 40 45 Arg Asp Ile Ala Leu Phe Asp Trp Leu Asp Asp Gln Arg Asp Thr Lys 50 55 60 Leu Cys Gly Tyr Ile Ile Gly Ser Gln Gly Ser Gly Leu Pro Lys Ala 65 70 75 80 Cys Gln Phe Tyr Arg Met Lys His Val Lys Arg Arg Gly Arg Leu Leu 85 90 95 Gln Val Pro Ala Ser Val Ile Tyr Ala Glu Val Lys Gln His Gly Gly 100 105 110 Pro Thr Asp Leu Tyr His Ala Ile Leu Glu Glu Ile Gly His Pro Leu 115 120 125 Ala Lys Ala Gly Ala Leu Arg Asp Leu Arg Ser Arg Ala Trp Gly Thr 130 135 140 Leu Lys Asp Tyr Gly Val Lys Leu Leu Ile Val Gly Asn Ala Asp Tyr 145 150 155 160 Leu Lys Leu Glu Ser Phe Asn Glu Leu Ile Asp Leu Phe Gly Lys Leu 165 170 175 Arg Ile Ala Ile Ala Leu Val Gly Thr Asp Thr Leu Ala Glu Thr Leu 180 185 190 Asp Arg Arg Gly Ser Ala Tyr Arg Arg Ile His Asp Ala Phe Leu Glu 195 200 205 Ser Phe Asp Phe Leu Asn Leu Thr Pro Glu Asp Ile Arg Glu Val Ile 210 215 220 Glu His Trp Glu Asn Gln Phe Leu Pro Thr His Ser Arg Leu Asn Phe 225 230 235 240 Ala Arg Ile Pro Asp Val Arg Lys Phe Leu Glu Leu Lys Ser Lys Gly 245 250 255 Arg Ile Glu Pro Leu Tyr Asp Leu Leu Arg Lys Ile Ala Ile Leu Lys 260 265 270 Ile Asp Glu Pro Lys Leu Glu Leu Asn Ser Thr Asn Leu Ala Asp Arg 275 280 285 Leu Gly Lys Arg Asn Ala Pro Lys Asp Arg Ile Ser Thr Arg 290 295 300 <210> 40 <211> 650 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG108 transposition protein sequence <220> <223> MG108-1-B transposition protein <400> 40 Met Phe Arg Thr Ser Ala Asp Ser Asn Glu Asn Ser Ala Ser Ser Pro 1 5 10 15 Ile Ser Glu Leu Ser Ser Pro Gly Leu Val Glu Ala Gly Ser Phe Lys 20 25 30 Leu Leu Gln Asp Ile Ser Pro Glu Val Gln Gln Glu Met Asp Leu Ile 35 40 45 Asp Ala Ile Val Gln Ala Ser Asn Lys Cys Asp Arg Lys Ala Ala Ile 50 55 60 Asp Arg Ala Cys Ala Val Leu Asn Arg His Pro Arg Ser Ile Met Arg 65 70 75 80 Lys Val Gln Arg Leu Arg Gln Glu Gly Ile Thr Ser Leu Ala Lys Gly 85 90 95 Arg Lys Asp Asn Gly Gln Phe Arg Val Ser Glu Gln Trp Val Asn Phe 100 105 110 Ile Thr Lys Met Tyr Ala Arg Gly Gln Lys Asp Ser Leu Arg Phe Ser 115 120 125 Pro His Lys Val Phe Val Arg Leu Thr Val Phe Ala Ala Gln Gly Asn 130 135 140 Arg Leu Arg Glu Ser Lys Tyr Ser Asp Leu Phe Lys Asp Tyr Pro Glu 145 150 155 160 Val Leu Lys Asp Leu Ile Gln Gly Lys His Pro Ser His Pro Thr Val 165 170 175 Tyr Lys Ile Ile Asp Asn Tyr Leu Leu Gln Lys Asn Thr Lys Ala Arg 180 185 190 His Pro Gly Ala Phe Pro Gly Lys Leu Val Leu Gln Thr Thr Glu Gly 195 200 205 Leu Ile Ser Leu Thr His Ser Asn Gln Val Trp Gln Ile Asp His Thr 210 215 220 Lys Leu Asp Ile Leu Leu Val Ile Lys Val Glu Glu Asp Asp Lys Val 225 230 235 240 Glu His Glu Gly Lys Lys Ile Thr Ala Arg Pro Tyr Leu Thr Leu Val 245 250 255 Val Asp Ser Tyr Ser Ser Cys Val Ala Gly Tyr Tyr Leu Gly Phe Glu 260 265 270 Pro Ala Gly Ser His Glu Val Ser Leu Ala Leu Arg Asn Ala Ile Leu 275 280 285 Pro Lys Gln Tyr Gly Gln Glu Tyr Lys Leu Gln Ala Lys Trp Asn Ile 290 295 300 Tyr Gly Val Pro Asp Tyr Val Met Thr Asp Arg Ala Lys Glu Phe Lys 305 310 315 320 Ser Glu His Leu Lys Gln Ile Ser Phe Gln Leu Gly Phe Gln Arg Arg 325 330 335 Leu Arg Ala Phe Pro Ser Ala Gly Gly Leu Val Glu Ser His Phe Asp 340 345 350 Lys Ile Asn Lys Glu Tyr Leu Ser Glu Lys Pro Gly Tyr Thr Gly Ser 355 360 365 Ser Val Glu Glu Arg Pro Lys Glu Ala Glu Asn Ala Ala Cys Leu Thr 370 375 380 Leu Asp Asp Leu Glu Arg Glu Leu Val Arg Tyr Phe Val Asp His Asn 385 390 395 400 Asn Gln His Phe Tyr Ser Glu Asp Lys Leu Thr Val Ser Glu Arg Met 405 410 415 Ser Lys Pro Lys Arg Phe Glu Arg Trp Gln Asp Gly Leu Leu Val Glu 420 425 430 Pro Glu Ile Leu Asn Glu Arg Glu Leu Asp Ile Cys Leu Met Lys Ser 435 440 445 Ile Pro Arg Lys Val Glu Lys Tyr Gly Cys Val Arg Phe Glu Thr Leu 450 455 460 Arg Tyr Gln Gly Glu Cys Leu Ala Asn Lys Ala Phe Ile Gly Arg Asp 465 470 475 480 Ile Thr Leu Arg Tyr Asp Gln Arg Asn Ile Ala Thr Leu Leu Val Tyr 485 490 495 Ser Tyr Ser Thr Thr Ser Gln Ile Gln Glu Phe Ile Gly Thr Val Gln 500 505 510 Ala Ile Gly Leu Glu Arg Glu Arg Phe Ser Leu Gly Glu Trp Glu Ala 515 520 525 Leu Lys Gln Lys Met Arg Asp Arg Asp Lys Glu Ile Asp Asn Ser Ile 530 535 540 Leu Met Ala Glu Arg Met Gly Leu Ile Glu Ser Thr Lys Glu Gln Ile 545 550 555 560 Lys Ser Ser Arg Ser Lys Arg Gln Arg Ile Lys Lys Ala His Thr Glu 565 570 575 Gln Glu Arg Lys Ala Asn Arg Ser Lys Val Val Glu Leu Tyr Pro Glu 580 585 590 Arg Ala Ile Glu Asp Thr Thr Val Ile Gln Glu Asn Val Glu Ser Thr 595 600 605 Pro Asn Ser Ser Ile Gln Lys Arg Val Glu Ser Thr Gln Glu Gln Gln 610 615 620 Ile Gln Gln Ala Ala Pro Lys Thr Arg Arg Val Arg Thr Val Ala Pro 625 630 635 640 Asp Trp Asn Gln Ile Lys Gln Asp Asn Trp 645 650 <210> 41 <211> 200 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 effector sequence <220> <223> MG110-1-6 effector <400> 41 Met Lys Leu Phe Ser Val Lys Ile Thr Tyr Leu Pro Glu Lys Cys Asp 1 5 10 15 His Ala Leu Leu Ala Gly Arg Cys Ile Lys Val Leu His Ala Phe Met 20 25 30 Ser Arg Asn Gly Gln Phe Asn Ile Ala Val Ala Phe Pro Arg Trp Ser 35 40 45 Glu Asn Thr Ile Gly Asn Gln Leu Val Phe Val Ser Pro Asp Tyr Lys 50 55 60 Phe Leu Asp Met Leu Leu Glu Gln Pro Tyr Phe Arg Met Met Ile Glu 65 70 75 80 Asn Gly Leu Phe Glu Thr Gly Thr Val Val Asp Leu Pro Val Ser Asp 85 90 95 Ser Tyr Val Lys Phe Val Arg Asn Gln Ser Ile Asp Lys Met Thr Pro 100 105 110 Ala Ala Lys Ala Arg Arg Leu Arg Arg Ala Lys Lys Arg Ala Leu Ala 115 120 125 Arg Gly Glu Val Phe Asp Pro Ile Ala Pro Arg Ser Lys Asp Val Asp 130 135 140 Phe Phe His Ser Ile Pro Met Glu Ser Ser Glu Ser Glu Met Ser Tyr 145 150 155 160 Leu Leu Arg Val Gln Arg Tyr Glu Val Gln Gln Ala Asn Pro Val Ala 165 170 175 Ser Phe Glu Val Cys Ser Tyr Gly Leu Ser Thr Asn Glu Ser His Gln 180 185 190 Ala Leu Ile Pro Ser Ser Val Thr 195 200 <210> 42 <211> 342 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 effector sequence <220> <223> MG110-1-7 effector <400> 42 Met Gln Leu Pro Asn Gln Leu Ser Tyr Lys Arg Ser Ile Asn Pro Ser 1 5 10 15 Lys Ala Ile Phe Tyr Tyr Arg Arg Asp Glu Asp Leu Tyr Pro Leu Pro 20 25 30 Val Glu Arg Ile Lys Ile Arg Gly Ser Lys Ser Gly Phe Ser Glu Ala 35 40 45 Tyr Thr Ala Lys Gly Ile Lys Glu Ser Ala Thr Ile His Ser Leu Ala 50 55 60 Thr Gly Asn Pro His Thr Ile Asp Thr Cys Tyr Leu Pro Pro Ala Ala 65 70 75 80 Asp Ser Leu Val Cys Arg Phe Ser Leu Arg Val Ser Ala Asn Ser Leu 85 90 95 Phe Pro Asp Arg Cys Ser Glu Ile Ala Phe Lys Asp Thr Val Ser Gln 100 105 110 Phe Leu Asn Ser Tyr Ile Ala Lys Asp Gly Phe Lys Glu Leu Ala Ile 115 120 125 Arg Tyr Ser Lys Asn Ile Ala Met Gly Thr Trp Leu Trp Arg Asn Lys 130 135 140 Glu Gly Asn Thr Phe Asp Val Leu Val Arg Thr Ser Gln Gly Asn Glu 145 150 155 160 Tyr Lys Phe Lys Asn Ala His Met Leu Phe Trp Asp Ser Val Trp Pro 165 170 175 Asp Glu Ser Ser Glu Leu Leu Ala Leu Leu Ser Asp Glu Leu Ala Val 180 185 190 Ala Leu Thr Lys Pro Arg Tyr Val Trp His Cys Asp Val Trp Ala Glu 195 200 205 Val Lys Met Pro Phe Cys Ser Glu Val Phe Pro Ser Gln Cys Phe Val 210 215 220 Asp His Asp Asp Lys Gln Ser Ala Ser Lys Val Leu Leu Thr Thr Asp 225 230 235 240 Ile Asp Gly Val Met Thr Ala Cys Tyr Asn Ala Asp Lys Val Gly Ala 245 250 255 Ala Ile Gln Met Ile Asp Asp Trp Trp Asp Glu Ser Cys Asp Phe Pro 260 265 270 Leu Arg Val Asn Glu Tyr Ala Ala Asp His Glu Asn Leu Ile Ala Arg 275 280 285 Arg His Pro Ser Thr Glu Arg Asp Phe Tyr Gln Cys Leu Gln Asn Leu 290 295 300 Arg Gly Tyr Thr Asp Lys Leu Asn Lys Val Lys Ser Val Asp Asp Ile 305 310 315 320 Glu Pro Asp Ala His Phe Val Ala Ser Val Leu Val Lys Gly Gly Met 325 330 335 Phe Gln Gly Gly Lys Ser 340 <210> 43 <211> 682 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 effector sequence <220> <223> MG110-1-8 effector <400> 43 Met Ser Leu Gln Asp Thr Leu Gln Ala Val Lys Ala Leu Lys Ala Lys 1 5 10 15 Glu Arg Tyr Asp Ala Leu Lys Lys Ser Phe Glu Leu Tyr Ser Glu His 20 25 30 Val Asp Val Thr Gly Ser Glu Leu Ala Cys Leu Thr Ile Leu Val Asn 35 40 45 Leu Val Ser Lys Asp Ala Val Glu Leu Glu Gly Leu Arg His Ala Lys 50 55 60 His Val Leu Lys Ser Asp Glu Phe Trp Gly Lys Phe Ser Lys Val Ala 65 70 75 80 Ser Gln Leu His Thr His Asn Leu Lys Trp Pro Asp Ser Arg Val Asn 85 90 95 Leu Lys His His Ile Arg Ala Leu Pro Glu Ile Gly Val Leu Pro Lys 100 105 110 Phe Gly Trp Ser Gly Asn Ser Gly Asp Tyr Arg Phe Gly Arg Leu Leu 115 120 125 Thr Ser Thr Phe Ile Trp Gln Gly Leu Glu His Ser Leu Ile Ser Val 130 135 140 Trp Leu Gly Asp Phe Val Ala Trp Arg Lys Ala Ala Tyr Lys Leu Gly 145 150 155 160 Ile Thr Lys Val Phe Trp Tyr Gln Ile Lys Arg Asp Leu Glu Asp Leu 165 170 175 Phe Gln Glu Ser His Phe Pro Asp Val Val Asp Ser Tyr Ser Pro Glu 180 185 190 Leu Gln Phe Pro Tyr Lys Asp Gln Tyr Leu Ser Val Thr Pro Val Ala 195 200 205 Ser His Glu Thr Gln Leu Ala Ile Gln His Val Thr Gly Leu Pro Met 210 215 220 His Ser Leu Ser Phe Pro His Pro Ser Ala Leu Gly Val Leu Cys Gly 225 230 235 240 Ser Leu Gly Gly His Val Arg Leu Ile Arg Leu Ser Pro Leu Gly Asn 245 250 255 Gln Asn Val Gln Arg Ser Ser Leu Gly Ser Leu Ser Leu Lys Asn Tyr 260 265 270 Leu Asn Pro Tyr Val Leu Thr Ala Ile Pro Ala Ile Asn Leu Tyr Arg 275 280 285 Arg Ile Val Asp Val Arg Thr Tyr Ser Ser Leu Arg Leu Lys Arg Arg 290 295 300 Ala Arg Leu Asn Ala Leu Ser Thr Leu Asp Gly Ile Leu Ala Glu Trp 305 310 315 320 Val Ala Pro Leu Val Gln Val Lys Leu Ser Ser Asn Val Asp Gly Arg 325 330 335 Ile Asp Gly Leu Gly Ala Glu Glu Gln Glu Phe Val Glu Ser Ser Ser 340 345 350 Val Asp Ile Glu Glu Phe Ser Arg Tyr Leu Asn Arg Lys Leu His Gly 355 360 365 Met Leu Glu Leu Gly Lys Tyr Ser Arg Lys Phe Ser Tyr His Gln Arg 370 375 380 Leu Val Gly Val Thr Gln Lys Arg Leu Ala Ser Leu Leu Arg Arg Leu 385 390 395 400 Leu Leu Ala Glu Thr Gln Ser Glu Ser Asn Asn Thr Thr Phe Ile Ile 405 410 415 Leu Lys Ser Leu Arg Ile Asn Glu Ala Asn Gly Leu Asn Asn Pro Tyr 420 425 430 Val Val Gly Met Pro Ser Ile Ile Gly Leu Tyr Gly Phe Leu His Arg 435 440 445 Phe Glu Cys Gln Leu Arg Glu Ile Tyr Ala Asp Ile Ser Val Asp Ser 450 455 460 Phe Ala Leu His Cys Gly Glu Tyr Ser Tyr His Ala Ser Asn Asn Leu 465 470 475 480 Pro Ala Pro Ser Ile Pro Asp Lys Glu Met Arg Ile Lys Arg Ser Gly 485 490 495 Ile Thr Pro Glu Phe Lys Phe Asp Gly Lys Phe Ser Ile Ile Val Lys 500 505 510 Leu His Cys Leu Thr Asp Asn Ala Val Leu Asp Val Glu Gln Ile Lys 515 520 525 Ala Ala Val Pro Glu Arg Leu Trp Gly Gly Ser Val His Pro Pro Tyr 530 535 540 Leu Tyr Glu Asn Thr Glu Trp Ala Ala Ile Ala Tyr Gly Ser Ala Asp 545 550 555 560 Leu Glu Arg Tyr Leu Ile Arg Asn Leu Phe Phe Gly Asn Trp Ile Thr 565 570 575 Pro Glu Glu Glu Asp Gly Phe Glu Leu Arg Lys His Ile Glu Lys Leu 580 585 590 Asn Gly Lys Asn Glu Leu Ser Leu Cys Leu Val Gly Tyr Lys Leu Leu 595 600 605 Glu Lys Val Lys Pro Arg Ser Val Val Ser Gly Ile His Ala Phe Cys 610 615 620 Glu Pro Val Val Asp Leu Cys Cys Leu Lys Gln Thr His Lys Val Ile 625 630 635 640 Lys Pro Thr Lys Ser Ile Glu Gln Glu Leu Phe Trp Arg Tyr Val Pro 645 650 655 Val Ser Gln Asn Cys Thr Thr Leu Arg Val Ser Pro Val Cys Gly Glu 660 665 670 Thr His Ala Ala Ser Gln Ser Ala Glu Leu 675 680 <210> 44 <211> 383 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 transposition protein sequence <220> <223> MG110-1-Q transposition protein <400> 44 Met Gly Phe Leu Pro Asn Ser Ile His Leu Tyr Pro Asp Glu Thr Val 1 5 10 15 Glu Ser Ala Leu Leu Arg Leu Cys Lys Ala Asn His Phe Glu Arg Tyr 20 25 30 Ile Asp Leu Ser Ile Glu Ile Arg Ser Trp Leu Glu Glu His His Pro 35 40 45 Thr Ile Ala Gly Ala Phe Pro Val Ala Leu Asp Ala Val Asn Val Tyr 50 55 60 His Ala Lys Gln Ser Ser Ala Lys Arg Val Gln Ser Leu Gln Leu Leu 65 70 75 80 Glu Gln Leu Val Gly Leu Pro Arg Phe Ser Leu Leu Asp Ile Ser Phe 85 90 95 Lys His Thr Asn Ala Val Asp Ala Gly His Phe Ala Glu Val Arg Tyr 100 105 110 Lys Gln Ile Thr Ile Pro Lys Ser Phe Val Arg Ala Ser Ser Val Pro 115 120 125 Val Cys Ile Ala Cys Leu Arg Glu Ser Asn Tyr Val Arg Phe Asp Trp 130 135 140 His Ile Ser Lys Val Thr Cys Cys Glu Lys His Lys Val Lys Leu Leu 145 150 155 160 Ser Asn Cys Pro Ala Cys Asn Ala Pro Leu Asn Tyr Met Ile Ser Glu 165 170 175 Asp Pro Ser His Cys Val Cys Gly Phe Asn Leu Leu Glu Thr Thr Asn 180 185 190 Ser Glu Lys Gly Ala Asp Asp Trp Arg Arg Arg Ile Ser Phe Asp Gln 195 200 205 Gln Gly Ser Leu Ser Ile Ser Glu Gln Leu Ala Leu Leu Leu Phe Leu 210 215 220 Glu Arg Tyr Phe Ser His Val Glu Leu Gly Asp Phe Ile Gly Asn Tyr 225 230 235 240 Lys Ser Leu Ile Asp Lys His Leu Gln Ile Leu Thr Ser Lys Asn Ile 245 250 255 Leu Leu Ala Thr Glu Lys Ile Asn Arg Val Ser Phe Ser Ser Leu Thr 260 265 270 Asp Asn Phe Leu Gly Asp Val Ala Gln Ile Gly Ser Leu Pro Asn Phe 275 280 285 Ile Lys Gln His Ile Ala Asn Val Val Ile Glu Leu Ala Leu Glu Thr 290 295 300 Pro Arg Ser Thr Ile Ala Asn Leu Gly Asp Ser Leu Val Ser Met Arg 305 310 315 320 Asp Ala Ala Leu Ile Thr Gly Ser Thr Ile Asp Asp Ile Phe Arg Leu 325 330 335 Tyr Glu Ser Gly Ile Leu Val Val Gly Lys Arg Ile Arg Asn Glu Gly 340 345 350 Arg Ile Glu Ser Phe Asn Pro Leu Phe Arg Leu Arg Asp Val Ala Ala 355 360 365 Ile Ala Leu Ser Tyr Ser Arg Tyr Gly Tyr Ser Gln Ser Ala Trp 370 375 380 <210> 45 <211> 334 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 transposition protein sequence <220> <223> MG110-1-C transposition protein <400> 45 Met Gly Leu Thr Asp Ala Asp Lys Ala Lys Leu Arg Glu Phe Lys Asp 1 5 10 15 Cys Phe Cys Pro Tyr Thr Pro Val Thr Thr Val Leu Asn Asp Leu Glu 20 25 30 Ser Leu Tyr Gln Ser Ser Glu Ile Gly Gly Glu Gln Leu Ser Met Leu 35 40 45 Leu Arg Gly Asp Thr Gly Thr Gly Lys Ser Ala Ile Ile His His Phe 50 55 60 Cys Asn Ile Lys Asn Gly Ile Asn Leu Glu Ser Ile Pro Val Leu Leu 65 70 75 80 Ser Arg Val Pro Ser Lys Leu Thr Val Glu Asp Met Thr Arg Gln Leu 85 90 95 Leu Ser Asp Leu Gly Val Phe Gly Ser Ser Thr His Arg Ala Lys Asn 100 105 110 Ala Gln Ser Asp Ala His Leu Thr Asn Arg Leu Leu Asp Ala Leu Lys 115 120 125 Val Lys Asn Thr Lys Met Ile Ile Ile Asn Glu Phe Gln Glu Leu Ile 130 135 140 Glu Phe Lys Gly Ala Arg Asp Arg Gln Ala Ile Gly Asn Arg Leu Lys 145 150 155 160 Leu Ile Ser Glu Glu Ala Ala Val Pro Ile Val Leu Val Gly Met Pro 165 170 175 Trp Ile Asp Glu Ile Leu Asn Asp Ser Gln Trp Ala Ser Arg Leu Ala 180 185 190 Thr Arg Thr His Thr Leu Gln Tyr Phe Ser Leu Ser Lys Arg Ile Arg 195 200 205 Glu Tyr Phe Glu Phe Leu Glu Ala Ile Glu Thr Tyr Val Pro Cys Glu 210 215 220 Ile Glu Thr Ser Ile Ile Asp Phe Glu Ile Ser Ile Ala Leu Phe Ala 225 230 235 240 Ala Ser Cys Gly Glu Met Arg Gln Leu Lys Ala Ile Leu Thr Glu Ala 245 250 255 Ile Lys Leu Cys Leu Ile Ser Gly Glu Pro Phe Ser Lys Gln Ala Leu 260 265 270 Ser His Ser Phe Ala Asn Leu Tyr Ala Gly Ile Glu Asn Pro Phe Asp 275 280 285 Met Pro Lys Glu Lys Ile Lys Val Arg Glu Val Glu Met His Ser Arg 290 295 300 Tyr Ile Arg Gly Asp Ser Thr His Arg Ala Ala Ile Glu Pro Arg Arg 305 310 315 320 Leu Ser Asp Phe Met Ser Leu Thr Gln Ile Leu Ser Lys Lys 325 330 <210> 46 <211> 601 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 transposition protein sequence <220> <223> MG110-1-B transposition protein <400> 46 Met Phe Asp Asp Glu Phe Asp His Asp Pro Leu Lys Glu Asp Val Glu 1 5 10 15 Ser Ser Asn Arg Gln Ser Asp Glu Ala Ser Tyr Leu Ser Pro Asp Leu 20 25 30 Asp Ser Tyr Pro Ile Lys Ser Ser Glu Glu Ala Leu Val Arg Tyr Glu 35 40 45 Leu Val Gln Phe Ile Arg Glu Arg Thr Ser Lys Gly Trp Thr Gln Arg 50 55 60 Asn Leu Asn Pro Leu Ile Ser Glu Tyr Phe Ser Thr His Arg Ser Leu 65 70 75 80 Glu Arg Pro Ser Trp Arg Thr Val Val Arg Trp His Lys Lys Leu Leu 85 90 95 Glu Gln Gly Asp Thr Pro Val Ser Leu Ile Glu Arg His His Asn Lys 100 105 110 Gly Asn Arg Asn Arg Lys Leu Leu Leu Asp His Glu Arg Phe Phe Glu 115 120 125 Ala Ala Ile Asp Ser Phe Leu Lys Ala Lys Arg Pro Ser Val Ala Thr 130 135 140 Ala Tyr Arg Tyr Tyr Lys Asp Gln Cys Leu Leu Gln Gly Asn Asn Ile 145 150 155 160 Asn Pro Met Ser Gln Arg Ala Phe Tyr Asp Arg Ile Asp Lys Leu Asn 165 170 175 Ser Tyr Glu Val Ala Val Lys Arg Phe Gly Lys Tyr Lys Ala Asp Ile 180 185 190 Met Tyr Gly His Lys Gly Ser Thr Leu Lys Pro Glu Arg Val Met Gln 195 200 205 Arg Val Glu Ile Asp His Thr Val Leu Asp Ile Thr Leu Leu Asp Asp 210 215 220 Asp Thr Gly Met Pro Ile Gly Lys Pro Ser Leu Thr Leu Leu Lys Cys 225 230 235 240 Ala Leu Ser Gly Cys Ile Val Gly Tyr Asn Leu Thr Phe Lys Ala Pro 245 250 255 Cys Phe Ala Ser Val Ala Lys Ala Ile Cys His Thr Leu Leu Pro Lys 260 265 270 Thr Ser Ser Leu Asp Ile Trp Gly Ile Asp Trp Pro Cys Tyr Gly Lys 275 280 285 Ile Glu Val Leu Val Val Asp Asn Gly Val Glu Phe Trp Ile Pro Ser 290 295 300 Met Glu Lys Met Cys Phe Glu Leu Gly Ile Asn Val Gln Tyr Asn Pro 305 310 315 320 Val Lys Lys Pro Trp Leu Lys Pro Phe Ile Glu Arg Asn Phe Lys Thr 325 330 335 Ile Asn Ser Leu Leu Leu Asp Glu Leu Ser Gly Lys Thr Phe Gly Asn 340 345 350 Ile Tyr Val Arg Gly Asp Tyr Asp Ser Val Lys Asn Ala Glu Ile Pro 355 360 365 Phe Gly Val Phe Val Tyr Val Phe Glu Lys Trp Ala Ala Glu Val Tyr 370 375 380 Asn Cys Ser Pro Asp Ser Gln Gly Met Lys Val Pro Ser Ile Ile Trp 385 390 395 400 Gln Asp Gly Ile Glu Lys Phe Pro Pro Ala Arg Leu Ser Asp Ser Asp 405 410 415 Ile Arg Glu Leu Pro Lys Ile Thr Gly Phe Lys Glu Ser Arg Lys Ile 420 425 430 Gln Ser Ser Gly Ile Thr Tyr Lys His Leu Arg Tyr Asp Ser Thr Asp 435 440 445 Leu Ala Glu Tyr Arg Lys Gln Tyr Trp Ser Asn Thr Arg Lys Glu Leu 450 455 460 Val Thr Ile Lys Ile Asp Val Asp Asp Leu Ser Lys Ile Phe Val Tyr 465 470 475 480 Leu Pro Glu Ile Glu Lys Tyr Leu Thr Val Pro Cys Val Asp Gln Glu 485 490 495 Tyr Thr Lys Asn Leu Ser Leu Asp Gln His Leu Ile Thr Arg Thr Tyr 500 505 510 Thr Lys Lys Arg Asn Lys Leu Leu Gly Lys Ser Glu Leu Glu Leu Ala 515 520 525 Lys Ser Arg Asp Glu Ile Arg Asp Ala Val Glu Gln His Asp Lys Lys 530 535 540 Ala Ala Thr Ser Lys Lys Val Thr Thr Ser Lys Lys Val Ala Gln Phe 545 550 555 560 Lys Gly Tyr Ser Asn Glu Ser Val Lys Asn Lys Val Ala Lys Pro Ile 565 570 575 Ser Ser Asp Asp Lys Ser Arg Ala Glu His Ala Glu Met Ser Glu Leu 580 585 590 Glu Ala Leu Trp Asn Ser Phe Arg Lys 595 600 <210> 47 <211> 207 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 transposition protein sequence <220> <223> MG110-1-A transposition protein <400> 47 Met Tyr Asn Arg Asn Leu Arg Lys Pro Ser Pro Asn Lys Asn Leu Tyr 1 5 10 15 Lys Phe Val Ser Arg Lys Asn His Ser Thr Val Met Cys Glu Ser Gly 20 25 30 Leu Glu Phe Asp Ala Cys Phe His Leu Glu Phe Ser Pro Ser Ile Ala 35 40 45 Ser Phe Glu Ser Gln Pro Thr Gly Ile Glu Tyr Gln Ala Asp Asn Lys 50 55 60 Ile Arg Arg Tyr Thr Pro Asp Phe Lys Ile Val Lys Asn Thr Gly Glu 65 70 75 80 Ile Glu Tyr Ile Glu Val Lys Pro Glu Arg Ile His Ser Thr Lys Lys 85 90 95 Phe Arg Asp Glu Phe Glu Tyr Lys Arg Ala Ala Tyr Arg Ala Leu Gly 100 105 110 Phe Lys Leu Ile Leu Val Ser Glu Lys Gln Ile Arg Ser Glu Lys Leu 115 120 125 Leu Ser Asn Leu Lys Ile Leu His Arg Tyr Ala Ser Thr Asn Phe Ser 130 135 140 Glu Leu His Lys Leu Ala Leu Thr His Ile Lys Lys Phe Lys Ser Leu 145 150 155 160 Ser Ile Arg Glu Leu Ala Ile Lys Leu Gly Ile Arg Ile Cys Asp Cys 165 170 175 Ile Ala Ala Cys Ala Leu Leu Ile Gly Ile Gly Ala Val Lys Ala Asp 180 185 190 Leu Glu Ser Asp Phe Leu Cys Glu His Ser Leu Leu Asn Glu Ala 195 200 205 <210> 48 <211> 215 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 effector sequence <220> <223> MG110-2-6 effector <400> 48 Met Thr Asp Lys Arg Tyr Phe Phe Ala Ile His Tyr Val Pro Ala Lys 1 5 10 15 Ala Asp Cys Gly Leu Leu Ala Gly Arg Cys Ile Ser Thr Leu His Gly 20 25 30 Tyr Leu Leu Asn His Ala Val Thr Gln Ile Gly Val Ala Phe Pro Cys 35 40 45 Trp Ser Asn Lys Ser Ile Gly Arg Thr Ile Ala Phe Val Ser Glu His 50 55 60 Ser Ser His Leu Thr Gln Phe Arg Glu Arg Thr Tyr Phe Gln Thr Met 65 70 75 80 Gln Gly Asp Gly Leu Phe Glu Leu Ser Pro Val Leu Glu Val Pro Asp 85 90 95 Asp Cys Ala Glu Val Arg Phe Ile Arg Asn Gln Asn Leu Ala Lys Leu 100 105 110 Phe Val Gly Glu Arg Arg Arg Arg Leu Leu Arg Ser Lys Arg Arg Val 115 120 125 Ala Glu Arg Gly Glu Leu Phe Val Pro Lys Ala Pro Ala Ile Asn Gln 130 135 140 Glu Ile Ala Pro Phe His Cys Ala Leu Ile Gln Ser Ala Ser Asn Ala 145 150 155 160 Gln Ser Tyr Val Leu His Ile Gln Lys Gln Ser Cys Asp Ser Glu Asp 165 170 175 Ser Thr Asn Thr Tyr Ser Arg Tyr Gly Leu Ala Ser Pro Asn Ser Tyr 180 185 190 Arg Gly Ser Val Pro Glu Leu Ser Ser Ser Ile Ser Thr Leu Phe Pro 195 200 205 Asp Ser Leu Tyr Leu Lys Arg 210 215 <210> 49 <211> 345 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 effector sequence <220> <223> MG110-2-7 effector <400> 49 Met Glu Leu Cys Lys His Leu Ser Tyr Ser Arg Ser Leu Ser Pro Gly 1 5 10 15 Lys Ala Val Phe Phe Tyr Lys Thr Ala Asp Ser Asp Phe Val Pro Leu 20 25 30 Arg Val Glu Thr Ala Arg Val Val Gly Gln Lys Ser Gly Tyr Ser Glu 35 40 45 Gly Phe Asp Ala Asn Phe Gln Pro Lys Asn Val Glu Arg Tyr Glu Leu 50 55 60 Ala Tyr Gly Asn Pro Gln Thr Ile Glu Ala Cys Tyr Val Pro Pro Asn 65 70 75 80 Ile Val Glu Leu Tyr Cys Arg Phe Ser Leu Arg Ile Glu Ala Asn Ser 85 90 95 Leu Ser Pro Asp Leu Cys Ser Asp Pro Gly Val Val Lys Thr Leu Lys 100 105 110 Gln Leu Ala Gly Leu Tyr Gln Glu His Gly Gly Tyr Ile Glu Leu Ala 115 120 125 Arg Arg Tyr Ser Arg Asn Leu Leu Met Gly Thr Trp Leu Trp Arg Asn 130 135 140 Arg His Asn Gln Gly Thr Arg Ile Glu Val Lys Thr Ser Gln Gly Ser 145 150 155 160 His Phe Ala Ile Asp Asp Val Arg His Leu Asp Trp Phe Ser Glu Trp 165 170 175 Pro Ala Leu Ala Glu Ala Gln Leu Asn Gln Leu Ala Ala Glu Met Ala 180 185 190 Ile Ala Leu Ser Arg Arg Asp Met Phe Trp Phe Ala Asp Ile Thr Ala 195 200 205 Val Met Lys Thr Gly Phe Cys Gln Glu Ile Phe Pro Ser Gln Arg Phe 210 215 220 Thr Glu Arg Pro Asp Asn His Asp Glu Pro Ser Lys Lys Leu Ala Thr 225 230 235 240 Val Glu Cys Leu Asp Gly Gln Leu Ala Ala Cys Leu His Ala Gln Lys 245 250 255 Val Gly Ala Ala Leu Gln Gln Ile Asp Asp Trp Trp Ala Glu Asp Ala 260 265 270 Asp Gln Pro Leu Arg Val His Gln Tyr Gly Ala Asp Ser Lys Asn Leu 275 280 285 Thr Ser Met Arg His Pro Val Ser Gly Leu Asp Phe Tyr His Leu Leu 290 295 300 Gly Arg Ala Asp Glu Phe Leu Glu Leu Met Arg Ser Ser Pro Ala Ser 305 310 315 320 Ser Pro Leu Pro Gly Glu Ile His Tyr Leu Met Ala Val Leu Thr Lys 325 330 335 Gly Gly Leu Phe Gln Lys Gly Lys Gly 340 345 <210> 50 <211> 710 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 effector sequence <220> <223> MG110-2-8 effector <400> 50 Met Pro Leu His Glu Leu Met Asn Leu His Asp Gln Ala Glu Gln Asp 1 5 10 15 Lys Ala Leu Arg Arg Ala Phe Ala Pro Tyr Thr Pro Asp Ile Glu Leu 20 25 30 Glu Gly Glu Glu Tyr Arg Ala Leu Val Val Leu Val Asn Leu Thr Leu 35 40 45 Lys Arg Asp Gln Ala Val Asp Leu Cys Asp Glu Ser Gln Ala Gln Arg 50 55 60 Leu Val Asn Asp Asp Lys His Leu Glu His Cys Val His Pro Val Ala 65 70 75 80 Trp Leu His Ser His Asn Leu Lys Tyr Pro Asp Thr Arg Val Ser Gly 85 90 95 Gln Arg Leu Val Ile Asp Ala Pro Pro Leu Ile Pro Gly Val Val Thr 100 105 110 Ser Ala Gly Leu Gln Asn Arg Leu Gly Trp Ala Asn Asn Ser Ala Asp 115 120 125 Ile Asn Tyr Ala Lys Leu Phe Cys Ser Ser Phe Leu Tyr Gln Gly Leu 130 135 140 Ser Ser Asn Leu Ala Leu Gln Leu Val Ala Asp Val Pro Ala Trp Thr 145 150 155 160 Gly Ala Phe Arg Gln Leu Gly Val Ala Asn Thr Ala Ile Ala Ala Leu 165 170 175 Gln Ala Gln Leu Ala His His Leu Ala Ala Thr Ala Ile Pro Ser Glu 180 185 190 Val Ser Val Tyr Ser Lys Gln Val Arg Phe Trp Tyr Gln Gly Asp Tyr 195 200 205 Cys Ala Ile Thr Pro Val Val Ser His Ala Leu Met Ala His Leu Gln 210 215 220 His Met Ile Tyr Glu Lys Arg Cys Ser His Leu Thr Ile Ser His Asp 225 230 235 240 His Pro Ser Ser Val Gly Asn Leu Val Gly Ala Val Gly Gly Lys Ile 245 250 255 Ser Val Leu Asn Tyr Pro Pro Pro Ile Ser Ile Pro Lys Arg Arg His 260 265 270 Phe Ser Gln Ser Arg Thr Gln Arg Leu Asn Glu Gly Arg Ser Leu Phe 275 280 285 Asp Arg Gly Met Leu Tyr Asp Arg Ile Phe Pro Gln Ala Leu Glu His 290 295 300 Leu Ile Thr Pro Ala Gly Leu Thr Arg Arg Gln Arg Lys Gln Ser Arg 305 310 315 320 Leu Ser Ala Met Arg Tyr Leu Arg Arg Gln Leu Val Ala Trp Ile Gly 325 330 335 Pro Val Ile Glu Trp Arg Asp Glu Ile Gln Leu Leu Pro Asn Ile Glu 340 345 350 Leu Pro Ile Thr Pro Glu Arg Leu Glu Trp Lys Ile Val Thr Ser Pro 355 360 365 Val Ala Glu Leu Pro Asp Leu Ala Thr Glu Leu Ala Gly Val Phe His 370 375 380 Leu Glu Leu Gln Thr His His Ala Thr Arg Arg Phe Ala Tyr His Pro 385 390 395 400 Glu Leu Leu Ile Pro Ile Lys Ser Gln Leu Arg Trp Leu Leu Asn Lys 405 410 415 Leu Ala Asp Asp Glu Asn Arg Pro Ser Pro Gln His Ala Ala Thr Ser 420 425 430 Cys Tyr Leu His Leu Ser Gly Leu Arg Val Tyr Asp Ala Leu Ala Leu 435 440 445 Ala Asn Pro Tyr Leu Cys Gly Ile Pro Ser Leu Ser Ala Leu Ala Gly 450 455 460 Phe Cys His Asp Tyr Glu Arg Arg Leu Thr Ala Leu Leu Lys Arg Pro 465 470 475 480 Val Arg Phe Thr Gly Val Ser Trp Tyr Leu Ser His Tyr His Leu Leu 485 490 495 Ser Gly Lys Ser Leu Gln Glu Pro Leu Ser Pro Met His Ala Arg Glu 500 505 510 Val Ser Ala Ile Arg Arg Pro Gly Leu Ile Asp Ser Lys Tyr Cys Asp 515 520 525 Leu Gly Met Asp Leu Val Ile Ala Leu Gln Val Asp Asp Glu His Pro 530 535 540 Leu Pro Ser Ala Asn Glu Gln Asp Leu Leu Gln Ala Ala Phe Pro Ser 545 550 555 560 Arg Phe Ala Gly Gly Cys Leu His Pro Pro Ser Leu Tyr Glu Gly Lys 565 570 575 Pro Trp Cys Ser Leu Tyr Thr Asn Arg Asn Glu Leu Phe Asn Thr Leu 580 585 590 Ser Arg Leu Pro Arg Thr Gly Cys Trp Val Tyr Pro Tyr Gln Ser Arg 595 600 605 Ile Ser Asn Leu Asp Asp Leu Ile Asp Thr Leu Ser Met Asp Arg Arg 610 615 620 Val Arg Pro Val Ser Thr Gly Tyr Val Phe Leu Asp Glu Pro Arg Val 625 630 635 640 Arg Ala Gly Ser Val Glu Lys Cys His Val Tyr Ala Glu Ser Ala Leu 645 650 655 Gly Leu Ala Leu Cys Val Asn Pro Val Glu Met Arg Leu Tyr Gly Asn 660 665 670 Asn His Phe Phe Asn His Gly Val Trp Gln Leu Thr Ala Ile Asn Arg 675 680 685 Ala Ile Leu Met Thr Gly Ala Gly Asn Met Glu Gln Arg His Gly Ala 690 695 700 Met Gln Thr Ser Glu Leu 705 710 <210> 51 <211> 409 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 transposition protein sequence <220> <223> MG110-2-Q transposition protein <400> 51 Met Arg Leu Leu Ile Arg Pro Glu Pro Tyr Pro Asp Glu Ser Leu Glu 1 5 10 15 Ser Tyr Leu Leu Arg Leu Ser Gln Glu Asn Gly Phe Glu Arg Tyr Thr 20 25 30 Leu Leu Ser Gly Ala Ile Arg Asp Ser Leu Leu Val Gln Asp His Glu 35 40 45 Ala Ser Gly Ala Phe Pro Leu Glu Leu Ala Arg Val Asn Val Phe His 50 55 60 Ala Gln Arg Ser Ser Gly Leu Arg Val Arg Ala Leu Gln Leu Phe Ala 65 70 75 80 Gln Leu Thr Asp Leu Asp Pro Ala Cys Leu Leu Gln Leu Ser Leu Met 85 90 95 His Ser Gly Leu His Phe Gly Ser Gly His Ala Cys Val His Arg Ala 100 105 110 Gly Val Asp Thr Pro Leu Gly Phe Ile Arg Thr Gly Pro Ile Pro Val 115 120 125 Cys Pro Ala Cys Leu Arg Glu Ser Ala Tyr Ile Arg Gln His Trp His 130 135 140 Tyr Ser Pro Tyr Leu Ala Cys His Gln His Gly Ser Gln Leu Leu His 145 150 155 160 Leu Cys Pro Ser Cys Gly Glu Ala Leu Asp Tyr Gln His Ser Glu Ser 165 170 175 Phe Thr His Cys Arg Cys Gly Phe Asp Leu Arg Thr Ala Ile Thr Gln 180 185 190 Pro Ala Ser Ala Glu Ala Gln Gln Leu Ser Thr Leu Ile Cys Gly Ala 195 200 205 Arg Phe Glu Ser Thr Asn Pro Leu Leu Ser Ser Glu His Pro Ser Leu 210 215 220 Met Phe Gly Ala Leu Tyr Trp Tyr Trp Leu Arg Asn Lys Arg Ala Asp 225 230 235 240 Ala Gly Gln Pro Glu Phe Gly Thr Leu Thr Met Ala Ile Asp Tyr Phe 245 250 255 Ser Ala Trp Pro Ala Asn Phe His His Glu Leu Gln Gln Met Ala Gln 260 265 270 Lys Ala Leu Gln Thr Gln Thr Arg Leu Leu Asn His Thr Ala Phe Arg 275 280 285 Glu Val Phe Gly Ser Val Leu Thr Asp Cys Arg Gln Leu Pro Thr Arg 290 295 300 Asp Ser His Arg Asn Phe Ile Leu Arg Gly Leu Leu Asp Tyr Leu Thr 305 310 315 320 Glu Leu Val Cys Ala Asn Pro Lys Thr Arg Val Ala Asn Leu Ala Asp 325 330 335 Ile Gln Leu Ser Ala Ile Glu Ala Ala Ala Leu Leu Gly Thr Ser Val 340 345 350 Glu Gln Val Phe Arg Leu Leu Gln Asp Gly Tyr Leu Thr Pro Ala His 355 360 365 Arg Arg Ile His Gly Gly Leu Lys Pro His Glu Pro Leu Phe His Leu 370 375 380 Arg His Val Ile Glu Cys Arg Gln Ala His Arg Ser Thr Phe Asn Asp 385 390 395 400 Ala Tyr His Pro Tyr Leu Pro Ala Trp 405 <210> 52 <211> 335 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 transposition protein sequence <220> <223> MG110-2-C transposition protein <400> 52 Met Glu Leu Ser Ser Thr Asp Ala Asp Lys Leu Lys Ser Phe Ile Asp 1 5 10 15 Cys Tyr Val Glu Thr Pro Leu Leu Arg Ile Ile Gln Asp Asp Phe Asp 20 25 30 Arg Leu Arg Tyr Asp Lys Gln Phe Ala Gly Glu Pro Ile Cys Met Leu 35 40 45 Leu Thr Gly Asp Ala Gly Thr Gly Lys Ser Ser Leu Leu Arg His Tyr 50 55 60 Met Ala Gln Ser Pro Glu Gln Ser Gly Gln Gly Phe Val Arg Lys Pro 65 70 75 80 Leu Leu Val Ser Arg Ile Pro Ser Lys Pro Thr Leu Glu Ser Thr Met 85 90 95 Val Glu Leu Leu Lys Asp Leu Gly Gln Trp Gly Ser Glu Tyr Arg Leu 100 105 110 His Arg Ser Ser Ala Glu Ser Leu Thr Glu Ala Leu Ile Lys Cys Leu 115 120 125 Lys Arg Cys Glu Thr Glu Leu Ile Ile Ile Asp Glu Phe Gln Glu Leu 130 135 140 Ile Glu Asn Lys Thr Arg Glu Lys Arg Asn Gln Ile Ala Asn Arg Leu 145 150 155 160 Lys Tyr Ile Ser Glu Thr Ala Lys Ile Pro Ile Val Leu Val Gly Met 165 170 175 Pro Trp Ala Ala Lys Ile Ala Glu Glu Pro Gln Trp Ala Ser Arg Leu 180 185 190 Met Val Arg Arg Thr Ile Pro Phe Phe Lys Leu Ser Glu Asp Ala Glu 195 200 205 Ser Phe Val Arg Phe Val Met Gly Leu Ala Arg Arg Met Pro Phe Ala 210 215 220 Thr Pro Pro Lys Leu Glu Ala Lys His Thr Ile Phe Ala Leu Phe Ala 225 230 235 240 Ser Cys His Gly Ser Ile Arg Arg Leu Lys His Leu Leu Asp Glu Ser 245 250 255 Val Lys Gln Ala Leu Ala Ala His Ser Glu Thr Leu Gln His Glu His 260 265 270 Ile Ala Val Ala Phe Ala Leu Phe Tyr Pro Asp Gln Ile Asn Pro Phe 275 280 285 Leu Gln Pro Ile Asp Glu Ile Gln Thr Cys Glu Val Lys Gln Tyr Ser 290 295 300 Arg Tyr Glu Ile Asp Ala Ala Gly Lys Asp Glu Val Leu Ile Pro Thr 305 310 315 320 Gln Phe Thr Asp Lys Ile Pro Ile Ser Gln Leu Leu Lys Lys Arg 325 330 335 <210> 53 <211> 630 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 transposition protein sequence <220> <223> MG110-2-B transposition protein <400> 53 Met Met Cys Ala Gln Gln Ser Ser Glu His Pro Ser Gly Leu Phe Glu 1 5 10 15 Asp Glu Phe Ala Leu Pro Glu Pro Ala Ala Ser Ser Thr Pro Ser Glu 20 25 30 Ser Thr Val Thr Gly Ile Ser Ala Thr Phe Asp Ser Phe Pro Asp Glu 35 40 45 Leu Lys Asn Glu Ala Leu His Arg Leu Lys Tyr Leu Gln Trp Ile Glu 50 55 60 Ala Arg Leu Ile Gly Gly Trp Thr Glu Lys Asn Ile Ser Pro Leu Leu 65 70 75 80 Val Glu Ala Ala Ser Ile Leu Pro Pro Pro Val Pro Asn Trp Arg Thr 85 90 95 Leu Ala Arg Trp Arg Lys Asn Tyr Ile Gln Gln Gly Lys Lys Ile Ile 100 105 110 Ala Leu Ile Pro Arg His Gln Ala Lys Gly Asn Ser Gln Ser Arg Leu 115 120 125 Pro Leu Ser Asp Glu Ile Phe Phe Glu Glu Ala Val His Lys Tyr Leu 130 135 140 Val Asp Glu Glu Pro Ser Ile Ala Ser Ser Tyr Gln Leu Tyr Lys Ser 145 150 155 160 Lys Val Glu Leu Glu Asn Lys Thr Ile Val Gln Asn Pro Ile Lys Ile 165 170 175 Leu Ser Tyr Lys Ala Phe Tyr Asp Arg Ile Lys Met Leu Pro Ala Tyr 180 185 190 Gln Val Met Lys Cys Arg Lys Gly Leu His Leu Ala Asn Ala Gln Phe 195 200 205 Lys Ala Ile Gly Ser His Lys Arg Pro Thr Arg Ile Met Glu Arg Val 210 215 220 Glu Ile Asp His Thr Pro Leu Asp Leu Ile Leu Leu Asp Asp Glu Leu 225 230 235 240 Leu Val Pro Leu Gly Arg Pro Cys Leu Thr Leu Leu Ile Asp Cys Tyr 245 250 255 Ser His Cys Val Val Gly Phe Asn Leu Asn Phe Asn Gln Pro Gly Tyr 260 265 270 Glu Ser Val Arg Asn Ala Leu Leu Asn Ser Ile Pro Gln Lys Asn Tyr 275 280 285 Ile Lys Asp Lys Tyr Pro Val Ile Glu His Glu Trp Pro Cys Tyr Gly 290 295 300 Lys Pro Glu Thr Leu Val Val Asp Asn Gly Val Glu Phe Trp Ser Asn 305 310 315 320 Ser Leu Glu Gln Ala Cys Leu Glu Leu Gly Ile Asn Ile Gln Tyr Asn 325 330 335 Pro Val Arg Lys Pro Trp Leu Lys Pro Met Ile Glu Arg Met Phe Arg 340 345 350 Thr Ile Asn Cys Lys Leu Ile Asp Pro Ile Pro Gly Lys Thr Phe Ser 355 360 365 Asn Tyr Leu Glu Lys Gly Glu Tyr Asn Pro Glu Lys Asp Ala Val Met 370 375 380 Arg Phe Ser Val Phe Leu Glu Ile Phe His Gln Trp Ile Ile Asp Ile 385 390 395 400 Tyr His Tyr Glu Pro Asp Ser Arg His Arg Tyr Ile Pro Ile Leu Ser 405 410 415 Trp Gln Tyr Gly Phe Asp Arg Leu Pro Pro Ala Lys Val Thr Gly Glu 420 425 430 Asp Met Ala Lys Leu Glu Val Ile Leu Ser Leu Cys Ile Arg Cys Lys 435 440 445 His Thr Arg Gly Gly Val Glu His Leu Tyr Leu Arg Tyr Asp Ser Glu 450 455 460 Glu Phe Ala Ser Tyr Arg Met Lys Tyr Pro Ser Lys Thr Asp Gly Lys 465 470 475 480 Gln Tyr Val Leu Val Lys Leu Asn Pro Arg Asp Ile Ser Tyr Val Tyr 485 490 495 Val Phe Ile Asp Lys Ile Gly Glu Tyr Ile Arg Val Pro Cys Val Asp 500 505 510 Ser Glu Gly Tyr Thr Arg Gly Leu Ser Leu Gln Ala His Lys Ile Asn 515 520 525 Val Lys Leu His Arg Asp Phe Ile Gly Lys Lys Ile Asp Val Val Ser 530 535 540 Leu Ala Ile Ser Arg Ala Lys Ile Glu Ser Arg Ile Ile Lys Glu Leu 545 550 555 560 Thr Glu Val Arg Gln Thr Leu Lys Lys His Asn Ile Lys Gly Ile Asn 565 570 575 Lys Ile Ala Lys Tyr Arg Asp Ile Gly Ser Gln Thr Ala Ala Asn Leu 580 585 590 Leu Ser Ser Thr Gln Thr Pro Glu Asn Thr Asn Asp Asn Pro Val Gln 595 600 605 Pro Lys Thr Asp Gln Leu Pro Leu Glu Asp Asp Trp Asp Ser Phe Thr 610 615 620 Ser Glu Leu Glu Pro Tyr 625 630 <210> 54 <211> 207 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG110 transposition protein sequence <220> <223> MG110-2-A transposition protein <400> 54 Met Tyr Arg Arg His Leu Lys His Ser Arg Val Lys Asn Leu Phe Lys 1 5 10 15 Phe Val Ser Ala Lys Met Asn Thr Val Phe Thr Val Glu Ser Ser Leu 20 25 30 Glu Phe Asp Thr Cys Phe His Leu Glu Tyr Ser Pro Ala Val Lys Thr 35 40 45 Phe Glu Ala Gln Pro Glu Gly Tyr Tyr Tyr Ile Phe Glu Asp Arg Glu 50 55 60 Cys Pro Tyr Thr Pro Asp Phe Arg Val Val Asp Glu Arg Gly Asn Pro 65 70 75 80 Tyr Phe Ile Glu Val Lys Pro Ser Ala Lys Val Ala Thr Pro Asp Phe 85 90 95 Leu Gln Arg Phe Pro Ile Lys Gln Gln Lys Ala Ile Glu Leu Arg Ser 100 105 110 Pro Leu Lys Leu Val Thr Glu Arg Gln Ile Arg Val Asp Pro Ile Leu 115 120 125 Gly Asn Leu Lys Leu Leu His Arg Tyr Ser Gly Phe Gln Ser Phe Thr 130 135 140 Pro Leu His Ile Gln Leu Leu Gly Leu Val Arg Gln Leu Gly Arg Val 145 150 155 160 Ser Leu Ala Lys Leu Ser Gly Ser Thr Gly Ala Pro Pro Glu Glu Ile 165 170 175 Leu Ala Thr Thr Leu Ser Leu Met Ala Arg Gly Leu Ile His Ser Asp 180 185 190 Leu Thr Glu Arg Glu Met Gly Leu Ser Ser Val Val Trp Ala Ile 195 200 205 <210> 55 <211> 400 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-8 effector <400> 55 Gln Phe Asn Ile Glu Asn Glu Thr Gly Ser Ala Pro Asn Ala Lys Lys 1 5 10 15 Arg Lys Lys Ser Lys Ser Ala Asn Asp Pro Asn Leu Met Ser Tyr Leu 20 25 30 Phe Lys Ala His Lys Ala Thr Glu Asp Ile Leu Ser His Cys Ser Ile 35 40 45 Ser His Leu Leu Lys Asn Asp Cys Lys Val Ser Glu Thr Glu Glu Asp 50 55 60 Pro Asp Lys Phe Ala His Arg Ile His Arg Lys Gln Lys Gln Ile Glu 65 70 75 80 Gln Leu Asp Ala Lys Leu Asn Ala Arg Leu Pro Lys Gly Arg Asp Leu 85 90 95 Thr Gly Glu Glu Phe Phe Arg Thr Leu Glu Thr Ala Thr His Gln Ile 100 105 110 Ser Asp Asn Val Ile Gln Ala Arg Glu Trp Asp Ala Lys Leu Leu Thr 115 120 125 Arg Pro Ala Thr Leu Pro Tyr Pro Ile Ile Tyr Gly Ser Ser Thr Asp 130 135 140 Leu Arg Trp Gly Lys Thr Lys Thr Gly Arg Ile Thr Val Asn Phe Asn 145 150 155 160 Gly Ile Asp Lys Tyr Leu Asn Ala Ala Asp Pro Asn Leu Lys Glu Trp 165 170 175 Phe Lys Thr His Glu Glu His Pro Phe Gln Leu Tyr Cys Asp Arg Arg 180 185 190 Gln Leu His Phe Phe Gln Arg Phe Leu Glu Asp Trp Gln Ala Tyr Gln 195 200 205 Ala Asn Lys Asp Thr Tyr Pro Ala Gly Leu Leu Thr Leu Ser Ser Ala 210 215 220 Ile Leu Ile Trp Thr Glu Cys Glu Gly Lys Gly Asp Pro Trp Asn Val 225 230 235 240 Asn His Leu Ser Leu His Cys Thr Tyr Asp Thr Arg Leu Met Thr Ala 245 250 255 Glu Gly Thr Leu Val Val Gln Gln Glu Lys Ser Ala Lys Ala Ala Lys 260 265 270 Asn Leu Glu Arg Glu Lys Ser Asp Pro Arg Asn Gln Ser Thr Leu Asn 275 280 285 Arg Leu Asn Asn Leu Pro Ala Arg Pro Ser Lys Gln Pro Tyr Gln Gly 290 295 300 Asn Pro Glu Ile Ser Val Gly Leu Ser Ile Gly Leu Thr Asn Pro Ile 305 310 315 320 Thr Ala Ala Val Val Asn Val Thr Thr Gly Glu Val Leu Thr Tyr Arg 325 330 335 Thr Pro Lys Thr Leu Leu Gly Glu Gln Tyr Arg Leu Leu Asn Arg His 340 345 350 Arg Asp Arg Gln Gln Gln Asn Thr Leu Gln Arg Gln Lys Asn Gln Lys 355 360 365 Arg Cys Val Arg Tyr Gln Pro Ser Glu Ser Glu Leu Gly Glu Tyr Val 370 375 380 Asp Arg Leu Leu Ala Asn Lys Ile Ile Gln Leu Ala Gln Gln Tyr Gln 385 390 395 400 <210> 56 <211> 748 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-9 effector <400> 56 Met Gly Met Lys Thr Ile Gln Ser Asp Leu Ile Val Arg Leu Asp Pro 1 5 10 15 Asn Pro Arg Arg Gly Lys Lys Asn Leu Asp Asp Leu Ser Glu Phe Asp 20 25 30 Ala Val Ala Trp Cys Arg Leu Cys Glu Arg Ala Tyr Gln His Thr Leu 35 40 45 Leu Ile Asp Gln Ile Ser Glu Gln Ile Lys Leu Asn Pro Asp Val Ile 50 55 60 Ala Trp Ile Tyr Ala Val Gln Asn Ser Glu Asp Gln Asn Ser Ala Asp 65 70 75 80 Met Asp Thr Asp Thr Asp Ser Glu Gln Gly Tyr Ser Trp Leu Pro Asp 85 90 95 Gly Leu Ile Asn Gly Leu Cys Ala Leu Leu Lys Asn Thr Pro Gln Phe 100 105 110 Glu Gly Met Ser Gly Arg Ala Tyr Thr Ser Ala Thr Asp Arg Val Glu 115 120 125 Glu Asn Phe Lys Gly Trp Phe Ala Asn His Gln Lys Leu Ile Arg Gln 130 135 140 Ile Lys Gly Lys Gln His Trp Leu Thr Val Leu Glu Ser Asp Ala Glu 145 150 155 160 Leu Ala Glu Asn Ser Asn Phe Asn Gln Ser Glu Ile Glu Asn Gln Ala 165 170 175 Lys Gln Ile Leu Asn Glu Ile Glu Ala Asp Asn Glu Ser Lys Asp Glu 180 185 190 Ser Val Asn Asp Asn Arg Arg Val Phe Ser Ile Leu Phe Asp Arg Phe 195 200 205 Glu Ala Thr Glu Asp Val Leu Asn Arg Arg Ala Ile Ile His Leu Leu 210 215 220 Lys Asn Gly Gly Lys Val Arg Trp Glu Pro Lys Lys Ser Arg Asn Arg 225 230 235 240 Lys Ser Gln Lys His Pro Ser Lys Pro Met Thr Phe Glu Glu Arg Leu 245 250 255 Val Ala Lys Arg Ile Glu Ile Ala Arg Leu Glu Lys Gln Leu Leu Ser 260 265 270 Gln Leu Pro Arg Ala Arg Asn Leu Phe Pro Asp Ile Ala Phe Glu Glu 275 280 285 Ser Leu Ala Glu Val Val Ala Leu Pro Lys Leu Ser Asp Glu Glu Gln 290 295 300 Val Glu Ala Glu Gln Val Glu Ser Glu Phe Tyr Asn Trp His Glu Ser 305 310 315 320 Ile Thr Phe Lys Leu Leu Glu Phe Leu Arg Glu Pro Lys Ser Leu Pro 325 330 335 Tyr Pro Ile Ser Phe Gly Tyr Glu Asp Val Arg Ser Trp Gln Ile Asn 340 345 350 Gln Ala Gly Lys Ile Phe Phe Lys Leu Asn Gly Trp Gly Asp Leu Ile 355 360 365 Phe Glu Val Arg Cys His Arg Arg Gln Leu Pro Leu Ile Lys Ser Phe 370 375 380 Leu Lys Asp Trp Gln Thr Lys Glu Gln Cys Gln Glu Gly Asp Gln Tyr 385 390 395 400 Ser Gly Ser Leu Met Leu Leu Arg Ser Ile Glu Leu Val Trp Lys Pro 405 410 415 Lys Pro Val Asn Glu Gln Asn Asp Ile Gln Leu Cys Ser Gln Cys Glu 420 425 430 Val Phe Gln Gln Tyr Pro Ser Lys Gly Phe Trp Ser Glu Cys Lys Leu 435 440 445 Ser Ile His Trp Ser Tyr Asp Ser Asp Ala Leu Ser Lys Gln Gly Leu 450 455 460 Glu Lys Val Arg Gln Arg Lys Leu Glu Pro Gln Leu Glu Lys Leu Arg 465 470 475 480 Lys Lys Gln Glu Glu Leu Glu Glu Lys Gln Gln Leu Leu Gln Ser Ile 485 490 495 Glu Glu Val Pro Glu Ala Leu Arg Ser Lys Ala Gln Ser Lys Lys Met 500 505 510 Arg Ser Leu Thr Lys Ala Ile Gln Glu Leu Gln Asp Asp Leu Ala Lys 515 520 525 Pro Arg Pro Lys Leu Asp Cys Leu Gln Asn Ser Leu Leu Phe Asp Arg 530 535 540 Pro Asp Arg Pro Leu His Glu Gly Val Pro Asn Ile Phe Val Gly Val 545 550 555 560 Leu Leu Asp Leu Asp Lys His Leu Val Val Thr Val Val Asp Ala Met 565 570 575 Arg Arg Lys Ile Leu Ala Ile Arg Asn Ala Arg Ser Ile Ser Lys Glu 580 585 590 Gly Tyr Asp Leu Leu Gln Ser Tyr Phe Arg Gln Arg Arg Glu His Ser 595 600 605 Lys Glu Arg Gln Ile Asp Gln Lys Ala His Arg His Val His Gln Thr 610 615 620 Glu Ser Asn Leu Gly Gln His Val Ala Arg Leu Phe Ala Lys Gly Ile 625 630 635 640 Val Glu Leu Gly Gln Lys Tyr Lys Ala Ser Thr Ile Val Ile Pro Glu 645 650 655 Thr Asp Gly Trp Arg Asp Arg Leu Tyr Ser Gln Leu Val Ala Ser Ala 660 665 670 Ala Ile Lys Cys Lys Gly Val Lys Lys Ala Met Thr Leu Tyr Thr Lys 675 680 685 Gln His Gly Glu Lys Leu His Gln Trp Asp Tyr Asn Arg Leu Ser Gln 690 695 700 Ala Ile Ser Asp Arg Ala Ala Thr Asp Gly Leu Lys Val Met Arg Gln 705 710 715 720 Asn Thr Val Tyr Glu Glu Asp Ala Phe Gln Gln Ala Ala Asn Leu Ala 725 730 735 Ile Ala Ala Tyr Asp Ser Leu Asn Ser Val Glu Lys 740 745 <210> 57 <211> 422 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-10 effector <400> 57 Ser Trp Gln Leu Asn Gln Glu Gly Lys Ile Cys Phe Lys Leu Asn Gly 1 5 10 15 Leu Gly Asp Tyr Leu Phe Glu Val Arg Cys Asp Arg Arg Gln Leu Gly 20 25 30 Ile Val Lys Tyr Phe Leu Gln Asp Trp Gln Thr Gln Asn Lys Asn Lys 35 40 45 Asn Glu Tyr Ser Gly Gly Leu Thr Leu Leu Arg Ser Ala Glu Leu Leu 50 55 60 Val Lys Pro Lys Leu Gly Lys Gln Asn Ala Lys Leu Pro Pro Ile His 65 70 75 80 Asp Arg Gln Ala Val Val Thr Ala Tyr Lys Leu Ser Leu His Cys Thr 85 90 95 Tyr Asp Thr Asp Tyr Leu Thr His Gln Gly Leu Glu Cys Val Arg Gln 100 105 110 Arg Lys Ile Ala Asn Gln Leu Lys Gly Leu Thr Asp Lys Lys Ala Lys 115 120 125 Leu Thr Lys Gln Gln Glu Gln Leu Gln Gln Leu Glu Gln Glu Met Gln 130 135 140 Gln Glu Gln Ile Gly Thr Ser Ala Lys Arg Ser Lys Arg His Ala Gln 145 150 155 160 Arg Leu Lys Gln Ile Glu Gln Leu Lys Gln Ser Ile Ser Lys Leu Gln 165 170 175 Ala Ala Ile Gln Ala Glu Leu Glu Arg Pro Arg Pro Lys Leu Glu Arg 180 185 190 Leu Gln Gln Ser Gln Leu Phe Gln Arg Ala Asp Arg Pro Leu Tyr Ala 195 200 205 Gly Val Ala His Leu Phe Val Gly Val Cys Leu Asp Leu Asp Gln His 210 215 220 Leu Val Val Thr Ile Val Asp Ala Met Arg His Lys Val Leu Thr Lys 225 230 235 240 Arg Thr Val Lys Gln Ile Met Gly Glu His Tyr Pro Leu Leu Gln Arg 245 250 255 Tyr Arg Arg Leu Lys Gln Gln His Pro Lys Gln Arg Arg Gln Asp Gln 260 265 270 Lys Val Gly Arg His Asn His Leu Ser Glu Thr Gly Leu Gly Glu Gln 275 280 285 Val Ala Cys Ala Ile Ala Asn Gly Leu Leu Ser Leu Ala Gln Gln Tyr 290 295 300 Lys Val Ser Thr Ile Val Leu Pro Glu Thr Lys Gly Trp Arg Glu Arg 305 310 315 320 Leu Tyr Ser Gln Leu Val Ala Arg Ala Lys Ile Lys Cys Asn Gly Ser 325 330 335 Lys Lys Ala Met Ala Arg Tyr Thr Lys Ala Tyr Gly Lys Arg Leu His 340 345 350 Gln Trp Asp Tyr Asn Arg Leu Ser Arg Ala Ile Glu Thr Glu Ala Gln 355 360 365 Thr Val Gly Val Thr Val Ile Phe Gln Arg Leu Glu Phe Gln Ala Asn 370 375 380 Ala Glu Gln Asp Asn Gln Pro Ala Asp Glu Ala Asp Glu Gln Asp Asn 385 390 395 400 Gln Arg Val Asn Pro Phe Glu Leu Ala Leu Gln Ile Ala Ile Ala Ala 405 410 415 Tyr Asp Ser Leu Gln Ala 420 <210> 58 <211> 404 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-11 effector <400> 58 Met Ala Glu Ser Thr Leu Trp Glu Lys Ser Glu Pro Glu Pro Leu Ala 1 5 10 15 Gln Leu Pro Thr Leu Pro His Thr Leu Pro Tyr Gln Ile Arg Phe Glu 20 25 30 Ser Ser Asp Asp Leu Tyr Trp Ser Leu Leu Pro Lys Gly Lys Gln Glu 35 40 45 Asp Ala Glu Lys Asn Glu Gly Lys Phe Glu Gln Ala Glu Pro Leu Pro 50 55 60 Arg Pro Ala Pro Lys Arg Lys Arg Arg Lys Arg Arg Lys Ile His Tyr 65 70 75 80 Gln Ala Ser Ile Cys Val Arg Phe Lys Gly Leu Ala Glu His Ser Phe 85 90 95 Arg Val Gln Cys Ser His Arg Gln Leu Pro Ile Phe Gln Gln Cys Leu 100 105 110 Asp Glu Trp Gln Leu Leu Asn Ala Leu Ser Asp Asp Val Lys Phe Ser 115 120 125 Leu Ala Val Phe Pro Leu Arg Ser Ala Arg Leu Val Trp Cys Lys Asp 130 135 140 Lys Gln Ala Ser Lys His Ser Lys Asn Pro Lys Ala Glu Trp Asn Gln 145 150 155 160 Tyr Arg Leu Tyr Leu His Cys Thr Ile Asp Arg Arg Thr Leu Thr Ala 165 170 175 Glu Gly Thr Glu Glu Leu Arg Gln Gln Lys Leu Val Glu Ala Gln Lys 180 185 190 Gln Lys Glu Ala Ser Val Lys Lys Gln Lys Pro Pro Lys Ile Pro Ala 195 200 205 Pro Leu Thr Glu Glu Gln Arg Gln Ala Lys Asn Gln Ala Glu Ala Leu 210 215 220 Lys Arg Asn His Ser Thr Leu Leu Arg Leu Gln Asn Pro Ser Pro Pro 225 230 235 240 Arg Leu Ser Lys Pro Cys Tyr Val Gly Gln Pro His Leu Val Val Gly 245 250 255 Val Cys Phe Ser Arg Arg Asp Arg Ala Ser Ala Ile Val Tyr Asp Ile 260 265 270 Gln Gln His Gln Glu Ile Glu Tyr Val Gly Val Arg Glu Leu Leu Thr 275 280 285 Asp Glu Ser Ala Glu Glu His Tyr Arg His Phe Ser Ser Asn Pro Gln 290 295 300 Arg Lys Gly Lys Arg Ser Leu Glu Gln Met Arg Leu Glu Gln Tyr Arg 305 310 315 320 Leu Val Glu Arg Phe Tyr Arg Glu Gln Glu Lys Tyr Gln Gln Arg Arg 325 330 335 Ala Glu Ala Gln Glu Cys Gly Leu Glu Leu Glu Asp Glu Ser Val Ser 340 345 350 Asn Leu Gly Glu Tyr Leu Asp Arg Leu Leu Ala Ala Arg Ile Val Glu 355 360 365 Phe Ala Val Lys Gln Gln Ala Ser Ser Ile Val Ile Pro Glu Leu Gly 370 375 380 Asn Ile Arg Glu Ser Ile Glu Cys Glu Val Gln Met Gln Met Glu Asn 385 390 395 400 Arg Gly Phe Glu <210> 59 <211> 731 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-12 effector <400> 59 Met Ala Ser Gly Ile Leu Arg Thr Ile Gln Ala Arg Leu Val Pro Ser 1 5 10 15 Glu Trp Met Pro Leu Asp Gln Lys Ala Ser Glu Asp Ser Gly Glu Ser 20 25 30 Gln Pro Val Pro Ile Ala Val Val Ser Ser Phe Val Glu Asp Cys Thr 35 40 45 Leu Gln Leu Gly Leu Thr Ser Thr Arg Leu Cys Arg Ala Leu Asn Glu 50 55 60 Cys Ile Asn Gln His Ser Asp Phe Glu Val Trp Lys Glu Gly Gly Ser 65 70 75 80 Ile Pro Pro Lys Ala Leu Lys Glu Ile Trp Asn Ser Ile Arg Thr Met 85 90 95 Pro Pro Tyr Gln Asp Leu Pro Glu Arg Phe Leu Arg Ser Ala Trp Leu 100 105 110 Arg Val Glu Gly Ile Tyr Ala Ser Trp Phe Ala Ile Arg Thr Arg Leu 115 120 125 Ala Ala Lys Gln Asp Gly Leu Asn Arg Trp Leu Ser Ile Val Arg Ser 130 135 140 Asp Glu Tyr Leu Thr Lys Thr Cys Asp Cys Ser Leu Glu Glu Met Gln 145 150 155 160 Ala Arg Ala Thr Gln Leu Leu Thr Glu Pro Ser Gly Ser Ser Leu Ser 165 170 175 Ala Leu Phe Asp Ala Tyr Phe Ala Leu Val Lys Ala Asp Gly Ser Leu 180 185 190 Leu Asp Arg Cys Ala Ile Val His Leu Ile Lys Asn Gly Cys Ala Val 195 200 205 Ala Ser Lys Pro Glu Asp Leu Lys Lys Phe Ala Ala Thr Cys Gln Lys 210 215 220 Lys Arg Gln Gln Val Glu Arg Ile Thr Lys Gln Leu Ala Ala Pro Ala 225 230 235 240 Pro Gln Val Arg Asp Leu Gly Glu Ala Ala Glu Ala Ala Leu Thr Asp 245 250 255 Ser Val Glu Arg Ile Pro Ser Asn Asn Ala Asp Phe Val Ala Gln Leu 260 265 270 Ala Ala Leu Gln Arg Lys Pro Ile Pro Leu Pro Tyr Ala Val Val Phe 275 280 285 Tyr Ser Asn Asp Asp Leu Glu Trp His Gln Ile Lys Arg Arg Asn Ser 290 295 300 Ala Thr Glu Lys Ile Glu Glu Arg Ile Phe Val Lys Phe Lys Gly Leu 305 310 315 320 Asn Lys Tyr Leu Arg Asn Arg Val Lys Tyr Asn Leu Glu Ala Gln Leu 325 330 335 Ala Gln Ile Leu Glu Ser Ser Gly Leu Lys Leu Asp Asp Ile Ser Trp 340 345 350 Lys Ile Ile Arg Arg Lys Thr Ala Gln Ser Thr Val Lys Tyr Ile Ser 355 360 365 Phe Lys Leu Lys Thr Pro Asp Pro Thr Leu Lys Gln His Leu Lys Glu 370 375 380 Gln Phe Glu Gln Ile Asp Leu Glu Asp Lys Tyr Asn Leu Gln Lys Glu 385 390 395 400 Tyr Gly Phe Glu Leu Cys Cys Gly Tyr Arg Gln Leu Ala Asp Phe Gln 405 410 415 Thr Phe Leu Ser Asp Trp Gln Leu Tyr Cys Thr Asn Arg Asp Arg Tyr 420 425 430 Ser Val Ser Pro Phe Ala Leu Arg Ser Ala Ala Leu Asp Trp Gln Lys 435 440 445 Glu Val Lys Gln Gly Lys Ser Lys Leu Gln Val Tyr Leu Arg Cys Thr 450 455 460 Leu Asp Gln Gln Glu Leu Thr Ala Glu Gly Ala Glu Arg Ala Arg Ala 465 470 475 480 Lys Ala Ala Thr Glu Leu Asn Lys Lys Ile Ala Lys Leu Glu Ala Ala 485 490 495 Gln Glu Gln Gly Glu Val Leu Ser Glu Glu Gln Gln Arg Asp Leu Glu 500 505 510 Arg Ala Arg Ser Gln Leu Arg Gly Ala Glu His Pro Tyr Pro Arg Pro 515 520 525 Ser Gln Pro Leu Tyr Glu Gly Asn Pro Asp Ile Leu Val Gly Val Cys 530 535 540 Leu Ser Trp Glu Gln Val Ala Thr Val Ala Val Val Asn Trp Ser Thr 545 550 555 560 Arg Gln Val Leu Val Tyr Arg Thr Ile His Gln Leu Met Gly Glu Asp 565 570 575 Tyr Pro Leu Leu Ser Ser Tyr Arg His Glu Gln Pro Arg Asn Ala Asn 580 585 590 Lys Arg His Lys Arg Gln Lys Arg Gly Gln Ser Ser Asn Ile Ser Glu 595 600 605 Ala Ser Lys Gly Lys His Ile Asp Arg Val Ile Ala Lys Arg Leu Val 610 615 620 Glu Val Val Val Glu Phe Asn Ala Gly Cys Leu Val Leu Pro Asn Leu 625 630 635 640 Asn Gly Leu Arg Glu Asn Leu Gln Ala Glu Leu Met Ala Lys Ala Ala 645 650 655 Trp Lys His Pro Gly Asp Val Ala Lys Gln Lys Ala Tyr Leu Lys Gln 660 665 670 Tyr Lys Lys Asn Leu His Cys Trp Pro Tyr Arg Arg Leu Ala Gln Phe 675 680 685 Val Lys Glu Arg Ala Asp Lys Ile Gly Val Pro Ile Glu Leu Gly Gln 690 695 700 Gln Pro Arg Glu Gly Asp Phe Lys Glu Gln Ala Val Gln Val Ala Trp 705 710 715 720 Ser Phe His Glu Ala Gln Gln Ala Asp Glu Gly 725 730 <210> 60 <211> 741 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-13 effector <400> 60 Met Ala Ile Lys Thr Leu Arg Ser Gln Leu Cys Ala Thr Glu Glu Thr 1 5 10 15 Arg Glu Tyr Leu Trp His Leu Phe Ile Thr Tyr Thr Leu Leu Ile Asn 20 25 30 Gln Leu Leu Glu Arg Leu Pro Lys Asp Ala Lys Phe Ser Asp Trp Arg 35 40 45 Lys Glu Gly Arg Val Pro Arg Lys Ala Val Ala Ala Leu Cys Asn Lys 50 55 60 Val Leu Glu Glu Asp Gly Ser Leu Lys Gly Leu Pro Ala Arg Phe Tyr 65 70 75 80 Thr Ser Ala Val Leu Cys Thr Ser Tyr Thr Phe Ala Ser Ile Phe Ala 85 90 95 Ile Gln Asn Lys Leu Arg Ala Arg Cys Glu Gly Lys Gln Arg Trp Leu 100 105 110 Asn Val Ala Glu His Asp Leu Glu Leu Ala Glu Thr Thr Ala Phe Ser 115 120 125 Leu Glu Glu Ile Arg Glu Arg Ala Ala Gln Val Leu Gly Gln Ala Glu 130 135 140 Ser Glu Arg Gln Glu Cys Leu Asp Glu Glu Glu Glu Pro Ser Asn Ile 145 150 155 160 Pro Ser Ile Met Ser Leu Leu Phe Lys Leu Leu Asp Lys Ser Asn Asp 165 170 175 Leu Leu Ser Tyr Arg Ala Ile Ala His Leu Leu Arg Asn Asp Cys Lys 180 185 190 Val Ser Tyr Glu Glu Glu Asp Pro Glu Lys Leu Ala Leu Arg Leu Ser 195 200 205 Lys Lys Arg Ile Gln Ile Glu Arg Leu Gln Glu Gln Leu Asn Ser Gln 210 215 220 Leu Pro Ile Gly Pro Asp Pro Thr Gly Glu Arg Thr Asn Gln Phe Ile 225 230 235 240 Glu Glu Ala Ile Phe Leu Pro Arg Asp Ser Asp Ser Ser Glu Asn Arg 245 250 255 Ile Lys Glu Phe Glu Thr Trp Glu Asp Leu Leu Pro Glu Arg Ile Ala 260 265 270 Asn Leu Ser Thr Gln Leu Glu Thr Leu Pro Tyr Pro Leu Leu Leu Gly 275 280 285 Ser Asn Asp Asp Val Ser Trp Ser Trp Glu Thr Ile Ser Thr Ala Ala 290 295 300 Ser Ser Ser Ser Thr Ser Pro Asn Pro Ser Pro Lys Arg Thr Arg Thr 305 310 315 320 Arg Arg Arg Arg Arg Lys Ala Lys Lys Arg Ile Cys Val Ser Phe Lys 325 330 335 Gly Lys Gly Leu Ser Gln Ile Arg Leu Arg Leu Tyr Cys Asp Arg Arg 340 345 350 Gln Leu Pro Ile Phe Arg Gln Phe Val Glu Asp Ser Lys Ala Asn Lys 355 360 365 Ala Arg Asn Lys Lys Glu Lys Phe Ser Leu Ala Leu Tyr Pro Leu Arg 370 375 380 Ser Ala Thr Leu Leu Trp Ala Glu Asp Pro Lys Leu Ser Thr Glu Lys 385 390 395 400 Asn Arg Asp Lys Pro Trp Asn Ser His Arg Leu Tyr Leu His Val Thr 405 410 415 Val Asp Thr Arg Leu Leu Thr Ala Glu Gly Thr Glu Gln Val Arg Gln 420 425 430 Glu Lys Ile Glu Leu Met His Lys Phe Leu Lys Gly Leu Val Glu Ala 435 440 445 Glu Glu Thr Gln Glu Ala Asn Glu Asp Glu Glu Ala Phe Leu Val Ala 450 455 460 Gln Lys Asn Arg Ser Arg Ala Thr Lys Lys Asn Gln Thr Thr Leu Lys 465 470 475 480 Leu Leu Glu Ser Asn Pro Pro Pro Pro Arg Pro Arg Gln Ser Ala Tyr 485 490 495 Arg Gly Asn Ala Glu Ile Ala Val Lys Val Ala Phe Ser Arg Glu His 500 505 510 Val Val Gly Val Ala Val Ser Asp Gly Gln Gln Pro Ile Leu Asp Tyr 515 520 525 Arg Asp Val Glu Thr Leu Leu Ile Asp Ser His Leu Glu Leu Leu Glu 530 535 540 Gln Arg Ser His Lys Leu Arg Asn Gln Pro Glu Arg Leu Arg Lys Val 545 550 555 560 Lys Leu Gly Asp Ser Lys Lys Ala Lys Lys Ala Lys Arg Thr Arg Tyr 565 570 575 Lys Pro Lys Ile Ser Thr Arg Gln Leu Gln Leu Gln Pro Tyr Arg Leu 580 585 590 Leu Lys Arg Trp His Arg Leu Lys Arg Lys Asn Val Thr Glu Arg Arg 595 600 605 Ala Glu Gln Lys His Gly Leu Tyr Arg Gln Ser Gln Ala Glu Thr Asn 610 615 620 Leu Ala His Gln Ile Asn His Ile Leu Ala Arg Asn Ile Val Asp Leu 625 630 635 640 Cys Gln Lys Trp Ser Ala Gly Thr Ile Ile Leu Pro Glu Phe Gly Asp 645 650 655 Leu Arg Glu Ser Ile Glu Ser Glu Ile Gln Ala Lys Ala Arg Arg Lys 660 665 670 Tyr Pro Asp Asp Asn Val Glu Arg Gln Lys Gln Tyr Ala Lys Glu Phe 675 680 685 Arg Met Gln Phe His Arg Trp Asn Tyr Lys His Leu Ser Glu Cys Ile 690 695 700 Arg Leu Arg Ala Ala Lys Val Gly Ile Ala Cys Ile Ala Gly Gln Gln 705 710 715 720 Pro Arg Leu Gly Thr Leu Arg Glu Lys Ala Ile Ala Val Thr Ala Ile 725 730 735 Pro Pro Lys Pro Lys 740 <210> 61 <211> 642 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-14 effector <400> 61 Met Ser Ile Ile Thr Ile His Cys Arg Leu Ile Ala Ser Glu Pro Ile 1 5 10 15 Arg Arg His Leu Trp Gln Leu Met Ser Arg Ser Asn Thr Pro Leu Ile 20 25 30 Asn Asp Leu Leu Lys Gln Val Ser His His Ala Asp Phe Glu Thr Trp 35 40 45 Gln Thr Arg Gly Thr Val Pro Ser Asn Ala Ile Arg Asp Leu Cys Glu 50 55 60 Pro Leu Lys Glu Val Tyr Pro Gly Gln Pro Ala Arg Phe Tyr Ala Ser 65 70 75 80 Ala Ile Leu Met Val Thr Tyr Thr Tyr Glu Ser Trp Leu Ala Leu Gln 85 90 95 Gln Thr Arg Arg Arg Arg Leu His Gly Lys Gln Arg Trp Leu Asn Val 100 105 110 Val Lys Ser Asp Ala Glu Leu Leu Gly Leu Ser Gly Ser Thr Leu Glu 115 120 125 Ser Ile Arg Gln Arg Ala Gln Asp Ile Leu Ser Gln Leu Ser Thr Glu 130 135 140 Met Glu Thr Gln Ser Ala Pro Asn Pro Lys Lys Arg Ser Gln Arg Gln 145 150 155 160 Gly Gln Thr His Ser Ser Asn Asp Ala Ser Leu Met Pro Arg Leu Phe 165 170 175 Thr Ala Tyr Asp Thr Ala Asp Asp Ile Leu Ser Gln Cys Ala Ile Val 180 185 190 His Leu Ile Lys Asn Gly Cys Lys Ile Ser Glu Thr Glu Glu Asp Ser 195 200 205 Glu Lys Phe Ala His Arg Ile His Arg Lys Gln Lys Glu Ile Asp Gln 210 215 220 Ile Glu Ala Gln Leu Gln Ala Arg Leu Pro Lys Gly Arg Asp Leu Thr 225 230 235 240 Gly Asp Val Phe Leu Glu Thr Leu Ala Ile Ala Thr Gln Gln Ile Pro 245 250 255 Glu Thr Val Ile Gln Ala Arg Glu Trp Gln Ala Lys Leu Leu Ser Arg 260 265 270 Pro Ala Ser Leu Pro Tyr Pro Met Ile Tyr Gly Ser Ser Thr Asp Val 275 280 285 Arg Trp Gly Lys Thr Ala Asn Asp Arg Ile Ala Val Ser Phe Asn Gly 290 295 300 Ile Asp Lys Tyr Leu Lys Glu Ala Asp Pro Glu Ile Gln Glu Trp Phe 305 310 315 320 Lys Leu His Lys Glu Tyr Pro Phe Arg Val Tyr Cys Asp Gln Arg Gln 325 330 335 Leu Pro Phe Phe Gln Arg Phe Leu Glu Asp Trp Gln Ala Tyr Gln Ala 340 345 350 Asn Lys Asp Thr Tyr Pro Ala Gly Leu Leu Thr Leu Ser Ser Ala Thr 355 360 365 Leu Ala Trp Arg Glu Gly Glu Gly Lys Gly Glu Pro Trp Glu Ala Asn 370 375 380 His Leu Ala Leu Tyr Cys Ala Phe Asp Thr Arg Leu Met Ser Ala Glu 385 390 395 400 Gly Thr Leu Glu Ile Gln Gln Glu Lys Ser Thr Lys Ala Leu Lys Asn 405 410 415 Leu Thr His Asp Asn Pro Asp Pro Arg Asn Gln Ser Thr Leu Asn Arg 420 425 430 Leu Lys Asn Val Pro Asp Arg Pro Ser Arg Lys Pro Tyr Arg Gly Asn 435 440 445 Pro Glu Ile Leu Val Gly Leu Ser Ile Gly Leu Ala Asp Pro Val Thr 450 455 460 Ala Ala Val Val Asn Gly Arg Thr Gly Glu Val Leu Thr Tyr Arg Ser 465 470 475 480 Pro Arg Thr Leu Leu Ala Glu His Tyr His Leu Leu Asn Arg Tyr Arg 485 490 495 Gln Gln Gln Gln Gln Asn Ala Leu Gln Arg His Arg Asn Gln Lys Arg 500 505 510 Gly Val Thr Tyr Gln Pro Ser Glu Ser Glu Leu Gly Gln Tyr Val Asp 515 520 525 Arg Leu Leu Ala Asn Ser Ile Ile Gln Leu Ala Gln Thr His Gln Ala 530 535 540 Gly Ser Ile Val Ile Pro Ser Leu Thr His Val Arg Glu Leu Leu Ala 545 550 555 560 Ser Glu Ile Thr Ala Lys Ala Glu Arg Lys Ser Arg Ile Val Glu Val 565 570 575 Gln Asp Lys Tyr Ala Lys Glu Tyr Arg Ile Ala Ile His Arg Trp Ser 580 585 590 Tyr Asn Arg Leu Ile Asn Ala Val Cys Ser Lys Ala Gln Gln Phe Gly 595 600 605 Met Thr Val Glu Ser Gly Phe Gln Pro Leu Gln Gly Asn Pro Gln Glu 610 615 620 Gln Ala Lys Asp Ile Ala Ile Ala Ala Tyr Tyr Ala Arg Thr Ile Ala 625 630 635 640 Ile Lys <210> 62 <211> 828 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-15 effector <400> 62 Met Ser Phe Lys Thr Ile Arg Ser Leu Leu Cys Ala Thr Glu Glu Thr 1 5 10 15 Arg Glu Tyr Leu Trp His Leu Phe Leu Asn His Thr Leu Leu Ile Asn 20 25 30 Gln Leu Leu Glu Lys Leu Pro Gln Lys Thr Ala Phe Ala Lys Trp Arg 35 40 45 Lys Ser Gly Arg Ile Pro Arg Lys Ala Ile Val Ala Ala Cys Asn Thr 50 55 60 Ser Leu Gln Glu Asp Glu Ser Leu Glu Gly Leu Pro Ala Arg Phe Tyr 65 70 75 80 Thr Ser Ala Val Leu Ser Val Ser Tyr Thr Phe Ala Phe Ile Phe Ala 85 90 95 Ile Gln Asn Gly Leu Arg Ala Lys Val Glu Gly Lys Gln Arg Trp Leu 100 105 110 Asn Val Ala Glu Lys Asp Leu Glu Leu Ala Gln Thr Thr Ser Phe Ser 115 120 125 Pro Glu Ala Ile Arg Ala Val Ala Ala Gln Val Val Asp Gln Ala Glu 130 135 140 Ala Glu Arg Gln Arg Glu Phe Glu Ala Arg Glu Asn Arg Thr Gly Gln 145 150 155 160 Pro Leu Pro Leu Met Thr Val Leu Phe Lys Phe Trp Asn Lys Thr Lys 165 170 175 Lys Pro Leu Arg Arg Arg Ala Ile Ala His Leu Leu Arg Asn Asp Cys 180 185 190 Gln Val Asn Ser Glu Ala Glu Asp Pro Asp Lys Leu Thr Leu Arg Leu 195 200 205 Ser Lys Lys Arg Ile Gln Ile Glu Arg Leu Gln Lys Gln Leu Asp Ser 210 215 220 Gln Leu Pro Thr Gly Arg Asp Pro Leu Gly Asp Arg Ile Glu Lys Phe 225 230 235 240 Ile Glu Asp Ala Ile Ala Phe Ala Glu His Ser Thr Phe Val Pro Thr 245 250 255 Gln Phe Trp Leu Lys Trp His Arg Leu Leu Leu Asp Val Gln Ser Ser 260 265 270 Glu Pro Met Leu Asp Leu Trp Phe Phe Gly Trp Thr Tyr Tyr Arg Leu 275 280 285 Asn Ala Ile Ala Glu Phe Glu Ala Trp Glu Gln Ser Leu Ser Glu Arg 290 295 300 Thr Ala Asn Leu Ser Thr Gln Leu Lys Ser Leu Pro Tyr Pro Leu Leu 305 310 315 320 Phe Gly Ser Thr Asp Asp Leu Tyr Trp Ser Trp Glu Lys Gln Val Gln 325 330 335 Pro Lys Thr Pro Gln Pro Ala Pro Ala His Pro Gln Ala Ser Ala Asp 340 345 350 Pro Thr Ile Lys Arg Lys Pro Lys Arg Cys Arg Thr Arg Lys Arg Lys 355 360 365 Lys Lys Ser Thr Pro Arg Ile Cys Val Ser Phe Lys Ser Arg Gly Leu 370 375 380 Ser His Leu Cys Leu Arg Leu Tyr Cys Asp Arg Arg Gln Leu Pro Val 385 390 395 400 Phe Arg Gln Leu Val Glu Glu Ser Glu Ala Asn Lys Ala Arg Lys Lys 405 410 415 Pro Asp Arg Phe Ser Leu Ala Leu Ser Pro Leu Arg Ser Ala Gly Leu 420 425 430 Met Trp Val Glu Asp Pro Gln Gln Leu His Lys Lys Lys His Trp Lys 435 440 445 Leu Lys Asn Leu Trp Leu Lys Trp Phe Cys Glu Met Ser Ser Gln Ala 450 455 460 Phe Pro Asp Glu Ile Arg Glu Gln Trp Phe Gln Ser Leu Val Tyr Leu 465 470 475 480 Cys Leu Ser Leu Pro Trp Gln Thr Ala Ala Ile Asp Pro Arg Leu Leu 485 490 495 Thr Ala Glu Gly Thr Glu Val Val Arg Gln Glu Lys Ile Thr Leu Met 500 505 510 Gly Lys Phe Leu Glu Gly Ser Lys Lys Ala Asp Glu Lys Gln Ala Ile 515 520 525 Glu Glu Leu Ser Lys Lys Lys Gln Ala Lys Leu Leu Thr Ala Glu Lys 530 535 540 Asn Arg Cys Lys Val Thr Lys Lys Asn Gln Thr Thr Leu Thr Leu Leu 545 550 555 560 Gln Ser Asn Ser Pro Leu Pro Arg Pro Ser Arg Val Ala Tyr Gln Gly 565 570 575 Asn Pro Asp Ile Ala Val Lys Val Ala Phe Ser Arg Glu His Ile Ala 580 585 590 Gly Val Ala Val Ser Asp Gly Cys Gln Pro Val Leu Asp Tyr His Asp 595 600 605 Ile Lys Ser Leu Leu Val Asp Pro Arg Val Asp Leu Leu Glu Glu Arg 610 615 620 Ser His Lys Leu Arg Asn Gln Pro Glu Arg Leu Trp Lys Ala Thr Leu 625 630 635 640 Ala Thr Gln Lys Ser Lys Pro Ser Lys Ser Lys Tyr Pro Arg Ser Lys 645 650 655 Pro Lys Ile Ser Thr Arg Gln Leu Gln Leu Gln Pro Tyr Arg Leu Leu 660 665 670 Lys Arg Trp Arg Arg Leu Lys Arg Glu Asn Gly Ala Lys Arg Gln Leu 675 680 685 Glu Gln Arg His Gly Leu Tyr Arg Pro Ser Gln Ala Glu Ser Asn Leu 690 695 700 Ala Gln Tyr Ile Asn His Leu Leu Ala Arg Asn Ile Val Asp Leu Cys 705 710 715 720 Gln Arg Trp Ser Ala Gly Ser Ile Ile Leu Pro Lys Phe Gly Asp Leu 725 730 735 Arg Glu Ser Ile Glu Ser Glu Ile Gln Ala Lys Ala Lys Arg Lys Tyr 740 745 750 Pro Asp Asp Asn Val Glu Arg Gln Lys Gln Tyr Ala Lys Glu Phe Arg 755 760 765 Met Glu Phe His Arg Trp Asn Tyr Gln His Leu Thr Gln Cys Ile Arg 770 775 780 Ser Arg Ala Ala Thr Val Gly Val Lys Cys Val Ala Gly Gln Gln Pro 785 790 795 800 Arg Leu Gly Thr Leu Arg Glu Lys Ala Thr Leu Ala Val Ser Ala Glu 805 810 815 Gln Arg Val Val Thr Ala Ile Pro Pro Lys Pro Lys 820 825 <210> 63 <211> 601 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-16 effector <400> 63 Met Thr Lys Leu Thr Ile His Cys Arg Leu Val Ala Glu Glu Glu Thr 1 5 10 15 Arg Arg Gln Val Trp Glu Met Met Ala Gly Arg Tyr Ala Pro Leu Ile 20 25 30 Ala Thr Thr Leu Glu Gln Val Ser Gln His Lys Asp Phe Pro Gln Trp 35 40 45 Val Ala Thr Gly Glu Leu Pro Thr Gln Val Val Lys Asn Leu Val Asn 50 55 60 Gln Ala Gln Ser Gly Leu Pro Ala Arg Trp Cys Ala Ser Ala Gln Arg 65 70 75 80 Gln Val Gln Glu Thr Tyr Lys Ala Trp Leu Thr Lys Arg Arg Lys Leu 85 90 95 Gln Gln Lys Leu Gln Gly Gln Gln Thr Trp Leu Ser Val Leu Arg Pro 100 105 110 Asp Ala Glu Leu Ala Lys Asn Ala Gly Leu Ser Leu Glu Glu Met Lys 115 120 125 Ile Arg Ala Gln Ala Leu Leu His Arg Glu Ile Asn Asn Trp Phe Gln 130 135 140 Val Tyr Gln Gln Cys Gln Asp Val Val Glu Arg Ser Ile Phe Ala Tyr 145 150 155 160 Leu Leu Lys His Arg Leu Thr Val Pro Ala Glu Pro Glu Asn Thr Asp 165 170 175 Lys Leu Arg Gln Lys Arg Arg Gln Val Glu Ile Lys Ile Glu Arg Leu 180 185 190 Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln Gly Arg Asp Leu Thr Gly 195 200 205 Ser Arg Tyr Ala Thr Ala Leu Asn Asp Gly Glu Gln Cys Asp Trp Glu 210 215 220 Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala Glu Ile Leu Ser Arg Pro 225 230 235 240 Asp Ser Leu Pro Pro Pro Val Glu Tyr Ala Thr Asn Thr Asp Met Thr 245 250 255 Trp His Lys Asp Glu Gln Gly Arg Leu Ala Val Thr Phe Asn Gly Leu 260 265 270 Gly Lys Leu Lys Phe Lys Ile Ala Cys Asp Gln Arg Gln Leu His Trp 275 280 285 Phe Gln Arg Phe Tyr Gln Asp Gln Glu Gln Phe Lys Ala Gln Lys Gly 290 295 300 Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg Ser Ala Glu Leu Leu Trp 305 310 315 320 Lys Pro Gly Asn Arg Ser Gly Asp Pro Trp Gln Ala Asn Phe Leu Tyr 325 330 335 Leu His Cys Thr Val Asp Ser Arg Leu Trp Thr Gln Glu Gly Thr Ala 340 345 350 Met Val Gln Gln Glu Lys Ala Lys Lys Ser Gln Ala Ile Val Lys Lys 355 360 365 Leu Ser Glu Arg Ser Asp Leu Thr Ala Gln Gln Lys Asp Cys Leu Gln 370 375 380 Arg His Gln Ser Thr Leu Ala Arg Leu His Met Gly Tyr Asp Arg Pro 385 390 395 400 Gln Arg Arg Met Tyr Gln Gly Lys Ser His Leu Val Val Gly Ile Ser 405 410 415 Leu Asp Met Glu Asn Leu Val Thr Val Ala Leu Val Asp Val Val Lys 420 425 430 Gln Lys Val Ile Thr Gly Cys Thr Met Lys Ser Leu Leu Gly Gln Asp 435 440 445 Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu Lys Arg Gln Asn Ser His 450 455 460 Leu Arg Lys Val Ala Gln Glu Arg Gly Ser Lys Ile Val Asn Tyr Glu 465 470 475 480 Ala Asn Leu Ala Ile His Val Glu Arg Leu Leu Val Lys Ala Ile Ile 485 490 495 His Phe Ala Gln Gln His Leu Ala Gly Ser Leu Cys Val Pro Thr Leu 500 505 510 Lys Asp Ile Arg Glu Thr Ile Gln Ala His Leu Gln Cys Arg Ala Glu 515 520 525 Glu Arg Phe Pro Asp Ser Lys Glu Leu Gln Arg Arg Tyr Ala Lys Glu 530 535 540 Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr Asn Arg Leu Leu Lys Leu 545 550 555 560 Leu Asn Gln Gln Ala Lys Phe Ala Gly Leu Val Val Glu Gln Gly Val 565 570 575 Gln Ser Ala Gly Glu Thr Ala Leu Glu Arg Ala Leu Gly Val Ala Leu 580 585 590 Ser Ala Tyr Tyr Gln Arg Ser Ala Ala 595 600 <210> 64 <211> 605 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-17 effector <400> 64 Met Thr Lys Leu Thr Ile Gln Cys Arg Leu Val Ala Glu Glu Glu Thr 1 5 10 15 Arg Arg Gln Val Trp Glu Met Met Ala Gly Arg Tyr Ala Pro Leu Ile 20 25 30 Ala Thr Thr Leu Glu Gln Val Ser Arg His Lys Asp Phe Pro Gln Trp 35 40 45 Val Ser Ala Gly Glu Ile Pro Ala Gln Val Val Lys Ser Leu Leu His 50 55 60 Ser Ala Lys Thr Ser Tyr Gly Gly Leu Pro Ala Arg Trp Tyr Ala Ser 65 70 75 80 Ala Gln Arg Gln Val Gln Glu Ile Tyr Lys Gly Trp Leu Lys Arg Arg 85 90 95 Arg Gln Leu Gln His Lys Leu Gln Gly Gln Gln Thr Trp Leu Ser Val 100 105 110 Leu Gln Pro Asp Ala Glu Leu Ala Gln Ser Ala Gly Leu Ser Leu Pro 115 120 125 Glu Leu Gln Gln Arg Ala Gln Ala Leu Leu Ala Gly Asp Thr Val Thr 130 135 140 Asn Trp Tyr His Ala Tyr Gln Gln Cys Gln Asp Ala Val Glu Arg Ser 145 150 155 160 Ile Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val Pro Thr Glu Pro 165 170 175 Glu Asp Thr Asp Lys Leu Lys Arg Lys Arg Arg Arg Val Glu Ile Arg 180 185 190 Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln Gly Arg 195 200 205 Asp Leu Thr Gly Ile Arg Tyr Ala Thr Ala Leu His Glu Gly Glu Gln 210 215 220 Cys Tyr Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala Glu Ile 225 230 235 240 Leu Ser Cys Pro Asp Ser Val Pro Pro Pro Val Glu Tyr Ala Thr Asn 245 250 255 Thr Asp Met Thr Trp His Lys Asp Glu Gln Ser Arg Leu Trp Val Thr 260 265 270 Phe Asn Gly Leu Gly Lys His Lys Phe Lys Ile Ala Cys Asp Gln Arg 275 280 285 Gln Leu His Trp Phe Glu Arg Phe Tyr Lys Asp Gln Glu Leu Phe Lys 290 295 300 Ala Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg Ser Cys 305 310 315 320 Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Glu Leu Trp Gln Val 325 330 335 Asn Cys Leu Tyr Leu His Cys Thr Val Asp Pro Arg Leu Trp Thr Gln 340 345 350 Glu Gly Thr Ala Ile Val Gln Gln Glu Lys Ala Gln Lys Ser Gln Ala 355 360 365 Ile Val Lys Glu Leu Ser Glu Arg Ser Asp Leu Thr Pro Gly Gln Glu 370 375 380 Asp Tyr Leu Arg Arg His Gln Ser Thr Leu Ala Arg Leu His Thr Gly 385 390 395 400 Tyr Ser Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys Ser His Leu Ser 405 410 415 Val Gly Ile Ser Leu Asp Met Asp Asn Leu Val Thr Val Ala Leu Val 420 425 430 Asp Val Val Glu Gln Arg Ile Ile Thr Gly Thr Thr Met Lys Asn Leu 435 440 445 Leu Gly Ser Gly Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu Lys Arg 450 455 460 Arg Asn Ala His Leu Arg Lys Val Ala Gln Gln Arg Gly Ser Lys Ile 465 470 475 480 Val Asn His Glu Ala Asn Leu Ala Thr His Ile Glu Arg Leu Leu Ala 485 490 495 Lys Ala Ile Ile Asn Phe Ala Gln Gln His Leu Ala Gly Ser Leu Cys 500 505 510 Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln Ala His Ile Gln 515 520 525 Ser Arg Ala Glu Glu Arg His Pro Asn Ser Lys Glu Leu Gln Arg Arg 530 535 540 Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr Asn Arg 545 550 555 560 Leu Leu Glu Leu Ile Ser Gln Gln Ala Ile Val Ala Gly Leu Leu Val 565 570 575 Glu Gln Gly Leu Gln Gly Ser Gly Gly Thr Ala Ile Lys Arg Ala Leu 580 585 590 Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala Ala 595 600 605 <210> 65 <211> 613 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-18 effector <400> 65 Met Ser Ile Lys Thr Ile Arg Cys Arg Leu Val Ala Ser Glu Ser Thr 1 5 10 15 Arg Lys Ala Leu Trp Glu Leu Met Ala Gly Lys Asn Thr Pro Leu Met 20 25 30 Asn His Val Leu Ala Leu Val Ser Ser Asp Thr Asn Phe Asp Ser Trp 35 40 45 Arg Gln Lys Gly Glu Ile Pro Ala Ser Ile Ile Lys Asn Tyr Ile Asn 50 55 60 Thr Leu Lys His Glu Pro Gln Phe Ala Gly Gln Pro Trp Trp Cys Tyr 65 70 75 80 Ala Ser Ser Glu Lys Gln Ala Thr Arg Ile Phe Asp Asn Trp Leu Ala 85 90 95 Thr Gln Lys Gln Leu Gln Ser Lys Leu Asn Gly Lys Glu Gln Trp Leu 100 105 110 Ser Val Leu Gln Pro Asp Ser Glu Leu Ala Ser Gln Ala Ser Cys Thr 115 120 125 Leu Ala Ala Leu Arg Arg Leu Ala Ser Gln Ile Asn Lys Gln Gly Leu 130 135 140 Thr Phe Asn Gln Leu Phe Asn Leu Tyr Thr Thr Val Gln Val Leu Lys 145 150 155 160 Gln Arg Ala Ala Ile Ala Tyr Leu Leu Lys Arg Gln Gly Lys Leu Glu 165 170 175 Pro Asn Glu Glu Asp Pro Glu Gln Ile Ala Arg Lys Arg Arg Lys Thr 180 185 190 Glu Ile Ser Ile Gln Arg Leu Lys Lys Gln Ile Gln Ala Arg Val Pro 195 200 205 Lys Gly Arg Asp Leu Thr Gly Ser Glu Tyr Thr Ala Ala Leu Asp Glu 210 215 220 Cys Ile Gln Thr Ala Ile Thr Thr Asp Glu Glu Tyr Glu Ala Trp Gln 225 230 235 240 Gly Lys Leu Thr Ala Lys Thr Val Ser Val Pro Phe Pro Leu Ile Cys 245 250 255 Glu Ser Ser Glu Val Leu Lys Trp Ser Gln Thr Ser Ser Gly Arg Ile 260 265 270 Val Val Lys Phe Ser Gly Leu His Gly Leu Ser Phe Asp Ile Tyr Cys 275 280 285 Asp Lys Thr His Leu Arg Trp Phe Ser Arg Phe Leu Ala Asp Gln Glu 290 295 300 Val Lys Lys Ala Ser Gly Gly Lys His Ser Ala Ala Leu Phe Thr Leu 305 310 315 320 Arg Ser Ala Thr Leu Leu Trp Arg Pro Asn Lys His Pro Ser Lys Gly 325 330 335 Asp Pro Trp Ser Thr Asn Tyr Leu Glu Leu His Cys Thr Val Asp Thr 340 345 350 Arg Leu Trp Thr Ala Glu Gly Thr Glu Gln Val Arg Arg Glu Lys Ser 355 360 365 Thr Glu Val Glu Lys Ile Leu Thr Glu Ile Gly Ser Lys Asp Ser Leu 370 375 380 Ser Asn Asn Gln Leu Val Tyr Ile Lys Arg Lys Gln Ala Thr Leu Thr 385 390 395 400 Arg Leu Gln Gly Asn Phe Asp Arg Pro His Gln Ser Pro Tyr Cys Gly 405 410 415 Asp Pro Asp Ile Ser Val Gly Ile Ser Met Gly Leu Asp Lys Pro Val 420 425 430 Thr Leu Ala Ile Val Asn Leu Lys Thr Gly Gln Val Ser Ala Tyr Arg 435 440 445 Thr Thr Arg Gln Leu Leu Gly Ser Asn Tyr Cys Leu Leu Gly Arg Arg 450 455 460 Arg Lys Glu Gln Glu Arg Ala Ser His Arg Ala His Ile Asn Arg Ala 465 470 475 480 Arg His Arg Ser Asp Tyr His Thr Tyr Lys Glu Ser Gln Val Gly Thr 485 490 495 Gln Ile Asp His Leu Leu Ala Cys Ser Ile Ile Glu Val Ala Met Gln 500 505 510 Tyr Lys Ala Ser Ser Ile Val Leu Pro Asp Leu Glu Tyr Ile Arg Glu 515 520 525 Val Val Glu Ala Glu Ile Lys Glu Arg Ala Glu Arg Arg Ile Pro Asp 530 535 540 Tyr Ser Glu Gly Gln Lys Arg Tyr Ala Lys Glu Tyr Arg Lys Lys Val 545 550 555 560 His Ser Trp Ser Tyr Arg Arg Leu His Asn Phe Ile Lys Asn Lys Cys 565 570 575 Glu Ala Val Gly Ile Ala Ile Glu Val Gln Arg Gln Glu Thr Ile Gly 580 585 590 Thr Pro Gln Gln Lys Ala Arg Lys Leu Val Glu Lys Ala Tyr Ala Asn 595 600 605 Arg Cys Phe Val Ala 610 <210> 66 <211> 543 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-19 effector <400> 66 Lys Asn Leu Val Asn Gln Ala Gln Ser Gly Leu Pro Ala Arg Trp Cys 1 5 10 15 Ala Ser Ala Gln Arg Gln Val Gln Glu Thr Tyr Lys Ala Trp Leu Thr 20 25 30 Lys Arg Arg Lys Leu Gln Gln Lys Leu Gln Ala Gln Gln Thr Trp Leu 35 40 45 Ser Val Leu Arg Pro Asp Ala Glu Leu Ala Gln Glu Ala Gly Leu Ser 50 55 60 Leu Pro Glu Leu Gln Gln Arg Ala Gln Ala Leu Leu Ala Gly Asp Thr 65 70 75 80 Ile Thr Asn Trp Tyr Gln Ala Tyr Gln Glu Cys Gln Asp Val Val Gln 85 90 95 Arg Ser Val Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val Pro Asn 100 105 110 Glu Pro Glu Asp Thr Asp Lys Leu Lys Arg Lys Arg Arg Gln Val Glu 115 120 125 Ile Lys Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln 130 135 140 Gly Arg Asp Leu Thr Gly Ser Arg Tyr Ala Thr Ala Leu Asn Asp Gly 145 150 155 160 Glu Gln Cys Asp Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala 165 170 175 Glu Ile Leu Ser Arg Pro Asp Ser Leu Pro Pro Pro Val Glu Tyr Ala 180 185 190 Thr Asn Thr Asp Met Thr Trp His Lys Asp Glu Gln Gly Arg Leu Ala 195 200 205 Val Thr Phe Asn Gly Leu Gly Lys Leu Lys Phe Lys Ile Ala Cys Asp 210 215 220 Gln Arg Gln Leu His Trp Phe Gln Arg Phe Tyr Gln Asp Gln Glu Gln 225 230 235 240 Phe Lys Ser Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg 245 250 255 Ser Ala Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Asp Pro Trp 260 265 270 Gln Ala Asn Phe Leu Tyr Leu His Cys Thr Val Asp Ser Arg Leu Trp 275 280 285 Thr Gln Glu Gly Thr Ala Met Val Gln Gln Glu Lys Ala Lys Lys Ser 290 295 300 Gln Ala Ile Val Lys Lys Leu Ser Glu Arg Ser Asp Leu Thr Ala Gln 305 310 315 320 Gln Lys Asp Cys Leu Gln Arg His Gln Ser Thr Leu Ala Arg Leu His 325 330 335 Met Gly Tyr Asp Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys Ser His 340 345 350 Leu Val Val Gly Ile Ser Leu Asp Met Glu Asn Leu Val Thr Val Ala 355 360 365 Leu Val Asp Val Val Lys Gln Lys Val Ile Thr Gly Cys Thr Met Lys 370 375 380 Ser Leu Leu Gly Gln Asp Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu 385 390 395 400 Lys Arg Gln Asn Ser His Leu Arg Lys Val Ala Gln Glu Arg Gly Ser 405 410 415 Lys Ile Val Asn Tyr Glu Ala Asn Leu Ala Ile His Val Glu Arg Leu 420 425 430 Leu Val Lys Ala Ile Ile His Phe Ala Gln Gln His Leu Ala Gly Ser 435 440 445 Leu Cys Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln Ala His 450 455 460 Leu Gln Cys Arg Ala Glu Glu Arg Phe Pro Asp Ser Lys Glu Leu Gln 465 470 475 480 Arg Arg Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr 485 490 495 Asn Arg Leu Leu Lys Leu Leu Asn Gln Gln Ala Lys Phe Ala Gly Leu 500 505 510 Val Val Glu Gln Gly Val Gln Ser Ala Gly Glu Thr Ala Leu Glu Arg 515 520 525 Ala Leu Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala Ala 530 535 540 <210> 67 <211> 605 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-20 effector <400> 67 Met Ser Lys Leu Thr Ile Gln Cys Arg Leu Val Ala Cys Glu Asp Thr 1 5 10 15 Arg Arg Gln Val Trp Glu Met Met Ala Gly Arg Tyr Ala Pro Leu Ile 20 25 30 Ala Thr Thr Leu Glu Gln Val Ser Gln His Lys Asp Phe Pro Gln Trp 35 40 45 Val Ser Ala Gly Glu Ile Pro Ala Gln Val Val Lys Ser Leu Leu His 50 55 60 Ser Ala Lys Thr Ser Tyr Gly Gly Leu Pro Ala Arg Trp Tyr Ala Ser 65 70 75 80 Ala Gln Arg Gln Val Gln Glu Ile Tyr Lys Gly Trp Leu Lys Arg Arg 85 90 95 Arg Gln Leu Gln His Lys Leu Gln Gly Gln Gln Thr Trp Leu Ser Val 100 105 110 Leu Gln Pro Asp Ala Glu Leu Ala Gln Ser Ala Gly Leu Ser Leu Pro 115 120 125 Glu Leu Gln Gln Arg Ala Gln Ala Leu Leu Ala Gly Asp Thr Val Thr 130 135 140 Asn Trp Tyr His Ala Tyr Gln Gln Cys Gln Asp Ala Val Glu Arg Ser 145 150 155 160 Ile Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val Pro Thr Glu Pro 165 170 175 Glu Asp Thr Asp Lys Leu Lys Arg Lys Arg Arg Arg Val Glu Ile Arg 180 185 190 Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln Gly Arg 195 200 205 Asp Leu Thr Gly Ile Arg Tyr Ala Thr Ala Leu His Glu Gly Glu Gln 210 215 220 Cys Tyr Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala Glu Ile 225 230 235 240 Leu Ser Cys Pro Asp Ser Val Pro Pro Pro Val Glu Tyr Ala Thr Asn 245 250 255 Thr Asp Met Thr Trp His Lys Asp Glu Gln Ser Arg Leu Trp Val Thr 260 265 270 Phe Asn Gly Leu Gly Lys His Lys Phe Lys Ile Ala Cys Asp Gln Arg 275 280 285 Gln Leu His Trp Phe Glu Arg Phe Tyr Lys Asp Gln Glu Leu Phe Lys 290 295 300 Ala Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg Ser Gly 305 310 315 320 Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Glu Leu Trp Gln Val 325 330 335 Asn Cys Leu Tyr Leu His Cys Thr Val Asp Pro Arg Leu Trp Thr Gln 340 345 350 Glu Gly Thr Ala Ile Val Gln Gln Glu Lys Ala Gln Lys Ser Gln Ala 355 360 365 Ile Val Lys Glu Leu Ser Glu Arg Ser Asp Leu Thr Pro Gly Gln Glu 370 375 380 Asp Tyr Leu Arg Arg His Gln Ser Thr Leu Ala Arg Leu His Thr Gly 385 390 395 400 Tyr Ser Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys Ser His Leu Ser 405 410 415 Val Gly Ile Ser Leu Asp Met Asp Asn Leu Val Thr Val Ala Leu Val 420 425 430 Asp Val Val Glu Gln Arg Ile Ile Thr Gly Thr Thr Met Lys Asn Leu 435 440 445 Leu Gly Ser Gly Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu Lys Arg 450 455 460 Arg Asn Ala His Leu Arg Lys Val Ala Gln Gln Arg Gly Ser Lys Ile 465 470 475 480 Val Asn His Glu Ala Asn Leu Ala Thr His Ile Glu Arg Leu Leu Ala 485 490 495 Lys Ala Ile Ile Asn Phe Ala Gln Gln His Leu Ala Gly Ser Leu Cys 500 505 510 Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln Ala His Ile Gln 515 520 525 Ser Arg Ala Glu Glu Arg His Pro Asn Ser Lys Glu Leu Gln Arg Arg 530 535 540 Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr Asn Arg 545 550 555 560 Leu Leu Glu Leu Ile Ser Gln Gln Ala Ile Val Ala Gly Leu Leu Val 565 570 575 Glu Gln Gly Leu Gln Gly Ser Gly Gly Thr Ala Ile Lys Arg Ala Leu 580 585 590 Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala Ala 595 600 605 <210> 68 <211> 638 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-21 effector <400> 68 Met Gly Gln Ile Thr Ile Gln Ser Arg Leu Val Ala Ser Glu Ala Thr 1 5 10 15 Arg Gln His Leu Trp Met Leu Met Ala Asp Arg Asn Thr Pro Leu Ile 20 25 30 Asn Gln Leu Leu Glu Gln Ile Asn Gln His Pro Asp Phe Leu Thr Trp 35 40 45 Arg Gln Lys Gly Lys Ile Pro Val Gly Thr Val Lys Gln Leu Cys Gln 50 55 60 Pro Leu Arg Ser Asp Pro Arg Phe Ser Gly Gln Pro Gly Arg Phe Tyr 65 70 75 80 Thr Ser Ala Ile Ala Leu Val Asp Tyr Ile Tyr Lys Ser Trp Leu Thr 85 90 95 Leu Gln Gln Arg Leu Gln His Lys Leu Asn Gly Gln Gln Arg Trp Leu 100 105 110 Glu Met Leu Lys Ser Asp Glu Glu Leu Ala Glu Ile Ser Gly Cys Ser 115 120 125 Leu Asp Thr Leu Arg Gln Arg Ala Ala Asn Leu Leu Gln Ala Asp Asn 130 135 140 Pro Ile His Pro Glu Pro Ser Thr Leu Pro Lys Ser Gly Lys Arg Arg 145 150 155 160 Lys Pro Lys Gln Thr Glu Thr Ser Ala Leu Ser Pro Asn Ile Ser Gln 165 170 175 Ala Leu Phe Phe Ala Tyr Arg Glu Thr Glu Asp Val Lys Ile Arg Ala 180 185 190 Ala Ile Ala Tyr Leu Leu Lys Asn Gly Cys Thr Leu Pro Glu Lys Pro 195 200 205 Glu Asp Pro Gln Lys Phe Ala Lys Arg Arg Arg Lys Val Glu Ile Gln 210 215 220 Ile Gln Arg Leu Thr Glu Gln Leu Glu Gly Arg Val Pro Lys Gly Arg 225 230 235 240 Asp Leu Thr Asn Thr Gln Trp Leu Ala Ala Leu Glu Thr Ala Thr Thr 245 250 255 Thr Ala Pro Gln Ser Glu Ala Glu Ala Lys Ser Trp Gln Asp Ser Leu 260 265 270 Leu Arg Glu Ser Ser Asn Leu Pro Phe Pro Val Ala Tyr Glu Thr Asn 275 280 285 Thr Asp Leu Thr Trp Phe Arg Asn Gln Gln Gly Arg Leu Cys Val Arg 290 295 300 Phe Asn Gly Leu Gly Asp His Ile Phe Gln Ile Tyr Cys Asp Arg Arg 305 310 315 320 Gln Leu His Trp Phe Glu Arg Phe Leu Asp Asp Gln Gln Val Gln Lys 325 330 335 Asp Ser Lys Asp Gln His Ser Ser Ala Leu Phe Thr Leu Arg Ser Val 340 345 350 Arg Ile Ser Trp Gln Glu Gly Lys Gly Lys Gly Thr Pro Trp Gln Ile 355 360 365 His Arg Leu Ala Leu Gln Cys Ser Leu Asp Thr Arg Leu Trp Thr Gln 370 375 380 Glu Gly Thr Glu Gln Val Arg Asn Glu Lys Ala Ala Asp Ile Ala Lys 385 390 395 400 Ile Leu Thr Lys Met Glu Asp Lys Gly Asn Leu Asn Asp Lys Gln Glu 405 410 415 Ala Phe Ile Lys Arg Lys Gln Ser Thr Leu Asp Arg Ile Asn His Thr 420 425 430 Phe Pro Arg Pro Ser Lys Pro Leu Tyr Gln Gly Gln Ser Gln Ile Ile 435 440 445 Val Gly Val Ser Ile Gly Leu Glu Lys Leu Ala Thr Ala Ala Val Val 450 455 460 Asp Ala Ser Thr Gly Lys Ile Leu Thr Tyr Arg Ser Ile Arg Gln Leu 465 470 475 480 Leu Gly Asn Asn Tyr Arg Leu Leu Asn Arg Gln Arg Gln Gln Gln His 485 490 495 His Asn Thr His Gln Arg Gln Ile Ala Gln Arg Gln Gly Lys Arg Gly 500 505 510 Leu Leu Ser Glu Ser Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu Ala 515 520 525 Asp Ala Ile Val Asp Leu Ala Lys Thr Tyr Tyr Ala Gly Ser Ile Val 530 535 540 Val Pro Lys Leu Gly Asp Val Arg Glu Arg Val Gln Ser Glu Ile Gln 545 550 555 560 Ala Arg Ala Glu Gln Val Cys Pro Asp Leu Leu Ser Gly Gln Gln Asn 565 570 575 Tyr Ala Lys Gln His Arg Ser Ala Ile His Arg Trp Ser Tyr Gly Arg 580 585 590 Leu Ile Asp Gln Ile Gln Ser Asn Ala Lys Arg Thr Gly Ile Val Val 595 600 605 Glu Asp Ala Gln Gln Pro Ile Gln Gly Thr Pro Gln Glu Ile Ala Arg 610 615 620 Ala Leu Ala Ile Thr Ala Tyr Gln Asp Arg Leu Lys Met Ile 625 630 635 <210> 69 <211> 502 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-22 effector <400> 69 Ala Asn Leu Leu Gln Ala Asp Asn Pro Ile His Pro Glu Pro Ser Thr 1 5 10 15 Leu Pro Lys Ser Ser Lys Arg Arg Lys Pro Lys Gln Thr Glu Thr Ser 20 25 30 Val Leu Ser Pro Asn Ile Ser Gln Ser Leu Phe Val Ala Tyr Arg Glu 35 40 45 Thr Glu Asp Val Lys Thr Arg Ala Ala Ile Ala Tyr Leu Leu Lys Asn 50 55 60 Gly Cys Thr Leu Pro Glu Lys Pro Glu Asp Pro Gln Lys Phe Ala Lys 65 70 75 80 Arg Arg Arg Lys Val Glu Ile Gln Ile Gln Arg Leu Thr Glu Gln Leu 85 90 95 Glu Gly Arg Val Pro Lys Gly Arg Asp Leu Thr Asn Thr Gln Trp Leu 100 105 110 Ala Ala Leu Glu Thr Ala Thr Thr Thr Ala Pro Gln Ser Glu Ala Glu 115 120 125 Ala Lys Ser Trp Gln Asp Ser Leu Leu Arg Glu Ser Ser Asn Leu Pro 130 135 140 Phe Pro Val Ala Tyr Glu Thr Asn Thr Asp Leu Thr Trp Phe Arg Asn 145 150 155 160 Gln Gln Gly Arg Leu Cys Val Arg Phe Asn Gly Leu Gly Asp His Ile 165 170 175 Phe Gln Ile Tyr Cys Asp Arg Arg Gln Leu His Trp Phe Glu Arg Phe 180 185 190 Leu Asp Asp Gln Gln Val Gln Lys Asp Ser Lys Asp Gln His Ser Ser 195 200 205 Ala Leu Phe Thr Leu Arg Ser Val Arg Ile Ser Trp Gln Glu Gly Lys 210 215 220 Gly Lys Gly Thr Pro Trp Gln Ile His Arg Leu Ala Leu Gln Cys Ser 225 230 235 240 Leu Asp Thr Arg Leu Trp Thr Gln Glu Gly Thr Glu Gln Val Arg Asn 245 250 255 Glu Lys Ala Ala Asp Ile Ala Lys Ile Leu Thr Lys Met Glu Asp Lys 260 265 270 Gly Asn Leu Asn Asp Lys Gln Glu Ala Phe Ile Lys Arg Lys Gln Ser 275 280 285 Thr Leu Asp Arg Ile Asn His Thr Phe Pro Arg Pro Ser Lys Pro Leu 290 295 300 Tyr Gln Gly Gln Ser Gln Ile Ile Val Gly Val Ser Ile Gly Leu Glu 305 310 315 320 Lys Leu Ala Thr Ala Ala Val Val Asp Ala Ser Thr Gly Lys Ile Leu 325 330 335 Thr Tyr Arg Ser Ile Arg Gln Leu Leu Gly Asn Asn Tyr Arg Leu Leu 340 345 350 Asn Arg Gln Arg Gln Gln Gln His His Asn Thr His Gln Arg Gln Ile 355 360 365 Ala Gln Arg Gln Gly Lys Arg Gly Leu Leu Ser Glu Ser Glu Leu Gly 370 375 380 Gln Tyr Val Asp Arg Leu Leu Ala Asp Ala Ile Val Asp Leu Ala Lys 385 390 395 400 Thr Tyr Tyr Ala Gly Ser Ile Val Val Pro Lys Leu Gly Asp Val Arg 405 410 415 Glu Arg Val Gln Ser Glu Ile Gln Ala Arg Ala Glu Gln Val Cys Pro 420 425 430 Asp Leu Leu Ser Gly Gln Gln Asn Tyr Ala Lys Gln His Arg Ser Ala 435 440 445 Ile His Arg Trp Ser Tyr Gly Arg Leu Ile Asp Gln Thr Gln Ser Asn 450 455 460 Ala Lys Arg Thr Gly Ile Val Val Glu Asp Ala Gln Gln Pro Ile Gln 465 470 475 480 Gly Thr Pro Gln Glu Ile Ala Arg Ala Leu Ala Ile Thr Ala Tyr Gln 485 490 495 Asp Arg Leu Lys Met Ile 500 <210> 70 <211> 541 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-23 effector <400> 70 Ala Asp Ser Leu Arg Ser Asp Pro Arg Phe Lys Ser His Pro Gln Arg 1 5 10 15 Leu Val Ala Ser Ala Gly Arg Val Val Asn Ser Met Phe Glu Ser Trp 20 25 30 Leu Ala Ile Gln Lys Gly Asn Phe Ala Arg Leu Lys Gly Lys Gln Arg 35 40 45 Trp Leu Ala Met Leu Lys Ser Asp Glu Glu Leu Val Glu Tyr Ser Asp 50 55 60 Cys Asp Leu Tyr Gln Ile Arg Asn His Ala Ala Gln Ile Leu Glu Ser 65 70 75 80 Val Ala Ala Ser Val Pro Ser Gln Thr Ser Asn Pro Ala Asn Lys Lys 85 90 95 Ser Lys Gln Gln Lys Ser Asp Arg Lys Lys Ser Lys Gln Lys Asp Asn 100 105 110 Asn Ile Pro Lys Ala Leu His Gly Leu Tyr Asp Ser Thr Asp Asn Val 115 120 125 Leu Thr Gln Ala Ala Ile Ile Tyr Leu Leu Lys Asn Gly Ser Lys Val 130 135 140 Ser Asp Cys Glu Glu Asp Pro Glu Lys Phe Thr Gln Lys Tyr Arg Lys 145 150 155 160 Thr Glu Leu Gln Val Glu Arg Leu Gln Lys Gln Ile Asp Ala Asn Met 165 170 175 Pro Lys Gly Arg Asp Leu Thr Gly Gln Val Trp Glu Glu Thr Leu Glu 180 185 190 Ile Ala Thr Leu Thr Ala Pro Arg Asn Gly Asp Glu Ala Lys Glu Trp 195 200 205 Gln Asn Thr Leu Leu Arg Lys Pro Lys Asn Thr Pro Tyr Pro Ile Phe 210 215 220 Tyr Arg Asn Lys Glu Asp Leu Arg Trp Tyr Glu Ile Glu Ile Asn Gly 225 230 235 240 Lys Ala Arg Arg Arg Gly Lys Asn His Asn Ser Pro Lys Lys Gln Leu 245 250 255 Cys Val Thr Leu Ser Gly Phe Gly Gly His Ala Leu Lys Val Ser Cys 260 265 270 Asp Arg Arg Gln Leu His Trp Phe Lys Arg Phe Leu Glu Asp Gln Gln 275 280 285 Thr Lys Lys Asn Ser Asp Gly Gln Cys Ser Ser Ser Leu Phe Thr Leu 290 295 300 Arg Ser Ala Gln Leu Leu Trp His Glu Gln Lys Gly Asn Gly Asn Ser 305 310 315 320 Trp Asp Val His His Leu His Leu His Cys Thr Val Glu Thr Pro Arg 325 330 335 Trp Thr Ala Glu Gly Thr Glu Lys Ile Arg Gln Ala Glu Arg Gln Glu 340 345 350 Val Ala Lys Arg Ile Glu Ser Leu Asn Gln Lys Glu Ala Leu Ser Pro 355 360 365 Ser Gln Gln Lys Tyr Leu Gln Arg Leu Asp Ser Gln Leu Lys Gly Leu 370 375 380 Asp Tyr Pro Phe Asp Arg Pro Ser Arg Pro Leu Tyr Thr Pro Gln Pro 385 390 395 400 Asp Ile Ile Ala Ala Val Ser Met Gly Leu Gln Tyr Pro Ala Thr Leu 405 410 415 Ile Ile Met Asn Ser Ser Thr Gln Glu Val Leu Ala Thr Arg Thr Ile 420 425 430 Arg Glu Leu Leu Gly Ser Asn Tyr Gly Leu Leu Leu Arg Arg Arg Arg 435 440 445 Gln Gln Gln Lys Asn Ala His Gln Arg His Lys Ala Gln Lys Arg Ser 450 455 460 Ala Ser Asp Gln Phe Gly Glu Ser Asn Leu Gly Glu Tyr Leu Asp Arg 465 470 475 480 Leu Ile Ala Lys Glu Ile Val Ala Ile Ala Lys Val His Lys Ala Gln 485 490 495 Ser Val Val Ile Pro Lys Leu Ala Arg Ile Arg Glu Ile Leu Asn Cys 500 505 510 Glu Val Met Ser Arg Ala Glu Gln Arg Cys Pro Gly Ser Val Glu Ile 515 520 525 Gln Lys Arg Tyr Ala Lys Glu Tyr Arg Thr Lys Ile His 530 535 540 <210> 71 <211> 614 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-24 effector <400> 71 Met Ser Gln Lys Thr Val Arg Cys Arg Leu Ile Ser Thr Glu Glu Asn 1 5 10 15 Arg Lys Ala Leu Trp Leu Leu Met Ala Glu Arg Asn Thr Pro Leu Ile 20 25 30 Asn Glu Ala Leu Arg Gln Leu Pro Ser His Ser Asp Phe Pro Lys Trp 35 40 45 Arg Gln Lys Gly Lys Leu Pro Asp Ile Ala Ala Lys Cys Leu Ile Asp 50 55 60 Arg Leu Lys Thr Asp Ala Arg Phe Ala Asn Gln Pro Val Trp Tyr Cys 65 70 75 80 Ile Ser Ala Gln Lys His Val Thr Tyr Ile Phe Arg Ser Trp Leu Ala 85 90 95 Ile Gln Arg Arg Lys Gln Trp Lys Leu Glu Gly Lys Arg Arg Trp Leu 100 105 110 Glu Ile Leu Gln Pro Asp Thr Ala Leu Ala Glu Lys Ala Gly Cys Ser 115 120 125 Ile Glu Ala Leu Arg Glu Glu Ala Gly Glu Ile Ile Ala Glu Ala Glu 130 135 140 Ile Val Asp Pro Phe Arg His Leu Leu Ala Lys Tyr Arg Glu Thr Glu 145 150 155 160 Asp Val Arg Glu Gln Cys Ala Ile Ala Tyr Leu Leu Lys Arg Lys Ala 165 170 175 Glu Leu Glu Pro Glu Glu Glu Asn Leu Ala Lys Leu Val Glu Arg His 180 185 190 Arg Lys Thr Glu Ile Phe Ile Gln Arg Leu Glu Ala Gln Leu Asp Ala 195 200 205 Ser Leu Pro Lys Gly Arg Asp Leu Thr Gly His Leu Gln Ala Glu Ala 210 215 220 Leu Ile Gln Ser Ile His Ser Pro Leu Leu Asp Asp Ser Asn Tyr Asn 225 230 235 240 Thr Trp Lys Asp Ala Leu Thr Thr Glu Pro Ala Lys Phe Pro Phe Pro 245 250 255 Ile Met Tyr Glu Thr Thr Glu Ser Leu Val Leu Ser Arg Asp Asp Arg 260 265 270 Gly Arg Ile Leu Leu Arg Phe Ser Gly Leu Ser Gln Gln Thr Tyr Lys 275 280 285 Ile Tyr Cys Asp Lys Pro His Gln His Trp Phe Glu Arg Phe Phe Glu 290 295 300 Asp Gln Glu Thr Lys Arg Val Gly Gly Asp Gln His Ser Ala Ala Ala 305 310 315 320 Phe Thr Leu Arg Ser Ala Gln Leu Met Trp Val Pro Ser Glu Lys His 325 330 335 Arg Asp Glu Pro Asp Pro Trp Asn Arg Tyr Tyr Leu Asn Leu Ser Cys 340 345 350 Thr Val Asp Thr Arg Leu Trp Thr Gln Glu Gly Thr Lys Val Val Val 355 360 365 Gln Glu Lys Ala Val Lys Thr Ala Gln Lys Leu Thr Ser Met Gln Glu 370 375 380 Lys Lys Ser Leu Thr Gln Thr Gln Arg Gly Tyr Ile Arg Arg Leu Glu 385 390 395 400 Ser Thr Leu Gln Arg Leu Gln Asn Pro Tyr Pro Arg Pro Ser Arg Thr 405 410 415 Val Tyr Trp Gly Gln Pro Glu Ile Leu Val Gly Val Ser Met Ser Leu 420 425 430 Asp Lys Thr Val Thr Ile Ala Val Val Asn Ala Leu Thr Glu Gln Val 435 440 445 Leu Thr Tyr Arg Ser Ala Lys Gln Leu Leu Gly Glu Arg Tyr Arg Leu 450 455 460 Leu Gln Arg Ala Arg Lys Glu Ile Val Lys Ile Ser His Gln Gly His 465 470 475 480 Arg Gln Arg Arg Lys Gly Gly Arg Arg Ile Ser Gln Glu Ser Asp Val 485 490 495 Gly Lys Tyr Val Asp Arg Leu Ile Ala Lys Ala Ile Asp Thr Leu Ala 500 505 510 Leu Lys Tyr Arg Ala Gly Ser Ile Val Leu Pro Asn Leu Ala Tyr Ile 515 520 525 Arg Glu Ser Ile Glu Ala Glu Val Gln Gln Arg Ala Ile Glu Lys Val 530 535 540 Pro Asp Phe Lys Asp Gly Gln Lys Gln Tyr Ala Lys Ala Tyr Arg Thr 545 550 555 560 Gln Ile His Arg Trp Pro Phe Ser Arg Leu Gln Ser Ala Ile Ile Ser 565 570 575 Lys Ala Glu Gln Ser Gly Ile Thr Ile Glu Ile Ala Thr Gln Gln Ile 580 585 590 Ser Gly Ser Phe Gln Asp Lys Ala Arg Glu Leu Gly Leu Gln Ala Tyr 595 600 605 Ala His Arg Ser Ala Ser 610 <210> 72 <211> 440 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-25 effector <400> 72 Leu Lys Asn Arg Gln Arg Leu Pro Lys Lys Ala Glu Asp Pro Glu Lys 1 5 10 15 Leu Ala Gln Arg Arg Arg Lys Val Glu Ile Lys Ile Glu Arg Leu Arg 20 25 30 Asp Gln Ile Glu Ser Cys Ile Pro Lys Gly Arg Asp Ile Thr Gly Glu 35 40 45 Ala Trp Leu Asn Thr Leu Leu Thr Ala Ala Asn Thr Val Pro Gln Ser 50 55 60 Ala Gln Glu Ala Lys Thr Trp Gln Asp Ile Leu Leu Thr Arg Ser Lys 65 70 75 80 Ser Val Pro Tyr Pro Val Ala Tyr Glu Thr Asn Glu Asp Leu Thr Trp 85 90 95 Ser Lys Asn Glu Lys Asn Arg Leu Cys Val Arg Phe Asn Gly Met Ser 100 105 110 Asp Tyr Ser Phe Gln Ile Tyr Cys Asp Gln Arg Gln Leu Lys Trp Phe 115 120 125 Glu Arg Phe Phe Gln Asp Gln Glu Thr Lys Lys Gln Ser Gln Asn Gln 130 135 140 His Pro Ser Ala Leu Phe Thr Leu Arg Ser Ala Arg Ile Phe Trp Gln 145 150 155 160 Glu His Gln Gly Lys Gly Gln Pro Trp Gln Lys His Arg Leu Ile Leu 165 170 175 Tyr Cys Ser Leu Asp Thr Arg Phe Trp Thr Ala Glu Gly Thr Glu Gln 180 185 190 Ile Arg Gln Glu Lys Ala Ala Lys Ile Thr Lys Thr Leu Ser Asn Leu 195 200 205 Gln Ala Lys Asp Glu Leu Thr Asp Ser Gln Gln Ala Phe Leu Arg Arg 210 215 220 Gln Thr Ser Thr Leu Glu Arg Ile Asn Thr Pro Phe Pro Arg Pro Asn 225 230 235 240 Gln Ala Ala Tyr Gln Gly Gln Pro His Ile Leu Val Gly Val Ala Leu 245 250 255 Gly Leu Glu Lys Pro Ala Thr Val Ala Val Val Asp Ile Asn Thr Gly 260 265 270 Arg Ala Ile Ala Tyr Arg Ser Ile Lys Gln Leu Leu Gly Ser Asn Tyr 275 280 285 Lys Leu Leu Asn Arg Gln Arg Arg Gln Lys Gln Arg Asn Ala His Gln 290 295 300 Arg His Lys Ala Gln Lys Gln Asn Lys Pro Asn Gln Phe Gly Asp Ser 305 310 315 320 Asn Leu Gly Glu Tyr Ile Asp Arg Leu Leu Ala Lys Ala Ile Leu Ser 325 330 335 Val Ala Gln Gln Tyr Gln Ala Ser Ser Ile Val Leu Pro Lys Leu Gly 340 345 350 Asp Leu Arg Glu Leu Val Gln Ser Glu Val Lys Val Lys Ala Glu Ala 355 360 365 Lys Ile Pro Gly Tyr Leu Glu Gly Gln Glu Gln Tyr Ala Lys Gln Tyr 370 375 380 Arg Val Ser Val His Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile 385 390 395 400 His Gln Gln Ala Ser Lys Ile Gly Ile Ala Ile Glu Gln Gly Gln Gln 405 410 415 Pro Thr Arg Ala Ser Pro Gln Asn Gln Ala Arg Glu Leu Ala Ile Thr 420 425 430 Ala Tyr Gln Ser Arg Thr Gln Lys 435 440 <210> 73 <211> 561 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-26 effector <400> 73 Gln His Lys Asp Phe Pro Gln Trp Val Ser Ala Gly Glu Ile Pro Ala 1 5 10 15 Gln Val Val Lys Asn Leu Val Asn Gln Ala Gln Ser Gly Leu Pro Ala 20 25 30 Arg Trp Cys Ala Ser Ala Gln Arg Gln Val Gln Glu Thr Tyr Lys Ala 35 40 45 Trp Ile Thr Lys Arg Arg Lys Leu Gln Gln Lys Leu Gln Gly Gln Gln 50 55 60 Thr Trp Leu Ser Val Leu Arg Pro Asp Ala Glu Leu Ala Lys Asn Ala 65 70 75 80 Gly Leu Ser Leu Glu Glu Met Lys Ile Arg Ala Gln Ala Leu Leu His 85 90 95 Arg Glu Ile His Asn Trp Phe Gln Val Tyr Gln Gln Cys Gln Asp Val 100 105 110 Val Glu Arg Ser Ile Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val 115 120 125 Pro Ala Glu Pro Glu Asn Thr Asp Lys Leu Arg Gln Lys Arg Arg Gln 130 135 140 Val Glu Ile Lys Ile Glu Trp Leu Glu Thr Gln Leu Ala Gly Arg Ser 145 150 155 160 Pro Gln Gly Arg Asp Leu Thr Gly Ser Arg Tyr Val Ala Ala Leu Asn 165 170 175 Glu Gly Glu Gln Cys Tyr Trp Glu Asn Asp Ala Asp Phe Leu Ala Trp 180 185 190 Gln Ala Glu Ile Leu Ser Arg Pro Asp Ser Leu Pro Pro Pro Val Glu 195 200 205 Tyr Ala Thr Asn Thr Asp Met Thr Trp His Lys Asp Glu Gln Gly Arg 210 215 220 Leu Ala Val Thr Phe Asn Gly Leu Gly Lys Leu Lys Phe Lys Ile Ala 225 230 235 240 Cys Asp Gln Arg Gln Leu His Trp Phe Gln Arg Phe Tyr Gln Asp Gln 245 250 255 Glu Gln Phe Lys Ser Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr 260 265 270 Leu Arg Ser Ala Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Asp 275 280 285 Pro Trp Gln Ala Asn Phe Leu Tyr Leu His Cys Thr Val Asp Pro Arg 290 295 300 Leu Trp Thr Gln Glu Gly Thr Ala Met Val Gln Gln Glu Lys Ala Lys 305 310 315 320 Lys Ser Gln Ala Ile Val Lys Lys Leu Ser Glu Arg Ser Asp Leu Thr 325 330 335 Ala Gln Gln Lys Asp Cys Leu Gln Arg His Gln Ser Thr Leu Ala Arg 340 345 350 Leu His Met Gly Tyr Asp Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys 355 360 365 Ser His Leu Val Val Gly Ile Ser Leu Asp Met Glu Asn Leu Val Thr 370 375 380 Val Ala Leu Val Asp Val Val Lys Gln Glu Val Ile Thr Gly Cys Thr 385 390 395 400 Met Lys Ser Leu Leu Gly Gln Asp Tyr Ala Leu Val Arg Arg Leu Arg 405 410 415 Tyr Glu Lys Arg Gln Asn Ser His Leu Arg Lys Val Ala Gln Glu Arg 420 425 430 Gly Ser Lys Ile Val Asn His Glu Ala Asn Leu Ala Ile His Val Glu 435 440 445 Arg Leu Leu Val Lys Ala Ile Ile His Phe Ala Gln Gln His Leu Ala 450 455 460 Gly Ser Leu Cys Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln 465 470 475 480 Ala His Leu Gln Cys Arg Ala Glu Glu Arg Phe Pro Asp Ser Lys Glu 485 490 495 Leu Gln Arg Arg Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp 500 505 510 Ser Tyr Asn Arg Leu Leu Lys Leu Leu Asn Gln Gln Ala Lys Phe Ala 515 520 525 Gly Leu Val Val Glu Gln Gly Val Gln Ser Ala Gly Glu Thr Ala Leu 530 535 540 Glu Arg Ala Leu Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala 545 550 555 560 Ala <210> 74 <211> 583 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-27 effector <400> 74 Gln Val Trp Glu Met Met Ala Gly Arg Tyr Ala Ser Leu Ile Ala Thr 1 5 10 15 Thr Leu Glu Gln Val Ser Gln His Lys Asp Phe Pro Gln Trp Val Ser 20 25 30 Ala Gly Glu Ile Pro Ala Gln Val Val Lys Asn Leu Val Asn Gln Ala 35 40 45 Gln Ser Gly Leu Pro Ala Arg Trp Cys Ala Ser Ala Gln Arg Gln Val 50 55 60 Gln Glu Thr Tyr Lys Ala Trp Leu Thr Lys Arg Arg Lys Leu Gln Gln 65 70 75 80 Lys Leu Gln Gly Gln Gln Thr Trp Leu Ser Val Leu Arg Pro Asp Ala 85 90 95 Glu Leu Ala Lys Asn Ala Gly Leu Ser Leu Glu Glu Met Lys Ile Arg 100 105 110 Ala Gln Ala Leu Leu His Arg Glu Ile Asn Asn Trp Phe Gln Val Tyr 115 120 125 Gln Gln Cys Gln Asp Val Val Glu Arg Ser Ile Phe Ala Tyr Leu Leu 130 135 140 Lys His Arg Leu Thr Val Pro Thr Glu Pro Glu Asp Thr Asp Lys Leu 145 150 155 160 Arg Arg Lys Arg Arg Gln Val Glu Ile Lys Ile Glu Arg Leu Glu Thr 165 170 175 Gln Leu Ala Gly Arg Ser Pro Gln Gly Arg Asp Leu Thr Gly Ser Arg 180 185 190 Tyr Val Ala Ala Leu Asn Glu Gly Glu Gln Cys Tyr Trp Glu Asn Asp 195 200 205 Ala Asp Phe Leu Ala Trp Gln Ala Glu Ile Leu Ser Cys Pro Asp Ser 210 215 220 Leu Pro Pro Pro Val Glu Tyr Ala Thr Asn Thr Asp Met Thr Trp His 225 230 235 240 Lys Asp Glu Gln Gly Arg Leu Ala Val Thr Phe Asn Gly Leu Gly Lys 245 250 255 Leu Lys Phe Lys Ile Ala Cys Asp Gln Arg Gln Leu His Trp Phe Gln 260 265 270 Arg Phe Tyr Gln Asp Gln Glu Gln Phe Lys Ser Gln Lys Gly Gln Arg 275 280 285 Ser Gln Ala Leu Phe Thr Leu Arg Ser Ala Glu Leu Leu Trp Lys Pro 290 295 300 Gly Asn Arg Ser Gly Asp Pro Trp Gln Ala Asn Phe Leu Tyr Leu His 305 310 315 320 Cys Thr Val Asp Pro Arg Leu Trp Thr Gln Glu Gly Thr Ala Met Val 325 330 335 Gln Gln Glu Lys Ala Lys Lys Ser Gln Ala Ile Val Lys Lys Leu Ser 340 345 350 Glu Arg Ser Asp Leu Thr Ala Gln Gln Arg Asp Cys Leu Gln Arg His 355 360 365 Gln Ser Thr Leu Ala Arg Leu His Met Gly Tyr Asp Arg Pro Gln Arg 370 375 380 Arg Met Tyr Gln Gly Lys Ser His Leu Val Val Gly Ile Ser Leu Asp 385 390 395 400 Met Glu Asn Leu Val Thr Val Ala Leu Val Asp Val Val Lys Gln Lys 405 410 415 Val Ile Thr Gly Cys Thr Met Lys Ser Leu Leu Gly Gln Asp Tyr Ala 420 425 430 Leu Val Arg Arg Leu Arg Tyr Glu Lys Arg Gln Asn Ser His Leu Arg 435 440 445 Lys Val Ala Gln Glu Arg Gly Ser Lys Ile Val Asn Tyr Glu Ala Asn 450 455 460 Leu Ala Ile His Val Glu Arg Leu Leu Val Lys Ala Ile Ile His Phe 465 470 475 480 Ala Gln Gln His Leu Ala Gly Ser Leu Cys Val Pro Thr Leu Lys Asp 485 490 495 Ile Arg Glu Thr Ile Gln Ala His Leu Gln Cys Arg Ala Glu Glu Arg 500 505 510 Phe Pro Asp Ser Lys Glu Leu Gln Arg Arg Tyr Ala Lys Glu Tyr Arg 515 520 525 Ile Asn Ala His Arg Trp Ser Tyr Asn Arg Leu Leu Lys Leu Leu Asn 530 535 540 Gln Gln Ala Lys Phe Ala Gly Leu Val Val Glu Gln Gly Val Gln Ser 545 550 555 560 Ala Gly Glu Thr Ala Leu Glu Arg Ala Leu Gly Val Ala Leu Ser Ala 565 570 575 Tyr Tyr Gln Arg Ser Ala Ala 580 <210> 75 <211> 417 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-28 effector <400> 75 Val Glu Ile Lys Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser 1 5 10 15 Pro Gln Gly Arg Asp Leu Thr Gly Ser Arg Tyr Ala Thr Ala Leu Asn 20 25 30 Asp Gly Glu Gln Cys Asp Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp 35 40 45 Gln Ala Glu Ile Leu Ser Arg Pro Asp Ser Leu Pro Pro Pro Val Glu 50 55 60 Tyr Ala Thr Asn Thr Asp Met Thr Trp His Lys Asp Glu Gln Gly Arg 65 70 75 80 Leu Ala Val Thr Phe Asn Gly Leu Gly Lys Leu Lys Phe Lys Ile Ala 85 90 95 Cys Asp Gln Arg Gln Leu His Trp Phe Gln Arg Phe Tyr Gln Asp Gln 100 105 110 Glu Gln Phe Lys Ser Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr 115 120 125 Leu Arg Ser Ala Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Asp 130 135 140 Pro Trp Gln Ala Asn Phe Leu Tyr Leu His Cys Thr Val Asp Ser Arg 145 150 155 160 Leu Trp Thr Gln Glu Gly Thr Ala Met Val Gln Gln Glu Ile Ala Lys 165 170 175 Lys Ser Gln Ala Ile Val Lys Lys Leu Ser Glu Arg Ser Asp Leu Thr 180 185 190 Ala Gln Gln Lys Asp Cys Leu Gln Arg His Gln Ser Thr Leu Ala Arg 195 200 205 Leu His Met Gly Tyr Asp Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys 210 215 220 Ser His Leu Val Val Gly Ile Ser Leu Asp Met Glu Asn Leu Val Thr 225 230 235 240 Val Ala Leu Val Asp Val Val Lys Gln Lys Val Ile Thr Gly Cys Thr 245 250 255 Met Lys Ser Leu Leu Gly Gln Asp Tyr Ala Leu Val Gln Arg Leu Arg 260 265 270 Tyr Glu Lys Arg Gln Asn Ser His Leu Arg Lys Val Ala Gln Glu Arg 275 280 285 Gly Ser Lys Ile Val Asn Tyr Glu Ala Asn Leu Ala Ile His Val Glu 290 295 300 Arg Leu Leu Val Lys Ala Ile Ile His Phe Ala Gln Gln His Leu Ala 305 310 315 320 Gly Ser Leu Cys Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln 325 330 335 Ala His Leu Gln Cys Arg Ala Glu Glu Arg Phe Pro Asp Ser Lys Glu 340 345 350 Leu Gln Arg Arg Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp 355 360 365 Ser Tyr Asn Arg Leu Leu Lys Leu Leu Asn Gln Gln Ala Lys Phe Ala 370 375 380 Gly Leu Val Val Glu Gln Gly Val Gln Ser Ala Gly Glu Thr Ala Leu 385 390 395 400 Glu Arg Ala Leu Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala 405 410 415 Ala <210> 76 <211> 488 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-29 effector <400> 76 Met Gly Lys Asp Ile Leu Asp Glu Ile Ala Ser Ile Gly Val Ile Glu 1 5 10 15 Asp Glu Thr Glu Trp Asn Ser Ile Glu Ser Ala Leu Leu Lys Lys Gln 20 25 30 Thr Leu Met Pro His Pro Ile Leu Phe Glu Ser Ser Asp Asp Phe Ile 35 40 45 Trp Ala Glu Pro Ala Arg Phe Gln Ile Glu Asp Leu Gln Ala Glu Glu 50 55 60 Glu Ile Ser Arg Asp Thr Glu Ala Lys Glu Leu Lys Ala Lys Asn Leu 65 70 75 80 Gln Ala Glu Lys Glu Ser Ser Asn Thr Glu Pro Arg Lys Arg Val Cys 85 90 95 Val Cys Phe Lys Ser Phe Asp Glu Lys Tyr Thr Phe Glu Val Ala Gly 100 105 110 Asp Tyr Arg His Ile His Ala Val Trp Gln Ala Leu Lys Glu Arg Lys 115 120 125 Glu Tyr Asp Lys Asn Ala Asp Lys Asn Thr Ser Ala Leu Phe Leu Val 130 135 140 Arg Ser Ala Thr Leu Ile Trp Arg Glu Tyr Lys Lys Asn Asp Asn Arg 145 150 155 160 Ile Val Arg Arg Arg Lys Ala Ala Lys Lys Arg Ala Lys Arg Glu Gly 165 170 175 Leu Val Ala Ser Thr Glu Ser Asp Ser Ser Leu Ala Pro Glu Phe Tyr 180 185 190 Asp Pro Glu Phe Pro Trp Asn Arg Tyr Gln Leu Phe Leu His Cys Thr 195 200 205 Ile Glu Thr Arg Tyr Leu Ser Lys Glu Gly Thr Glu Ile Asp Ile Glu 210 215 220 Lys Gln Lys Lys Ser Thr Ala Lys Ser Ile Gln Thr Leu Glu Lys Asn 225 230 235 240 Ile Ala Glu Leu Glu Lys Lys Gly Glu Ser Ala Lys Thr Arg Lys Asp 245 250 255 Arg His Asn Arg Arg Ser Gly Thr Leu Arg Arg Leu Glu Ser Tyr Asp 260 265 270 Asn Asn Tyr Glu Arg Ser Ser Lys Pro Leu Tyr Ala Gly Gln Pro His 275 280 285 Ile Val Thr Gly Val Ala Leu Gly Ser Ser Gly Leu Val Thr Thr Thr 290 295 300 Ile Ser Asp Ala Ile Ser Gly Lys Ile Leu Glu Cys Arg Gly Leu Glu 305 310 315 320 Ala Leu Leu Gly Lys Asp Tyr Glu Leu Val Lys Arg Arg Gln Phe Glu 325 330 335 Arg Gln Leu Asn Ser Arg Arg Arg Thr Gln Asn Gln Lys Arg Gly Ala 340 345 350 Asn Asp Gln Phe Gly Glu Ser Asn Leu Gly Asp Thr Ile Asp Lys Arg 355 360 365 Ile Ala Asn Ala Val Ile Asp Phe Ala Lys Lys His Gln Ser Gly Phe 370 375 380 Ile Val Leu Pro Asp Met Asn Asp Tyr Arg Arg Arg Lys Gln Ser Glu 385 390 395 400 Ile Ala Ala Phe Ala Glu Arg Glu Cys Gly Gly Trp Lys Gly Ile Glu 405 410 415 Lys Lys Phe Ala Lys Ala Gln Lys Glu Lys Ile His Ser Trp Ser Tyr 420 425 430 Gly Arg Leu Thr Thr Tyr Ile Thr Asn Gln Ala Glu Lys Glu Gly Ile 435 440 445 Leu Val Arg Thr Arg Arg Gln Pro Ile Gln Gly Ser Ser Gln Glu Gln 450 455 460 Gly Lys Leu Met Ala Ile Glu Ala Tyr Lys Asp Lys Pro Lys Pro Lys 465 470 475 480 Lys Ser Arg Pro Lys Lys Ser Ala 485 <210> 77 <211> 467 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-30 effector <400> 77 Lys Thr Ala Glu Ile Leu Ala Gln Thr Thr Pro Gln Pro Ala Glu Ala 1 5 10 15 Arg Thr Ala Lys Ser Ser Lys Lys Lys Gln Lys Ser Lys Leu Asn Gly 20 25 30 Gln Lys Gln Ser Phe Asp Leu Leu Phe Glu Gln Tyr Gln Glu Thr Asp 35 40 45 Asp Glu Leu Thr Arg Ser Ala Ile Val Tyr Leu Leu Lys Asn Gly Arg 50 55 60 Lys Leu Pro Asn Glu Pro Glu Asp Pro Lys Gln Phe Ala Lys Arg Arg 65 70 75 80 Arg Lys Ala Glu Ile Arg Val Glu Arg Thr Thr Asn Thr Leu His Arg 85 90 95 Met Gln Leu Pro Thr Gly Arg Asp Met Thr Asp Gln Glu Trp Leu Lys 100 105 110 Thr Leu Ala Thr Ala Val Ser Asn Val Pro Glu Asp Asp Gly Glu Ala 115 120 125 Ala Ser Trp Gln Ala Ile Leu Met Ser Glu Ala His Lys Leu Pro Phe 130 135 140 Pro Ile Leu Tyr Glu Thr Asn Glu Asp Leu Ser Trp Phe Leu Asn Asp 145 150 155 160 Gly Glu Arg Leu Cys Val Thr Phe Asn Gly Leu Ser Glu His Thr Phe 165 170 175 Glu Ile His Cys Asp Arg Arg Gln Leu His Trp Phe Lys Arg Phe Leu 180 185 190 Glu Asp Gln Glu Ile Lys Lys Ala Ser Lys Asn Gln His Ser Cys Ala 195 200 205 Leu Phe Thr Leu Arg Ser Ala Arg Ile Ala Trp Gln Glu Gly Lys Glu 210 215 220 Lys Gly Glu Pro Trp Asn Thr His Arg Leu Thr Leu Ala Cys Thr Val 225 230 235 240 Glu Thr Arg Ala Trp Thr Ala Glu Gly Thr Glu Gln Ile Arg Gln Glu 245 250 255 Lys Ala Ala Glu Cys Lys Lys Val Ile Leu Gly Thr Lys Ala Lys Gly 260 265 270 Asn Leu Asn Gln Arg Gln Glu Gln Phe Ile Gln Arg Arg Glu Lys Thr 275 280 285 Ile Val Leu Met Asn Asn Ser Phe Pro Arg Pro Ser Arg Pro Leu Tyr 290 295 300 Gln Gly Gln Pro Glu Ile Ile Ala Ser Val Ser Tyr Gly Leu Asp Arg 305 310 315 320 Pro Ala Thr Leu Ala Ile Val Asp Ile Thr Thr Gly Lys Ala Ile Ala 325 330 335 Tyr Arg Ser Ile Arg Gln Leu Leu Gly Asp His Tyr Lys Leu Leu Thr 340 345 350 Arg Tyr Arg Leu Arg Gln Gln Gln Asn Ala His Arg Arg His Asn Arg 355 360 365 Gln Arg Lys Gly Ala Ser Asn Arg Ile Gln Glu Ser Gln Leu Gly Glu 370 375 380 Tyr Leu Asp Cys Leu Ile Ala Gln Ala Ile Val Ser Val Ala Gln Thr 385 390 395 400 Tyr Gln Ala Ser Ser Ile Val Leu Pro Asp Leu Gly Asn Ile Arg Glu 405 410 415 Val Val Glu Ala Glu Val Arg Ala Arg Ala Glu Gln Arg Ile Val Gly 420 425 430 Tyr Leu Glu Gly Gln Gln Gln Tyr Ala Lys Gln Tyr Arg Ala Ser Ile 435 440 445 His Arg Trp Ser Tyr Gly Arg Leu Ser Glu Lys Ile Gln Ser Gln Ala 450 455 460 Ala Gln Ala 465 <210> 78 <211> 550 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-31 effector <400> 78 Pro Leu Ile Asn Ala Leu Ile Arg Glu Leu Val Ser His Pro Glu Phe 1 5 10 15 Glu Ser Trp Arg Glu Lys Gly Arg His Pro Ser Asp Val Val Ala Lys 20 25 30 Leu Asn Arg Thr Leu Lys Thr Asp Ala Gln Phe Ala Gly Gln Pro Ser 35 40 45 Arg Phe Phe Met Ser Ala Glu Lys Val Val Asn Tyr Ile Phe Lys Ser 50 55 60 Trp Phe Lys Ile Gln Ser Arg Leu Gln Gln Lys Leu Ser Gly Lys Gln 65 70 75 80 Lys Trp Leu Glu Ile Leu Lys Ser Asp Glu Glu Leu Val Glu Leu Cys 85 90 95 Gly Gln Ser Ile Asp Val Leu Gln Lys Lys Ala Val Gln Val Leu Gln 100 105 110 Glu Val Gly Lys Ala Ile Asp Lys Glu Thr Ser Asp Thr Ile Pro Glu 115 120 125 Lys Lys Arg Ala Asn Leu Ile Arg Gln Arg Leu Phe Lys Lys Leu Ser 130 135 140 Ser Ala Lys Gln Pro Leu Pro Gln Tyr Ala Ala Ile Tyr Leu Leu Lys 145 150 155 160 Asn His Cys Lys Ile Pro Asn Glu Pro Glu Asp Val Glu Asn Phe Ala 165 170 175 Gln Arg Arg Arg Lys Thr Glu Ile Gln Ile Gln Ile Leu Gln Asp Gln 180 185 190 Ile Glu Ser Arg Ile Pro Lys Gly Arg Asp Leu Thr Gly Lys Ala Trp 195 200 205 Thr Glu Thr Leu Leu Lys Ala Val Asn Ser Ile Pro Gln Asp Asn Gln 210 215 220 Glu His Lys Gln Trp Gln Asp Arg Leu Leu Ser Met Pro Ser Thr Ala 225 230 235 240 Pro Phe Pro Ile Leu Phe Glu Thr Asn Glu Asp Leu Val Trp Ser Ala 245 250 255 Asn Glu Arg Asp Arg Ile Cys Val Arg Phe Asn Gly Leu Ser Glu His 260 265 270 Thr Phe Gln Ile Tyr Cys Asp Gln Arg Gln Leu His Trp Phe Lys Arg 275 280 285 Phe Leu Glu Asp Gln Lys Thr Lys Arg Ala Ser Lys Asn Gln His Ser 290 295 300 Ser Ala Leu Phe Thr Leu Arg Ser Ala Arg Ile Ser Trp Gln Glu Asn 305 310 315 320 Asp Arg Lys Gly Asn Pro Trp Glu Thr His Tyr Ile Thr Leu Ser Cys 325 330 335 Thr Val Asp Val Arg Leu Trp Ser Ala Glu Gly Thr Asp Glu Val Arg 340 345 350 His Glu Lys Ala Ala Asp Val Ala Lys Val Leu Thr Arg Leu Asn Glu 355 360 365 Lys Asp Ser Leu Thr Glu Thr Gln Ala Gly Tyr Ala Arg Arg Leu Thr 370 375 380 Ser Thr Leu Glu Lys Leu Ser Ser Pro Phe Glu Arg Pro Ser Leu Pro 385 390 395 400 Arg Tyr Gln Gly Lys Asp Asn Ile Ile Ala Gly Ile Ser Leu Gly Trp 405 410 415 Asp Lys Pro Val Thr Leu Ala Ile Trp Asn Thr Asp Thr Gln Glu Val 420 425 430 Leu Thr Tyr Arg Ser Leu Lys Gln Leu Leu Gly Lys Asp Tyr Pro Leu 435 440 445 Tyr Leu Arg His Arg Arg Glu Gln Gln Lys Gln Ser His Glu Arg His 450 455 460 Lys Ala Gln Lys Gln Gly Lys Gly Asn Arg Phe Gly Thr Ser Asn Leu 465 470 475 480 Gly Glu His Leu Asp Arg Leu Leu Ala Lys Ala Ile Val Ala Ile Ala 485 490 495 Gln Gln Tyr Ser Ala Gly Ser Ile Ala Val Pro Lys Leu Asp Ser Ile 500 505 510 Arg Asp Thr Leu Gln Ala Glu Ile Asp Ala Lys Ala Glu Gln Arg Ile 515 520 525 Pro Gly Tyr Leu Glu Gly Gln Lys Arg Tyr Ser Arg Asp Tyr Lys Arg 530 535 540 Ser Ile His Arg Trp Ser 545 550 <210> 79 <211> 446 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-32 effector <400> 79 Ser Ile Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val Pro Thr Glu 1 5 10 15 Ser Glu Asp Thr Asp Glu Leu Arg Arg Lys Arg Arg Gln Val Glu Ile 20 25 30 Lys Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln Gly 35 40 45 Arg Asp Leu Thr Gly Ser Arg Tyr Ala Thr Ala Leu Asn Asp Gly Glu 50 55 60 Gln Cys Asp Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala Glu 65 70 75 80 Ile Leu Ser Arg Pro Asp Ser Leu Pro Pro Pro Val Glu Tyr Ala Thr 85 90 95 Asn Thr Asp Met Thr Trp His Lys Asp Glu Gln Gly Arg Leu Ala Val 100 105 110 Thr Phe Asn Gly Leu Gly Lys Leu Lys Phe Lys Ile Ala Cys Asp Gln 115 120 125 Arg Gln Leu His Trp Phe Gln Arg Phe Tyr Gln Asp Gln Glu Gln Phe 130 135 140 Lys Ser Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg Ser 145 150 155 160 Ala Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Asp Pro Trp Gln 165 170 175 Ala Asn Phe Leu Tyr Leu His Cys Thr Val Asp Ser Arg Leu Trp Thr 180 185 190 Gln Glu Gly Thr Ala Met Val Gln Gln Glu Lys Ala Lys Lys Ser Gln 195 200 205 Ala Ile Val Lys Lys Leu Ser Glu Arg Ser Asp Leu Thr Ala Gln Gln 210 215 220 Lys Asp Cys Leu Gln Arg His Gln Ser Thr Leu Ala Arg Leu His Met 225 230 235 240 Gly Tyr Asp Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys Ser His Leu 245 250 255 Val Val Gly Ile Ser Leu Asp Met Glu Asn Leu Val Thr Val Ala Leu 260 265 270 Val Asp Val Val Lys Gln Lys Val Ile Thr Gly Cys Thr Met Lys Ser 275 280 285 Leu Leu Gly Gln Asp Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu Lys 290 295 300 Arg Gln Asn Ser His Leu Arg Lys Val Ala Gln Glu Arg Gly Ser Lys 305 310 315 320 Ile Val Asn Tyr Glu Ala Asn Leu Ala Ile His Val Glu Arg Leu Leu 325 330 335 Val Lys Ala Ile Ile His Phe Ala Gln Gln His Leu Ala Gly Ser Leu 340 345 350 Cys Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln Ala His Leu 355 360 365 Gln Cys Arg Ala Glu Glu Arg Phe Pro Asp Ser Lys Glu Leu Gln Arg 370 375 380 Arg Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr Asn 385 390 395 400 Arg Leu Leu Glu Leu Ile Ser Gln Gln Ala Ile Val Ala Gly Leu Leu 405 410 415 Val Glu Gln Gly Leu Gln Gly Ser Gly Gly Thr Ala Ile Lys Arg Ala 420 425 430 Leu Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala Ala 435 440 445 <210> 80 <211> 649 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-44 effector <400> 80 Met Ser Gln Ile Thr Ile Gln Cys Asn Leu Val Ala Ser Glu Ala Thr 1 5 10 15 Arg Gln Tyr Leu Trp His Leu Met Ala Asp Ile Tyr Thr Pro Phe Ile 20 25 30 Asn Glu Met Leu Ala Thr Ile Ala Gln His Pro Asn Phe Glu Glu Trp 35 40 45 Ser Gln Asn Gly Arg Ile Pro Ala Asp Val Phe Glu Asp Ile Arg Lys 50 55 60 Thr Leu Lys Ala His Pro Asp Phe Gln Gly Met Pro Gly Arg Trp Tyr 65 70 75 80 Tyr Ala Gly Arg Asp Leu Val Lys Arg Ile Phe Lys Ser Trp Leu Ala 85 90 95 Leu Arg Arg Arg Leu Arg His Gln Leu Ser Gly Gln Thr His Trp Leu 100 105 110 Glu Ile Phe Gln Ser Asp Asp Asp Leu Val Ala Ala Cys Gly Gln Asp 115 120 125 Leu Pro Ala Ile Arg Ala Glu Ala Ala Ser Ile Leu Thr Lys Ile Gln 130 135 140 Ile Glu Ala Pro Asn Thr Ser Lys Gln Pro Lys Lys Thr Lys Gln Pro 145 150 155 160 Lys Lys Ala Gly Ser Lys Thr Gln Lys Pro Glu Glu Glu Gln Arg Asn 165 170 175 Arg Asn Leu Phe Pro Ala Leu Phe Lys Glu Tyr Asp Gly Ala Glu Thr 180 185 190 Glu Leu Val Lys Cys Ala Ile Ala Cys Leu Leu Lys Asn Asn Cys Gln 195 200 205 Ile Pro Thr Lys Ala Glu His Pro Glu Lys Phe Gln Lys Arg Arg Arg 210 215 220 Lys Thr Glu Ile Arg Val Glu Arg Ile Ile Glu Gln Leu Ala Arg Thr 225 230 235 240 Arg Leu Pro Lys Gly Arg Asp Leu Thr Asn Glu Lys Trp Leu Asp Thr 245 250 255 Leu Lys Met Ala Val Gln Gln Val Pro Lys Asp Glu Thr Glu Ala Ala 260 265 270 Ala Trp Glu Ala Asp Leu Gln Thr Asp Ser Ser Pro Leu Pro Phe Pro 275 280 285 Ile Ala Tyr Glu Ser Asn Glu Asp Leu Lys Trp Ser Gln Asn Ala Lys 290 295 300 Gly Arg Leu Cys Val Arg Phe Asn Gly Leu Gly Lys His Thr Phe Glu 305 310 315 320 Ile Tyr Cys Asp Thr Arg Gln Leu His Trp Phe Lys Arg Phe Leu Asp 325 330 335 Asp Gln Thr Ile Lys Lys Gln Gly Gly Asn Ser His Ser Ala Gly Ala 340 345 350 Leu Thr Leu Arg Ser Gly Arg Ile Ser Trp Arg Leu Asp Ser Ser Lys 355 360 365 Gly Asn Pro Trp Asp Arg Asn Arg Leu Val Leu Phe Cys Ser Val Asp 370 375 380 Thr Leu Leu Trp Thr Lys Glu Gly Thr Glu Lys Ala Ser Gln Glu Lys 385 390 395 400 Ala Ser Lys Ile Ala Gln Val Ile Ser Gly Thr Lys Ala Lys Gly Asn 405 410 415 Leu Thr Ser Lys Gln Glu Asp Phe Val Arg Lys Arg Glu Lys Thr Leu 420 425 430 Ala Leu Leu Gln Asn Pro Phe Pro Arg Pro Ser Arg Pro Leu Tyr Gln 435 440 445 Gly Ser Pro Ala Ile Leu Ala Gly Val Ser Phe Gly Leu Asp Lys Pro 450 455 460 Ala Thr Leu Ala Ile Val Asp Val Thr Thr Gly Lys Ala Ile Ala Tyr 465 470 475 480 Arg Ser Ile Arg Gln Leu Leu Gly Asp Asp His Lys Leu Leu Asn Arg 485 490 495 Gln Arg Gln Arg Gln Arg Gln Lys Ala Gln Arg Arg Arg Ser Asn Gln 500 505 510 Leu Lys Phe Ala Ser Asn Arg Ile Ser Glu Gly Gly Leu Gly Gly Gln 515 520 525 Ile Asp Ser Leu Ile Ala Lys Ala Ile Val Gln Ile Ala Gln Gln Tyr 530 535 540 Asn Ala Ser Ser Ile Val Leu Gly Asp Leu Ala Asn Ile Arg Glu Ile 545 550 555 560 Ile Glu Ser Glu Ile Gln Ala Lys Ala Glu Gln Lys Thr Thr Leu Lys 565 570 575 Glu Ile Gln Ala Lys Tyr Ala Arg Asp Tyr Arg Ala Ser Ile His Arg 580 585 590 Trp Ser Tyr Lys Arg Leu Ala Gln Lys Ile Glu Ser Asn Ala Leu Gln 595 600 605 Ala Gly Leu Ile Val Ala Thr Ile Lys Gln Pro Leu Ala Gly Ser Pro 610 615 620 Gln Asp Lys Ala Arg Asp Val Ala Ile Ala Gly Phe Gln Ser Arg Ser 625 630 635 640 Val Ser Lys Ile Leu Asp Thr Gly Ser 645 <210> 81 <211> 429 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-45 effector <400> 81 Met Pro Pro Cys Arg Pro Pro Ala Thr Arg Gln Tyr Leu Trp Gly Leu 1 5 10 15 Ala Ala Glu Lys Asn Thr His Leu Ile Asn Ala Leu Ile Gln Glu Val 20 25 30 Val Ser His Glu Asp Phe Glu Asp Trp Arg Leu Lys Gly Arg His Pro 35 40 45 Ala Asp Val Val Ala Lys Ala Cys Arg Arg Leu Lys Thr Glu Val Pro 50 55 60 Phe Ser Gly Gln Pro Ser Arg Phe Tyr Ala Ser Ala Glu Lys Ala Val 65 70 75 80 Asn Tyr Ile Phe Lys Ser Trp Phe Thr Leu Gln Ser Arg Leu Gln Arg 85 90 95 Gln Ile Ser Gly Lys Gln Ala Trp Leu Asp Met Leu Lys Ser Asp Asp 100 105 110 Glu Leu Val Glu Leu Cys Gly Arg Pro Leu Glu Gly Ile Gln Ala Thr 115 120 125 Ala Ala Gln Leu Leu Lys Gln Ile Glu Lys Thr Leu Glu Ser Glu Ala 130 135 140 Thr Glu Glu Ser Gln Gly Lys Ser Lys Glu Asp Gln Val Arg Thr His 145 150 155 160 Leu Phe Lys Lys Tyr His Ser Ala Lys Gln Ala Leu Asn Leu Cys Ala 165 170 175 Ala Ala Tyr Leu Leu Lys Asn Asn Ser Lys Ile Pro Asp Lys Pro Glu 180 185 190 Asp Pro Asn Lys Phe Ala Gln Arg Gln Arg Lys Ala Glu Ile Gln Val 195 200 205 Gln Arg Leu Gln Asp Gln Ile Glu Gly Arg Ile Pro Lys Gly Arg Asp 210 215 220 Leu Thr Gly Gln Ala Trp Leu Ser Thr Leu Leu Thr Val Thr Thr Thr 225 230 235 240 Val Pro Arg Asp Asn Arg Glu His Lys Gln Trp Gln Asp Arg Leu Leu 245 250 255 Ala Gln Pro Arg Thr Ile Pro Phe Pro Ile Leu Phe Glu Thr Asn Glu 260 265 270 Asp Leu Val Trp Ser Arg Asn Gln Ala Asp Arg Leu Cys Val Arg Phe 275 280 285 Asn Gly Leu Ser Glu His Thr Phe Gln Ile Tyr Cys Asp Gln Arg Gln 290 295 300 Leu Pro Trp Phe Gln Arg Phe Leu Glu Asp Gln Gln Thr Lys Arg Ala 305 310 315 320 Ser Lys Asn Gln His Ser Ser Ala Leu Phe Ala Leu Arg Ser Ala Arg 325 330 335 Ile Ser Trp Gln Glu Asn Asp Arg Lys Gly Gln Pro Trp Asp Ala His 340 345 350 Ser Leu Thr Leu Ser Cys Thr Ile Asp Thr Arg Leu Trp Ser Ala Glu 355 360 365 Gly Thr Asp Glu Val Arg Gln Glu Lys Ala Ala Asp Thr Ala Lys Val 370 375 380 Leu Thr Arg Leu Asn Glu Lys Gly Ser Leu Ser Asp Thr Gln Ala Gly 385 390 395 400 Tyr Ala Lys Arg Leu Thr Ser Thr Leu Asn Arg Leu Asp Ser Pro Phe 405 410 415 Lys Arg Pro Ser Gln Pro Arg Tyr Gln Gly Lys Pro His 420 425 <210> 82 <211> 477 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-46 effector <400> 82 Glu Gln Gln Asn Arg Asn Leu Phe Pro Ala Leu Phe Lys Glu Tyr Asp 1 5 10 15 Gly Ala Glu Thr Glu Leu Val Lys Cys Ala Ile Ala Cys Leu Leu Lys 20 25 30 Asn Asn Cys Gln Ile Pro Thr Lys Ala Glu His Pro Glu Lys Phe Gln 35 40 45 Lys Arg Arg Arg Lys Thr Glu Ile Arg Val Glu Arg Ile Ile Glu Gln 50 55 60 Leu Ala Arg Thr Arg Leu Pro Lys Gly Arg Asp Leu Thr Asn Glu Lys 65 70 75 80 Trp Leu Asp Thr Leu Lys Met Ala Val Gln Gln Val Pro Lys Asp Glu 85 90 95 Thr Glu Ala Ala Ala Trp Glu Ala Asp Leu Gln Thr Asp Ser Ser Pro 100 105 110 Leu Pro Phe Pro Ile Ala Tyr Glu Ser Asn Glu Asp Leu Lys Trp Ser 115 120 125 Gln Asn Ala Lys Gly Arg Leu Cys Val Arg Phe Asn Gly Leu Gly Lys 130 135 140 His Thr Phe Glu Ile Tyr Cys Asp Thr Arg Gln Leu His Trp Phe Lys 145 150 155 160 Arg Phe Leu Asp Asp Gln Thr Ile Lys Lys Gln Gly Gly Asn Ser His 165 170 175 Ser Ala Gly Ala Leu Thr Leu Arg Ser Gly Arg Ile Ser Trp Arg Leu 180 185 190 Asp Ser Ser Lys Gly Asn Pro Trp Asp Arg Asn Arg Leu Val Leu Phe 195 200 205 Cys Ser Val Asp Thr Leu Leu Trp Thr Lys Glu Gly Thr Glu Lys Ala 210 215 220 Ser Gln Glu Lys Ala Ser Lys Ile Ala Gln Val Ile Ser Gly Thr Lys 225 230 235 240 Ala Lys Gly Asn Leu Thr Ser Lys Gln Glu Asp Phe Val Arg Lys Arg 245 250 255 Glu Lys Thr Leu Ala Leu Leu Gln Asn Pro Phe Pro Arg Pro Ser Arg 260 265 270 Pro Leu Tyr Gln Gly Ser Pro Ala Ile Leu Ala Gly Val Ser Phe Gly 275 280 285 Leu Asp Lys Pro Ala Thr Leu Ala Ile Val Asp Val Thr Thr Gly Lys 290 295 300 Ala Ile Ala Tyr Arg Ser Ile Arg Gln Leu Leu Gly Asp Asp His Lys 305 310 315 320 Leu Leu Asn Arg Gln Arg Gln Arg Gln Arg Gln Lys Ala Gln Arg Arg 325 330 335 Arg Ser Asn Gln Leu Lys Phe Ala Ser Asn Arg Ile Ser Glu Gly Gly 340 345 350 Leu Gly Gly Gln Ile Asp Ser Leu Ile Ala Lys Ala Ile Val Gln Ile 355 360 365 Ala Gln Gln Tyr Asn Ala Ser Ser Ile Val Leu Gly Asp Leu Ala Asn 370 375 380 Ile Arg Glu Ile Ile Glu Ser Glu Ile Gln Ala Lys Ala Glu Gln Lys 385 390 395 400 Thr Thr Leu Lys Glu Ile Gln Ala Lys Tyr Ala Arg Asp Tyr Arg Ala 405 410 415 Ser Ile His Arg Trp Ser Tyr Lys Arg Leu Ala Gln Lys Ile Glu Ser 420 425 430 Asn Ala Leu Gln Ala Gly Leu Ile Val Ala Thr Ile Lys Gln Pro Leu 435 440 445 Ala Gly Ser Pro Gln Asp Lys Ala Arg Asp Val Ala Ile Ala Gly Phe 450 455 460 Gln Ser Arg Ser Val Ser Lys Ile Leu Asp Thr Gly Ser 465 470 475 <210> 83 <211> 439 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-47 effector <400> 83 Leu Lys Asn Gly Gly Lys Ile Ser Asn Lys Glu Glu Asp Pro Glu Lys 1 5 10 15 Phe Ala Lys Arg Arg Arg Lys Leu Glu Ile Gln Ile Glu Arg Leu Arg 20 25 30 Glu Gln Leu Glu Ala Arg Ile Pro Lys Gly Arg Asp Leu Thr Asp Ala 35 40 45 Lys Trp Leu Glu Thr Leu Leu Leu Ala Thr Asn Lys Ala Pro Glu Asn 50 55 60 Glu Glu Glu Ala Lys Phe Trp Gln Asp Ser Leu Leu Lys Lys Ser Ser 65 70 75 80 Thr Val Pro Phe Pro Val Ala Tyr Glu Thr Lys Glu Asp Met Thr Trp 85 90 95 Phe Lys Asn Glu Arg Gly Arg Ile Cys Val Lys Phe Asn Gly Leu Ser 100 105 110 Glu His Ser Phe Gln Val Tyr Cys Asp Thr Arg His Leu His Trp Phe 115 120 125 Gln Arg Phe Leu Lys Asp Gln Gln Ile Lys His Asn Ser Lys Asn Gln 130 135 140 His Ser Ser Ser Leu Phe Thr Leu Arg Ser Gly Arg Ile Val Trp Gln 145 150 155 160 Glu Gly Glu Ser Lys Gly Asp Pro Trp Lys Val Asn His Leu Ile Leu 165 170 175 Tyr Cys Ser Val Asp Thr Arg Leu Trp Thr Ala Glu Gly Thr Asn Leu 180 185 190 Val Arg Glu Glu Lys Ala Glu Glu Ile Ala Lys Thr Ile Thr Gln Thr 195 200 205 Lys Val Lys Gly Glu Leu Asn Asp Lys Gln Leu Ala His Ile Lys Arg 210 215 220 Lys Asn Ser Ser Leu Ala Arg Ile Asn Asn Pro Phe Pro Arg Pro Ser 225 230 235 240 Lys Pro Leu Tyr Lys Gly Gln Pro His Ile Leu Val Gly Val Ser Leu 245 250 255 Gly Leu Glu Lys Pro Thr Thr Leu Ala Ile Val Asp Gly Thr Thr Ser 260 265 270 Lys Val Ile Thr Tyr Arg Ser Ile Lys Gln Leu Leu Gly Asp Asn Tyr 275 280 285 Lys Leu Leu Asn Arg Gln Arg Gln Gln Lys His Leu Leu Ser His Gln 290 295 300 Arg Gln Ile Ala Gln Thr Leu Ala Ser Pro Asn Gln Leu Gly Glu Ser 305 310 315 320 Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu Ala Lys Glu Ile Val Ala 325 330 335 Ile Ala Gln Thr Tyr Lys Ala Gly Ser Ile Val Leu Pro Lys Leu Gly 340 345 350 Asp Met Arg Glu Gln Leu Gln Ser Glu Ile Gln Ala Lys Ala Glu Gln 355 360 365 Lys Ser Asp Leu Leu Glu Val Gln Gln Lys Tyr Ala Lys Gln Tyr Arg 370 375 380 Val Ser Val Tyr Gln Trp Ser Tyr Gly Arg Leu Ile Ala Asn Ile Arg 385 390 395 400 Ser Ser Ala Ala Lys Ala Gly Ile Val Ile Glu Glu Ser Lys Gln Pro 405 410 415 Ile Arg Gly Ser Pro Lys Glu Lys Ala Lys Glu Leu Ala Ile Val Ala 420 425 430 Tyr Asn Ser Arg Gln Thr Thr 435 <210> 84 <211> 641 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-48 effector <400> 84 Met Ser Val Ile Thr Ile Gln Cys Arg Leu Val Ala Lys Glu Phe Ser 1 5 10 15 Leu Arg Tyr Leu Trp Glu Leu Met Ala Gln Lys Asn Thr Pro Leu Val 20 25 30 Asn Glu Leu Leu Gln Ala Ile Val Gln His Ser Asp Phe Glu Ser Trp 35 40 45 Leu Gln Lys Gly Ser Ile Pro Gln Ala Thr Ile Lys Ala Leu Cys Asp 50 55 60 Ser Leu Lys Asn Asp Pro Arg Phe Ser Gly Gln Pro Gly Cys Phe Tyr 65 70 75 80 Thr Ser Ala Thr Ser Leu Val Ser Tyr Asn Tyr Lys Ser Trp Phe Ala 85 90 95 Leu Gln Lys Arg Arg Gln Gln Lys Ile Glu Gly Lys Glu Arg Trp Leu 100 105 110 Asn Leu Leu Lys Ser Glu Arg Glu Leu Glu Glu Glu Cys Asp Arg Thr 115 120 125 Leu Glu Glu Ile Arg Ala Lys Ala Thr Gln Ile Leu Thr Gln Phe Gln 130 135 140 Pro Gln Ala Glu Asn Ala Glu Thr Pro Pro Gly Glu Ala Thr Gln Lys 145 150 155 160 Lys Lys Gly Lys Lys Ser Lys Ser Thr Pro Ser Lys Gly Lys Ala Ala 165 170 175 Ser Leu Phe Asn Thr Leu Phe Asn Ala Tyr Ala Gln Thr Lys Asp Pro 180 185 190 Leu Glu Arg Cys Ala Leu Ala Tyr Leu Leu Lys Asn Asn Gly Glu Val 195 200 205 Ser Leu Val Glu Glu Asp Leu Glu Ala Tyr Gln Gln Arg Arg Arg Lys 210 215 220 Lys Glu Ile Glu Ile Glu Arg Leu Lys Glu Gln Leu Lys Ser Arg His 225 230 235 240 Pro Lys Gly Arg Asp Leu Thr Ala Glu Lys Trp Leu Glu Thr Leu Glu 245 250 255 Ala Ala Arg Thr Gln Gln Pro Glu Ser Glu Ala Glu Ala Ala Thr Trp 260 265 270 Gln Ala Asn Leu Leu Arg Asn Ser Ser Pro Val Pro Phe Pro Val Asn 275 280 285 Tyr Glu Thr Asn Glu Asp Leu Thr Trp Phe Lys Asn Glu Ala Gly Arg 290 295 300 Ile Cys Val Phe Phe Ser Gly Leu Arg Glu His His Phe Glu Val Trp 305 310 315 320 Cys Asp Asn Arg Gln Leu His Trp Phe Glu Arg Phe Phe Gln Asp Gln 325 330 335 Gln Ile Lys Arg Gln Ser Lys Asn Gln His Ser Ser Ser Leu Phe Thr 340 345 350 Leu Arg Ser Gly Arg Ile Gly Trp Gln Glu Cys Thr Gly Glu Gly Glu 355 360 365 Ala Trp Asn Ile His His Leu Lys Leu Tyr Cys Thr Leu Asp Thr Arg 370 375 380 Leu Trp Thr Ala Glu Gly Thr Glu Gln Val Ala Gln Glu Lys Ala Ala 385 390 395 400 Glu Ile Ser Asn Ile Leu Thr Lys Thr Lys Gln Lys Asp Asp Leu Asn 405 410 415 Glu Lys Gln Leu Ala Phe Ile Lys Arg Gly Glu Thr Met Leu Ala Arg 420 425 430 Ile Asn Thr Pro Phe Pro Arg Pro Ser Lys Pro Leu Tyr Gln Gly Gln 435 440 445 Ser Glu Ile Val Val Gly Val Ser Leu Gly Leu Glu Lys Pro Ala Thr 450 455 460 Val Ala Val Ile Asp Val Pro Gly Asp Arg Val Leu Ala Tyr Arg Asn 465 470 475 480 Val Lys Gln Leu Leu Gly Asp His Tyr Pro Leu Leu Asn Arg Arg Arg 485 490 495 Gln Gln Gln Arg Ser Leu Ser Gln Lys Arg Gln Lys Ala Gln Lys Gln 500 505 510 Gly Ala Ala Asn Glu Phe Gly Glu Ser Glu Leu Gly Gln Tyr Ile Asp 515 520 525 Arg Leu Leu Ala Lys Glu Ile Val Ala Ile Ala Arg Ser Tyr Gln Ala 530 535 540 Gly Ser Ile Ala Leu Pro Lys Leu Thr Asp Ile Arg Glu Ile Leu His 545 550 555 560 Ser Glu Met Gln Thr Arg Val Glu Lys Lys Ile Pro Gly Tyr Lys Glu 565 570 575 Ala Gln Asp Lys Tyr Ala Lys Gln Tyr Arg Val Asn Val His Arg Trp 580 585 590 Ser Tyr Gly Arg Leu Met Asp Ala Ile Ala Ser Gln Ala Ala Lys Val 595 600 605 Gly Ile Val Ile Glu Val Gly Lys His Pro Ser Glu Gly Ser Phe Gln 610 615 620 Asp Lys Ala Arg Glu Val Ala Ile Ser Ala Tyr Cys Asp Arg Ser Val 625 630 635 640 Asn <210> 85 <211> 709 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-49 effector <400> 85 Met Ser Ile Ile Thr Ile Arg Cys Arg Leu Val Ala Gly Ile Lys Gln 1 5 10 15 Gln Ile Asp Lys Lys Ser Ile Lys Asn Phe Ser Ala Glu Asp Arg Ala 20 25 30 Leu Leu Gln Lys Leu Leu Asp Asp Lys Ser Gln Thr Asp Arg Asp Asn 35 40 45 Pro Lys Asp Lys Gln Lys Ile Phe Leu Ala Gln Ser Ser Glu Asp Val 50 55 60 Arg Gln Asn Leu Trp Gln Leu Phe Phe Thr Ser Ser Ala Leu Ile Asp 65 70 75 80 Gln Leu Leu Asp Arg Leu Ser Gln His Pro Asn Val Gln Thr Trp Gln 85 90 95 Gln Gln Gly Lys Leu Pro Asp Asp Glu Leu Lys Ala Cys Trp Leu Glu 100 105 110 Leu Lys Thr Ser Pro Leu Tyr Asp Glu Lys Leu Pro Gly Arg Phe Phe 115 120 125 Ser Ser Val Gln Ser Met Val Lys Thr Ile Tyr Ala Ser Trp Leu Ala 130 135 140 Leu His Gln Gln Lys Gln Arg Arg Leu Asn Gly Leu Asn Arg Leu Thr 145 150 155 160 Glu Ile Val Tyr Ser Asp Glu Thr Leu Leu Glu Met Cys Asp Ser Thr 165 170 175 Phe Ala Gln Leu Gln Leu Asn Ala Ala Ser Met Leu Ser Glu Ile Asp 180 185 190 Lys Glu Val Val Asn Ser Glu Lys Ser Arg Ser Arg Ile Asp Leu Leu 195 200 205 Phe Lys Lys Tyr Thr Glu Leu Pro Val Glu Asp Thr Ile Gly Arg Ser 210 215 220 Ala Ile Ser Tyr Leu Ile Lys His Gly Cys Lys Ile Glu Ser Lys Ile 225 230 235 240 Glu Leu Thr Pro Lys Phe Ala Arg Trp Phe Lys Thr Lys Leu Lys Gln 245 250 255 Ala Gln Arg Leu Glu His Gln Leu Ala Gly His Phe Pro Arg Gly Arg 260 265 270 Asp Leu Asn Gly Ile Ala Phe Leu Asn Ala Leu Glu Thr Ala Thr Lys 275 280 285 Asp Glu Pro Gln Asp Asn Pro Glu Leu Met Leu Trp Gln Ser Gln Ile 290 295 300 Leu Arg Asp Pro Ser Ser Leu Pro His Pro Ile Glu Phe Asn Ser Asn 305 310 315 320 Thr Asp Leu Arg Trp Leu Lys Leu Tyr Arg Lys Gln Tyr Gln Cys Lys 325 330 335 Arg Thr Val Ser Gly Asp Ser Ile Asp Ser Ile Glu Leu Thr Gln Arg 340 345 350 Leu Phe Val Glu Phe Lys Gly Leu Thr Gln Gly Ser Asn Tyr Val Phe 355 360 365 Glu Val Tyr Cys Asp Arg Arg Gln Leu Ala Ile Phe Gln Gln Phe Phe 370 375 380 Asp Asp Asp Arg Leu Leu Arg Asn Ser Ser Ser Glu Glu Lys Tyr Ser 385 390 395 400 Ser Ser Leu Phe Thr Leu Arg Ser Ala Tyr Leu Leu Trp Asp Arg Gln 405 410 415 Glu Ser Gln Asp Arg Tyr Arg Arg His Thr Leu Ser Ile Gln Thr Ala 420 425 430 Thr Glu Pro Trp Asn Thr Asn Gln Leu Tyr Leu His Cys Ser Ile Glu 435 440 445 Thr Lys Ser Leu Thr Ala Glu Gly Met Arg Glu Ile Gln Gln Gln Lys 450 455 460 Thr Gln Lys Val Asn Asn Ile Leu Ala Lys Gln Ser Lys Asn Ala Tyr 465 470 475 480 Pro Ser Ile Asp Gln Gln Gln Ser Gln Arg Lys Asn Gln Thr Ser Leu 485 490 495 Asn Leu Leu Asp Arg Ser Leu Pro Arg Pro Ser Arg Pro Ile Tyr Gln 500 505 510 Gly Asn Pro Gln Ile Ile Val Gly Leu Ile Phe Asp Pro Val Arg Pro 515 520 525 Ile Tyr Leu Ala Val Val Asp Val Thr Thr Gly Lys Pro Ile Thr Tyr 530 535 540 Arg Ser Thr Arg Gln Leu Leu Gly Asp Lys Tyr Gln Lys Leu Ser Glu 545 550 555 560 Tyr Arg Leu Lys Gln Gln Gln Asn Ser His His Arg Arg Lys His Asn 565 570 575 Gln Gln Gly Gln Phe Gln Gln Pro Thr Glu Ser Thr Gln Gly Glu Tyr 580 585 590 Leu Asn Arg Leu Leu Ala Lys Ala Val Ile Gln Ile Ala Gln Glu Phe 595 600 605 Lys Ala Ala Ser Ile Ala Leu Pro Pro Ile Asn His Asn Ile Glu Lys 610 615 620 Val Gln Ser Lys Ile Glu Ala Asp Ala Glu Glu Asp Leu Pro Glu Asp 625 630 635 640 Val Gly Thr Gln Lys Lys Ile Thr Arg Lys Thr Ser Val Val Ile His 645 650 655 Lys Trp Ser Tyr His Ser Leu Leu Glu Tyr Val Lys Ser Asn Ala Ala 660 665 670 Lys Leu Gly Ile Thr Val Glu Thr Val Ser Leu Pro Ser Leu Gly Thr 675 680 685 Pro Ser Gln Gln Ala Ala Glu Val Ala Ile Ser Ala Tyr Asn Ser Arg 690 695 700 Lys His Ile Lys Lys 705 <210> 86 <211> 642 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-50 effector <400> 86 Met Arg Tyr Ala Ile Ser Met Ser Gln Ile Thr Ile Gln Cys Gln Leu 1 5 10 15 Phe Ala Asp Glu Ala Ala Arg Lys Tyr Leu Trp Gln Leu Met Thr Ala 20 25 30 Arg Asn Thr Pro Leu Val Asn Glu Leu Leu Arg Leu Ile Ala Leu His 35 40 45 Pro Asp Phe Leu Lys Trp Arg Ser Ser Gly Lys Leu Pro Thr Thr Glu 50 55 60 Val Thr Lys Leu Ala Lys Thr Leu Lys Thr Asp Glu Arg Phe Asn Asn 65 70 75 80 Gln Pro Ala Lys Phe His Ile Ser Ala Glu Lys Thr Ala Ile Tyr Thr 85 90 95 Phe Lys Ser Trp Leu Ala Ile Gln Lys Arg Ala Gln Gln Gln Leu Glu 100 105 110 Gly Lys Ile Ser Trp Leu Arg Met Leu Arg Thr Asn Glu Glu Leu Val 115 120 125 Ala Asp Cys Gly Gln Asp Leu Ala Gln Ile Arg Thr Lys Ala Gln Ala 130 135 140 Leu Ile Leu Gln Tyr Gln Ser Ser Glu Asp Ser Ala Glu Ser Gln Lys 145 150 155 160 Asn Phe Arg Lys Ser Leu Tyr Gln Ala Tyr Asp Ile Ala Glu Pro Arg 165 170 175 Leu Gly Ala Gln Asn Glu Arg Ser Leu Thr Arg Ser Ala Ile Ala Tyr 180 185 190 Leu Leu Lys Asn Arg Cys His Ile Pro Ser Asp Thr Asp Glu Asp Leu 195 200 205 Lys Lys Phe Leu Lys Tyr Arg Arg Lys Ile Glu Asn Gln Val Lys Arg 210 215 220 Leu Thr Gln Gln Leu Glu Asn Arg Leu Pro Gln Gly Arg Asp Leu Thr 225 230 235 240 Gly Glu Arg Phe Leu Lys Thr Leu His Ser Ala Thr Lys Ser Val Ser 245 250 255 Val Asp Asn Thr Glu Ala Ser Arg Trp Gln Ser Gln Leu Leu Glu Arg 260 265 270 Pro Asp Leu Val Pro Phe Pro Ile Thr Leu Glu Ser Asn Met Asp Leu 275 280 285 Met Trp Phe Ile Thr Gln Gln Asp Lys Ile Gly Leu His Ile Gly Gly 290 295 300 Ile Ser Glu His Glu Phe Thr Ile Gly Cys Gly Gln Arg Gln Leu His 305 310 315 320 Tyr Phe Gln Arg Phe Leu Ser Asp Tyr Gln Thr Met Leu Ala Ser Lys 325 330 335 Arg Gln His Thr Ser Ser Leu Phe Leu Leu Arg Ser Ala Lys Ser Ile 340 345 350 Trp Ile Pro Ser Lys Asp Lys Gly Glu Pro Trp Asn Val His Gln Leu 355 360 365 Tyr Leu Ser Cys Thr Leu Asp Thr Arg Leu Leu Thr Ser Glu Gly Thr 370 375 380 Glu Leu Val Lys Gln Glu Val Ala Ala Gly Thr Thr Lys Lys Leu Val 385 390 395 400 Thr Met Gln Glu Lys Leu Asp Arg Thr Asp Asn Gln Asp Asn Tyr Val 405 410 415 Lys Arg Leu Gln Ser Thr Leu Asp Arg Leu Asp Arg Pro Phe Asn Arg 420 425 430 Pro Ser Lys Pro Leu Tyr Gln Gly Gln Ser Asn Ile Ile Val Ala Val 435 440 445 Ser Met Gly Leu Gln Ser Pro Val Thr Ala Ile Ala Ile Asp Ile Thr 450 455 460 Thr Gln Lys Ile Leu Ala Tyr Arg His Thr Lys Gln Leu Leu Gly Asp 465 470 475 480 Asp Tyr Arg Leu Val Asn Arg Gln Arg Asn Leu Gln Thr Gln Gln Arg 485 490 495 His Ser Ser His Lys Ala Gln Lys Gln Gly Leu Ser Arg Gln Cys Ser 500 505 510 Asn Ser Glu Leu Gly Glu His Leu Asp Arg Leu Phe Ala Lys Ala Ile 515 520 525 Val Glu Leu Ala Gln Thr Tyr Gln Ala Gly Ser Ile Ala Leu Pro Lys 530 535 540 Leu Asp Gln Ile Arg Leu Ser Ile Gln Ser Glu Ile Asp Thr Lys Ala 545 550 555 560 Gln Gln Lys Ile Pro Gly Tyr Val Glu Gly Gln Lys Lys Tyr Ala Lys 565 570 575 Gln Ile Arg Ile Asn Leu His Asn Trp Ser Tyr Asn Arg Val Ser Gln 580 585 590 Leu Ile Ile Asn Lys Ala Gly Gln Ser Gly Ile Ala Ile Glu Tyr Gly 595 600 605 Asp Gln Pro Ala Arg Ala Ser Pro Asn Val Arg Glu Ala Ser Arg Asn 610 615 620 Glu Asn Arg Ala Gly Glu Ile Ala Leu Ser Ala Tyr Ala Lys Arg Thr 625 630 635 640 Ile Pro <210> 87 <211> 467 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-51 effector <400> 87 Met Phe Pro Ser Phe Cys Ser Pro Pro Phe Leu Ser Tyr Phe Ser Thr 1 5 10 15 Pro Leu Asn Gly Tyr Asn Arg Cys Ala Ile Ser Tyr Leu Leu Lys Asn 20 25 30 Gly Cys Lys Ile Asn Asp Lys Glu Glu Asn Pro Glu Lys Phe Ala Gln 35 40 45 Arg Arg Arg Lys Leu Glu Ile Gln Ile Gln Arg Leu Thr Glu Lys Leu 50 55 60 Ala Ala Arg Ile Pro Lys Gly Arg Asp Leu Thr Asp Thr Gln Trp Leu 65 70 75 80 Glu Ala Leu Phe Thr Ala Thr Gln Thr Val Pro Glu Asn Glu Thr Glu 85 90 95 Ala Lys Phe Trp Gln Asn Ser Leu Leu Lys Lys Ser Ser Ser Val Pro 100 105 110 Phe Pro Val Ala Tyr Glu Thr Asn Glu Asp Leu Val Trp Val Lys Asn 115 120 125 Gln Phe Gly Arg Ile Cys Ile Lys Phe Ser Gly Leu Ser Glu His Thr 130 135 140 Phe Gln Ile Tyr Cys Asp Ser Arg Gln Leu His Trp Phe Gln Arg Leu 145 150 155 160 Leu Glu Asp Gln Lys Ile Lys Lys Asn Ser Lys Asn Gln His Ser Ser 165 170 175 Ala Leu Phe Thr Leu Arg Ser Gly Arg Ile Ser Trp Gln Glu Gly Glu 180 185 190 Asp Lys Gly Asp Pro Trp Asn Val His His Leu Thr Leu Tyr Cys Ser 195 200 205 Val Asp Thr Arg Leu Trp Thr Glu Glu Gly Thr Asn Leu Val Lys Glu 210 215 220 Glu Lys Ala Glu Glu Ile Ala Lys Thr Ile Thr Gln Thr Gln Ala Lys 225 230 235 240 Gly Asp Leu Asn Asp Asn Gln Gln Ala His Ile Lys Arg Lys Asn Ser 245 250 255 Ser Leu Ala Arg Ile Asn Asn Pro Phe Pro Arg Pro Ser Gln Pro Leu 260 265 270 Tyr Gln Gly Gln Ser His Ile Leu Val Gly Val Ser Leu Gly Leu Glu 275 280 285 Asn Pro Ala Thr Ile Ala Ile Val Asp Gly Thr Thr Ser Lys Val Leu 290 295 300 Thr Tyr Arg Asn Ile Lys Gln Ile Leu Gly Asp Asn Tyr Lys Leu Leu 305 310 315 320 Asn Lys Gln Arg Gln Gln Lys His Leu Leu Ser His Gln Arg His Ile 325 330 335 Ala Gln Arg Met Ala Ala Ser Asn Glu Phe Gly Asp Ser Glu Leu Gly 340 345 350 Glu Tyr Ile Asp Arg Leu Leu Ala Lys Glu Ile Ile Ala Ile Ala Gln 355 360 365 Thr Tyr Lys Ala Gly Ser Ile Val Leu Pro Lys Leu Gly Asp Met Arg 370 375 380 Glu Gln Val Gln Ser Glu Ile Lys Ala Lys Ala Glu Gln Lys Ser Asp 385 390 395 400 Leu Val Glu Val Gln Gln Lys Tyr Ala Lys Gln Tyr Arg Val Ser Val 405 410 415 His Gln Trp Ser Tyr Gly Arg Leu Ile Ala Asn Ile Gln Cys Gln Ala 420 425 430 Asn Lys Ala Gly Ile Val Ile Glu Glu Ala Lys Gln Pro Ile Arg Gly 435 440 445 Ser Pro Gln Glu Lys Ala Lys Glu Leu Ala Ile Asn Ala Tyr Gln Ser 450 455 460 Arg Lys Ala 465 <210> 88 <211> 814 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-52 effector <400> 88 Met Ala Ile Arg Thr Met Glu Thr Asp Val Ile Val Arg Thr Ser Lys 1 5 10 15 Pro Arg Glu Ser Lys Arg Ser Ile Asp Asp Leu Val Leu Phe Asp Glu 20 25 30 Ala Ala Trp Cys Arg Val Cys Glu Phe Gly Tyr Gln His Thr Leu Phe 35 40 45 Val Asp Thr Ile Met Lys Gln Val Lys Gln Leu Pro Ile Asn Trp Leu 50 55 60 Tyr Thr Asn Gln Glu Leu Gln Lys Gln Asp Asp Thr Thr His Glu Thr 65 70 75 80 Glu Thr Lys Gln Gly Gln Asn Gly Leu Pro Glu Gly Leu Val Lys Ala 85 90 95 Leu His Asp Ala Leu Ala Ser Thr Pro Gln Leu Ser Lys Met Ser Gly 100 105 110 Arg Phe Tyr Ala Ser Ala Ile Asp Arg Val Glu Glu Ile Ile Glu Ser 115 120 125 Trp Phe Ala Ala His Gln Lys Leu Ile His Lys Leu Arg Gly Gln Arg 130 135 140 Arg Trp Leu Ala Ala Val Glu Ser Asp Thr Ala Leu Ala Glu Ser Ser 145 150 155 160 His Phe Ser Gln Tyr Glu Ile Glu Gln Arg Ala Ala Gln Ile Leu Ala 165 170 175 Glu Leu Glu Ala Lys Gly Glu Leu Thr Ala Ala Ser Gly Asn Gln Thr 180 185 190 Pro Phe Asn Val Leu Phe Lys Gln Phe Asp Glu Thr Glu Ala Val Leu 195 200 205 Ser Arg Arg Ala Ile Ile His Leu Leu Lys Asn Ile Asn Glu Val Gln 210 215 220 Val Lys Leu Lys Gln Pro Lys Lys Gly Lys Gly Arg Asn Lys Ala Ala 225 230 235 240 Gln Arg Ser Leu Thr Glu Arg Leu Glu Ala Lys Arg Val Glu Ile Glu 245 250 255 Arg Leu Glu Lys Gln Leu Leu Gly Gln Leu Pro Arg Ala Arg Asn Leu 260 265 270 Phe Pro Asp Gln Ala Phe Asp Gln Arg Leu Glu Ala Leu Ile Asp Met 275 280 285 Pro Leu Ser Glu Ala Thr Glu Leu Glu Arg Tyr Tyr Phe Leu Tyr Phe 290 295 300 Ser Leu Leu Leu Tyr Leu Ser Gly Ser Asn Thr Tyr Val Gln Leu Glu 305 310 315 320 Gln His Leu Leu Ile Ala Leu Val Leu Gln Trp Ser Lys Leu Asp Asp 325 330 335 Leu His Tyr Tyr Arg Ala Leu Asn Tyr Ser Phe Ile Leu Tyr Ala Ala 340 345 350 Ser Glu Gln Gln Tyr Leu Gln Leu Gly Ser Tyr Leu Leu Gln Ser Ile 355 360 365 Lys Ile Glu Ala Glu Arg Val Glu Ala Ala Phe Phe Ala Trp His Glu 370 375 380 Ser Ile Thr Pro Lys Leu Gln Asp Phe Leu Arg Glu Pro Lys Ala Leu 385 390 395 400 Pro Tyr Pro Ile Ser Phe Gly Tyr Glu Asp Val Arg Ser Trp His Val 405 410 415 Asn Gln Lys Gly Lys Ile Phe Phe Lys Leu Asn Gly Trp Gly Asp Leu 420 425 430 Leu Phe Glu Val Arg Cys His Arg Arg Gln Leu Ser Leu Ile Lys Thr 435 440 445 Phe Cys Lys Asp Trp Gln Thr Lys Asn Asn Ala Glu His Lys Gly Gln 450 455 460 Tyr Ser Gly Ser Leu Met Leu Leu Arg Ser Ile Glu Leu Ile Trp Lys 465 470 475 480 Pro Lys Lys Ala Ser Glu Gln Lys Asp Ala Gln Leu Cys Ser Gln Cys 485 490 495 Glu Val Phe Gln Gln Tyr Gly Gly Lys Gly Phe Trp Asn Glu Cys Lys 500 505 510 Leu Thr Ile His Trp Thr Phe Asp Thr Asp Gly Leu Thr Lys Gln Gly 515 520 525 Ser Glu Gln Ile Arg Gln Arg Lys Leu Lys Pro Gln Leu Lys Lys Leu 530 535 540 Gln Asp Asp Gln Ala Ala Leu Glu Gln Lys Gln Asp Arg Leu Asn Lys 545 550 555 560 Leu Glu Gln Gln Val Ala Glu Pro Ser Gln Ser Gln Ala Gln Leu Lys 565 570 575 Arg Leu Glu Pro Leu Lys Lys Glu Val Gln Lys Leu Gln Glu Lys Leu 580 585 590 Ala Lys Pro Arg Pro Lys Leu Asp Cys Leu Gln Ala Ala Lys Pro Phe 595 600 605 Asp Arg Pro Asp Arg Pro Leu Tyr Glu Gly Ile Pro Asn Ile Phe Val 610 615 620 Gly Val Leu Leu Asp Leu Asp Lys His Leu Val Val Thr Val Val Asp 625 630 635 640 Ala Met Arg Arg Lys Arg Leu Thr Leu Arg Ser Ala Arg Lys Val Ser 645 650 655 Pro Glu Gly Tyr Arg Leu Leu Gln Lys Tyr Phe Arg Gln Arg Gln Glu 660 665 670 His Ser Gln Gln Arg Gln Gln Asp Gln Lys Ala Gln Arg Arg Ser His 675 680 685 Gln Thr Glu Ser Gly Leu Gly Gln Gln Val Ala Arg Leu Phe Ala Lys 690 695 700 Gly Leu Val Glu Leu Ala Gln Ala Tyr Lys Ala Ser Thr Ile Val Ile 705 710 715 720 Pro Ile Thr Gly Gly Trp Arg Glu Arg Leu Tyr Ser Gln Leu Val Ala 725 730 735 Arg Ala Lys Ile Arg Cys Asn Gly Ser Lys Gln Ala Val Asp Arg Tyr 740 745 750 Thr Lys Glu His Gly Glu Arg Leu His Gln Trp Asp Tyr Asn Arg Leu 755 760 765 Ser Gln Ala Ile Thr Asp Cys Ala Ala Thr His Gly Ile Glu Ile Val 770 775 780 Leu Gln Lys Thr Val Phe Glu Ala Asp Val Phe Gln Gln Ser Ala Asn 785 790 795 800 Leu Ala Ile Ala Ala Tyr Asp Ser Leu Asn Ser Glu Pro Pro 805 810 <210> 89 <211> 637 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-53 effector <400> 89 Ser Met Ser Gln Ile Thr Ile Gln Cys Gln Leu Phe Ala Asp Glu Ala 1 5 10 15 Ala Arg Lys Tyr Leu Trp Gln Leu Met Thr Asp Arg Asn Thr Pro Leu 20 25 30 Val Asn Glu Leu Leu Arg Leu Ile Ala Leu His Pro Asp Phe Leu Lys 35 40 45 Trp Arg Ser Ser Gly Lys Leu Pro Thr Thr Glu Val Thr Lys Leu Ala 50 55 60 Lys Thr Leu Lys Thr Asp Glu Arg Phe Asn Asn Gln Pro Ala Lys Phe 65 70 75 80 His Ile Ser Ala Glu Lys Thr Ala Ile Tyr Thr Phe Lys Ser Trp Leu 85 90 95 Ala Ile Gln Lys Arg Ala Gln Gln Gln Leu Glu Gly Lys Ile Ser Trp 100 105 110 Leu Arg Met Leu Arg Thr Asn Glu Glu Leu Val Ala Asp Cys Gly Gln 115 120 125 Asp Leu Ala Gln Ile Arg Thr Lys Ala Gln Ala Leu Ile Leu Gln Tyr 130 135 140 Gln Ser Ser Glu Asp Ser Ala Glu Ser Gln Lys Asn Phe Arg Lys Ser 145 150 155 160 Leu Tyr Gln Ala Tyr Asp Ile Ala Glu Pro Arg Leu Gly Ala Gln Asn 165 170 175 Glu Arg Ser Leu Thr Arg Ser Ala Ile Ala Tyr Leu Leu Lys Asn Arg 180 185 190 Cys His Ile Pro Ser Asp Thr Asp Glu Asp Leu Lys Lys Phe Leu Lys 195 200 205 Tyr Arg Arg Lys Ile Glu Asn Gln Val Lys Arg Leu Thr Gln Gln Leu 210 215 220 Glu Asn Arg Leu Pro Gln Gly Arg Asp Leu Thr Gly Lys Arg Phe Leu 225 230 235 240 Lys Thr Leu Asp Ser Ala Thr Lys Ser Val Pro Val Asp Asn Thr Glu 245 250 255 Ala Ser Arg Trp Gln Ser Gln Leu Leu Glu Arg Pro Asp Leu Val Pro 260 265 270 Phe Pro Ile Thr Leu Glu Ser Asn Met Asp Leu Met Trp Phe Ile Ala 275 280 285 Gln Gln Asp Lys Ile Gly Leu His Ile Gly Gly Ile Ser Glu His Glu 290 295 300 Phe Thr Ile Gly Cys Gly Gln Arg Gln Leu His Tyr Phe Gln Arg Phe 305 310 315 320 Leu Ser Asp Tyr Gln Thr Met Leu Ala Ser Lys Arg Gln His Thr Ser 325 330 335 Ser Leu Phe Leu Leu Arg Ser Ala Lys Leu Ile Trp Ile Pro Ser Lys 340 345 350 Asp Lys Gly Glu Pro Trp Asn Val His Gln Leu Tyr Leu Ser Cys Thr 355 360 365 Leu Asp Thr Arg Leu Leu Thr Ser Glu Gly Thr Glu Leu Val Lys Gln 370 375 380 Glu Val Ala Ala Gly Thr Thr Lys Lys Leu Val Thr Met Gln Glu Lys 385 390 395 400 Leu Asp Arg Thr Asp Thr Gln Asp Asn Tyr Val Lys Arg Leu Gln Ser 405 410 415 Thr Leu Asp Arg Leu Asp Arg Pro Phe Asn Arg Pro Ser Lys Pro Ser 420 425 430 Tyr Gln Gly Gln Ser Asn Ile Ile Val Ala Val Ser Met Gly Leu Gln 435 440 445 Ser Pro Val Thr Ala Ile Ala Ile Asp Ile Thr Thr Gln Lys Ile Leu 450 455 460 Ala Tyr Arg Asn Thr Lys Gln Leu Leu Gly Asp Asp Tyr Arg Leu Val 465 470 475 480 Asn Arg Gln Arg Asn Leu Gln Thr Gln Gln Arg His Leu Ser His Lys 485 490 495 Ala Gln Lys Gln Gly Leu Ser Arg Gln Cys Ser Asn Ser Glu Leu Gly 500 505 510 Glu His Leu Asp Arg Leu Phe Ala Lys Ala Ile Val Glu Leu Ala Gln 515 520 525 Thr Tyr Gln Ala Gly Ser Ile Ala Leu Pro Lys Leu Asp Gln Ile Arg 530 535 540 Leu Ser Ile Gln Ser Glu Ile Asp Thr Lys Ala Gln Gln Lys Ile Pro 545 550 555 560 Gly Tyr Val Glu Gly Gln Lys Lys Tyr Ala Lys Gln Ile Arg Ile Asn 565 570 575 Leu His Asn Trp Ser Tyr Asn Arg Val Ser Gln Leu Ile Ile Asn Lys 580 585 590 Ala Gly Gln Ser Gly Ile Ala Ile Glu Tyr Gly Asp Gln Pro Ala Arg 595 600 605 Ala Ser Pro Asn Val Arg Glu Ala Ser Arg Asn Glu Asn Arg Ala Arg 610 615 620 Glu Ile Ala Ile Ser Ala Tyr Ala Lys Arg Thr Ile Pro 625 630 635 <210> 90 <211> 376 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-2 effector intergenic region encoding tracrRNA <400> 90 cacacaacag aaccttgata atagaatagt aaataattaa tagcgccgcc gttcatgctt 60 ctaggagcct ctgaaaggtg acaaatgcgg gttagtttgg ctgttgtcag acagtcttgc 120 tttctgaccc tggtagctgc ccaccccgaa gctgctgttc cttgtgaaca ggaattaggt 180 gcgcccccag taataagggt atgggtttac cacagtggtg gctactgaat cacctccgag 240 caaggaggaa cccactttaa ttttttttcg taaagccaag cgggagccaa aaccctaggg 300 ggtttacgaa agtctcacga ttcttacatt gagtaagttt cagtgttttt gggatggtta 360 accctttatt tacaag 376 <210> 91 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-4 effector intergenic region encoding tracrRNA <400> 91 tatacaaacg tttgaacctg gaaaatagaa taatgagaaa tagcgccgct tgttcatgcg 60 cgaaagcgtc tctgaacagt gtaaatgtgg gttagtttga ctgtcgtgaa gacggtcttg 120 ctttctgacc ctggtagctg cccaccttga agctgctgtc tcttgtagac aggaatcagg 180 tgcgccccca gtaatatagg tgcgggttta ccgcagtggt ggctacccaa tcacctccga 240 gcaaggagga acccacctta attatttttt ggcaaaccaa agtgggagca atttcactgg 300 gaggttcgcc aagttttcaa acaacttatt ttgtagaggt tttgccgttt tctgctaaga 360 aaagattttc ttgtccagat gcagtgataa 390 <210> 92 <211> 462 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-6 effector intergenic region encoding tracrRNA <400> 92 gatttatcag taccgtacct ggaaaattga atataattga taacagcgcc gcaggtcatg 60 ccgtcaaaag cctctgaact gtgttaaatg ggggttagtt tgactgttga aagacagttg 120 tgctttctga ccctggtagc tgcccaccct gatgctgcta tctttcggga taggaataag 180 gtgcgctccc agtaataggg gtgtagatgt actacagtgg tggctactaa atcacctccg 240 accaaggagg aatccatcct taatttttta ttttttcgtg aacctaagcg agagcaaaat 300 ctctaggagg ttcacgaaaa agctgaatcc ttcatggaat atgagtttca gtttgttagt 360 gggatgatgg cttctcctga aaaggagaaa tggagtaaga attttagagg tttacgaaaa 420 tgacctttaa aagctacttc aggcaagtgt tacagcgctc gc 462 <210> 93 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-7 effector intergenic region encoding tracrRNA <400> 93 tcaaaaagac cgtaccttga aaatataatg gtaacaaaca gcgccgcagt tcatgcgtct 60 tatggcgcct ctgtgctgtg caaaatgtgg gttagtttga ctgttggaag acagtcttgc 120 tttctgaccc tggtagctgc ccaccttgaa gctgctatcc cttgtggata ggaatcaggt 180 gcgcccccag taatagaggt gcgggtttac cgcagtggtg gctaccgaat cacctccgag 240 caaggaggaa cccaccttaa ttattttttt ggcatggcaa agcgggagcg attttaccgg 300 gactgatgcc aaagcttcaa atctttttat tgacaaggtt tctagacttt tgtttgtcac 360 ttgatttatt tttttaattg tcaactagca agtgattttg gtagttttgc caaaagtgtc 420 tctaggaatc ttgataaata aagggtttta ggcgcg 456 <210> 94 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-2 effector target CRISPR repeat <400> 94 gtttcaacga ccatcccaac taggggtggg ttgaaag 37 <210> 95 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-4 effector target CRISPR repeat <400> 95 gtttcaactt tccttccagc tagaggcggg ttgaaag 37 <210> 96 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-6 effector target CRISPR repeat <400> 96 gtttcaacca ccatctcaac tagggatggg ttgaaag 37 <210> 97 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-7 effector target CRISPR repeat <400> 97 gtttcaacgc cccttcaagc tttgggcggg ttgaaagc 38 <210> 98 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG108-1 effector target CRISPR repeat <400> 98 gttgcgatcg ccgctccggt ggcgatgggg ttgaaag 37 <210> 99 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG110-1-6 effector target CRISPR repeat <400> 99 gtgacctgcc gcataggcag ctggtaaa 28 <210> 100 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG110-2-6 effector target CRISPR repeat <400> 100 tatgaactgc cgcataggca gccaaga 27 <210> 101 <211> 922 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-13-B transposition protein <400> 101 Met Leu Ser Ser Gln Ala Phe Asn Asp Trp Cys Gln Arg Leu Gln Ile 1 5 10 15 Asn Ser Val Ala Arg Ala Val Ile Glu Gln Val Arg Asn Ala Ala Pro 20 25 30 Ser Arg Gln Val Gln Gly Arg Arg Lys Asn Val Cys Gly Ser Tyr Pro 35 40 45 Ser Arg Lys Met Gly Val Thr Ile Gln Phe Glu Ser His Arg Asn Glu 50 55 60 Leu Ala Arg Ile His Glu Leu Glu His Asp Gln Thr Val Leu Glu Tyr 65 70 75 80 Tyr Asp Gln Pro Pro Pro Ile Glu Leu Val Tyr Ser Ser Lys Thr Gly 85 90 95 Arg Arg Thr Arg His Gln Tyr Thr Pro Asp Phe Phe Val Leu Arg Thr 100 105 110 Asp Gly Val Glu Trp Glu Glu Cys Lys Thr Glu Thr Glu Leu Ile Lys 115 120 125 Leu Ala Gln Glu Asn Ser Asn Arg Tyr Cys Gln Asp Val Glu Gly Lys 130 135 140 Trp His Cys Pro Pro Gly Glu Ala Tyr Ala Gln Val Phe Gly Phe Gln 145 150 155 160 Phe Arg Val Trp Cys Asn Ser Glu Ile Asn Trp Val Leu Gln Asp Asn 165 170 175 Trp Val Trp Leu Glu Asp Tyr Leu Gly Val Glu Val Pro Ser Val Ser 180 185 190 Pro Ala Ala Leu Gln Ala Leu Gln Arg His Leu Gln Gln Thr Pro Gly 195 200 205 Ile Cys Val Ser Glu Leu Leu Ala Val Glu Pro Thr Val Ser Pro Asp 210 215 220 His Leu Tyr His Leu Ile Ala Thr Glu Gln Val Tyr Val Glu Leu Ala 225 230 235 240 Ala Ala Arg Leu Ser Glu Pro Glu Gln Val Arg Val Phe Leu Asp Gln 245 250 255 Asp Met Ala Gln Ala Phe His Arg Ile Gln Gly Glu Phe Glu Leu Val 260 265 270 Gln Thr Asn Lys Gln Ser Met Leu Asn Phe Ser Ile Gly Thr Phe Leu 275 280 285 His Trp Asp Glu Val Glu Trp Glu Val Ile Asn Ile Gly Ala Asn Thr 290 295 300 Val Gly Leu Leu Arg Ser Glu Gly Glu Val Ile Glu Leu Ala Lys Pro 305 310 315 320 Thr Leu Glu Asn Leu Val Ser Arg Gln Arg Ile Val Ala Ser Tyr Asn 325 330 335 Ser Glu Asn Ile Glu Lys Gln Lys Ile Ile Asn Asp Lys Ile Lys Ala 340 345 350 Ile Leu Gln Glu Ala Thr Ser Ala Glu Ile Ala Glu Ala Asn Arg Arg 355 360 365 Tyr Asp Leu Ile Gln Ala Cys Ser Asn Thr Ser Arg His Pro Ser Ser 370 375 380 Thr Val Arg Arg Trp Gln Asn Gln Tyr Gln Lys Ala Glu Lys Ile Tyr 385 390 395 400 Gly Asn Gly Tyr Val Gly Leu Leu Pro Arg Tyr His Thr Lys Gly Asn 405 410 415 Arg Thr Met Arg Ile Asp Asp Ile Ala Tyr Gln Phe Met Ile Glu Phe 420 425 430 Ile Glu Gln His Tyr Glu Asn Pro Lys Gln Arg Arg Lys Gln Arg Val 435 440 445 Tyr Glu Ala Phe Val Ser Ala Cys Glu Ala His Glu Pro Lys Leu Ile 450 455 460 Pro Pro Ser Arg Ile Thr Phe Ser Gln Ala Ile Asp Lys Arg Gly Gly 465 470 475 480 Gln Ala Gln Thr Leu Lys Arg Glu Gly Arg Arg Ala Ala Ile Ala Lys 485 490 495 Glu Ala Phe Tyr Trp Gln Leu Glu Arg Thr Thr Pro Gln His Gly Ser 500 505 510 Arg Pro Phe Glu Ile Val His Leu Asp His Thr Gln Leu Asp Ile Glu 515 520 525 Leu Met Ser Ser Leu Ser Thr Leu Ala Val Gln Pro Leu Ala Ser Asn 530 535 540 His Arg Thr Leu Ser Gln Asn Leu Gly Arg Pro Trp Ala Thr Phe Met 545 550 555 560 Val Asp Ala Tyr Ser Arg Arg Leu Leu Ala Val Tyr Leu Thr Tyr Glu 565 570 575 Glu Pro Ser Tyr Arg Ser Cys Met Met Ala Leu Arg Ile Cys Val Gln 580 585 590 Arg Phe Glu Arg Leu Pro Gln Ile Leu Val Val Asp Asn Gly Val Glu 595 600 605 Phe His Ser His Tyr Phe Glu Glu Leu Leu Ala Tyr Tyr Ala Cys Thr 610 615 620 Lys Lys His Arg Pro Pro Ala Met Ala Arg Phe Gly Ser Val Val Glu 625 630 635 640 Arg Leu Phe Gly Thr Ala Asn Thr Gln Phe Val His Glu Leu Gln Gly 645 650 655 Asn Thr Gln Ile Thr Arg Gln Val Arg Gln Val Thr Gln Ser Ile Asn 660 665 670 Pro Lys Arg Leu Ala Ile Trp Thr Leu Ser Asp Leu Tyr Pro Ala Leu 675 680 685 Cys Glu Trp Ala Tyr Glu Ile Tyr Asp Gln Arg Glu His Pro Ala Leu 690 695 700 Gly Gln Ser Pro His Asp Ile Phe Thr Gln Gly Leu Ala Leu Gly Gly 705 710 715 720 Thr Arg Asp His Arg Arg Val Glu Asn Asn Glu Val Phe Gln Ile Leu 725 730 735 Thr Leu Pro Ala Pro Asp Gln Arg Arg Arg Lys Val Gln Ala Gly Arg 740 745 750 Gly Val Lys Ile His Asn Ile Tyr Tyr Trp Ser Asn Ala Phe Arg Asp 755 760 765 Pro Lys Val Glu Gly Ser Gln Val Glu Val Lys Tyr Asp Pro Phe Asp 770 775 780 Ala Ser Ile Ala Tyr Ala Phe Val His His Gln Trp Val Lys Cys Ile 785 790 795 800 Ser Thr Tyr Cys Ala Asp Leu Gln Gly Arg Ser Glu Arg Glu Leu Arg 805 810 815 Leu Val Ser Glu Glu Leu Arg Gln Arg Gln Arg Val Ala Gly Cys Arg 820 825 830 His Ser Leu Ser Asp Lys Glu Leu Val Glu Phe Leu Asn Ser Gln His 835 840 845 Ala Lys Glu Gly Gln Phe Leu Gln Arg Arg Leu Gln Ala Val Glu Gln 850 855 860 Leu Ala Val Leu Gln Gln Leu Asp Pro Pro Val Asp Asp Ala Asp Ala 865 870 875 880 Glu Ser Gln Gln Ile Glu Phe Gly Gly Asp Ala Gln Pro Ser Cys Asn 885 890 895 Gly Asn Ser Pro Gln Thr Ala Gln Thr Val Pro Ala Ile Val Asn Phe 900 905 910 Ala Val Pro Pro Glu Phe Tyr Gly Glu Phe 915 920 <210> 102 <211> 364 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-13-C transposition protein <400> 102 Met Ala Val Gln Asp Gly Phe Pro Tyr Glu Leu Leu Asp Gln Pro Ile 1 5 10 15 Thr Asp Arg Val Ala Tyr Phe Arg His Tyr Thr Met Ala His Pro Val 20 25 30 Leu Leu Asn Ala Ala Gln Ile Leu Met Gln Thr Val Arg Glu Pro Ala 35 40 45 Gly Ile Ser Leu Val Phe Val Phe Gly Pro Thr Gly Val Gly Lys Ser 50 55 60 Thr Leu Leu Arg Arg Val Ser Gln Lys Leu Thr Glu Ala Met Phe Ala 65 70 75 80 Ala Leu Gln Gln Asp Gln Gly Arg Ile Pro Met Thr Gly Ile Glu Ala 85 90 95 Ala Thr Pro Glu Phe Gly Gln Phe Asp Trp Lys Asp Phe Tyr Leu Arg 100 105 110 Ala Leu Ala Ala Val Gln Glu Pro Phe Ile Tyr Pro Trp Ser Thr Ser 115 120 125 Arg Leu Thr Thr Leu Lys Leu Arg Leu Ala Leu Glu His Ala Leu Arg 130 135 140 Lys Arg Gln Leu Gln Val Phe Tyr Ile Asp Glu Ala Gln Asn Phe Ala 145 150 155 160 Lys Val Ala Ser Ala Arg Lys Leu Ser Asp Gln Thr Asp Ala Ile Lys 165 170 175 Ser Leu Ala Asn Leu Thr Gly Val Gln Phe Val Leu Thr Gly Thr Tyr 180 185 190 Glu Val Leu Met Leu Arg Asn Leu Ser Ala Gln Leu Cys Arg Arg Ser 195 200 205 Ile Asp Ile His Phe Pro Arg Tyr Arg Ala Glu Ile Pro Glu Asp Leu 210 215 220 Gln Ser Phe Arg Gly Ile Val Gln Thr Phe Gln Arg His Leu Pro Leu 225 230 235 240 Pro Gln Glu Pro Asn Leu Leu Glu Gln Trp Glu Phe Cys Tyr Glu Arg 245 250 255 Ser Leu Gly Cys Val Gly Ile Leu Lys Asp Trp Leu Ser Arg Ala Leu 260 265 270 Val Ala Thr Leu Glu Ala Gly Ala Lys Thr Leu Thr Pro Gln Met Leu 275 280 285 Glu Gln His Ala Trp Ser Leu Glu Arg Cys Met Ile Met Leu Ala Glu 290 295 300 Ala Lys Glu Glu Glu Lys Lys Leu Glu Val Gln Pro Leu Gln Ser Ala 305 310 315 320 Leu Arg Ile Ala Leu Gly Leu Glu Thr Ala Val Val Glu Pro Ala Ser 325 330 335 Pro Pro Thr Pro Ser Val Ser Pro Arg Arg Thr Ala Ile Ser Ala Lys 340 345 350 Pro Lys Arg Tyr Pro Val Gly Gly Gly Gln His Asp 355 360 <210> 103 <211> 267 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-13-Q transposition protein <400> 103 Met Ile Glu Val Pro Ser Ile Phe Glu Ser Trp Ser Leu Glu Thr Phe 1 5 10 15 Gln Leu Pro Arg Arg Ser His Leu Tyr Ser Leu Ser Pro Ala Gly Leu 20 25 30 Ala Thr Asp Ala Ile Glu Ser Leu Thr Ser Tyr Leu Thr Arg Leu Ala 35 40 45 Glu Ala His Arg Val Ser Val Arg Lys Leu Leu Asp Glu Lys Ile Leu 50 55 60 Leu Leu Leu Lys Pro Pro Arg Thr Phe Lys Tyr Glu Ile Gln Ser Ala 65 70 75 80 Gln Ser Trp Leu Ala Ala Thr Pro Glu Val Ala Lys Ala Val Glu Cys 85 90 95 Leu Arg Arg Leu Thr Leu Arg Gln Asp Leu Gln His Leu Thr Leu Leu 100 105 110 Pro Trp Gln His Gln Leu Ser Thr Pro Ser Val Phe His Asp Val Gln 115 120 125 Pro Phe Cys Pro Val Cys Phe Glu Glu Ala Arg Asn Thr Asp Ala Ala 130 135 140 Val Tyr Glu Pro Leu Leu Trp Thr Leu Glu Ala Val Lys Val Cys Leu 145 150 155 160 Arg His Arg Arg Tyr Leu Gln Phe Cys Cys Thr Tyr Cys Gly Arg Lys 165 170 175 Gln Pro Phe Leu Lys Leu Glu Ala Arg Pro Gly His Cys Ala His Cys 180 185 190 Gly Ser Trp Leu Gly Leu Glu Leu Pro Phe Phe Val Ser Thr Glu Pro 195 200 205 Glu Glu Leu Asp Trp His Ile Asn Leu Ala Gln Met Leu Gly Gln Arg 210 215 220 Leu Gln Ala Ala Trp Gln Arg Thr Asn Gln Ser Leu Ser Lys Ala Lys 225 230 235 240 Arg Ser Lys Gln Ala Gln Lys Pro Ser Leu Met Ser Leu Leu Glu Ser 245 250 255 Arg Tyr Glu Leu Asp Glu Ile Lys Leu Val Tyr 260 265 <210> 104 <211> 218 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-54 effector <400> 104 Met Thr Ile Ile Thr Val Gln Cys Arg Leu Lys Ala Pro Glu Ala Thr 1 5 10 15 Arg Arg Thr Leu Trp Glu Leu Met Ala Gly Arg Asn Thr Pro Leu Ile 20 25 30 Asn Lys Leu Ile Glu Leu Leu Arg Gly His Pro Asp Leu Asp Lys Trp 35 40 45 Arg Asp Lys Gly Lys Leu Pro Ala Gly Val Val Gly Glu Leu Cys Lys 50 55 60 Thr Leu Lys Ala Asp Pro Leu Tyr Asn Gly Gln Pro Ser Asn Ala Tyr 65 70 75 80 Lys Ser Ala Val Glu Thr Val Glu Glu Gln Phe Glu Ser Leu Leu Ala 85 90 95 Leu His Leu Glu Leu Lys Glu Lys Leu Arg Ile Lys Thr Arg Arg Leu 100 105 110 Ala Ile Phe Lys Ser Asn Ala Glu Leu Met Gln Leu Ser Gly Leu Thr 115 120 125 Leu Asp Asp Met Lys Lys Arg Ala Gly Glu Val Leu Asn Glu Leu Lys 130 135 140 Glu Asp Glu Arg Lys Lys Pro Ile Gly Thr Leu Tyr Arg Lys Tyr Glu 145 150 155 160 Leu Leu Phe Phe Asp Asp Pro Asp Arg Trp Ala Val Cys Tyr Leu Ile 165 170 175 Lys Asn Gly Gly Lys Leu Pro Lys Gly Lys Glu Asp Pro Glu Lys Phe 180 185 190 Glu Lys Ser Arg Arg Lys Leu Glu Ile Met Val Gln Lys Leu Thr Met 195 200 205 Arg Leu Asp Ser Cys Leu Pro Gly Gly Arg 210 215 <210> 105 <211> 541 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-54-B transposition protein <400> 105 Met Asp Lys Thr Asn Asn Pro Thr Leu Thr Glu Gly Leu Glu Gly Glu 1 5 10 15 Ala Ala Leu Arg Leu Glu Val Ile Thr Asp Leu Leu Gln Pro Cys Asp 20 25 30 Arg Ser Thr Tyr Gly Gln Arg Leu Arg Glu Gly Ala Ala Lys Leu Gly 35 40 45 Ile Ser Val Arg Ser Leu Gln Arg Leu Phe Lys Arg Tyr Gln Glu Glu 50 55 60 Gly Leu Ser Ala Leu Met Ser Gly Pro Arg Arg Asp Arg Gly Ala His 65 70 75 80 Arg Ile Gly Glu Glu Trp Ile Gln Phe Ile Val Lys Thr Tyr Gln Asp 85 90 95 Gly Asn Lys Gly Ser Lys Arg Leu Thr Pro Lys Gln Val Ala Ile Arg 100 105 110 Val Arg Ala Gln Ala His Gln Lys Gly Gln Glu Ser Tyr Pro Ser Tyr 115 120 125 Arg Thr Val Leu Arg Val Leu Glu Pro Ser Ile Glu Asn Lys Asn Lys 130 135 140 Ser Ile Arg Ser Pro Gly Trp Arg Gly Glu Ala Leu Ser Leu Lys Thr 145 150 155 160 Arg Asp Gly Asp Ala Leu Glu Ala Ile Arg Ser Asn Gln Val Trp Gln 165 170 175 Cys Asp His Thr Arg Ala Asp Val Leu Leu Val Asp Arg Glu Gly Arg 180 185 190 Leu Ile Gly Arg Pro Trp Leu Thr Thr Val Ile Asp Ser Tyr Ser Arg 195 200 205 Cys Ile Val Gly Ile Asp Leu Ser Phe Asp Ala Pro Ser Ser Gln Lys 210 215 220 Val Ala Leu Ala Leu Arg His Ala Ile Leu Pro Lys Leu Tyr Gly Ala 225 230 235 240 Glu Tyr Lys Leu Asn Cys Glu Trp Asn Ala Tyr Gly Lys Pro Glu Cys 245 250 255 Leu Phe Thr Asp Gly Gly Lys Asp Phe Arg Ser Asn His Leu Ala Glu 260 265 270 Ile Ala Ala Gln Leu Gly Phe Ile Leu Lys Leu Arg Asp Arg Pro Ser 275 280 285 Glu Gly Gly Ile Val Glu Arg Pro Phe Lys Thr Leu Asn Gln Ser Leu 290 295 300 Phe Ser Thr Leu Pro Gly Tyr Thr Gly Pro Asn Val Lys Glu Arg Pro 305 310 315 320 Glu Asp Ala Glu Lys Glu Ala Thr Leu Thr Leu Arg Glu Leu Glu Ile 325 330 335 Leu Ile Val Arg Tyr Ile Val Asp Asn Tyr Asn Gln Lys Gln Asp Ala 340 345 350 Arg Thr Gly Asp Gln Thr Arg Ala Gln Arg Trp Glu Gly Gly Ile Asp 355 360 365 Leu Pro Glu Pro Leu Ser Glu Arg Glu Leu Asp Ile Cys Leu Leu Lys 370 375 380 Ser Thr Arg Arg Lys Ile Gln Arg Gly Gly His Leu Gln Phe Glu Asn 385 390 395 400 Ile Thr Tyr Arg Gly Glu His Leu Gly Gly Tyr Glu Gly Asp Tyr Met 405 410 415 Asn Leu Arg Tyr Asp Pro Arg Asp Ile Thr Ser Ile Trp Val Tyr Arg 420 425 430 Gln Glu Ser Ser Gly Asp Val Phe Leu Cys Arg Ala His Ala Val Gly 435 440 445 Leu Gln Thr Glu Ile Leu Ser Leu Asn Asp Ala Gln Ala Ala Ala Lys 450 455 460 Arg Leu Arg Asp Lys Gly Arg Gly Leu Asp Asn Asn Ser Ile Leu Gln 465 470 475 480 Glu Ser Ile Glu Arg Glu Ala Thr Val Thr Lys Asn Leu Gln Arg Arg 485 490 495 Lys Lys Glu Glu Gln Ala Tyr Lys Thr Pro Thr Pro Ala Pro Glu Glu 500 505 510 Lys Val Glu Leu Thr Pro Glu Val Ser Lys Ile Glu Asp Ile Glu His 515 520 525 Leu Glu Val Trp Asp Leu Asp Glu Leu Asn Gly Trp Gly 530 535 540 <210> 106 <211> 268 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-54-C transposition protein <400> 106 Met Glu Asp Lys Lys Leu Pro Ile Asp Gln Glu Trp Leu Asn Gly Glu 1 5 10 15 Ile Ala Arg Leu Asn Lys Lys Thr Val Ile Pro Ile Glu Gln Val Lys 20 25 30 Ser Leu His Asp Trp Leu Asp Glu Lys Arg Ala Ala Arg Gln Ser Cys 35 40 45 Arg Val Val Gly Glu Ser Arg Thr Gly Lys Thr Val Thr Cys Gln Ser 50 55 60 Tyr Ala Leu Arg Asn Thr Pro Arg Leu Ser Gly Asn Thr Pro Pro Asn 65 70 75 80 Leu Pro Val Val Tyr Val Val Pro Ala Gln Lys Cys Gly Pro Lys Asp 85 90 95 Phe Phe Gly Ala Ile Ile Gly Ala Leu Ile Tyr Arg Ala Val Lys Gly 100 105 110 Ser Thr Ser Glu Leu Arg Asn Arg Ala Thr Glu Ile Leu Lys Ser Cys 115 120 125 Gly Val Glu Met Leu Ile Ile Asp Glu Ala Asp Arg Leu Arg Pro Glu 130 135 140 Thr Phe Ser Glu Val Arg Asp Ile Tyr Asp Asn Leu Glu Ile Ala Val 145 150 155 160 Val Leu Val Gly Thr Asp Arg Leu Asp Ala Ala Ile Lys Arg Asp Glu 165 170 175 Gln Val Tyr Asn Arg Phe Ser Ala Cys Arg Arg Phe Gly Leu Leu Thr 180 185 190 Gly Glu Asp Phe Ile Arg Ala Val Ala Ile Trp Glu Asp Lys Ile Leu 195 200 205 Lys Leu Pro Val Ala Ser Asn Leu Thr Ser Lys Glu Thr Leu Lys Ile 210 215 220 Leu Thr Arg Gly Thr Gly Gly Tyr Ile Gly Lys Leu Asp Gln Ile Leu 225 230 235 240 Lys Gly Ala Ala Ile Arg Ser Leu Arg Lys Gly His Lys Arg Val Glu 245 250 255 Thr Glu Val Leu Lys Glu Val Val Lys Glu Phe Ser 260 265 <210> 107 <211> 178 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-54-Q transposition protein <400> 107 Met Ser Glu Asp Ile Lys Pro Trp Leu Leu Pro Val Gln Pro Glu Pro 1 5 10 15 Gly Glu Ser Leu Ser Ser Phe Leu Gly Arg Val Arg Gln Arg Asn His 20 25 30 Leu Thr Ala Gly Ala Leu Gly Asn Ile Thr Arg Leu Gly Ala Thr Ile 35 40 45 Ala Arg Trp Glu Lys Phe Tyr Leu Asn Pro Phe Pro Ser Ala Ala Gln 50 55 60 Leu Glu Ala Met Ala Ala Ile Val Gly Leu Thr Gly Glu Phe Ile Arg 65 70 75 80 Asp Met Leu Pro Pro Thr Gly Glu Ala Met Lys Cys Glu Pro Ile Arg 85 90 95 Leu Cys Pro Glu Cys Tyr Ala Glu Ser Pro Tyr His Arg Leu Gln Trp 100 105 110 Gln Phe Gln Ser Val Trp Lys Cys Thr Ser His Gly Asn Lys Leu Leu 115 120 125 Ser Lys Cys Pro Val Cys Ser Ala Ser Phe Gly Ile Pro Ser Asn Trp 130 135 140 Asn Gly Tyr Cys Arg Arg Cys Gly Thr Pro Phe Glu Leu Met Arg Ala 145 150 155 160 Arg Ser Glu Ser Ile Pro Ala Leu Ser Pro Val Asp Asp Lys Gly Tyr 165 170 175 Asp Arg <210> 108 <211> 638 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG108 effector sequence <220> <223> MG108-2 effector <400> 108 Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Ser Glu Ser Thr 1 5 10 15 Arg Arg Glu Leu Trp Glu Leu Met Ala Glu Lys Asn Thr Pro Leu Ile 20 25 30 Asn Glu Leu Leu Glu Gln Ile Gly His His Pro Asp Phe Glu Thr Trp 35 40 45 Arg Glu Lys Gly Lys Leu Pro Ala Asp Val Val Lys Gln Leu Ala Glu 50 55 60 Pro Leu Lys Thr Asp Pro Arg Phe Ile Gly Gln Pro Gly Arg Phe Tyr 65 70 75 80 Thr Ser Ala Ile Ala Leu Val Lys Tyr Ile Tyr Lys Ser Trp Phe Ala 85 90 95 Val Met Met Gln Leu Gln Tyr Gln Leu Lys Gly Lys Ile Arg Trp Leu 100 105 110 Glu Met Leu Lys Ser Asp Glu Glu Leu Val Glu Thr Ser Gly Ile Thr 115 120 125 Leu Asp Asn Leu Arg Ile Lys Ala Ala Glu Ile Leu Ala Gln Cys Thr 130 135 140 Pro Gln Pro Asp Ser Val Glu Ser Gln Glu Lys Lys Ser Lys Lys Arg 145 150 155 160 Lys Lys Gly Lys Lys Thr Lys Lys Ser Asp Ser Gln Pro Ser Leu Ser 165 170 175 Lys Asn Leu Phe Asp Thr Tyr Asp Ser Thr Glu Asp Ile Ile Ser Lys 180 185 190 Ser Ala Ile Val Tyr Leu Leu Lys Asn Gly Cys Lys Leu Thr Asp Lys 195 200 205 Glu Glu Asp Pro Lys Glu Phe Ala Lys Arg Arg Arg Thr Thr Glu Ile 210 215 220 Gln Ile Gln Arg Leu Thr Glu Gln Leu Ser Ala Arg Ile Pro Lys Gly 225 230 235 240 Arg Asp Leu Thr Asn Ala Lys Trp Leu Glu Thr Leu Ala Ile Ala Thr 245 250 255 Glu Asn Ala Pro Glu Asn Glu Thr Glu Ala Lys Ser Trp Gln Asn Lys 260 265 270 Leu Leu Arg Lys Ser Ala Ser Val Pro Phe Pro Val Ser Tyr Glu Thr 275 280 285 Asn Glu Asp Leu Thr Trp Phe Lys Asn Asn Lys Gly Arg Leu Cys Val 290 295 300 Tyr Phe Asn Gly Leu Ser Glu His Ile Phe Gln Ile Tyr Cys Asp Ser 305 310 315 320 Gln His Leu His Trp Phe Gln Arg Phe Leu Ala Asp Gln Glu Val Lys 325 330 335 Glu Asn Ser Lys Asn Gln His Ser Ala Ser Leu Phe Thr Leu Arg Ala 340 345 350 Gly Lys Ile Val Trp Gln Glu Gly Glu Gly Lys Gly Glu Pro Trp Asn 355 360 365 Ile Asn His Leu Thr Leu His Cys Ser Val Asp Thr Arg Leu Trp Thr 370 375 380 Ala Glu Gly Thr Gln Gln Val Arg Lys Glu Lys Glu Val Glu Ile Ile 385 390 395 400 Lys Phe Leu Asn Lys Asn Lys Asp Arg Ser Asp Leu Ser Lys Asn Gln 405 410 415 Lys Ala Asn Ile Lys Arg Gln Asn Ser Thr Leu Val Lys Ile Ala Asn 420 425 430 Pro Phe Pro Arg Pro Ser Gln Pro Leu Tyr Gln Gly Gln Gly Gln Ile 435 440 445 Leu Val Gly Val Ser Ile Gly Leu Glu Ser Pro Ala Thr Leu Ala Val 450 455 460 Val Asp Ala Ile Thr Lys Lys Val Ile Thr Tyr Arg Ser Ile Arg Gln 465 470 475 480 Leu Leu Gly Glu Asn Tyr Arg Leu Leu Asn Arg Gln Arg Arg Gln Lys 485 490 495 Gln Ser Leu Ser His Gln Arg Gln Lys Ala Gln Arg Leu Ala Asp Gly 500 505 510 Asn Gln Leu Gly Glu Ser Glu Leu Gly Gln Tyr Ile Asp Arg Leu Ile 515 520 525 Ala Lys Lys Ile Val Val Ile Ala Ala Ala Tyr Asn Ala Gly Ser Ile 530 535 540 Val Leu Pro Lys Leu Gly Asn Val Arg Gln Ile Ile Gln Ser Glu Met 545 550 555 560 Asp Ala Leu Ala Glu Gln Lys Cys Pro Glu Tyr Lys Glu Gly Gln Lys 565 570 575 Lys Tyr Ala Lys Gln Tyr Arg Ile Asn Ile His Gln Trp Ser Tyr Gly 580 585 590 Arg Leu Ile Glu Cys Val Lys Thr Gln Ala Ala Lys Ile Gly Ile Val 595 600 605 Ile Glu Glu Ala Lys Gln Ser Ile Arg Gly Ser Pro Gln Glu Lys Ala 610 615 620 Lys Glu Leu Ala Leu Ala Ala Tyr Asp Ser Arg Ser Asn Asp 625 630 635 <210> 109 <211> 572 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG108 transposition protein sequence <220> <223> MG108-2-B transposition protein <400> 109 Met Tyr Met Gln Asp Asp Arg Thr Arg Ser Ala Glu Ile Pro Ala Pro 1 5 10 15 Ser Ser Gly Glu Gly Asn Ser Glu Val Glu Thr Ser Glu Val Ile Thr 20 25 30 Glu Leu Pro Leu Glu Ala Arg Leu Lys Gln Glu Ile Ile Gln Ser Leu 35 40 45 Leu Glu Pro Cys Asp Arg Ile Thr Tyr Gly Gln Arg Gln Arg Glu Ala 50 55 60 Ala Glu Lys Leu Gly Val Ser Val Arg Thr Val Arg Arg Leu Val Lys 65 70 75 80 Lys Trp Glu Glu Lys Gly Leu Glu Ala Leu Thr Gln Thr Ala Arg Thr 85 90 95 Asp Lys Gly Lys His Arg Ile Asp Glu Glu Trp Gln Glu Phe Ile Ile 100 105 110 Lys Thr Tyr Lys Glu Gly Asn Lys Gly Ser Lys Arg Ile Thr Pro Lys 115 120 125 Gln Val Ala Val Arg Val Gln Val Arg Ala Ala Gln Leu Gly Glu Glu 130 135 140 Lys Tyr Pro Ser Tyr Arg Thr Val Tyr Arg Val Leu Glu Pro Ile Ile 145 150 155 160 Glu Gln Gln Glu Gln Thr Gln Asn Ile Arg Ser Arg Gly Trp Arg Gly 165 170 175 Ser Arg Leu Ser Val Lys Thr Arg Thr Gly Gln Asp Leu Ser Val Glu 180 185 190 Tyr Ser Asn His Val Trp Gln Cys Asp His Thr Arg Val Asp Val Leu 195 200 205 Leu Val Asp Arg His Ser Lys Ile Leu Gly Arg Pro Trp Leu Thr Thr 210 215 220 Val Ile Asp Thr Tyr Ser Arg Cys Ile Val Gly Ile Asn Leu Gly Phe 225 230 235 240 Asp Ala Pro Ser Ser Gln Val Val Ala Leu Ala Leu Arg His Ala Ile 245 250 255 Leu Pro Lys Gln Tyr Gly Leu Glu Tyr Lys Leu His Cys Glu Trp Gly 260 265 270 Thr Phe Gly Lys Pro Glu His Phe Tyr Thr Asp Gly Gly Lys Asp Phe 275 280 285 Arg Ser Asn His Leu Gln Gln Ile Gly Val Gln Leu Gly Phe Val Cys 290 295 300 His Leu Arg Asp Arg Pro Ser Glu Gly Gly Ile Val Glu Arg Pro Phe 305 310 315 320 Gly Thr Phe Asn Thr Glu Leu Phe Ser Thr Leu Pro Gly Tyr Thr Gly 325 330 335 Ser Asn Val Gln Glu Arg Pro Glu Glu Ala Glu Lys Glu Ala Cys Leu 340 345 350 Thr Leu Arg Glu Leu Glu Gln Leu Leu Val Arg Tyr Ile Val Asp Lys 355 360 365 His Asn Gln Ser Ile Asp Ala Arg Met Gly Asp Gln Ser Arg Phe Gln 370 375 380 Arg Trp Glu Ala Gly Leu Ile Ala Val Pro Ser Leu Met Gly Glu Arg 385 390 395 400 Glu Leu Asp Ile Cys Leu Met Lys Gln Thr Arg Arg Thr Ile Tyr Arg 405 410 415 Gly Gly Tyr Leu Gln Phe Glu Asn Leu Thr Tyr Arg Gly Glu His Leu 420 425 430 Ala Gly Tyr Ala Gly Glu Ser Val Val Leu Arg Tyr Asp Pro Arg Asp 435 440 445 Ile Thr Thr Ile Leu Val Tyr Arg Ser Glu Glu Gly Lys Glu Val Phe 450 455 460 Leu Ala Arg Ala Tyr Ala Gln Asp Leu Glu Thr Glu Gln Leu Ala Leu 465 470 475 480 Asp Glu Ala Lys Ala Ser Ser Arg Lys Ile Arg Glu Ala Gly Lys Thr 485 490 495 Val Ser Asn Arg Ser Ile Leu Ala Glu Val Gln Glu Arg Glu Thr Phe 500 505 510 Leu Thr Gln Lys Lys Thr Lys Lys Glu Arg Gln Lys Glu Glu Gln Val 515 520 525 Gln Leu Arg Lys Ala Lys Gln Pro Leu Pro Ile Glu Pro Glu Glu Ile 530 535 540 Glu Val Ala Ser Val Arg Asp Glu Ala Glu Ser Glu Met Pro Glu Val 545 550 555 560 Phe Asp Tyr Asp Gln Met Arg Glu Asp Tyr Gly Trp 565 570 <210> 110 <211> 240 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG108 transposition protein sequence <220> <223> MG108-2-C transposition protein <400> 110 Met Thr Thr Gln Glu Ala Lys Thr Val Ala Gln Gln Leu Gly Asp Phe 1 5 10 15 Pro Val Asn Asp Thr Lys Leu Gln Ala Glu Ile Gln Arg Leu Asn Arg 20 25 30 Lys Thr Phe Val Pro Leu Glu Gln Val Glu Asn Leu His Glu Trp Leu 35 40 45 Glu Glu Lys Arg Gln Ala Arg Gln Ser Gly Arg Val Val Gly Glu Ser 50 55 60 Arg Thr Gly Lys Thr Met Gly Cys Asn Ala Tyr Arg Leu Arg His Lys 65 70 75 80 Pro Lys Gln Glu Leu Gly Lys Pro Pro Ile Val Pro Val Val Tyr Phe 85 90 95 Lys Val Thr Gln Glu Cys Ala Ala Lys Glu Phe Phe Gly Leu Ile Ile 100 105 110 Gln Asn Leu Lys Tyr Gln Val Val Lys Gly Thr Val Pro Glu Leu Arg 115 120 125 Ala Arg Ala Val Gln Val Leu Lys Gly Cys Arg Val Glu Met Leu Ile 130 135 140 Leu Asp Glu Ala Asp Arg Leu Lys Pro Lys Thr Phe Ala Glu Val Gln 145 150 155 160 Asp Ile Phe Asp Asp Leu Glu Leu Ala Val Ile Leu Val Gly Thr Asp 165 170 175 Arg Leu Asp Ala Val Ile Lys Arg Asp Glu Gln Val Tyr Asn Arg Phe 180 185 190 Arg Ala Cys His Arg Phe Gly Lys Leu Ser Gly Glu Glu Phe Lys Arg 195 200 205 Thr Val Glu Ile Trp Glu Lys Lys Val Leu Gln Leu Pro Val Ala Ser 210 215 220 Asn Leu Phe Ser Lys Thr Ile Glu Arg Gly Lys Cys Ser Gln Asn Gly 225 230 235 240 <210> 111 <211> 261 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-6 active effector sgRNA <220> <221> modified_base <222> (239)..(261) <223> a, c, u, g, unknown or other <400> 111 auaacagcgc cgcaggucau gccgucaaaa gccucugaac uguguuaaau ggggguuagu 60 uugacuguug aaagacaguu gugcuuucug acccugguag cugcccaccc ugaugcugcu 120 aucuuucggg auaggaauaa ggugcgcucc caguaauagg gguguagaug uacuacagug 180 guggcuacua aaucaccucc gaccaaggag gaauccaucc gaaaggaugg guugaaagnn 240 nnnnnnnnnn nnnnnnnnnn n 261 <210> 112 <211> 263 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-2 effector sgRNA <220> <221> modified_base <222> (241)..(263) <223> a, c, u, g, unknown or other <400> 112 gaauuaauag cgccgccguu caugcuucua ggagccucug aaaggugaca aaugcggguu 60 aguuuggcug uugucagaca gucuugcuuu cugacccugg uagcugccca ccccgaagcu 120 gcuguuccuu gugaacagga auuaggugcg cccccaguaa uaaggguaug gguuuaccac 180 agugguggcu acugaaucac cuccgagcaa ggaggaaccc acugaaaggu ggguugaaag 240 nnnnnnnnnn nnnnnnnnnn nnn 263 <210> 113 <211> 265 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-4 effector sgRNA <220> <221> modified_base <222> (243)..(265) <223> a, c, u, g, unknown or other <400> 113 gaaauagcgc cgcuuguuca ugcgcgaaag cgucucugaa caguguaaau guggguuagu 60 uugacugucg ugaagacggu cuugcuuucu gacccuggua gcugcccacc uugaagcugc 120 ugucucuugu agacaggaau caggugcgcc cccaguaaua uaggugcggg uuuaccgcag 180 ugguggcuac ccaaucaccu ccgagcaagg aggaacccac cuugaaagag gcggguugaa 240 agnnnnnnnn nnnnnnnnnn nnnnn 265 <210> 114 <211> 276 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-7 effector sgRNA <220> <221> modified_base <222> (254)..(276) <223> a, c, u, g, unknown or other <400> 114 guaacaaaca gcgccgcagu ucaugcgucu uauggcgccu cugugcugug caaaaugugg 60 guuaguuuga cuguuggaag acagucuugc uuucugaccc ugguagcugc ccaccuugaa 120 gcugcuaucc cuuguggaua ggaaucaggu gcgcccccag uaauagaggu gcggguuuac 180 cgcaguggug gcuaccgaau caccuccgag caaggaggaa cccaccuuga aaaagcuuug 240 ggcggguuga aagnnnnnnn nnnnnnnnnn nnnnnn 276 <210> 115 <211> 246 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-1 effector sgRNA 1 <220> <221> modified_base <222> (224)..(246) <223> a, c, u, g, unknown or other <400> 115 gaugcuaagu cgcgccuagc aucaaggagc uaugucuuga uugucuuggg uguccgcccu 60 ggaugaguug agguguagau gcuucuauca uggcagcuac uaaacgcccc aagcaagggg 120 aacccaucuu uaauuuuggc aaaccgaagc gggggcaaaa ucuccaggag guucgccaaa 180 accuuugaaa cuccuuagcu ggaaauggcg augggguuga aagnnnnnnn nnnnnnnnnn 240 nnnnnn 246 <210> 116 <211> 274 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-1 effector sgRNA 2 <220> <221> modified_base <222> (252)..(274) <223> a, c, u, g, unknown or other <400> 116 cuuguucgag uucguuugaa cugaacaagg guaaguaugg gccaguuuaa uugcuuuccg 60 ucccaggaua gcugccagcu ucuaccguag guucguccug caagugaugc uaagucgcgc 120 cuagcaucaa ggagcuaugu cuugauuguc uugggugucc gcccuggaug aguugaggug 180 uagaugcuuc uaucauggca gcuacuaaac gccccaagca aggggaaccc aucgaaagau 240 gggguugaaa gnnnnnnnnn nnnnnnnnnn nnnn 274 <210> 117 <211> 550 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-13 effector intergenic region encoding tracrRNA <400> 117 gttgaggtgg atttgtgtac tgggtcaaaa gatttcgcta ggtttgcctt ttcgcgcgct 60 gctgaagcag tgaaaagttc cgacagttta aaagttctaa cacttttact gctttccgtc 120 gggagtagtt gtccgcttct gcgttgttga gaccgaagtt tgtccaggtg ataggcagaa 180 cgttgatgca acaggtagat agtcgcgctc tatcaggaag ctgttctagt tattagtgtt 240 cgtgcactaa taaagaggat acagggatac atgtggttgt gtccagcaat ggcacaacag 300 ggccactact cgaagccccg agcaagggtt gagcctaccc aaattttgta ctaaaaattt 360 ggcaaaccga agcgaggtca gtttgaccca gcaccttgtc aatcagtcga aatcttgcac 420 cagtctgcgt tttgagttgg caacagcctc acgctgaacc acttcaagca gaaagttatg 480 gcaatgtgat gacctttgcc aaaataggtg tgcaaagccg actgtagcaa gaatttgagc 540 actaggagtt 550 <210> 118 <211> 457 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-2 effector intergenic region encoding tracrRNA <400> 118 tactagaaaa atttgcacct tgataataga ataatagtca caatagcgcc gtagttcatg 60 cttgctaaag cctctgaatt gcgaaaagtc cgggttagtg ctgtcggcag acagcgttgc 120 tttctgaccc tggtagctgc ccaccccgat gctgctgtcc cttgcagaca ggaaccaggt 180 gcgcccccag taataagggt gtgggtttac cacagtggtg gctactgaat cacctccgag 240 caaggaggaa tccaccttaa ctattttttc gtgaatccaa gcgggagcaa aattcccaag 300 ggatagacga atttggtgaa ataaatagcc agacttaagt ttgagctttt tctgggatgg 360 tcaaccctcc tgttacgaca gtttccaaag taaaattttc gagttttacg agttttgttt 420 ctggaagcta gtacacaaaa gggttgaagc gtttaaa 457 <210> 119 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-13 effector target CRISPR repeat <400> 119 tggcaattgc ccttccagtg ttgggtgggt tgaaag 36 <210> 120 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG108-2 effector target CRISPR repeat <400> 120 gtttcaacga ccatcccgac aaggggtggg ttgaaag 37 <210> 121 <211> 60 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG110-1-6 effector crRNA <220> <221> modified_base <222> (9)..(40) <223> a, c, u, g, unknown or other <400> 121 cugguaaann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn gugaccugcc gcauaggcag 60 <210> 122 <211> 59 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG110-2-6 effector crRNA <220> <221> modified_base <222> (7)..(38) <223> a, c, u, g, unknown or other <400> 122 ccaagannnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnua ugaacugccg cauaggcag 59 <210> 123 <211> 385 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-6 active transposon end LE <400> 123 gggaggaaag gttaattggg gggttgattt attttggttg gttgtgttat atttgttatt 60 cgcgggcgat tagcacagtg gtagcgcact tccttcacac ggaaggggtc acaggttcaa 120 atcctgtatc gcccatttgt gtacagtgac acattaattg tcatcaatga cagattgctg 180 tcgtggagcc aaattatgtg tcgctgagac aaattaatgt cgtttaacta tcagtgacaa 240 atttttgtcg cttttcacaa caatagtgtg aaggaagtgc gcctttcaat ccatcctaga 300 aattataatt ccaatcccta cttacctaga atggtggttg aaactgtaag attcgcgccg 360 ctaataaaac tttcagcgat ttgga 385 <210> 124 <211> 313 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-6 active transposon end RE <400> 124 aacacataat gctatcctag cttacaaaaa agaaagcgac aatcaatctg tcactcctca 60 aattctcttc tttgagaacg acgacagcta aattgtcact gattgggagg acgacactta 120 atttgtcact aacggctagc gatctttaat caaggaaaac agctagaata tagagaaatc 180 aatagttttc atcagcgaca acaatttggc atcacgtcaa ataattagtc actgtacagg 240 ttttattttt aatgtacagt agccctcttg caaaagtcca agaattagga atgttagagg 300 aggtttgata act 313 <210> 125 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-2 putative transposon end LE <400> 125 ttgtaaaacc tcagatgagc aaggtattga tgaataatat tttccgccaa aatttacctc 60 tgtttgggca ataattgtat gatagaattt atatattagt tgcttcaata gcaaaatgcg 120 ggtgtagttc agtggtagaa cgtcaccttc ccaaggtgaa tgtcgtgggt tcgagtccca 180 tctcccgctt gtgttgttgt tgtacagtgt tgtcgattgc caaattattt gtccgcgttg 240 acaaattgat gtccgtttgc caaattattt gtcatttaca aaactcgaac ccacgacatt 300 <210> 126 <211> 400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-2 putative transposon end RE <400> 126 atctacaaaa ttgttttata caactatgtt tgtattttag ttctcaggac aaagattgtg 60 tcaattcttc acaaaagttg taattctcgc ctttttcaaa aaaggacaaa gaatttgtca 120 actttcctaa accggacaac taatttgtca aaaagctttt tcaatatata aagggggtat 180 aatagctgta acccttgcgt agagtaggtt agtgagctac taggtttggc ggtcaataat 240 ttggcaagtg gtcaaataat ttggcaatcg acaattattt atcgttgggg acgaatcagt 300 gtcacggagt caaattatgt gtcgttgtga cagattgatg tcgtctaagc accagtgaca 360 aattgatgtt gctttaataa tttaaaatcg tcacgaaata 400 <210> 127 <211> 489 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-4 putative transposon end LE <400> 127 tttcgggttc tccagttgtg ctcacaaggc tgcccgtttg gcttcatccc gttggcaata 60 cccatacgtt tttttttacg gctgtgtcca atcttccgta gtgccctcga aatcgtgcgc 120 tgactaatct ccccctccca tagctgtgcc atctcgcttt gggttttatc cccatgctct 180 ttgacgaaag cccgaaaatt ctcccaatcg ctgattttgc ctgtctgttg gcatgcttgc 240 cttggctttg gcttgacatc gcccgtttcg gcttggcgct caaaccataa gttaatcgta 300 ttgcgactga tattgaacag ttgactcgcc tcacttttct tcagaccgtc caactcaatc 360 gcttgcatta ctttttgccg gaagtcatca ctgtaaggtt tagccattga aatgaggtag 420 acgcaatggg tattcttcta gcttacgtcc taacctgcat ggctatagct atactatcca 480 cgacttgga 489 <210> 128 <211> 602 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-4 putative transposon end RE <400> 128 aagtgttcaa tcaaaacaca tatgtattat aaagttaaaa ggacatttat tttgtcaatg 60 acagtaaaaa gtcacaaaaa tattgatttc agaaaaaaga catatatttt gtcgaattta 120 caatatagga cggctaattc gtcaataact tcgtgctagg aattagcgat agaaaaacaa 180 taaaaccctt gcatagcaaa ggctttagag taaataataa gttgtcaatt aatttggcaa 240 acggtcagat aatgtgacac tcgacagaaa tcctttctag ggaaaggttt tgttgtttat 300 atatctaact ttgttcgagc gctcattctc aataagcagc ctagaaatgg gtacagatcg 360 agatatctag agccggaatt gagataggat tgagataatt taatcagggc cattaagcat 420 atggcaaggg tttcggacgc tacgaagaaa ccacatgaga taaacccaag ctctcaatct 480 ttatagctcg taagctcaac aatttcttaa gtcacattga aagcactggt tctaacgatt 540 tcaatctcta taggcagtca gaaaagaatc caagtgaaga taaacctttg tttgtgctag 600 tg 602 <210> 129 <211> 681 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-7 putative transposon end LE <400> 129 agttaggagt ttgaagttag gagtttgaag ttaccactca gcactcaata ctcagcactt 60 tctactcatt tccctttctt tgtggtacac tgcaatatag gctagtcaaa ctatgccggg 120 atgtagcgca gcttggtagc gcacttcgtt cgggacgaag gggtcgctgg ttcgaatcca 180 gtcatcccga taattattta gttatttata cgacatatta cacgtaatga aagctgtaca 240 ttaactaatt atttgtcact gttaacagat tgatgtcaaa tttcacaaat tgatgtcact 300 attaacagat tagtgtgctt gagctagccg ttaagactca gcttttgatt gtagctgaaa 360 tttatttgtt tgctatgtta caggctcacc cttgaaatta attataactg gacatgactt 420 tacttgttca aatacgaact gttctggtat ataatgattt ttgtttgggg tcatacttca 480 aactgttagg attattttgc aatatacatt tcggcagttt ttgacccttc ctaaaatctt 540 gtgagaaatc cgggacaact ggattcgctt tcaacccacc actaataatt ttaaattatt 600 ctttccactg ttgattaatc catttaattt cagctaaggc ttaaaacatc aaaatattca 660 aagtatctca ctgccaacag a 681 <210> 130 <211> 415 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-7 putative transposon end RE <400> 130 atttgtgttt tataaaaaca tagttgtatt atactgacac ctggacaaag aatttgttaa 60 attttgcaaa atcattggtt tgtttgtttt ttggaaaatg acaattaatg tgttatattt 120 ctgagattgg acagttaata tgttaattaa ggtttgaaag gctttaaatc tgaaaataat 180 aaaagcccca tcagaaacct ttctatgaca gggctttcaa tatttgatag agttgtgaca 240 ataatttgtt aagttgacaa ataattagtt aatgtacaaa atatttaatg tatagttaaa 300 atattgtaat agtaacggtt ttgtctatga attatagcaa aggacgggca aggatgcccg 360 ttccacaaga ttttgatttg tagtttactt tggaattttt ctttttatta tttaa 415 <210> 131 <211> 260 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-13 putative transposon end LE <400> 131 tgtcactgta tccataaggt gagccattgt gaaagcataa gttgagccaa aaatgcttga 60 aatgctgatt tttgcgttgc ttgatttagt ttaatccaaa cggtttgaaa gcataacgtg 120 agccaaagtt ttattttgaa agcataagct gagcaaacat ttgcggcaac ggcttgaaca 180 gcctcaaaat tgtgattagc tgaaatcaga agcgatgagt tccggtttca cggttgtaac 240 tcttcaggag gctgcgaaga 260 <210> 132 <211> 1979 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-13 putative transposon end RE <400> 132 agagcctcac tttatcgcat tgccacacaa gagcgcacac ataaaacatt aggggtaggt 60 tgaaagaggc aggggtctgc aaattaaata ccaagcttga cctgaagcag cattagcttt 120 aggaactgcg atcgccatca tgcgaactgc tttattaatg cagtgagcag aaattcaagt 180 ttcgacgagt aattgtcgat tattagaagg agttacaaag tatggagcca gaagatacgg 240 aattgagagt gagcaaacca atccaagtgg gagcaagaaa tcaattctgg caaatagatt 300 gcactgtttt tgatgtcagt ctggtcgaga aaactactcc agattattgg caaatggatt 360 ttactgctct tgatgtaaat ctggtcgggg aaactacttc agatgaccct ctttaaccct 420 agctactgtg cgcgacacac aatcgcaaac tatgttggga taccaactta catctgaaga 480 ggtacatggg agtgcgatcg caacactact tcatgctgcc gctcgaaaaa ctatctatca 540 caatatgaat tatttaatct gcgttttcat ggaggcatga tggaagaaca taaatttgga 600 atcactaatg cagttatcct taattcaata tcagggtacg tcaaactcac aagaagaaga 660 cccagcaccc tcaaggatat tgaagagatg gtgaatcgat attttcagca aagctcaggt 720 gactagaaac aatattcatc cacgaatgct tgataagtat agcttgattc tcgtctgagc 780 gagaatcaag ctggcatata tcgttagaac ttcgtggaca acagcacaaa aaacaagaga 840 caaactgctc gttaataaac tcaagtttcg cattaaagct atttagaaat gggtgaagac 900 cgttttatct tcatctattt ttagtctagc tcataaacct tttggaacag tacgttacaa 960 attaattaca ttagcagccg gggacttagc gctacagata aacgtgaatc tgggataagc 1020 tgaaacgcat ttaacccgag ataaagttag ctcatctagg tatagacaca ctagtccaat 1080 taatttggag gctttcttat tcaggttata catactgaaa ctcttttcct ctctatctgc 1140 caagcaccgc aactaatttg atagaaggca accaggaaat ttattggata aattggcgcg 1200 gtaatttgac gatgtgttag ggcagtgatg cactgcttct tgtgaagaag cgtttaaaga 1260 gtaatttgtc tctcatattt cttgctcaac gcagcaaatg tgatgctagt gcaaaatagc 1320 gtgacgggtg acacttacta aattgagtca gccgagcatc ggatggtgat atggagcgac 1380 agcaaaccag agcatcggtt gccaatccag caatctagct gactaagcag tgcaagtaat 1440 ttgacagcag agcaaaacag cgtgactgtt gacaaggaga aatttcattt ctagatcgtg 1500 ccattaattt gcgaatttag gtgaattttg tgctatcaat ttgcgaacct agaatttgtg 1560 ccattgattt aagaacaaag gatcgtgcag tagaccgcca gatcggttgc aatgcactag 1620 gttcgattcc ttcaatgtgc tttcagatga acaagcaagt atctgtgcca ctgatttgcg 1680 aatcggtcga agatttgtgc cacagattta caaatgacta ttcgacccta acaagccgat 1740 tgtgccagca atttgcgaat cgtgccatat tttttgatta ttcacacgtg cgactttccc 1800 aaaagtcagc caaaaatcgc tcaaaacgac attagcgtgc gacaagcgac atttatcgtg 1860 cgaccgtaca tttgctttta caaaggcggc acccagattc gaactggggg tggaggtttt 1920 gcagacctct gccttaccac ttggcgatgc cgccgaattg catcatggac attgtatca 1979 <210> 133 <211> 1444 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-54 putative transposon end LE <400> 133 ccgccggagg gtcgagcgac aaactgagca aaagtagtga taaattttgt ctaaaatcaa 60 gcgacctcat tctctgtaca gtgccagatt aaatgacgtg atgccaaatt agtgtcgtcg 120 gttgataccc ttgctacatc aacactctac agcctcataa ccattcttag acctatcact 180 ttagtgccaa attgtgagtc gtttaatcaa ataatgacag attaatcgtc tttaaagaat 240 taatctcagt gacgaattaa ctgtcattat ccgacgatag ccccaagata atatcatgtt 300 gcctctaaca tgaatatgta atggggagaa tatcctaaac cattagtatc ctttcctaaa 360 taaacacttt cattcgcgcg aagagttata gcgccgttat tgccgataaa ctcaagcgcc 420 gttattgccg ataaactcaa tggtgttatt ctacaacggc ggtcaattaa tatttatagt 480 gaaactcctc catttttagt aaaaaatagc aacgtaacaa catagggcta tcgtttatta 540 taaatacgta attcccgaaa attagtggga aggtcacacc ttccatccgt tccatatatc 600 tgagagctga attgatttga attcatcaaa ctccaagtcg catacattct agtagtacag 660 ccatttcttc tatcctgacg tgtataagtt acagaggctt gattataact cttatggcgg 720 cctttaattt gatgatcgaa atctcctgaa tatagttcag cattaatatt aactccatca 780 tcactagaat taataactac tgcgtcctgt tctgaagctt gccacatacc attaaatgct 840 ccaggtgctc tattttgagc aaaagcagaa gacaatccag aaatagctat tacgcaaata 900 gaagaagcaa gtacaagtac gagtttttta ggtctcatgg tttttaattc taaaagctag 960 tcaatttgtg agattgaagg gtgttaaact aaagcagagg tagctacaaa taatgtagaa 1020 gctacgaaat tacgtatgaa acttttttca aatccagcgt ggtcattatg gatagtgatt 1080 tttacgccta tagcttctta ttctaaagga atttcctatt aacgatcgcc gctattgtag 1140 cagtggcata attgtcacac taaggattga ctcccaaccg tataattaaa cactatttga 1200 aaggtagggg cagattttga tgtttgctac tccacggtat aagttttctt cggggagagc 1260 taaaacgtcc tttattcgcc gatgcaggcg aaaccataga gttttgaatt acagggtgga 1320 agacccaaac aaaacgtgcc gctcatgttc tgttgtctcc gccagtgcta aatgccaaac 1380 taattgtcgc attatcttag tatgttgcta ggataacaat atgttttatt aaaattttta 1440 ttta 1444 <210> 134 <211> 307 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-1 putative transposon end LE <400> 134 tgtccattaa agaattattt gtcgccttta aagaattaat gtccaatttc aggaattttg 60 gatgtttcag gctttggcaa gaaatctctt gctcaaaatt ttggtttaaa gaattaatgt 120 ccaaaatttc gacatacttg cgttgaaata catcactcat cgttagagtg cgatcgcagc 180 gctcctttca acccatctac attcacacaa aagcactctt accaaagact cttactcttt 240 cagtgcaatc aaccttggaa gggcgattac aaagcagtct tccaaattca gcgtagtatt 300 gacattc 307 <210> 135 <211> 619 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-1 putative transposon end RE <400> 135 ggtgtgagca gttaacaacc atggcttaaa taatgacact ttttggttta aatattcaac 60 cagcgaatag taaaatttat gacaaatttt gctttaaaca aagctatggc tattttggtg 120 aagtgaatca gcctgaagat caatagcagc aagggttgca tcacctagca gtgtttagag 180 ccaagatgac aataattctt taaagtcggt caaacaattc tttaatggac accatgtgtg 240 atgtacacta acgctcatct gtcactctag gcagatgtcc attaaggagc tatttgtcag 300 ttttaaacag ctcttgtcaa aaaattttag tactcaacgt attttcaagg gttttaagcg 360 acaccccttg atttgctgct tttttgccct gaaattccag ttttaaggag atgttgtcac 420 agatgattca tgccttgcta ccctgtatcg gtatatggac agagtcatta cagacgatcg 480 cctgtagtgc gatcgcagcg ctcctttcta tccacattaa ttcacatgtt ttaacgctca 540 ccactaatcg actgctgagc ggttgctgta atagcgtcga gacgtatgta ggccgaaatc 600 gatcgcatcc gcaacagcg 619 <210> 136 <211> 709 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG110-1-6 putative transposon end LE <400> 136 tattgttatc cctatttatt gttattagac aaattgttta tttaaacaac aataaataga 60 taccatcaaa atacaatttg tacagtgata aaatcgaaaa aatagataac aatttgttat 120 atgcagcgcg aaaactggaa tagagaactg agcggcgtgg tttaatatat gagcggcaat 180 agtggaagtt taagggggaa tgtatcgctg acgggtatag cttgttgatt gaagcataaa 240 ttgacaaatt cacaaacgaa aaatcaatga gttacgcttc tctttgaacc ataagatggc 300 aaaaaattaa accataagct gacaaatttc ttagtgaacg tgttacacca cccaaaacgt 360 ggtaagccac tgttgtaaaa ttacaagata tctcatgtac ttcatagtta cgaagtcggt 420 ttagctaagg gcgagtcact cacgaccagt tcaacagtgt tacgggcact gtttaccagc 480 gacctatgac gaagaccttc gatactttca ataatactac tgtagagcat ttcaaaggcc 540 atcgaaatat agaggtgtag ttatatttta agcgtctcag agcaaaaaag ccctctccat 600 agcgctttca cattttcatc cattctcgat ctcgacaatg aaacttaact cccaaatcaa 660 cgagccagcg gagaggagca atttagctag ctccgcgtgc attggcttg 709 <210> 137 <211> 479 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG110-1-6 putative transposon end RE <400> 137 aaccgagacc tgtaagttgt aagtaaataa caacttaaat ataggttatg ccagctatta 60 ctgcaaattt gacaacttat ggttcaaatt tgtcacttta tgcttcaatt tacatagctt 120 taagttggtg gcatctctgc cagcctcacc ccggcacccg agtctaccgc tgtggctgct 180 tccttccgga cctgaccaga ttcacggttt atcgttgcgg ggggaccagc agagacacca 240 tagaggaggt ctcgttgacc ttggtggggc attatacgca ctctgtttcg atgtgcaacc 300 tacgctatgg ggtttattat cttttttcta ttagtgagaa tactttaacg aaattcgctg 360 gttcgccgct cccgttgctg aagcttttag cgctctcggc tatacttgac taactttatc 420 ggtttttgcc gctgtctctg tatcacagag ccggcgatgt attttatggg agcgcgcag 479 <210> 138 <211> 474 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG110-2-6 putative transposon end LE <400> 138 tgaggttgcc tccagtacgt ccacaccacg tggatgacca gacaggcttt gaggttaact 60 aattgatgtt gttacaacca taagttgaca taacggccat aataaaatca acaggttaca 120 aaacgatttt tacccataag ttgacataaa aatgaagcat aagctgacat agagtgacaa 180 gaccacacat ggacacaaaa tcggcgttgt aagtttacaa gatcgacttg tagcatccac 240 tataggcaaa cacacctacg gcagccatcc tctcattaag tgcaagtggc actatcgaac 300 acaacgctca ccatttttgc gtagggcaaa gtcgatccgc cccgaatttt ctagaccatc 360 cgaacctttg gctagcaggc tacatgaatt tctccatgtg ccggatatcg agccattgtc 420 tgcataatta taaaacgctc cctattgctt gaaacgactt gcattgtttt gagg 474 <210> 139 <211> 334 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG110-2-6 putative transposon end RE <400> 139 agcgcctcca acctgtagtt gcttttctac aggtttaggc tatgtcaact tatgatgcaa 60 gtttatgtca gcttttggtt ccactatgtc aacttatggt tccaacgaca attgatttgc 120 cagaaatggt gggggctctg ccagccacat cccggcactc gaaggactcg ccttggctgc 180 taccttccgg tcctgaccag gtcgacgaga ttccgatgcg ggaggaccaa cagagccccc 240 ataacaacgc cggcgagtct acctagcctg accggcaatt gcaatcgctt taccggtcag 300 ctgagttcaa gtgtctgaaa actcgacaag tagc 334 <210> 140 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> Nucleoplasmin NLS <400> 140 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 141 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> SV40 2x NLS <400> 141 Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro Lys Lys Lys Arg Lys 1 5 10 15 Val Asp Ser <210> 142 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> P2A <400> 142 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 143 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> T2A <400> 143 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 144 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> HA <400> 144 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 145 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> Myc <400> 145 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1 5 10 <210> 146 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> FLAG <400> 146 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 147 <211> 640 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 effector sequence <220> <223> MG64-56 effector <400> 147 Met Ser Val Ile Thr Ile Gln Cys Arg Leu Val Ala Asp Asp Lys Ala 1 5 10 15 Leu Arg His Leu Trp Glu Leu Met Ala Glu Lys Asn Thr Pro Leu Val 20 25 30 Asn Glu Leu Leu Asp Arg Leu Gly Lys His Thr Asp Phe Glu Ala Trp 35 40 45 Val Gln Ala Gly Lys Val Pro Lys Thr Thr Ile Lys Ala Leu Cys Asp 50 55 60 Ser Leu Lys Thr Gln Glu Pro Phe Ile Gly Gln Pro Gly Arg Phe Tyr 65 70 75 80 Thr Ser Ala Thr Thr Leu Val Ala Tyr Ile Tyr Lys Ser Trp Leu Ala 85 90 95 Leu His Lys Arg Arg Gln Arg Lys Ile Glu Gly Lys Glu Arg Trp Leu 100 105 110 Glu Met Leu Lys Ser Asp Val Glu Leu Glu Gln Glu Ser Asn Ser Ser 115 120 125 Leu Glu Leu Ile Arg Thr Ile Ala Thr Glu Ile Leu Ser Lys Phe Ser 130 135 140 Ala Ser Ser Thr Asp Gly Ile Asn Gln Lys Ser Lys Gly Lys Lys Ser 145 150 155 160 Lys Lys Leu Lys Lys Asp Lys Ala Asp Glu Pro Met Ser Ile Lys Pro 165 170 175 Gly Val Leu Phe Glu Ala Tyr Gln Lys Thr Glu Asp Ile Leu Arg Arg 180 185 190 Ser Ala Leu Val Tyr Leu Ile Lys Asn Asn Cys Gln Val Asn Phe Ala 195 200 205 Glu Glu Asp Pro Asp Lys Tyr Ala Lys Met Arg Arg Lys Lys Glu Ile 210 215 220 Glu Ile Glu Arg Leu Lys Glu Gln Leu Lys Ser Arg Val Pro Lys Gly 225 230 235 240 Arg Asp Leu Thr Gly Lys Lys Trp Leu Glu Thr Leu Glu Lys Ala Val 245 250 255 Asn Ser Ile Pro Gln Asp Glu Asn Glu Ala Lys Ser Trp Gln Ala Gly 260 265 270 Leu Leu Arg Lys Ser Ser Thr Val Pro Phe Pro Val Ala Tyr Glu Thr 275 280 285 Asn Glu Asp Met His Trp Glu Ile Ser Asp Lys Gly Arg Ile Phe Val 290 295 300 Ser Phe Asn Gly Leu Ser Lys Leu Lys Leu Glu Val Tyr Cys Asp Gln 305 310 315 320 Arg His Leu Pro Trp Phe Gln Arg Phe Val Glu Asp Gln Glu Thr Lys 325 330 335 Arg Lys Gly Lys Asn Gln His Ser Ser Gly Leu Phe Thr Leu Arg Ser 340 345 350 Gly Arg Leu Ser Trp Leu Lys Gln Glu Gly Lys Gly Glu Pro Trp Ser 355 360 365 Val Asn Arg Leu Ile Leu Phe Cys Ser Val Asp Thr Arg Met Trp Thr 370 375 380 Val Glu Gly Thr Gln Gln Val Ala Ile Glu Lys Ile Ala Asp Val Glu 385 390 395 400 Gln Asn Leu Thr Lys Ala Lys Glu Lys Gly Glu Leu Asn Ser Asn Gln 405 410 415 Gln Ala Phe Val Thr Arg Gln Gln Ser Thr Leu Ala Lys Ile Asn Thr 420 425 430 Pro Phe Pro Arg Pro Ser Lys Pro Leu Tyr Glu Gly Lys Ser His Ile 435 440 445 Leu Val Gly Val Ser Leu Gly Leu Glu Asn Pro Ala Thr Val Ala Val 450 455 460 Phe Asp Ala Val Asn Asn Lys Val Leu Ala Tyr Arg Ser Val Lys Gln 465 470 475 480 Leu Leu Gly Asn Asn Tyr Asn Leu Leu Asn Arg Gln Gln Gln Gln Lys 485 490 495 Gln Arg Leu Ser His Asp Arg His Lys Ala Gln Lys Asp Phe Ala Arg 500 505 510 Asn Asp Phe Gly Glu Ser Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu 515 520 525 Ala Lys Glu Ile Val Ala Ile Ala Val Thr Tyr Phe Ala Gly Ser Ile 530 535 540 Val Leu Pro Lys Leu Gly Asp Met Arg Glu Ile Ile Gln Ser Glu Val 545 550 555 560 Gln Ala Arg Ala Glu Lys Lys Ile Pro Gly Phe Lys Glu Gly Gln Gln 565 570 575 Lys Tyr Ala Lys Glu Tyr Arg Lys Gln Val His Asn Trp Ser Tyr Gly 580 585 590 Arg Leu Ile Glu Asn Ile Gln Ser Gln Ala Ala Lys Val Gly Ile Leu 595 600 605 Ile Glu Thr Gly Gln Gln Pro Ile Arg Gly Ser Pro Gln Glu Gln Ala 610 615 620 Arg Asp Leu Ala Leu Phe Ala Tyr Gln Cys Arg Ile Ala Ser Ser Ile 625 630 635 640 <210> 148 <211> 579 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-56-B transposition protein <400> 148 Met Gly Glu Thr Leu Asn Ser Asn Glu Val Asp Glu Ser Leu Val Leu 1 5 10 15 Tyr Asp Gly Ser Asp Glu Val Asp Glu Ile Ser Glu Ser Glu Asp Thr 20 25 30 Lys Gln Asn Asn Val Ile Val Thr Glu Leu Ser Glu Glu Ala Lys Leu 35 40 45 Arg Met Glu Val Leu Gln Ser Leu Ile Glu Pro Cys Asp Arg Lys Thr 50 55 60 Tyr Gly Ile Lys Leu Lys Gln Ala Ala Glu Lys Leu Gly Lys Thr Val 65 70 75 80 Arg Thr Val Gln Arg Leu Val Lys Lys Tyr Gln Glu Gln Gly Leu Ser 85 90 95 Gly Val Thr Glu Val Glu Arg Ser Asp Lys Gly Gly Tyr Arg Ile Asp 100 105 110 Asp Asp Trp Gln Asp Phe Ile Val Lys Thr Tyr Lys Glu Gly Asn Lys 115 120 125 Gly Gly Arg Lys Met Thr Pro Ala Gln Val Ala Ile Arg Val Gln Val 130 135 140 Arg Ala Gly Gln Leu Gly Leu Glu Lys Tyr Pro Cys His Met Thr Val 145 150 155 160 Tyr Arg Val Leu Asn Pro Ile Ile Glu Arg Lys Glu Gln Lys Gln Lys 165 170 175 Val Arg Asn Ile Gly Trp Arg Gly Ser Arg Val Ser His Gln Thr Arg 180 185 190 Asp Gly Gln Thr Leu Asp Val His His Ser Asn His Val Trp Gln Cys 195 200 205 Asp His Thr Lys Leu Asp Val Met Leu Val Asp Gln Tyr Gly Glu Thr 210 215 220 Leu Ala Arg Pro Trp Leu Thr Lys Ile Thr Asp Ser Tyr Ser Arg Cys 225 230 235 240 Ile Met Gly Ile His Leu Gly Phe Asp Ala Pro Ser Ser Leu Val Val 245 250 255 Ala Leu Ala Met Arg His Ala Met Leu Arg Lys Gln Tyr Ser Ser Glu 260 265 270 Tyr Lys Leu His Cys Glu Trp Gly Thr Tyr Gly Val Pro Glu Asn Leu 275 280 285 Phe Thr Asp Gly Gly Lys Asp Phe Arg Ser Glu His Leu Lys Gln Ile 290 295 300 Gly Phe Gln Leu Gly Phe Glu Cys His Leu Arg Asp Arg Pro Pro Glu 305 310 315 320 Gly Gly Ile Glu Glu Arg Gly Phe Gly Thr Ile Asn Thr Asp Phe Leu 325 330 335 Ser Gly Phe Tyr Gly Tyr Leu Gly Ser Asn Val Gln Glu Arg Ala Glu 340 345 350 Gly Ala Glu Glu Glu Ala Cys Ile Thr Leu Arg Glu Leu His Leu Leu 355 360 365 Ile Val Arg Tyr Ile Val Asp Asn Tyr Asn Gln Arg Ile Asp Ala Arg 370 375 380 Ser Gly Asn Gln Thr Arg Phe Gln Arg Trp Glu Ala Gly Leu Pro Ala 385 390 395 400 Leu Pro Asn Leu Val Asn Glu Arg Glu Leu Asp Ile Cys Leu Met Lys 405 410 415 Lys Thr Arg Arg Ser Ile Tyr Lys Gly Gly Tyr Val Ser Phe Glu Asn 420 425 430 Ile Met Tyr Arg Gly Asp Tyr Leu Ser Ala Tyr Ala Gly Glu Ser Val 435 440 445 Leu Leu Arg Tyr Asp Pro Arg Asp Ile Ser Thr Val Phe Val Tyr Arg 450 455 460 Gln Asp Ser Gly Lys Glu Val Leu Leu Ser Gln Ala His Ala Ile Asp 465 470 475 480 Leu Glu Thr Glu Gln Ile Ser Leu Glu Glu Thr Lys Ala Ala Ser Arg 485 490 495 Lys Ile Arg Asn Ala Gly Lys Gln Leu Ser Asn Lys Ser Ile Leu Ala 500 505 510 Glu Val Gln Asp Arg Asp Thr Phe Ile Lys Gln Lys Lys Lys Ser His 515 520 525 Lys Glu Arg Lys Lys Glu Glu Gln Ala Gln Val Asn Phe Val Lys Pro 530 535 540 Pro Gln Thr Asn Glu Pro Val Glu Thr Val Glu Glu Ile Pro Gln Pro 545 550 555 560 Gln Lys Arg Arg Pro Arg Val Phe Asp Tyr Glu Gln Leu Arg Lys Asp 565 570 575 Tyr Asp Asp <210> 149 <211> 278 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-56-C transposition protein <400> 149 Met Ala Glu Asp Tyr Leu Arg Lys Trp Val Gln Asn Leu Trp Gly Asp 1 5 10 15 Asp Pro Ile Pro Glu Glu Leu Leu Pro Ile Ile Glu Arg Leu Ile Thr 20 25 30 Pro Ser Val Val Glu Leu Glu His Ile Gln Lys Ile His Asp Trp Leu 35 40 45 Asp Ser Leu Arg Leu Ser Lys Gln Cys Gly Arg Ile Val Ala Pro Pro 50 55 60 Arg Ala Gly Lys Ser Val Thr Cys Asp Val Tyr Lys Leu Leu Asn Lys 65 70 75 80 Pro Gln Lys Arg Thr Gly Lys Arg Asp Ile Val Pro Val Leu Tyr Met 85 90 95 Gln Val Pro Gly Glu Cys Ser Ala Gly Glu Leu Leu Thr Leu Ile Leu 100 105 110 Glu Ser Leu Lys Tyr Asp Ala Ile Ser Gly Lys Leu Thr Asp Leu Arg 115 120 125 Arg Arg Val Leu Arg Leu Leu Lys Glu Ser Lys Val Glu Met Leu Val 130 135 140 Ile Asp Glu Ala Asn Phe Leu Lys Leu Asn Thr Phe Ser Glu Ile Ala 145 150 155 160 Arg Ile Tyr Asp Leu Leu Lys Ile Ser Ile Val Leu Val Gly Thr Asp 165 170 175 Gly Leu Asp Asn Leu Ile Lys Lys Glu Pro Tyr Ile His Asp Arg Phe 180 185 190 Ile Glu Cys Tyr Arg Leu Pro Leu Val Ser Glu Lys Lys Phe Pro Glu 195 200 205 Phe Val Gln Ile Trp Glu Asp Glu Val Leu Cys Leu Pro Val Pro Ser 210 215 220 Asn Leu Thr Lys Arg Glu Thr Leu Met Pro Leu Tyr Gln Lys Thr Ser 225 230 235 240 Gly Lys Ile Gly Leu Val Asp Arg Val Leu Arg Arg Ala Ala Ile Leu 245 250 255 Ser Leu Arg Lys Gly Leu Lys Asn Ile Asp Lys Ala Thr Leu Asp Glu 260 265 270 Val Leu Glu Trp Phe Glu 275 <210> 150 <211> 176 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG64 transposition protein sequence <220> <223> MG64-56-Q transposition protein <400> 150 Met Glu Ile Pro Ala Glu Gln Pro Arg Phe Phe Gln Val Glu Pro Leu 1 5 10 15 Glu Gly Glu Ser Leu Ser His Phe Leu Gly Arg Phe Arg Arg Glu Asn 20 25 30 Tyr Leu Thr Ala Thr Gln Leu Gly Lys Leu Thr Gly Ile Gly Ala Val 35 40 45 Ile Ser Arg Trp Glu Lys Phe Tyr Leu Asn Pro Phe Pro Thr Pro Gln 50 55 60 Glu Leu Glu Ala Leu Ala Ala Val Val Glu Val Lys Val Asp Arg Leu 65 70 75 80 Ile Glu Met Leu Pro Pro Arg Gly Val Thr Met Lys Pro Arg Pro Ile 85 90 95 Arg Leu Cys Ser Ala Cys Tyr Gln Glu Ser Pro Cys His Arg Val Glu 100 105 110 Trp Gln Phe Lys Asp Val Met Val Cys Asp Cys Leu Arg His Cys Pro 115 120 125 Leu Asn Asn Arg His Gln Leu Ala Leu Leu Thr Lys Cys Thr Asn Cys 130 135 140 Glu Thr Pro Phe Pro Ile Pro Ala Asp Trp Val Gln Gly Glu Cys Pro 145 150 155 160 His Cys Phe Leu Pro Phe Thr Lys Met Ala Arg Arg Gln Lys Arg Tyr 165 170 175 <210> 151 <211> 485 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-56 effector intergenic region encoding tracrRNA <400> 151 caaaataccg aaccttgaaa acttaatatg aaagtaacag cgccgcagtt catgctcttc 60 tgagtctctg tactgtgata aatctgggtt agtttaacgg ttgaaagacc gttttgcttt 120 ctgaccctgg tagctgctcg ctcttgatgc tgctgtcttt tgacaggata ggtgcgctcc 180 cagcaataaa gagttaaagc tgataaagct tgagccgttg taaaacggtg gggtttacct 240 cagtggtggc tactgaatca cccccttcgt cgggggaacc ctcctaaata ttttttttgg 300 cgtgtcaaag cgggggcaaa aatcctggag tcccgccaaa atctcaaaac ctttgtccta 360 tcttgacttg ataaactagc atgtcagtta atttagtttt ttgatgtcaa gtaggagatg 420 cttttaggca gtcctgccaa agatgtgtat ggaaagctct aatagcaagg gttctagacg 480 gatcg 485 <210> 152 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-56 effector target CRISPR repeat <400> 152 gtttcaacaa ccatcccagc taggggtggg ttgaaag 37 <210> 153 <211> 595 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-56 putative transposon end LE <400> 153 tatgcgactt gagcgatttg tgtaagtttt gtgttgcaca aaccatccta agcgacatta 60 gtttgcaaaa aacgacatta atttacgaat cgcgaccttt aatttgcgaa tatacaacag 120 attttgtcga ttaactaatt atttgtcgtc ttaacaaatt aatgtcgccc aaatcttcaa 180 gactataatc cttatgtatc aaaggttata gccttttgaa cttatattgg ctatcatcaa 240 atatttaact aattaagtgt cgtcttttaa ttaattaaca ttttaaatgt cgttttttca 300 aaaaacacct ttccaaattt ttcttttgct cataacaaaa taactgtcgt cttttggaag 360 tgagtgaaaa atataaaatt aaatgtcgct ttttggaaca aagtagtatg atatttatta 420 ggcaatagta gctatgtaac aacaaaaaca tagttagatt gaagtcttct tttttgtctc 480 tagctacgaa gtcattaccc ttgctgcgat taaatttaga cgcaagctaa tttcgctctt 540 agacttgctg taccgtattg cctaaccaac tagtttcaag cgatgaagtt tgttt 595 <210> 154 <211> 493 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-56 putative transposon end RE <400> 154 taagttctat taactccaag ttttaataat tgcatggcaa taacaatcct ttttagaaag 60 gatttaagag ggttgaaagg aatgtcacct tcccaagaat acttttcaaa agctattttg 120 ggttagggaa gaataatcac agataactaa tatgcacaag taagtctaaa atagggataa 180 gtctgtcgat tagtccaata gcaaggcatc ttgttagacg acattaattt gttaacgtta 240 gttggaacta attcgacgac attaattcgt taacagcgac attaatttgt taatgacgac 300 attaatctgt taacgacgac attaatctgt taacgacgac aaataatctg ttaattgaca 360 gatttgaaag cgggtgatgg gactcgaacc cacgacgttc accttgggaa ggtgacattc 420 taccactgaa ttacacccgc aaatggagtt taggctcaat aaagctaacc cccattataa 480 cacgatttgc cca 493 <210> 155 <211> 568 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-2 active transposon end RE <400> 155 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 60 aggtggcact tttcggggaa atgtgttcta tctacaaaat tgttttatac aactatgttt 120 gtattttagt tctcaggaca aagattgtgt caattcttca caaaagttgt aattctcgcc 180 tttttcaaaa aaggacaaag aatttgtcaa ctttcctaaa ccggacaact aatttgtcaa 240 aaagcttttt caatatataa agggggtata atagctgtaa cccttgcgta gagtaggtta 300 gtgagctact aggtttggcg gtcaataatt tggcaagtgg tcaaataatt tggcaatcga 360 caattattta tcgttgggga cgaatcagtg tcacggagtc aaattatgtg tcgttgtgac 420 agattgatgt cgtctaagca ccagtgacaa attgatgttg ctttaataat ttaaaatcgt 480 cacgaaataa gcctaacgtg agttttcgtt ccactgagcg tcagaccacc gttgatgata 540 ccgctgcctt actgggtgca ttagccag 568 <210> 156 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-4 effector putative tracrRNA <400> 156 aatagcgccg cttgttcatg cgcgaaagcg tctctgaaca gtgtaaatgt gggttagttt 60 gactgtcgtg aagacggtct tgctttctga ccctggtagc tgcccacctt gaagctgctg 120 tctcttgtag acaggaatca ggtgcgcccc cagtaatata ggtgcgggtt taccgcagtg 180 gtggctaccc aatcacctcc gagcaaggag gaacccacct taattat 227 <210> 157 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-7 effector putative tracrRNA <400> 157 aacagcgccg cagttcatgc gtcttatggc gcctctgtgc tgtgcaaaat gtgggttagt 60 ttgactgttg gaagacagtc ttgctttctg accctggtag ctgcccacct tgaagctgct 120 atcccttgtg gataggaatc aggtgcgccc ccagtaatag aggtgcgggt ttaccgcagt 180 ggtggctacc gaatcacctc cgagcaagga ggaacccacc ttaattat 228 <210> 158 <211> 328 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-9 effector putative tracrRNA <400> 158 gctgaagtta gtctctggat actgaagtca gtgtctaggg actgaagtaa ggggagcttt 60 acccgcaagg gatactttcg accccctgta gctgcccgct cctggtgggg tgccctgaca 120 cccgcctcat tacagcaatg tatgactgtc tgggctaatg aaagaaggat tagggacgca 180 ggttcacgac ctacttcaat catagtctgt gcaacccaga taagtgagta tgacccgcaa 240 gggtctaaac gcctttagta gaatggttct tccagtttgt taagggcagg gcttggttct 300 ccaaggtggc tacgaattct tctcgatt 328 <210> 159 <211> 187 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-10 effector putative tracrRNA <400> 159 ggtagcgctg gagccacata gttcataagc tcacgcttct tggacttcct gtgttctcta 60 aaacgggttc tgttttaccc ttaccaaggg atactttcag atccgagtag ctgcaagctc 120 atggcggagt gtcccctgac gctttgccac cgtcatagcg atgtgatggc cgtctggcgt 180 atgaacg 187 <210> 160 <211> 326 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-12 effector putative tracrRNA <400> 160 aatagcgccc ctaatcaaat cgaaggcgtt tgaggacggg gaaaatgggt aagtttccat 60 cgaaaggtgg ttcttttcag ccctatgtag tcccactccc ttgtggagtg ttagcatctg 120 aggtgcctag cacagcaaag tctctcagga gacggagtca aagctgggga acaagtatta 180 cgaacgaatc tcgcgattct attagtatac gtaggtcgct cccatgcaac aagatgctca 240 tctctcagca atgagggtag ggaacgtatc ccaaacacta catgaatagc tcgtcgggct 300 tgcccggtga gtatccacca agcctt 326 <210> 161 <211> 311 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-13 effector putative tracrRNA <400> 161 cgctaggttt gccttttcgc gcgctgctga agcagtgaaa agttccgaca gtttaaaagt 60 tctaacactt ttactgcttt ccgtcgggag tagttgtccg cttctgcgtt gttgagaccg 120 aagtttgtcc aggtgatagg cagaacgttg atgcaacagg tagatagtcg cgctctatca 180 ggaagctgtt ctagttatta gtgttcgtgc actaataaag aggatacagg gatacatgtg 240 gttgtgtcca gcaatggcac aacagggcca ctactcgaag ccccgagcaa gggttgagcc 300 tacccaaatt t 311 <210> 162 <211> 342 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-14 effector putative tracrRNA <400> 162 aacagcgccg cagtttaagc tctatagccg ctgaactgtg aaaaatgtgg gtcagtttgg 60 tcgttgcaag acgatcgtgc tttccgaccc tagtaactgt ccgctcactg actgccatcc 120 tggggcaaat cttcaaattt tgtgtatttg tgtggggatg gaaagctgca ttagtcgatt 180 ctcttcctcc aatgtagcgt aggtgcgcac ccagcagaag tgagttaagc cttcacaatg 240 tggaggtaca gaagcatcat ctctccattt tttggtgtag atggtgtgac tgaagtggta 300 gttaccgaat cgcccctgat caagggggag ccctccataa tt 342 <210> 163 <211> 297 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-15 effector putative tracrRNA <400> 163 aatgacgttt gtttctgtgc gcgctgctga agcagtgaaa aatacggaca gtctaatttg 60 ctttccgtcc ggagtagttg tccgcttctg cgttgttgga accgaagttt gtccaggtga 120 taggcggagt gtttcggcaa cagatggaga gtcgcacctc tatcaggggg cagttttagt 180 ggttagtgtt tagcgcacta tcactaggat acagggatac atgtggtagt gaccagagat 240 ggcactgcgg gaccgctact cgaagccccg aacaagggtt gagcttaccc aaatctt 297 <210> 164 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-16 effector putative tracrRNA <400> 164 aatagcgccg cagtttaagc tcagcaagcc tctggactgc gaaaagtatg gggtagtttg 60 accgtcggta aacggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120 ttcttaactg ggaatcgaga tgaggtgcgc ccccagcaaa agggaacggg tttactggag 180 tggtggtcgc cgaatcaccc ccgagcaagg gggactcgtc ctttgc 226 <210> 165 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-17 effector putative tracrRNA <400> 165 aatagcgccg cagtttaagc tcaatgagcc tcttgactgc gaacagtatg gggtagtttg 60 accggcggta accggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120 ttctcaaccg ggaatcgaga atcaggtgcg cccccagcaa gagggaacgg gtttactgga 180 gtggtggtcg ccgaatcacc cccgagcaag ggggactcgt cctttgc 227 <210> 166 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-19 effector putative tracrRNA <400> 166 aatagcgccg cagtttaagc tcagcaagcc tctggactgc gaaaagtatg gggtagtttg 60 accgtcggta aacggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120 ttctcaaccg ggaatcgaga atcaggtgcg cccccagcaa gagggaacgg gtttactgga 180 gtggtggtcg ccgaatcacc cccgagcaag ggggactcgt cctttgc 227 <210> 167 <211> 211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-20 effector putative tracrRNA <400> 167 aatagcgccg cagtttaagc tcaatgagcc tcttgactgc gaacagtatg gggtagtttg 60 accggcggta accggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120 ttctcaaccg ggaatcgaga atcaggtgcg cccccagcaa gagggaacgg gtttactgga 180 gtggtggtcg ccgaatcacc cccgagcaag g 211 <210> 168 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-21 effector putative tracrRNA <400> 168 aatagcgccg cagttcatgc ttctttgaag cctctgtgct gtgcaaaatg tgggttagtt 60 tggctgttga agaaacagcc ttgctttctg accctggtag ctgtccaccc tgaagctgct 120 atcccctgtg gataggatag gtgcgccccc agcaataggg gagcgggtat accgcagtgg 180 tggctactga atcacctcca agcaaggagg aatccacttt at 222 <210> 169 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-22 effector putative tracrRNA <400> 169 aatagcgccg cagttcatgc ttctttgaag cctctgtgct gtgcaaaatg tgggttagtt 60 tggctgttga agaaacagcc ttgctttctg accctggtag ctgtccaccc tgaagctgct 120 atcccctgtg gataggatag gtgcgccccc agcaataggg gagcgggtat accgcagtgg 180 tggctactga atcacctcca agcaaggagg aatccacttt at 222 <210> 170 <211> 248 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-24 effector putative tracrRNA <400> 170 aaaagcgccg tagaacatgc tcacgcctct gttctgcgaa aaattagggt ttgtttggct 60 gtctgacagc agtcttactt tctgtcccta gaatctgacc actccgatgc tgctgttgta 120 agtgaacttg attgagctcg gacaccatgc aacaggataa ggggcgcacc cagcaagaga 180 ggacggactt accgtagtgt tggcttctga agcaactccg accaaggagt agtccatgca 240 ttcatcat 248 <210> 171 <211> 277 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-25 effector putative tracrRNA <400> 171 aatcgcgccg cacattcatg ttccttgaga acctctgaat tgcgaaagtg tgggctagtt 60 tgttcgcttg atgcgaatgt gctttctggc cctggtagct gtccgccctg atgctgattt 120 ctacgggtaa ctgtaggaat gattaactcg ttctatagac aggtttcgtg ctttctattg 180 taacggggtc ggtgcgctcc cagcaatagg ggtgtgggtc tactacagtg atggctactg 240 aatcacctcc gagcaaggag gaatccacct taacttt 277 <210> 172 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-27 effector putative tracrRNA <400> 172 aatagcgccg cagtttaagc tcagcaagcc tctggactgc gaaaagtatg gggtagtttg 60 accgtcggta aacggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120 ttcttaactg ggaatcgaga tgaggtgcgc ccccagcaag agggaacggg tttactggag 180 tggtggtcgc cgaatcaccc ccgagcaagg gggactcgtc ctttgc 226 <210> 173 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-28 effector putative tracrRNA <400> 173 aatagcgccg cagtttaagc tcagcaagcc tctggactgc gaaaagtatg gggtagtttg 60 accgtcggta aacggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120 ttcttaactg ggaatcgaga tgaggtgcgc ccccagcaag agggaacggg tttactggag 180 tggtggtcgc cgaatcaccc ccgagcaagg gggactcgtc ctttgc 226 <210> 174 <211> 255 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-29 effector putative tracrRNA <400> 174 tagcgcacga acctgactag cgtcattacg atgcgagttc tggaaatggg acagtttcat 60 tgctttccgt ccctggcact gcctgcttac tcacgaccac aaggagacaa ttcagcgctg 120 tgagttcgcg attctctact gtttatgaca aactaacgtt tgtctggcag tacagcaaga 180 ttgtgtatca gaccatgttt ggcgaagata catggcaggc cgaatcgcca atgaaaccag 240 cggacttccc ctaat 255 <210> 175 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-32 effector putative tracrRNA <400> 175 aatagcgccg cagtttaagc tcaatgagcc tcttgactgc gaacagtatg gggtagtttg 60 accggcggta accggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120 ttcttaactg ggaatcgaga tgaggtgcgc ccccagcaag agggaacggg tttactggag 180 tggtggtcgc cgaatcaccc ccgagcaagg gggactcgtc ctttgc 226 <210> 176 <211> 203 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-44 effector putative tracrRNA <400> 176 tctagcgccg cagctcatgt cagcaatggc caatgtgttg tgctaaatgc gagctagttt 60 gactgcctgc taagcagtct tgctttctgg ctcaggtgac tatccaccca aaggtcgttg 120 gtgcgctggc gatttgaggg cacgggttcc ggagtgatag ttaccattac acctccggcc 180 aaggaggaat ccaccccacc ccc 203 <210> 177 <211> 203 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-46 effector putative tracrRNA <400> 177 tctagcgccg cagctcatgt cagcaatggc caatgtgttg tgctaaatgc gagctagttt 60 gactgcctgc taagcagtct tgctttctgg ctcaggtgac tatccaccca aaggtcgttg 120 gtgcgctggc gatttgaggg cacgggttcc ggagtgatag ttaccattac acctccggcc 180 aaggaggaat ccaccccacc ccc 203 <210> 178 <211> 310 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-49 effector putative tracrRNA <400> 178 gattgcgcct cgatcgatgc tctatgagcc gctcgatcgt agaaaaatgg gtgagtttga 60 ttatctactt cgttagataa tgctgctttc cgaccctggc attctgtccg cccttgaagc 120 tgcttctcat ggactagcgt aagctcgttg gtaagaagga aaagtcataa tttaaagtca 180 cgtctttcta gtatgacata ggtgcgctcc cacgcaatat agggttcagc ttttatttta 240 taaaagtaga gactttcctc tagtgacagt gccgaaatga ccccgtgcga ggggtaacta 300 cctaagtttt 310 <210> 179 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-51 effector putative tracrRNA <400> 179 aacagcgccg cagttcatgt ttgttataaa cctctgtact gcgataaatg cgggttagtt 60 tgactgttgt gagacagtct tgctttctga ccctagtagc tgcccacctt gatgctgctg 120 ttcccagtga acaggaataa ggtgcgcccc cagtaataga ggtgcgggtt taccgcagtg 180 gtggctactg aatcacctcc gactaaggag gaatccacct taattat 227 <210> 180 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-52 effector putative tracrRNA <400> 180 accggggatc gtcctggtga agggagagtt gctttggatc ggtcacaagc ttttccttaa 60 ctaattctca ctgactgact aggatgatcg agggggttat gttttaccac tgcaaggtgg 120 atactttcaa acccctgtgg tagctgctcg ctcctggtga ggtgccctga cacttcaccc 180 cactacagca atgtgtgtgg ctgtctggtt atgagagaag ttagggcata ggttcgttac 240 ctgcattcaa tcataaatta cgcgaccaga taagtgagta tgatccgcaa ggatctatat 300 gtctttagca aagaagtgct tctgctttgt tactggcgta gggcatggtt ctctaaagtg 360 gctaccgaac cttcccaatt 380 <210> 181 <211> 257 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64_56 effector putative tracrRNA <400> 181 aacagcgccg cagttcatgc tcttctgagt ctctgtactg tgataaatct gggttagttt 60 aacggttgaa agaccgtttt gctttctgac cctggtagct gctcgctctt gatgctgctg 120 tcttttgaca ggataggtgc gctcccagca ataaagagtt aaagctgata aagcttgagc 180 cgttgtaaaa cggtggggtt tacctcagtg gtggctactg aatcaccccc ttcgtcgggg 240 gaaccctcct aaatatt 257 <210> 182 <211> 246 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-1 effector putative tracrRNA <400> 182 tttagcgcac ttgttcgagt tcgtttgaac tgaacaaggg taagtatggg ccagtttaat 60 tgctttccgt cccaggatag ctgccagctt ctaccgtagg ttcgtcctgc aagtgatgct 120 aagtcgcgcc tagcatcaag gagctatgtc ttgattgtct tgggtgtccg ccctggatga 180 gttgaggtgt agatgcttct atcatggcag ctactaaacg ccccaagcaa ggggaaccca 240 tcttta 246 <210> 183 <211> 223 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-2 effector putative tracrRNA <400> 183 aatagcgccg tagttcatgc ttgctaaagc ctctgaattg cgaaaagtcc gggttagtgc 60 tgtcggcaga cagcgttgct ttctgaccct ggtagctgcc caccccgatg ctgctgtccc 120 ttgcagacag gaaccaggtg cgcccccagt aataagggtg tgggtttacc acagtggtgg 180 ctactgaatc acctccgagc aaggaggaat ccaccttaac tat 223 <210> 184 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-9 effector target CRISPR repeat <400> 184 gtctttcatc ctatctcgcg ccagatcgct tcctgcaacc c 41 <210> 185 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-12 effector target CRISPR repeat <400> 185 gttgcaagcg cctccttggc tgttggtggg tggaaag 37 <210> 186 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-14 effector target CRISPR repeat <400> 186 gttgcaatcg ccttcccaga gatgggtggg ctgaaag 37 <210> 187 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-15 effector target CRISPR repeat <400> 187 gttacaatta ccctcccagc gttgggtggg ttgaaagg 38 <210> 188 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-16 effector target CRISPR repeat <400> 188 aagttgcatc cgctttccag caaccagggc gggtgaaag 39 <210> 189 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-17 effector target CRISPR repeat <400> 189 gttgcatccg ctttccagca accagggcgg gtgaaag 37 <210> 190 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-19 effector target CRISPR repeat <400> 190 gtacccaaag ccttttttcc ttaagcctat ccg 33 <210> 191 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-25 effector target CRISPR repeat <400> 191 gtttcaaccg ccatcccagc taggggt 27 <210> 192 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-27 effector target CRISPR repeat <400> 192 agttgcatcc gctttccagc aaccagggcg ggtgaaag 38 <210> 193 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-28 effector target CRISPR repeat <400> 193 gttgcatctg cttttcagca actagggcgg gggaaagc 38 <210> 194 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-29 effector target CRISPR repeat <400> 194 ggcgcgatcg cctttatggg tacgggcaag ttgaaag 37 <210> 195 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-32 effector target CRISPR repeat <400> 195 aagttgcatc cgctttccag caaccagggc gggtgaaagt t 41 <210> 196 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-44 effector target CRISPR repeat <400> 196 gttgcctccc gcttcgaggc acgggaacga ttgaaag 37 <210> 197 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-46 effector target CRISPR repeat <400> 197 gttgcctccc gcttcgaggc acgggaacga ttgaaag 37 <210> 198 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-49 effector target CRISPR repeat <400> 198 gttgcaacac tccctgactg cctgacacaa atgcctcgaa agc 43 <210> 199 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-52 effector target CRISPR repeat <400> 199 gtcgcaatga ctattttggc ttggggcgga atga 34 <210> 200 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-51 effector target CRISPR repeat <400> 200 gtttcaacac ccctcccgaa gtggggcggg ttgaaag 37 <210> 201 <211> 261 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-6 active effector sgRNA <220> <221> modified_base <222> (239)..(261) <223> a, c, u, g, unknown or other <400> 201 auaacagcgc cgcaggucau gccgucaaaa gccucugaac uguguuaaau ggggguuagu 60 uugacuguug aaagacaguu gugcuuucug acccugguag cugcccaccc ugaugcugcu 120 aucuuucggg auaggaauaa ggugcgcucc caguaauagg gguguagaug uacuacagug 180 guggcuacua aaucaccucc gaccaaggag gaauccaucc gaaaggaugg guugaaagnn 240 nnnnnnnnnn nnnnnnnnnn n 261 <210> 202 <211> 263 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-2 effector sgRNA <220> <221> modified_base <222> (241)..(263) <223> a, c, u, g, unknown or other <400> 202 gaauuaauag cgccgccguu caugcuucua ggagccucug aaaggugaca aaugcggguu 60 aguuuggcug uugucagaca gucuugcuuu cugacccugg uagcugccca ccccgaagcu 120 gcuguuccuu gugaacagga auuaggugcg cccccaguaa uaaggguaug gguuuaccac 180 agugguggcu acugaaucac cuccgagcaa ggaggaaccc acugaaaggu ggguugaaag 240 nnnnnnnnnn nnnnnnnnnn nnn 263 <210> 203 <211> 265 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-4 effector sgRNA <220> <221> modified_base <222> (243)..(265) <223> a, c, u, g, unknown or other <400> 203 gaaauagcgc cgcuuguuca ugcgcgaaag cgucucugaa caguguaaau guggguuagu 60 uugacugucg ugaagacggu cuugcuuucu gacccuggua gcugcccacc uugaagcugc 120 ugucucuugu agacaggaau caggugcgcc cccaguaaua uaggugcggg uuuaccgcag 180 ugguggcuac ccaaucaccu ccgagcaagg aggaacccac cuugaaagag gcggguugaa 240 agnnnnnnnn nnnnnnnnnn nnnnn 265 <210> 204 <211> 276 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-7 effector sgRNA <220> <221> modified_base <222> (254)..(276) <223> a, c, u, g, unknown or other <400> 204 guaacaaaca gcgccgcagu ucaugcgucu uauggcgccu cugugcugug caaaaugugg 60 guuaguuuga cuguuggaag acagucuugc uuucugaccc ugguagcugc ccaccuugaa 120 gcugcuaucc cuuguggaua ggaaucaggu gcgcccccag uaauagaggu gcggguuuac 180 cgcaguggug gcuaccgaau caccuccgag caaggaggaa cccaccuuga aaaagcuuug 240 ggcggguuga aagnnnnnnn nnnnnnnnnn nnnnnn 276 <210> 205 <211> 246 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-1 effector sgRNA 1 <220> <221> modified_base <222> (224)..(246) <223> a, c, u, g, unknown or other <400> 205 gaugcuaagu cgcgccuagc aucaaggagc uaugucuuga uugucuuggg uguccgcccu 60 ggaugaguug agguguagau gcuucuauca uggcagcuac uaaacgcccc aagcaagggg 120 aacccaucuu uaauuuuggc aaaccgaagc gggggcaaaa ucuccaggag guucgccaaa 180 accuuugaaa cuccuuagcu ggaaauggcg augggguuga aagnnnnnnn nnnnnnnnnn 240 nnnnnn 246 <210> 206 <211> 274 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-1 effector sgRNA 2 <220> <221> modified_base <222> (252)..(274) <223> a, c, u, g, unknown or other <400> 206 cuuguucgag uucguuugaa cugaacaagg guaaguaugg gccaguuuaa uugcuuuccg 60 ucccaggaua gcugccagcu ucuaccguag guucguccug caagugaugc uaagucgcgc 120 cuagcaucaa ggagcuaugu cuugauuguc uugggugucc gcccuggaug aguugaggug 180 uagaugcuuc uaucauggca gcuacuaaac gccccaagca aggggaaccc aucgaaagau 240 gggguugaaa gnnnnnnnnn nnnnnnnnnn nnnn 274 <210> 207 <211> 60 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG110-1-6 effector crRNA <220> <221> modified_base <222> (9)..(40) <223> a, c, u, g, unknown or other <400> 207 cugguaaann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn gugaccugcc gcauaggcag 60 <210> 208 <211> 59 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG110-2-6 effector crRNA <220> <221> modified_base <222> (7)..(38) <223> a, c, u, g, unknown or other <400> 208 ccaagannnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnua ugaacugccg cauaggcag 59 <210> 209 <211> 227 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-4 effector putative tracrRNA <400> 209 aauagcgccg cuuguucaug cgcgaaagcg ucucugaaca guguaaaugu ggguuaguuu 60 gacugucgug aagacggucu ugcuuucuga cccugguagc ugcccaccuu gaagcugcug 120 ucucuuguag acaggaauca ggugcgcccc caguaauaua ggugcggguu uaccgcagug 180 guggcuaccc aaucaccucc gagcaaggag gaacccaccu uaauuau 227 <210> 210 <211> 228 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-7 effector putative tracrRNA <400> 210 aacagcgccg caguucaugc gucuuauggc gccucugugc ugugcaaaau guggguuagu 60 uugacuguug gaagacaguc uugcuuucug acccugguag cugcccaccu ugaagcugcu 120 aucccuugug gauaggaauc aggugcgccc ccaguaauag aggugcgggu uuaccgcagu 180 gguggcuacc gaaucaccuc cgagcaagga ggaacccacc uuaauuau 228 <210> 211 <211> 328 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-9 effector putative tracrRNA <400> 211 gcugaaguua gucucuggau acugaaguca gugucuaggg acugaaguaa ggggagcuuu 60 acccgcaagg gauacuuucg acccccugua gcugcccgcu ccuggugggg ugcccugaca 120 cccgccucau uacagcaaug uaugacuguc ugggcuaaug aaagaaggau uagggacgca 180 gguucacgac cuacuucaau cauagucugu gcaacccaga uaagugagua ugacccgcaa 240 gggucuaaac gccuuuagua gaaugguucu uccaguuugu uaagggcagg gcuugguucu 300 ccaagguggc uacgaauucu ucucgauu 328 <210> 212 <211> 187 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-10 effector putative tracrRNA <400> 212 gguagcgcug gagccacaua guucauaagc ucacgcuucu uggacuuccu guguucucua 60 aaacggguuc uguuuuaccc uuaccaaggg auacuuucag auccgaguag cugcaagcuc 120 auggcggagu guccccugac gcuuugccac cgucauagcg augugauggc cgucuggcgu 180 augaacg 187 <210> 213 <211> 326 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-12 effector putative tracrRNA <400> 213 aauagcgccc cuaaucaaau cgaaggcguu ugaggacggg gaaaaugggu aaguuuccau 60 cgaaaggugg uucuuuucag cccuauguag ucccacuccc uuguggagug uuagcaucug 120 aggugccuag cacagcaaag ucucucagga gacggaguca aagcugggga acaaguauua 180 cgaacgaauc ucgcgauucu auuaguauac guaggucgcu cccaugcaac aagaugcuca 240 ucucucagca augaggguag ggaacguauc ccaaacacua caugaauagc ucgucgggcu 300 ugcccgguga guauccacca agccuu 326 <210> 214 <211> 311 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-13 effector putative tracrRNA <400> 214 cgcuagguuu gccuuuucgc gcgcugcuga agcagugaaa aguuccgaca guuuaaaagu 60 ucuaacacuu uuacugcuuu ccgucgggag uaguuguccg cuucugcguu guugagaccg 120 aaguuugucc aggugauagg cagaacguug augcaacagg uagauagucg cgcucuauca 180 ggaagcuguu cuaguuauua guguucgugc acuaauaaag aggauacagg gauacaugug 240 guugugucca gcaauggcac aacagggcca cuacucgaag ccccgagcaa ggguugagcc 300 uacccaaauu u 311 <210> 215 <211> 342 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-14 effector putative tracrRNA <400> 215 aacagcgccg caguuuaagc ucuauagccg cugaacugug aaaaaugugg gucaguuugg 60 ucguugcaag acgaucgugc uuuccgaccc uaguaacugu ccgcucacug acugccaucc 120 uggggcaaau cuucaaauuu uguguauuug uguggggaug gaaagcugca uuagucgauu 180 cucuuccucc aauguagcgu aggugcgcac ccagcagaag ugaguuaagc cuucacaaug 240 uggagguaca gaagcaucau cucuccauuu uuugguguag auggugugac ugaaguggua 300 guuaccgaau cgccccugau caagggggag cccuccauaa uu 342 <210> 216 <211> 297 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-15 effector putative tracrRNA <400> 216 aaugacguuu guuucugugc gcgcugcuga agcagugaaa aauacggaca gucuaauuug 60 cuuuccgucc ggaguaguug uccgcuucug cguuguugga accgaaguuu guccagguga 120 uaggcggagu guuucggcaa cagauggaga gucgcaccuc uaucaggggg caguuuuagu 180 gguuaguguu uagcgcacua ucacuaggau acagggauac augugguagu gaccagagau 240 ggcacugcgg gaccgcuacu cgaagccccg aacaaggguu gagcuuaccc aaaucuu 297 <210> 217 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-16 effector putative tracrRNA <400> 217 aauagcgccg caguuuaagc ucagcaagcc ucuggacugc gaaaaguaug ggguaguuug 60 accgucggua aacgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120 uucuuaacug ggaaucgaga ugaggugcgc ccccagcaaa agggaacggg uuuacuggag 180 ugguggucgc cgaaucaccc ccgagcaagg gggacucguc cuuugc 226 <210> 218 <211> 227 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-17 effector putative tracrRNA <400> 218 aauagcgccg caguuuaagc ucaaugagcc ucuugacugc gaacaguaug ggguaguuug 60 accggcggua accgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120 uucucaaccg ggaaucgaga aucaggugcg cccccagcaa gagggaacgg guuuacugga 180 gugguggucg ccgaaucacc cccgagcaag ggggacucgu ccuuugc 227 <210> 219 <211> 227 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-19 effector putative tracrRNA <400> 219 aauagcgccg caguuuaagc ucagcaagcc ucuggacugc gaaaaguaug ggguaguuug 60 accgucggua aacgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120 uucucaaccg ggaaucgaga aucaggugcg cccccagcaa gagggaacgg guuuacugga 180 gugguggucg ccgaaucacc cccgagcaag ggggacucgu ccuuugc 227 <210> 220 <211> 211 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-20 effector putative tracrRNA <400> 220 aauagcgccg caguuuaagc ucaaugagcc ucuugacugc gaacaguaug ggguaguuug 60 accggcggua accgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120 uucucaaccg ggaaucgaga aucaggugcg cccccagcaa gagggaacgg guuuacugga 180 gugguggucg ccgaaucacc cccgagcaag g 211 <210> 221 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-21 effector putative tracrRNA <400> 221 aauagcgccg caguucaugc uucuuugaag ccucugugcu gugcaaaaug uggguuaguu 60 uggcuguuga agaaacagcc uugcuuucug acccugguag cuguccaccc ugaagcugcu 120 auccccugug gauaggauag gugcgccccc agcaauaggg gagcggguau accgcagugg 180 uggcuacuga aucaccucca agcaaggagg aauccacuuu au 222 <210> 222 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-22 effector putative tracrRNA <400> 222 aauagcgccg caguucaugc uucuuugaag ccucugugcu gugcaaaaug uggguuaguu 60 uggcuguuga agaaacagcc uugcuuucug acccugguag cuguccaccc ugaagcugcu 120 auccccugug gauaggauag gugcgccccc agcaauaggg gagcggguau accgcagugg 180 uggcuacuga aucaccucca agcaaggagg aauccacuuu au 222 <210> 223 <211> 248 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-24 effector putative tracrRNA <400> 223 aaaagcgccg uagaacaugc ucacgccucu guucugcgaa aaauuagggu uuguuuggcu 60 gucugacagc agucuuacuu ucugucccua gaaucugacc acuccgaugc ugcuguugua 120 agugaacuug auugagcucg gacaccaugc aacaggauaa ggggcgcacc cagcaagaga 180 ggacggacuu accguagugu uggcuucuga agcaacuccg accaaggagu aguccaugca 240 uucaucau 248 <210> 224 <211> 277 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-25 effector putative tracrRNA <400> 224 aaucgcgccg cacauucaug uuccuugaga accucugaau ugcgaaagug ugggcuaguu 60 uguucgcuug augcgaaugu gcuuucuggc ccugguagcu guccgcccug augcugauuu 120 cuacggguaa cuguaggaau gauuaacucg uucuauagac agguuucgug cuuucuauug 180 uaacgggguc ggugcgcucc cagcaauagg gguguggguc uacuacagug auggcuacug 240 aaucaccucc gagcaaggag gaauccaccu uaacuuu 277 <210> 225 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-27 effector putative tracrRNA <400> 225 aauagcgccg caguuuaagc ucagcaagcc ucuggacugc gaaaaguaug ggguaguuug 60 accgucggua aacgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120 uucuuaacug ggaaucgaga ugaggugcgc ccccagcaag agggaacggg uuuacuggag 180 ugguggucgc cgaaucaccc ccgagcaagg gggacucguc cuuugc 226 <210> 226 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-28 effector putative tracrRNA <400> 226 aauagcgccg caguuuaagc ucagcaagcc ucuggacugc gaaaaguaug ggguaguuug 60 accgucggua aacgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120 uucuuaacug ggaaucgaga ugaggugcgc ccccagcaag agggaacggg uuuacuggag 180 ugguggucgc cgaaucaccc ccgagcaagg gggacucguc cuuugc 226 <210> 227 <211> 255 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-29 effector putative tracrRNA <400> 227 uagcgcacga accugacuag cgucauuacg augcgaguuc uggaaauggg acaguuucau 60 ugcuuuccgu cccuggcacu gccugcuuac ucacgaccac aaggagacaa uucagcgcug 120 ugaguucgcg auucucuacu guuuaugaca aacuaacguu ugucuggcag uacagcaaga 180 uuguguauca gaccauguuu ggcgaagaua cauggcaggc cgaaucgcca augaaaccag 240 cggacuuccc cuaau 255 <210> 228 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-32 effector putative tracrRNA <400> 228 aauagcgccg caguuuaagc ucaaugagcc ucuugacugc gaacaguaug ggguaguuug 60 accggcggua accgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120 uucuuaacug ggaaucgaga ugaggugcgc ccccagcaag agggaacggg uuuacuggag 180 ugguggucgc cgaaucaccc ccgagcaagg gggacucguc cuuugc 226 <210> 229 <211> 203 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-44 effector putative tracrRNA <400> 229 ucuagcgccg cagcucaugu cagcaauggc caauguguug ugcuaaaugc gagcuaguuu 60 gacugccugc uaagcagucu ugcuuucugg cucaggugac uauccaccca aaggucguug 120 gugcgcuggc gauuugaggg cacggguucc ggagugauag uuaccauuac accuccggcc 180 aaggaggaau ccaccccacc ccc 203 <210> 230 <211> 203 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-46 effector putative tracrRNA <400> 230 ucuagcgccg cagcucaugu cagcaauggc caauguguug ugcuaaaugc gagcuaguuu 60 gacugccugc uaagcagucu ugcuuucugg cucaggugac uauccaccca aaggucguug 120 gugcgcuggc gauuugaggg cacggguucc ggagugauag uuaccauuac accuccggcc 180 aaggaggaau ccaccccacc ccc 203 <210> 231 <211> 310 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-49 effector putative tracrRNA <400> 231 gauugcgccu cgaucgaugc ucuaugagcc gcucgaucgu agaaaaaugg gugaguuuga 60 uuaucuacuu cguuagauaa ugcugcuuuc cgacccuggc auucuguccg cccuugaagc 120 ugcuucucau ggacuagcgu aagcucguug guaagaagga aaagucauaa uuuaaaguca 180 cgucuuucua guaugacaua ggugcgcucc cacgcaauau aggguucagc uuuuauuuua 240 uaaaaguaga gacuuuccuc uagugacagu gccgaaauga ccccgugcga gggguaacua 300 ccuaaguuuu 310 <210> 232 <211> 227 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-51 effector putative tracrRNA <400> 232 aacagcgccg caguucaugu uuguuauaaa ccucuguacu gcgauaaaug cggguuaguu 60 ugacuguugu gagacagucu ugcuuucuga cccuaguagc ugcccaccuu gaugcugcug 120 uucccaguga acaggaauaa ggugcgcccc caguaauaga ggugcggguu uaccgcagug 180 guggcuacug aaucaccucc gacuaaggag gaauccaccu uaauuau 227 <210> 233 <211> 380 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-52 effector putative tracrRNA <400> 233 accggggauc guccugguga agggagaguu gcuuuggauc ggucacaagc uuuuccuuaa 60 cuaauucuca cugacugacu aggaugaucg aggggguuau guuuuaccac ugcaaggugg 120 auacuuucaa accccugugg uagcugcucg cuccugguga ggugcccuga cacuucaccc 180 cacuacagca augugugugg cugucugguu augagagaag uuagggcaua gguucguuac 240 cugcauucaa ucauaaauua cgcgaccaga uaagugagua ugauccgcaa ggaucuauau 300 gucuuuagca aagaagugcu ucugcuuugu uacuggcgua gggcaugguu cucuaaagug 360 gcuaccgaac cuucccaauu 380 <210> 234 <211> 257 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG64-56 effector putative tracrRNA <400> 234 aacagcgccg caguucaugc ucuucugagu cucuguacug ugauaaaucu ggguuaguuu 60 aacgguugaa agaccguuuu gcuuucugac ccugguagcu gcucgcucuu gaugcugcug 120 ucuuuugaca ggauaggugc gcucccagca auaaagaguu aaagcugaua aagcuugagc 180 cguuguaaaa cggugggguu uaccucagug guggcuacug aaucaccccc uucgucgggg 240 gaacccuccu aaauauu 257 <210> 235 <211> 246 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-1 effector putative tracrRNA <400> 235 uuuagcgcac uuguucgagu ucguuugaac ugaacaaggg uaaguauggg ccaguuuaau 60 ugcuuuccgu cccaggauag cugccagcuu cuaccguagg uucguccugc aagugaugcu 120 aagucgcgcc uagcaucaag gagcuauguc uugauugucu uggguguccg cccuggauga 180 guugaggugu agaugcuucu aucauggcag cuacuaaacg ccccaagcaa ggggaaccca 240 ucuuua 246 <210> 236 <211> 223 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG108-2 effector putative tracrRNA <400> 236 aauagcgccg uaguucaugc uugcuaaagc cucugaauug cgaaaagucc ggguuagugc 60 ugucggcaga cagcguugcu uucugacccu gguagcugcc caccccgaug cugcuguccc 120 uugcagacag gaaccaggug cgcccccagu aauaagggug uggguuuacc acaguggugg 180 cuacugaauc accuccgagc aaggaggaau ccaccuuaac uau 223 <210> 237 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-9 effector crRNA <400> 237 gucuuucauc cuaucucgcg ccagaucgcu uccugcaacc c 41 <210> 238 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-12 effector crRNA <400> 238 guugcaagcg ccuccuuggc uguugguggg uggaaag 37 <210> 239 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-14 effector crRNA <400> 239 guugcaaucg ccuucccaga gauggguggg cugaaag 37 <210> 240 <211> 38 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-15 effector crRNA <400> 240 guuacaauua cccucccagc guuggguggg uugaaagg 38 <210> 241 <211> 39 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-16 effector crRNA <400> 241 aaguugcauc cgcuuuccag caaccagggc gggugaaag 39 <210> 242 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-17 effector crRNA <400> 242 guugcauccg cuuuccagca accagggcgg gugaaag 37 <210> 243 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-19 effector crRNA <400> 243 guacccaaag ccuuuuuucc uuaagccuau ccg 33 <210> 244 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-25 effector crRNA <400> 244 guuucaaccg ccaucccagc uaggggu 27 <210> 245 <211> 38 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-27 effector crRNA <400> 245 aguugcaucc gcuuuccagc aaccagggcg ggugaaag 38 <210> 246 <211> 38 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-28 effector crRNA <400> 246 guugcaucug cuuuucagca acuagggcgg gggaaagc 38 <210> 247 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-29 effector crRNA <400> 247 ggcgcgaucg ccuuuauggg uacgggcaag uugaaag 37 <210> 248 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-32 effector crRNA <400> 248 aaguugcauc cgcuuuccag caaccagggc gggugaaagu u 41 <210> 249 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-44 effector crRNA <400> 249 guugccuccc gcuucgaggc acgggaacga uugaaag 37 <210> 250 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-46 effector crRNA <400> 250 guugccuccc gcuucgaggc acgggaacga uugaaag 37 <210> 251 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-49 effector crRNA <400> 251 guugcaacac ucccugacug ccugacacaa augccucgaa agc 43 <210> 252 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-52 effector crRNA <400> 252 gucgcaauga cuauuuuggc uuggggcgga auga 34 <210> 253 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-51 effector crRNA <400> 253 guuucaacac cccucccgaa guggggcggg uugaaag 37 <210> 254 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-56 effector crRNA <400> 254 guuucaacaa ccaucccagc uagggguggg uugaaag 37 <210> 255 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-2 effector crRNA <400> 255 guuucaacga ccaucccaac uagggguggg uugaaag 37 <210> 256 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-4 effector crRNA <400> 256 guuucaacuu uccuuccagc uagaggcggg uugaaag 37 <210> 257 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-6 effector crRNA <400> 257 guuucaacca ccaucucaac uagggauggg uugaaag 37 <210> 258 <211> 38 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-7 effector crRNA <400> 258 guuucaacgc cccuucaagc uuugggcggg uugaaagc 38 <210> 259 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG64-13 effector crRNA <400> 259 uggcaauugc ccuuccagug uugggugggu ugaaag 36 <210> 260 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG108-2 effector crRNA <400> 260 guuucaacga ccaucccgac aagggguggg uugaaag 37 <210> 261 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG108-1 effector crRNA <400> 261 guugcgaucg ccgcuccggu ggcgaugggg uugaaag 37

Claims (141)

  1. 카고(cargo) 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
    재조합효소(recombinase) 또는 전위효소(transposase) 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
    클래스 II 타입 II Cas 이펙터, 및 상기 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
    상기 카고 뉴클레오타이드 서열을 상기 표적 핵산 부위로 끌어들이도록 구성된 상기 재조합효소 또는 전위효소 복합체
    를 포함하는 시스템.
  2. 제1항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
  3. 제1항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
  4. 제3항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
  7. 제6항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
  8. 제7항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 3'에 위치하는 것인 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 Tn7 타입 전위효소 복합체인 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된 것인 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 클래스 II 타입 II Cas 이펙터가 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개 또는 4개의 폴리펩티드(들)를 포함하는 것인 시스템.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 시스템.
  14. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  15. 제2항 내지 제14항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  16. 제2항 내지 제15항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 19 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 클래스 II 타입 II Cas 이펙터 및 상기 재조합효소 또는 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 시스템.
  18. 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 제1항 내지 제17항 중 어느 한 항의 시스템을 발현시키거나 제1항 내지 제17항 중 어느 한 항의 시스템을 세포에 도입하는 단계를 포함하는 방법.
  19. 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
    Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
    클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
    상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체
    를 포함하는 시스템.
  20. 제19항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
  21. 제19항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
  22. 제21항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
  23. 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터가 아닌 것인 시스템.
  24. 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
  25. 제19항 내지 제24항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
  26. 제19항 내지 제25항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
  27. 제26항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 5'에 위치하는 것인 시스템.
  28. 제19항 내지 제27항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된 것인 시스템.
  29. 제19항 내지 제28항 중 어느 한 항에 있어서, 상기 TnsA 서브유닛이 서열번호 7 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
  30. 제19항 내지 제29항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함하는 것인 시스템.
  31. 제19항 내지 제30항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 시스템.
  32. 제24항 내지 제31항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 20 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  33. 제24항 내지 제32항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 21 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  34. 제19항 내지 제33항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터가 아닌 것인 시스템.
  35. 제19항 내지 제34항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 시스템.
  36. 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 제19항 내지 제34항 중 어느 한 항의 시스템을 발현시키거나 제19항 내지 제34항 중 어느 한 항의 시스템을 세포에 도입하는 단계를 포함하는 방법.
  37. 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서,
    카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을,
    클래스 II 타입 II Cas 이펙터, 및 상기 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체;
    상기 카고 뉴클레오타이드를 상기 표적 핵산 부위로 끌어들이도록 구성된 재조합효소 또는 전위효소 복합체; 및
    상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산
    과 접촉시키는 단계를 포함하는 방법.
  38. 제37항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
  39. 제37항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
  40. 제39항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
  41. 제37항 내지 제40항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 방법.
  42. 제37항 내지 제41항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 방법.
  43. 제42항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 3'에 위치하는 것인 방법.
  44. 제37항 내지 제43항 중 어느 한 항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 Tn7 타입 전위효소 복합체인 시스템.
  45. 제37항 내지 제44항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된 것인 방법.
  46. 제37항 내지 제45항 중 어느 한 항에 있어서, 상기 클래스 II 타입 II Cas 이펙터가 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 방법.
  47. 제37항 내지 제46항 중 어느 한 항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개 또는 4개의 폴리펩티드(들)를 포함하는 것인 방법.
  48. 제37항 내지 제47항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 방법.
  49. 제37항 내지 제48항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
  50. 제41항 내지 제49항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
  51. 제41항 내지 제50항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 19 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
  52. 제37항 내지 제51항 중 어느 한 항에 있어서, 상기 클래스 II 타입 II Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 방법.
  53. 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서,
    상기 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을,
    클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체;
    상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체; 및
    상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산
    과 접촉시키는 단계를 포함하는 방법.
  54. 제53항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
  55. 제53항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
  56. 제55항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
  57. 제53항 내지 제56항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 방법.
  58. 제53항 내지 제57항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 방법.
  59. 제58항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 3'에 위치하는 것인 방법.
  60. 제53항 내지 제59항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된 것인 방법.
  61. 제53항 내지 제60항 중 어느 한 항에 있어서, 상기 TnsA 서브유닛이 서열번호 7 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 방법.
  62. 제53항 내지 제61항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함하는 것인 방법.
  63. 제53항 내지 제62항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 방법.
  64. 제57항 내지 제63항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 20 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
  65. 제57항 내지 제64항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 21 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
  66. 제53항 내지 제65항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터가 아닌 것인 방법.
  67. 제53항 내지 제66항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 방법.
  68. 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
    Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
    클래스 I 타입 I-F Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
    상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체
    를 포함하는 시스템.
  69. 제68항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
  70. 제68항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
  71. 제70항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
  72. 제68항 내지 제71항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
  73. 제68항 내지 제72항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
  74. 제68항 내지 제73항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
  75. 제74항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 3'에 위치하는 것인 시스템.
  76. 제74항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 5'에 위치하는 것인 시스템.
  77. 제68항 내지 제76항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 I 타입 I-F Cas 이펙터에 결합하도록 구성된 것인 시스템.
  78. 제68항 내지 제77항 중 어느 한 항에 있어서, 상기 클래스 I 타입 I-F Cas 이펙터가 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
  79. 제68항 내지 제78항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 44 내지 46 또는 51 내지 53 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함하는 것인 시스템.
  80. 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 제68항 내지 제79항 중 어느 한 항의 시스템을 발현시키거나 제68항 내지 제79항 중 어느 한 항의 시스템을 세포에 도입하는 단계를 포함하는 방법.
  81. 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
    Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
    클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
    상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsB, TnsC 및 TniQ 구성요소를 포함하는 Tn7 타입 전위효소 복합체
    를 포함하고, 이때 (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 폴리펩티드를 포함하거나;
    (b) 상기 Tn7 타입 전위효소 복합체가 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 TnsB, TnsC 또는 TniQ 구성요소를 포함하는 것인 시스템.
  82. 제81항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
  83. 제81항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
  84. 제83항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
  85. 제81항 내지 제84항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
  86. 제81항 내지 제85항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 TnsB, TnsC 또는 TniQ 구성요소를 포함하는 것인 시스템.
  87. 제81항 내지 제86항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터인 시스템.
  88. 제81항 내지 제87항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
  89. 제81항 내지 제88항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
  90. 제81항 내지 제89항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
  91. 제90항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 5'에 위치하는 것인 시스템.
  92. 제91항에 있어서, 상기 PAM 서열이 5'-nGTn-3' 또는 5'-nGTt-3'을 포함하는 것인 시스템.
  93. 제81항 내지 제92항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된 것인 시스템.
  94. 제81항 내지 제93항 중 어느 한 항에 있어서, 상기 TnsB, TnsC 및 TniQ 구성요소가 각각 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
  95. 제81항 내지 제94항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 시스템.
  96. 제81항 내지 제95항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
  97. 제88항 내지 제96항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 125, 127, 123, 129, 131, 133, 153 또는 134 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  98. 제88항 내지 제97항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 126, 155, 128, 124, 130, 132 또는 154 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  99. 제81항 내지 제97항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 시스템.
  100. 제81항 또는 제88항에 있어서,
    (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 22 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (b) 상기 좌측 재조합효소 서열이 서열번호 125 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (c) 상기 우측 재조합효소 서열이 서열번호 126 또는 155, 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
    (d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 90의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 94, 112 또는 202 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 23 내지 25 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
  101. 제81항 또는 제88항에 있어서,
    (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 26 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (b) 상기 좌측 재조합효소 서열이 서열번호 127 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (c) 상기 우측 재조합효소 서열이 서열번호 128 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 91, 156 또는 209 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 95, 113 또는 203 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 27 내지 29 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
  102. 제81항 또는 제88항에 있어서,
    (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 60 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (b) 상기 좌측 재조합효소 서열이 서열번호 131 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (c) 상기 우측 재조합효소 서열이 서열번호 132 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 117, 161 또는 214 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 119의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 101 내지 103 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
  103. 제81항 또는 제88항에 있어서,
    (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 147 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (b) 상기 좌측 재조합효소 서열이 서열번호 153 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (c) 상기 우측 재조합효소 서열이 서열번호 154 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 151, 181 또는 234 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 152 또는 254의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 148 내지 150 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
  104. 제81항 또는 제88항에 있어서,
    (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 34 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (b) 상기 좌측 재조합효소 서열이 서열번호 129 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (c) 상기 우측 재조합효소 서열이 서열번호 130 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 93, 157 또는 210 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 97, 114 또는 204 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 148 내지 150 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
  105. 제81항, 제88항 및 제91항 중 어느 한 항에 있어서,
    (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 30 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (b) 상기 좌측 재조합효소 서열이 서열번호 123 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (c) 상기 우측 재조합효소 서열이 서열번호 124 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
    (d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 92의 적어도 약 46개 내지 80개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 111 또는 201의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
    (e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 31, 32 및 33, 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하거나;
    (f) 상기 PAM 서열이 5'-nGTn-3' 또는 5'-nGTt-3'을 포함하는 것인 시스템.
  106. 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
    Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
    클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
    상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsB 및 TnsC 구성요소를 포함하지만 TnsA 및/또는 TniQ 구성요소를 포함하지 않는 Tn7 타입 전위효소 복합체
    를 포함하는 시스템.
  107. 제106항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
  108. 제106항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
  109. 제108항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
  110. 제106항 내지 제109항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 39, 40, 109 또는 110 중 어느 하나에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
  111. 제106항 내지 제110항 중 어느 한 항에 있어서, 상기 TnsB 구성요소가 서열번호 40 또는 109에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
  112. 제106항 내지 제111항 중 어느 한 항에 있어서, 상기 TnsC 구성요소가 서열번호 39 또는 110에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
  113. 제106항 내지 제112항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터인 시스템.
  114. 제106항 내지 제112항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 서열번호 38 또는 서열번호 108에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
  115. 제106항 내지 제114항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
  116. 제106항 내지 제115항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
  117. 제106항 내지 제116항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 상기 이중 가닥 핵산 또는 상기 시스템이 세포 내부에 있는 것인 시스템.
  118. 제106항 내지 제117항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
  119. 제118항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 5'에 위치하는 것인 시스템.
  120. 제106항 내지 제119항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된 것인 시스템.
  121. 제106항 내지 제120항 중 어느 한 항에 있어서, 상기 TnsB 및 TnsC 구성요소가 각각 서열번호 40 및 39 또는 109 및 110에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
  122. 제106항 내지 제121항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 시스템.
  123. 제106항 내지 제121항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 115, 116, 205, 206, 261, 235, 260 또는 236 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  124. 제115항 내지 제123항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 134에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  125. 제115항 내지 제124항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 135 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
  126. 제106항 내지 제125항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 시스템.
  127. 제106항 또는 제115항에 있어서,
    (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 38 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (b) 상기 좌측 재조합효소 서열이 서열번호 134 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
    (c) 상기 우측 재조합효소 서열이 서열번호 135 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
    (d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 182 또는 235의 적어도 약 46개 내지 80개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 98, 115, 116, 205 또는 206의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
    (e) 상기 TnsB 및 TnsC 구성요소가 서열번호 40 및 39 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
  128. 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 제81항 내지 제127항 중 어느 한 항의 시스템을 발현시키거나 제81항 내지 제127항 중 어느 한 항의 시스템을 세포에 도입하는 단계를 포함하는 방법.
  129. RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 엔도뉴클레아제가 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제가 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 클래스 II 타입 II 엔도뉴클레아제이고, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  130. 제129항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 것인 조작된 뉴클레아제 시스템.
  131. 제129항 또는 제130항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  132. RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 엔도뉴클레아제가 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제가 서열번호 5에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V 엔도뉴클레아제이고, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  133. 제132항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 13 내지 16 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  134. RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 엔도뉴클레아제가 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제가 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V-K 엔도뉴클레아제이고, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  135. 제134항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  136. 제134항 또는 제135항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  137. RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 엔도뉴클레아제가 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제가 서열번호 38 또는 서열번호 108 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V-K 엔도뉴클레아제이고, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  138. 제137항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  139. 제137항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210, 115, 116, 205, 206, 261, 235, 260 또는 236 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  140. 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 하나의 Cas6, Cas7 또는 Cas8 폴리펩티드를 포함하는 클래스 I 타입 I-F Cas 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  141. 제140항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 121, 122, 207 또는 208 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
KR1020237010115A 2020-08-24 2021-08-23 카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법 KR20230054457A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202063069703P 2020-08-24 2020-08-24
US63/069,703 2020-08-24
US202163186698P 2021-05-10 2021-05-10
US63/186,698 2021-05-10
US202163232593P 2021-08-12 2021-08-12
US63/232,593 2021-08-12
PCT/US2021/047195 WO2022046662A1 (en) 2020-08-24 2021-08-23 Systems and methods for transposing cargo nucleotide sequences

Publications (1)

Publication Number Publication Date
KR20230054457A true KR20230054457A (ko) 2023-04-24

Family

ID=80353933

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237010115A KR20230054457A (ko) 2020-08-24 2021-08-23 카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법

Country Status (11)

Country Link
US (1) US20240301374A1 (ko)
EP (1) EP4200422A4 (ko)
JP (1) JP2023539237A (ko)
KR (1) KR20230054457A (ko)
CN (1) CN116438302A (ko)
AU (1) AU2021333586A1 (ko)
BR (1) BR112023003441A2 (ko)
CA (1) CA3190758A1 (ko)
GB (1) GB2615658A (ko)
MX (1) MX2023002281A (ko)
WO (1) WO2022046662A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240145522A (ko) * 2022-02-23 2024-10-07 메타지노미, 인크. 융합 단백질
WO2023220599A2 (en) * 2022-05-09 2023-11-16 Cornell University Adaptations for high efficiency and altered pam usage with tn7-crispr-cas transposition systems

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202013012241U1 (de) * 2012-05-25 2016-01-18 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
GB201514510D0 (en) * 2015-08-14 2015-09-30 Nemesis Bioscience Ltd Delivery vehicle
US20200002746A1 (en) * 2017-02-14 2020-01-02 Seqwell, Inc. Compositions and methods for sequencing nucleic acids
EP3704237A1 (en) * 2017-11-02 2020-09-09 Arbor Biotechnologies, Inc. Novel crispr-associated transposon systems and components
US20230193255A1 (en) * 2018-11-16 2023-06-22 The Regents Of The University Of California Compositions and methods for delivering crispr/cas effector polypeptides
US11384344B2 (en) * 2018-12-17 2022-07-12 The Broad Institute, Inc. CRISPR-associated transposase systems and methods of use thereof

Also Published As

Publication number Publication date
EP4200422A1 (en) 2023-06-28
AU2021333586A9 (en) 2024-02-08
WO2022046662A1 (en) 2022-03-03
JP2023539237A (ja) 2023-09-13
CA3190758A1 (en) 2022-03-03
AU2021333586A1 (en) 2023-04-27
BR112023003441A2 (pt) 2023-05-02
MX2023002281A (es) 2023-05-16
EP4200422A4 (en) 2024-08-28
GB2615658A (en) 2023-08-16
US20240301374A1 (en) 2024-09-12
CN116438302A (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
JP7502537B2 (ja) Ruvcドメインを有する酵素
US20240301374A1 (en) Systems and methods for transposing cargo nucleotide sequences
US20220298494A1 (en) Enzymes with ruvc domains
US20230340481A1 (en) Systems and methods for transposing cargo nucleotide sequences
WO2021178934A1 (en) Class ii, type v crispr systems
WO2021202559A1 (en) Class ii, type ii crispr systems
WO2021226369A1 (en) Enzymes with ruvc domains
CN116615547A (zh) 用于对货物核苷酸序列转座的系统和方法
KR20240145522A (ko) 융합 단백질
KR20240145512A (ko) 융합 단백질
GB2617659A (en) Enzymes with RUVC domains
KR20240150801A (ko) 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법
WO2023164591A2 (en) Systems and methods for transposing cargo nucleotide sequences

Legal Events

Date Code Title Description
A201 Request for examination