KR20230062873A - 염기 편집 효소 - Google Patents

염기 편집 효소 Download PDF

Info

Publication number
KR20230062873A
KR20230062873A KR1020237012244A KR20237012244A KR20230062873A KR 20230062873 A KR20230062873 A KR 20230062873A KR 1020237012244 A KR1020237012244 A KR 1020237012244A KR 20237012244 A KR20237012244 A KR 20237012244A KR 20230062873 A KR20230062873 A KR 20230062873A
Authority
KR
South Korea
Prior art keywords
endonuclease
nucleic acid
seq
glu
ala
Prior art date
Application number
KR1020237012244A
Other languages
English (en)
Inventor
쥰 리앙 린
앨런 브룩스
크리스티나 버터필드
크리스토퍼 브라운
신디 캐스텔
Original Assignee
메타지노미, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메타지노미, 인크. filed Critical 메타지노미, 인크.
Publication of KR20230062873A publication Critical patent/KR20230062873A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2497Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/02Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
    • C12Y302/02027Uracil-DNA glycosylase (3.2.2.27)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Dental Preparations (AREA)
  • Paints Or Removers (AREA)
  • Graft Or Block Polymers (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 개시내용은 독특한 도메인 특징을 갖는 엔도뉴클레아제 효소뿐만 아니라 이러한 효소 또는 이의 변이체를 사용하는 방법을 제공한다.

Description

염기 편집 효소
상호 참조
본 출원은 2020년 9월 11일에 출원된 "염기 편집 효소(BASE EDITING ENZYMES)"라는 제목의 미국 가출원 제63/077,057호 및 2021년 7월 15일에 출원된 "염기 편집 효소(BASE EDITING ENZYMES)"라는 제목의 미국 가출원 제63/222,351호를 우선권으로 주장하며, 이들 각각은 그 전체가 본원에 포함된다.
Cas 효소는 이와 연관된 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(Clustered Regularly Interspaced Short Palindromic Repeat; CRISPR) 가이드 리보핵산(RNA)과 함께 원핵생물 면역계의 만연한(박테리아의 약 45%, 고세균의 약 84%) 성분으로 보이며, CRISPR-RNA 가이드 핵산 절단에 의해 감염성 바이러스 및 플라스미드와 같은 비-자기 핵산으로부터 상기 미생물을 보호하는 역할을 한다. CRISPR RNA 요소를 코딩하는 데옥시리보핵산(DNA) 요소는 구조 및 길이가 상대적으로 보존될 수 있지만, 이의 CRISPR 연관(Cas) 단백질은 매우 다양하며, 광범위하게 다양한 핵산-상호작용 도메인을 포함한다. CRISPR DNA 요소는 1987년도에 일찍 관찰되었지만, CRISPR/Cas 복합체의 프로그래밍 가능한 엔도뉴클레아제 절단 능력은 비교적 최근에야 인식되어, 다양한 DNA 조작 및 유전자 편집 응용 분야에서 재조합 CRISPR/Cas 시스템을 사용하게 되었다.
서열 목록
본 출원은 ASCII 형식으로 전자 제출되고 그 전체가 본원에 참조로 포함되는 서열 목록을 포함한다. 2021년 9월 9일에 생성된 상기 ASCII 사본은 명칭이 55921-715_601_SL.txt이고, 크기가 705,305 바이트이다.
일부 양상에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기(base editor); 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 실시양태에서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 닉카제(nickase) 돌연변이를 포함한다. 일부 실시양태에서, 상기 클래스 2, 타입 II cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 72에 비해 잔기 13에, 또는 서열번호 75에 비해 잔기 17에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다. 일부 양상에서, 본 개시내용은 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 양상에서, 본 개시내용은 서열번호 360-368 또는 598 중 어느 하나 또는 이의 변이체를 포함하는 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 상기 클래스 2, 타입 II cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에서 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 50-51 또는 385-390 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 실시양태에서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, 상기 조작된 가이드 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성(non-degenerate) 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 양상에서, 본 개시내용은 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체로서, 상기 조작된 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 구조체; 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, 타입 II Cas 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 50-51 또는 385-390 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 360-368 또는 598로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 상기 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 시토신 데아미나제이다. 일부 실시양태에서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시스템은 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 리보핵산 구조체는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 리보핵산 구조체는 상기 가이드 리보핵산 서열 및 상기 tracr 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 상기 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물, 또는 인간 게놈 서열에 상보적이다. 일부 실시양태에서, 상기 가이드 리보핵산 서열은 길이가 15 내지 24 개의 뉴클레오티드이다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시양태에서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73 또는 78에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 서열번호 77에 비해 잔기 8에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 72에 비해 잔기 13에, 또는 서열번호 75에 비해 잔기 17에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 폴리펩티드는 상기 엔도뉴클레아제 및 상기 염기 편집기를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 상기 시스템은 Mg2+ 공급원을 추가로 포함한다. 일부 실시양태에서: (a) 상기 엔도뉴클레아제는 서열번호 70, 71, 73, 74, 76, 78, 77 또는 78 중 어느 하나 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나; (b) 상기 가이드 RNA 구조체는 서열번호 88, 89, 91, 92, 94, 96, 95 또는 488 중 어느 하나의 비축퇴성 뉴클레오티드와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나; (c) 상기 엔도뉴클레아제는 서열번호 360, 361, 363, 365, 367, 또는 368 중 어느 하나를 포함하는 PAM에 결합하도록 구성되거나; (d) 상기 염기 편집기는 서열번호 58 또는 595 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함한다. 일부 실시양태에서: (a) 상기 엔도뉴클레아제는 서열번호 70, 71, 또는 78 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나; (b) 상기 가이드 RNA 구조체는 서열번호 88, 89, 또는 96 중 적어도 하나의 비축퇴성 뉴클레오티드와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나; (c) 상기 엔도뉴클레아제는 서열번호 360, 362 또는 368 중 어느 하나를 포함하는 PAM에 결합하도록 구성되거나; (d) 상기 염기 편집기는 서열번호 594 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함한다. 일부 실시양태에서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT 또는 스미스-워터맨(Smith-Waterman) 상동성 검색 알고리즘에 의해 결정된다. 일부 실시양태에서, 상기 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 존재(existence) 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고 조건부 조성 점수 매트릭스 조정을 사용하여 상기 BLASTP 상동성 검색 알고리즘에 의해 결정된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 촉매적으로 사멸되도록 구성된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다.
일부 양태에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 핵산을 제공한다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된, 서열번호 70-78 중 어느 하나에 대해 적어도 70% 서열 동일성을 갖는 엔도뉴클레아제를 코딩하는 것인 핵산을 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시양태에서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간이다.
일부 양상에서, 본 개시내용은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 벡터로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 벡터를 제공한다.
일부 양상에서, 본 개시내용은 본원에 기재된 임의의 양상 또는 실시양태의 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 코딩하는 핵산을 추가로 포함한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래 비리온 또는 렌티바이러스이다.
일부 양상에서, 본 개시내용은 본원에 기재된 임의의 양상 또는 실시양태의 벡터를 포함하는 세포를 제공한다.
일부 양상에서, 본 개시내용은 본원에 기재된 임의의 양상 또는 실시양태의 세포를 배양하는 단계를 포함하는, 엔도뉴클레아제의 제조 방법을 제공한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 여기서 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하는 것인 방법을 제공한다. 일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합된다. 일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, 클래스 2, 타입 II Cas 엔도뉴클레아제, 상기 엔도뉴클레아제에 커플링된 염기 편집기, 및 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고; 상기 PAM은 서열번호 70-78 또는 597로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법을 제공한다. 일부 실시양태에서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 상기 염기 편집기에 공유 결합되거나, 링커를 통해 상기 염기 편집기에 커플링된다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 또는 이의 변이체로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 아데닌 데아미나제를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 아데닌을 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 상기 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 상기 아데닌 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 시토신 데아미나제를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 시토신을 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 상기 시토신을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 복합체는 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 상기 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시양태에서, 상기 PAM은 상기 조작된 가이드 리보핵산 구조체의 상기 서열에 상보적인 상기 서열의 3' 말단에 바로 인접한다. 일부 실시양태에서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시양태에서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 양상에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 본원에 기재된 임의의 양상 또는 실시양태의 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것을 포함하고, 상기 엔도뉴클레아제는 상기 조작된 가이드 리보핵산 구조체와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법을 제공한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템은 아데닌 데아미나제를 포함하고, 상기 뉴클레오티드는 아데닌이고, 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템은 시티딘 데아미나제 및 우라실 DNA 글리코실라제 억제제를 포함하고, 상기 뉴클레오티드는 시토신이고 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 아데닌을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 상기 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA 또는 박테리아 DNA를 포함한다. 일부 실시양태에서, 상기 표적 핵산 유전자좌는 시험관내에 있다. 일부 실시양태에서, 상기 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시양태에서, 상기 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포 또는 인간 세포이다. 일부 실시양태에서, 상기 세포는 동물 내에 있다. 일부 실시양태에서, 상기 세포는 달팽이관 내에 있다. 일부 실시양태에서, 상기 세포는 배아 내에 있다. 일부 실시양태에서, 상기 배아는 2세포 배아이다. 일부 실시양태에서, 상기 배아는 마우스 배아이다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 본원에 기재된 임의의 양상 또는 실시양태의 핵산 또는 본원에 기재된 임의의 양상 또는 실시양태의 벡터를 전달하는 것을 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함한다. 일부 실시양태에서, 상기 핵산은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임이 작동 가능하게 연결된 프로모터를 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA를 전달하는 것을 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 번역된 폴리펩티드를 전달하는 것을 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 상기 조작된 가이드 리보핵산 구조체를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함한다.
일부 양상에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 양상에서, 본 개시내용은 서열번호 360-368 또는 598 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, 상기 tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 상기 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 시토신 데아미나제이다. 일부 실시양태에서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 엔도뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기로서, 상기 염기 편집기는 서열번호 1-51, 385-386, 387-443, 444-447, 488-475 또는 595 중 어느 하나, 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 촉매적으로 사멸되도록 구성된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 실시양태에서, 상기 Cas 엔도뉴클레아제는 클래스 II, 타입 II Cas 엔도뉴클레아제 또는 클래스 II, 타입 V Cas 엔도뉴클레아제이다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 Cas 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 실시양태에서, 상기 Cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 360-368 또는 598로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 상기 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 상기 아데노신 데아미나제는 서열번호 50-51, 385-443, 또는 448-475 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 아데노신 데아미나제는 서열번호 50-51, 385-390, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 시토신 데아미나제이다. 일부 실시양태에서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 폴리펩티드는 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시양태에서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합된다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 서열번호 1-51, 385-386, 387-443, 444-447 또는 488-475 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 코딩하는 것인 핵산을 제공한다. 일부 실시양태에서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간이다.
일부 양상에서, 본 개시내용은 본원에 기재된 임의의 양상 또는 실시양태의 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래의 비리온 또는 렌티바이러스이다.
일부 양상에서, 본 개시내용은 본원에 기재된 양상 또는 실시양태 중 어느 하나의 벡터를 포함하는 세포를 제공한다.
일부 양상에서, 본 개시내용은 본원에 기재된 양상 또는 실시양태 중 어느 하나의 상기 세포를 배양하는 단계를 포함하는, 염기 편집기의 제조 방법을 제공한다.
일부 양상에서, 본 개시내용은 (a) 본원에 기재된 임의의 양상 또는 실시양태의 핵산 편집 폴리펩티드; 및 (b) 상기 핵산 편집 폴리펩티드와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 조작된 가이드 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나의 비축퇴성 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 본원에 기재된 임의의 양상 또는 실시양태의 상기 조작된 핵산 편집 폴리펩티드 또는 본원에 기재된 임의의 양상 또는 실시양태의 상기 시스템을 상기 표적 핵산 유전자좌에 전달하는 것을 포함하고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법을 제공한다.
일부 양상에서, 본 개시내용은 (a) RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; (b) 엔도뉴클레아제에 커플링된 염기 편집기; 및 (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열울 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 (a) 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다.
일부 양상에서, 본 개시내용은 (a) 서열번호 360-368을 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및 (b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 (a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체로서, 상기 tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 구조체; 및 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, 타입 II Cas 엔도뉴클레아제를 포함하는 조작된 핵산 편집 시스템을 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 360-368로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51 및 385-475 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 서열번호 57에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제이다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 59-66 중 어느 하나에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 조작된 핵산 편집 시스템은 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 조작된 가이드 리보핵산 구조체는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 조작된 가이드 리보핵산 구조체는 가이드 리보핵산 서열 및 tracr 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물 또는 인간 게놈 서열에 상보적이다. 일부 실시양태에서, 가이드 리보핵산 서열은 길이가 15 내지 24 개의 뉴클레오티드이다. 일부 실시양태에서, 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 염기 편집기에 직접 공유 결합되거나, 링커를 통해 염기 편집기에 공유 결합된다. 일부 실시양태에서, 폴리펩티드는 엔도뉴클레아제 및 염기 편집기를 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 370을 포함한다. 일부 실시양태에서, 시스템은 Mg2+ 공급원을 추가로 포함한다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 70과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 88과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 360을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 71과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 89와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 361을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 73과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 91과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 363을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 75와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 93과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 365를 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 76과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 94와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 366을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 77과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 95와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 367을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 78과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 96과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 368을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 염기 편집기는 아데닌 데아미나제를 포함한다. 일부 실시양태에서, 데아미나제는 서열번호 57을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제를 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58을 포함한다. 일부 실시양태에서, 본원에 기재된 조작된 핵산 편집 시스템은 우라실 DNA 글리코실화 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실화 억제제는 서열번호 67을 포함한다.
일부 실시양태에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 스미스-워터맨(Smith-Waterman) 상동성 검색 알고리즘에 의해 결정된다. 일부 실시양태에서, 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고, 조건부 조성 점수 매트릭스 조정을 사용하여 BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 핵산을 제공한다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된, 서열번호 70-78 중 어느 하나에 대해 적어도 70% 서열 동일성을 갖는 엔도뉴클레아제를 코딩하는 것인 핵산을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시양태에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간이다.
일부 양상에서, 본 개시내용은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하는 핵산을 포함하는 벡터로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 벡터를 제공한다. 일부 실시양태에서, 벡터는 본원에 기재된 핵산을 포함한다. 일부 실시양태에서, 벡터는 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 코딩하는 핵산을 추가로 포함한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래의 비리온 또는 렌티바이러스이다. 일부 양상에서, 본 개시내용은 본원에 기재된 벡터를 포함하는 세포를 제공한다. 일부 양상에서, 본 개시내용은 본원에 기재된 세포를 배양하는 단계를 포함하는, 엔도뉴클레아제의 제조 방법을 제공한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하는 것인 방법을 제공한다.
일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제는 염기 편집기에 직접 공유 결합되거나, 링커를 통해 염기 편집기에 공유 결합된다. 일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제는 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, 클래스 2, 타입 II Cas 엔도뉴클레아제, 상기 엔도뉴클레아제에 커플링된 염기 편집기, 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고; 상기 PAM은 서열번호 360-368로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법을 제공한다.
일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 염기 편집기에 공유 결합되거나, 링커를 통해 염기 편집기에 커플링된다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51 및 385-475로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제를 포함하고; 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 아데닌을 포함하고; 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 아데닌 데아미나제는 서열번호 57에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 염기 편집기는 시토신 데아미나제를 포함하고; 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 시토신을 포함하고; 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 시토신을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 59-66 중 어느 하나에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 복합체는 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시양태에서, PAM은 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열의 3' 말단에 바로 인접한다.
일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 양상에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 본원에 기재된 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것을 포함하는 방법을 제공하고, 여기서 엔도뉴클레아제는 조작된 가이드 리보핵산 구조체와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법을 제공한다.
일부 실시양태에서, 조작된 핵산 편집 시스템은 아데닌 데아미나제를 포함하고, 뉴클레오티드는 아데닌이고, 표적 핵산 유전자좌를 변형시키는 것은 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템은 시티딘 데아미나제 및 우라실 DNA 글리코실라제 억제제를 포함하고, 뉴클레오티드는 시토신이고 표적 핵산 유전자좌를 변형시키는 것은 아데닌을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA 또는 박테리아 DNA를 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 시험관내에 있다. 일부 실시양태에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시양태에서, 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포 또는 인간 세포이다. 일부 실시양태에서, 세포는 동물 내에 있다.
일부 실시양태에서, 세포는 달팽이관 내에 있다. 일부 실시양태에서, 세포는 배아 내에 있다. 일부 실시양태에서, 배아는 2세포 배아이다. 일부 실시양태에서, 배아는 마우스 배아이다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 본원에 기재된 핵산 또는 본원에 기재된 벡터를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함한다.
일부 실시양태에서, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동 가능하게 연결된 프로모터를 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 캡핑된 mRNA를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 번역된 폴리펩타이드를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 리보핵산 구조체를 코딩하는 데옥시리보핵산(DNA)를 전달하는 것을 포함한다.
일부 양상에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다.
일부 양상에서, 본 개시내용은 서열번호 360-368을 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51 및 385-475 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 서열번호 57에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제이다.일부 실시양태에서, 시토신 데아미나제는 서열번호 58에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 아데노신 시토신 데아미나제는 서열번호 59-66 중 어느 하나에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
본 개시내용의 추가적인 양상 및 이점은 본 개시내용의 예시적인 실시양태만이 제시되고 설명되는 하기 상세한 설명으로부터 당업자에게 용이하게 명백해질 것이다. 알 수 있는 바와 같이, 본 개시내용은 다른 및 상이한 실시양태가 가능하고, 이의 여러 세부사항은 모두 본 개시내용에서 벗어나지 않으면서 다양한 명백한 측면에서 변형될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되지 않아야 한다.
참조에 의한 인용
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 마치 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함된다고 구체적이고 개별적으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다.
본 발명의 신규한 특징은 특히 첨부된 청구범위에서 제시된다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 실시양태를 제시하는 하기 상세한 설명, 및 첨부 도면(또한 본원에서 "도면" 및 "도")을 참조하여 얻어질 것이며, 첨부 도면에서,
도 1은 상이한 클래스 및 타입의 CRISPR/Cas 유전자좌의 전형적인 구성을 도시한다.
도 2는 본원에 기재된 시스템의 발현을 구동하는 T7 프로모터를 함유하는 염기 편집기 플라스미드의 구조를 도시한다.
도 3은 본원에 기재된 시스템에 대한 플라스미드 지도를 도시한다. MGA는 TadA*(ABE8.17m으로부터)-SV40 NLS를 포함하고 MGC는 우라실 글리코실라제 억제제에 연결된 APOBEC1(BE3으로부터) 및 SV40 NLS를 포함한다.
도 4는 닉카제 효소를 생성하는 뉴클레아제 활성을 파괴하도록 돌연변이된 본원에 기재된 선택된 엔도뉴클레아제의 RuvCI 도메인 내의 예측된 촉매 잔기를 도시한다.
도 5는 단일 가이드 RNA 발현 카세트를 본원에 기재된 시스템으로 클로닝하기 위한 예시적인 방법을 도시한다. 하나의 단편은 T7 프로모터와 스페이서를 포함한다. 다른 단편은 스페이서와 단일 가이드 스캐폴드 서열 및 양방향 터미네이터를 포함한다. 단편을 발현 플라스미드로 조립하여, sgRNA와 염기 편집기를 동시에 발현할 수 있는 기능적 작제물을 생성한다.
도 6a 및 6b는 이. 콜라이(E. coli)에서의 lacZ 표적화를 위한 sgRNA 설계를 도시한다. 본원에 기재된 시스템에 사용된 스페이서 길이는 22 개의 뉴클레오티드였다. 본원에 기재된 선택된 시스템의 경우, 이. 콜라이에서 lacZ를 표적화하는 3개의 sgRNA가 편집 윈도우(editing window)를 결정하도록 설계하였다.
도 7은 선택된 돌연변이된 효과기의 닉카제 활성을 도시한다. 양쪽 5' 말단에 형광단(6-FAM)으로 표지된 600bp 이중 가닥 DNA 단편을 동족 sgRNA가 보충된 정제된 효소와 함께 인큐베이션하였다. 반응 산물을 10% TBE-우레아 변성 겔에서 분해시켰다. 이중 가닥 절단은 400개 및 200개 염기의 밴드를 생성한다. 닉카제 활성은 600개 및 200개 염기의 밴드를 생성한다.
도 8a, 8b 및 8c는 본원에 기재된 선택된 시스템에 의한 염기 편집을 입증하는 생어(Sanger) 시퀀싱 결과를 도시한다.
도 9는 본원에 기재된 시스템이 본원에 기재된 엔도뉴클레아제 및 염기 편집기를 사용하여 염기-편집 능력을 어떻게 확장하는가를 도시한다.
도 10a 및 10b는 TadA(ABE8.17m) 및 MG 닉카제를 포함하는 아데닌 염기 편집기(ABE)의 염기 편집 효율을 도시한다. TadA는 tRNA 아데닌 데아미나제이고 TadA(ABE8.17m)는 이. 콜라이 TadA의 조작된 변이체이다. TadA(ABE8.17m)와 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 Edit R에 의해 정량화된 A에서 G로의 전환의 백분율을 나타낸다. ABE8.17m은 실험의 양성 대조군으로서 사용하였다.
도 11a 및 11b는 래트 APOBEC1, MG 닉카제 및 바실러스 서브틸리스(Bacillus subtilis) 박테리오파지(UGI(PBS1))의 우라실 글리코실라제 억제제를 포함하는 시토신 염기 편집기(CBE)의 염기 편집 효율을 도시한다. APOBEC1은 시토신 데아미나제이다. N-말단에서 rAPOBEC1에 융합되고 C-말단에서 UGI에 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 Edit R에 의해 정량화된 C에서 T로의 전환의 백분율을 나타낸다. BE3는 실험에서 양성 대조군으로서 사용하였다.
도 12는 CBE의 염기 편집 활성에 미치는 MG 우라실 글리코실라제 억제제(UGI)의 효과를 도시한다. 패널 (a)는 N-말단 APOBEC1, MG15-1 닉카제 및 C-말단 UGI를 포함하는 MGC15-1 및 변이체의 염기 편집 활성을 보여주는 그래프를 도시한다. 3가지 MG UGI를 이. 콜라이에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. 패널 (b)는 N-말단 rAPOBEC1, SpCas9 닉카제 및 C-말단 UGI를 포함하는 BE3의 염기 편집 활성을 보여주는 그래프이다. 2가지 MG UGI를 HEK293T 세포에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. 편집 효율은 Edit R에 의해 정량화하였다.
도 13a 및 13b는 A0A2K5RDN7, MG 닉카제 및 MG UGI를 포함하는 시토신 염기 편집기의 편집 효율을 보여주는 편집된 부위의 지도를 도시한다. 작제물은 N-말단 A0A2K5RDN7, MG 닉카제 및 C-말단 MG69-1을 포함한다. 단순화를 위해, 도면에는 MG 닉카제의 정체만이 도시된다. BE3은 염기 편집에 대한 양성 대조군으로서 사용하였다. 음성 대조군으로는 공 벡터(empty vector)를 사용하였다. 상이한 날에 3회의 독립적인 실험을 수행하였다. 약어: R, 반복; NEG, 음성 대조군.
도 14는 이. 콜라이에서의 TadA 특성규명을 위한 양성 선택 방법을 도시한다. 패널 (a)는 TadA 선택에 사용된 하나의 플라스미드 시스템의 지도를 도시한다. 벡터는 CAT(H193Y), CAT를 표적화는 sgRNA 발현 카세트 및 ABE 발현 카세트를 포함한다. 본 도면에는, 이. 콜라이로부터의 N-말단 TadA 및 스트렙토코커스 피오게네스(Streptococcus pyogenes)로부터의 C-말단 SpCas9(D10A)가 도시되어 있다. 패널 (b)는 이. 콜라이 세포 내로 도입/형질전환될 때 CAT(H193Y)의 주형 가닥의 A2 위치가 편집되어 H193Y 돌연변이를 야생형으로 되돌리고 이의 활성을 복원시킴을 입증하는 시퀀싱 추적을 도시한다. 약어: CAT, 클로람페니콜 아세틸트랜스퍼라제.
도 15는 TadA에 의해 유발된 돌연변이가 클로람페니콜(Cm)의 높은 내용성(tolerance)을 가능하게 함을 도시한다. 패널 (a)는 이. 콜라이의 항생제 내성을 선택하기 위해 상이한 농도의 클로람페니콜이 사용된 성장 플레이트의 사진을 도시한다. 이 예에서, 이. 콜라이(EcTadA)로부터의 TadA의 야생형 및 변이체 2가지를 테스트하였다. 패널 (b)는 돌연변이된 TadA를 보유하는 ABE가 야생형보다 더 높은 편집 효율을 나타낸다는 것을 입증하는 결과 요약 표를 도시한다. 이들 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다. 단순화를 위해, 표에는 데아미나제의 정체만이 도시된다.
도 16a는 양성 선택에서 MG TadA 활성을 조사하기 위한 성장 플레이트의 사진을 도시한다. 8개의 MG68 TadA 후보를 0 내지 2 ㎍/mL의 클로람페니콜(ABE는 N-말단 TadA 변이체 및 C-말단 SpCas9(D10A) 닉카제를 포함함)에 대해 테스트하였다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 이 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 16b는 MG TadA 후보의 편집 효율을 요약하고, MG68-3 및 MG68-4가 아데닌의 염기 편집을 구동하였음을 입증한다.
도 17은 MG68-4 상의 D109N 돌연변이를 통한 MG68-4_nSpCas9의 염기 편집 효율의 개선을 도시한다. 패널 (a)는 야생형 MG68-4 및 이의 변이체가 0 내지 4 ㎍/mL의 클로람페니콜에 대해 테스트된 성장 플레이트의 사진을 도시한다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 이 실험에서 아데닌 염기 편집기는 N-말단 TadA 변이체 및 C-말단 SpCas9(D10A) 닉카제를 포함한다. 패널 (b)는 MG TadA 후보의 편집 효율을 나타내는 요약 표를 도시한다. 패널 (b)는 MG68-4 및 MG68-4(D109N)가 아데닌의 염기 편집을 나타냈고, D109N 돌연변이가 증가된 활성을 나타냈음을 입증한다. 이 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 18은 MG68-4(D109N)_nMG34-1의 염기 편집을 도시한다. 패널 (a)는 N-말단 MG68-4(D109N) 및 C-말단 SpCas9(D10A) 닉카제를 포함하는 ABE가 0 내지 2 ㎍/mL의 클로람페니콜에 대해 테스트된 실험의 성장 플레이트의 사진을 도시한다. 패널 (b)는 sgRNA의 존재 및 부재 하의 편집 효율을 나타내는 요약 표를 도시한다. 이 실험에서 콜로니는 1 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 19는 MG68-4-nMG34-1 염기 편집 활성의 개선을 위해 설계된 28가지의 MG68-4 변이체(서열번호 448-475)를 도시한다. 효소의 편집을 개선하기 위한 표적화 돌연변이유발을 위해 12개의 잔기를 선택하였다.
서열 목록의 간략한 설명
본 출원과 함께 제출된 서열 목록은 본 개시내용에 따른 방법, 조성물 및 시스템에서 사용하기 위한 예시적인 폴리뉴클레오티드 및 폴리펩티드 서열을 제공한다. 하기는 이 중의 서열의 예시적인 설명이다.
서열번호 1-47은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG66 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 48-49는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG67 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 50-51은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 52-56은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 우라실 DNA 글리코실라제 억제제의 서열을 나타낸다.
서열번호 57-66은 참조 데아미나제의 서열을 나타낸다.
서열번호 67은 참조 우라실 DNA 글리코실라제 억제제의 서열을 나타낸다.
서열번호 68은 아데닌 염기 편집기의 서열을 나타낸다.
서열번호 69는 시토신 염기 편집기의 서열을 나타낸다.
서열번호 70-78은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG 닉카제의 전장 펩티드 서열을 나타낸다.
서열번호 79-87은 본원에 기재된 시험관내 닉카제 분석에서 사용된 프로토스페이서 및 PAM을 나타낸다.
서열번호 88-96은 본원에 기재된 시험관내 닉카제 분석에서 사용된 단일 가이드 RNA의 펩티드 서열을 나타낸다.
서열번호 97-156은 이. 콜라이 lacZ를 표적화할 때의 스페이서의 서열을 나타낸다.
서열번호 157-176은 부위 지정 돌연변이유발을 수행할 때의 프라이머의 서열을 나타낸다.
서열번호 177-178은 lacZ 시퀀싱을 위한 프라이머의 서열을 나타낸다.
서열번호 179-342는 증폭 동안 사용된 프라이머의 서열을 나타낸다.
서열번호 343-345는 lacZ 시퀀싱을 위한 프라이머의 서열을 나타낸다.
서열번호 346-359는 증폭 동안 사용된 프라이머의 서열을 나타낸다.
서열번호 360-368은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 프로토스페이서 인접 모티프를 나타낸다.
서열번호 369-384는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 핵 국소화 서열(NLS)을 나타낸다.
서열번호 385-443은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 444-447은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG121 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 448-475는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 476 및 477은 아데닌 염기 편집기의 서열을 나타낸다.
서열번호 478-482는 시토신 염기 편집기의 서열을 나타낸다.
서열번호 483-487은 본원에 기재된 조작된 핵산 편집 시스템을 코딩하기에 적합한 플라스미드의 서열을 나타낸다.
서열번호 488 및 489는 MG15-1 및 MG34-1에 대한 sgRNA 스캐폴드 서열을 나타낸다.
서열번호 490-522는 이. 콜라이 및 HEK293T 세포에서 게놈 유전자좌를 표적화하기 위해 사용된 스페이서의 서열을 나타낸다.
서열번호 523-585는 증폭 및 생어 시퀀싱 동안 사용된 프라이머의 서열을 나타낸다.
본 발명의 다양한 실시양태가 본원에서 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 수많은 변경, 변화 및 치환이 본 개시내용에서 벗어나지 않고 당업자에게 일어날 수 있다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
본원에 개시된 일부 방법의 실행은 달리 명시되지 않는 한, 면역학, 생화학, 화학, 분자생물학, 미생물학, 세포생물학, 유전체학 및 재조합 DNA의 기술을 사용한다. 예를 들어, 문헌[Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))] (그 전체가 본원에 참조로 포함됨)을 참조한다.
본 명세서에 사용되는 바와 같이, 단수형인 부정관사 및 정관사는 문맥이 명백하게 달리 나타내지 않는 한 복수형도 포함하도록 의도된다. 또한, "포함되는", "포함되다", "갖는", "갖다", "~와 함께" 또는 이들의 어미변화가 상세한 설명 및/또는 청구범위에서 사용되는 한, 이러한 용어들은 용어 "포함하는"와 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 당업자에 의해 결정된 특정 값에 대해 허용 가능한 오차 범위 내를 의미하며, 이는 값이 어떻게 측정 또는 결정되는지, 즉 측정 시스템의 한계에 부분적으로 의존할 것이다. 예를 들어, "약"은 당업계의 관행에 따라 1 또는 1 초과의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 20% 이하, 15% 이하, 10% 이하, 5% 이하, 또는 1% 이하의 범위를 의미할 수 있다.
본원에 사용된 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본적인 구조적, 기능적 및/또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 유기체로부터 유래할 수 있다. 일부 비제한적인 예는 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵 유기체의 세포, 원생동물 세포, 식물 세포(예를 들어, 식물 작물, 과일, 채소, 곡물, 대두, 옥수수, 메이즈, 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 면, 대마, 담배, 현화 식물, 침엽수, 겉씨 식물, 양치류, 석송, 붕어마름(hornwort), 우산이끼, 이끼로부터의 세포), 조류 세포(예를 들어, 보트리코쿠스 브라우니이(Botryococcus braunii), 클라미도모나스 레인하르드티이(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐아 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스 씨. 아가르드(Sargassum patens C. Agardh) 등), 해조류(예를 들어, 다시마), 진균 세포(예를 들어, 효모 세포, 버섯으로부터의 세포), 동물 세포, 무척추 동물(예를 들어, 초파리, 자포동물, 극피동물, 선충류 등)로부터의 세포, 척추동물(예를 들어, 어류, 양서류, 파충류, 조류, 포유동물)로부터의 세포, 포유동물(예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 인간이 아닌 영장류, 인간 등)의 세포 등을 포함한다. 때때로, 세포는 천연 유기체로부터 유래하지 않는다(예를 들어, 세포는 합성으로 제조될 수 있고, 때로는 인공 세포로 명명됨).
본원에 사용된 바와 같이, 용어 "뉴클레오티드"는 일반적으로 염기-당-포스페이트 조합물을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열의 단량체 단위(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))일 수 있다. 용어 뉴클레오티드는 리보뉴클레오시드 트리포스페이트 아데노신 트리포스페이트(ATP), 우리딘 트리포스페이트(UTP), 시토신 트리포스페이트(CTP), 구아노신 트리포스페이트(GTP) 및 데옥시리보뉴클레오시드 트리포스페이트, 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어 [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이들을 함유하는 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에 사용된 바와 같이, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 트리포스페이트(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 트리포스페이트의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP 및 ddTTP를 포함할 수 있지만, 이에 제한되지 않는다. 뉴클레오티드는 표지되지 않거나, 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)을 포함하는 모이어티를 사용하는 것과 같이 검출 가능하게 표지될 수 있다. 표지화는 양자점으로 수행될 수도 있다. 검출 가능한 표지는 예를 들어 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조)벤조산(DABCYL), 캐스케이드 블루, 오레곤 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있지만, 이에 제한되지 않는다. 형광 표지된 뉴클레오티드의 구체적인 예는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP(미국 캘리포니아주 포스터 시티 소재의 Perkin Elmer로부터 입수 가능); 플루오로링크(FluoroLink) 데옥시뉴클레오티드, 플루오로링크 Cy3-dCTP, 플루오로링크 Cy5-dCTP, 플루오로링크 플루오르(Fluor) X-dCTP, 플루오로링크 Cy3-dUTP, 및 플루오로링크 Cy5-dUTP(미국 일리노이주 알링턴 하이츠 Ill 소재의 Amersham으로부터 입수 가능); 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP(미국 인디애나주 인디애나폴리스 소재의 Boehringer Mannheim으로부터 입수 가능); 및 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP 및 텍사스 레드-12-dUTP(미국 오레곤주 유진 소재의 Molecular Probes로부터 입수 가능)를 포함할 수 있다. 뉴클레오티드는 또한 화학 변형에 의해 표지되거나 표시될 수 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오틴화된 dNTP의 일부 비제한적 예는 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP)를 포함할 수 있다.
용어 "폴리뉴클레오티드", "올리고뉴클레오티드" 및 "핵산"은 일반적으로 단일 가닥, 이중 가닥 또는 다중 가닥 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 이들의 유사체인 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭하기 위해 상호교환 가능하게 사용된다. 폴리뉴클레오티드는 세포에 대해 외인성 또는 내인성일 수 있다. 폴리뉴클레오티드는 세포-유리(cell-free) 환경에 존재할 수 있다. 폴리뉴클레오티드는 유전자 또는 이의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있고, 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예를 들어, 변경된 백본, 당 또는 핵염기)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적 예는 5-브로모우라실, 펩티드 핵산, 제노 핵산, 모르폴리노, 잠금 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코르디세핀, 7-데아자-GTP, 형광단(예를 들어, 당에 연결된 로다민 또는 플루오레세인), 티올-함유 뉴클레오티드, 비오틴-연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우리딘, 디히드로우리딘, 쿠에오신 및 와이오신을 포함한다. 폴리뉴클레오티드의 비제한적인 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연관 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로 RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 세포-유리 DNA(cfDNA) 및 세포-유리 RNA(cfRNA)를 포함하는 세포-유리 폴리뉴클레오티드, 핵산 프로브 및 프라이머를 포함한다. 뉴클레오티드의 서열은 비뉴클레오티드 성분에 의해 중단될 수 있다.
용어 "형질감염" 또는 "형질감염된"은 일반적으로 비바이러스 또는 바이러스 기반 방법에 의해 핵산이 세포 내로 도입되는 것을 지칭한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 코딩하는 유전자 서열일 수 있다. 예를 들어, 문헌 [Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88]을 참조한다.
용어 "펩티드", "폴리펩티드" 및 "단백질"은 일반적으로 펩티드 결합(들)에 의해 연결된 적어도 2개의 아미노산 잔기의 중합체를 지칭하기 위해 본원에서 상호교환 가능하게 사용된다. 상기 용어는 특정 길이의 중합체를 의미하지 않으며, 펩티드가 재조합 기술, 화학적 또는 효소적 합성을 사용하여 생산되는지 또는 자연적으로 발생하지를 암시하거나 구별하려는 의도도 아니다. 상기 용어는 자연 발생 아미노산 중합체뿐만 아니라, 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 경우에, 중합체는 비아미노산에 의해 중단될 수 있다. 상기 용어는 전장 단백질, 및 2차 및/또는 3차 구조(예를 들어, 도메인)를 갖거나 갖지 않는 단백질을 포함하는 임의의 길이의 아미노산 사슬을 포함한다. 상기 용어는 또한 예를 들어 디설파이드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 산화 및 표지 성분과의 접합과 같은 임의의 기타 조작에 의해 변형된 아미노산 중합체를 포함한다. 본원에 사용된 바와 같이, 용어 "아미노산" 및 "아미노산들"은 일반적으로 변형된 아미노산 및 아미노산 유사체를 포함하지만 이에 제한되지 않는 천연 및 비천연 아미노산을 지칭한다. 변형된 아미노산은 천연 아미노산 및 비천연 아미노산을 포함할 수 있으며, 이는 아미노산 상에 자연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 것이다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산과 L-아미노산 둘 모두를 포함한다.
본원에 사용된 바와 같이, "비-고유(non-native)"는 일반적으로 고유 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유는 친화도 태그를 지칭할 수 있다. 비-고유는 융합을 지칭할 수 있다. 비-고유는 돌연변이, 삽입 및/또는 결실을 포함하는 자연 발생 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유 서열은 비-고유 서열이 융합되는 핵산 및/또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타내고/내거나 이를 코딩할 수 있다. 비-고유 핵산 또는 폴리뉴클레오티드 서열은 키메라 핵산 및/또는 폴리펩티드를 코딩하는 키메라 핵산 및/또는 폴리펩티드 서열을 생성하기 위해 유전적 조작에 의해 자연 발생 핵산 또는 폴리펩티드 서열(또는 이의 변이체)에 연결될 수 있다.
본원에 사용된 바와 같이, 용어 "프로모터"는 일반적으로 유전자의 전사 또는 발현을 제어하고 RNA 전사가 개시되는 뉴클레오티드 또는 뉴클레오티드의 영역에 인접하거나 중첩하여 위치될 수 있는 조절 DNA 영역을 지칭한다. 프로모터는 종종 전사 인자라고 지칭되는 단백질 인자에 결합하는 특정 DNA 서열을 함유할 수 있으며, 이는 RNA 폴리머라제가 DNA에 결합하여 유전자 전사로 이어지는 것을 용이하게 한다. '코어 프로모터'로도 지칭되는 '기본 프로모터'는 일반적으로 작동 가능하게 연결된 폴리뉴클레오티드의 전사 발현을 촉진하기 위해 필요한 모든 기본 요소를 함유하는 프로모터를 지칭할 수 있다. 일반적으로 진핵생물의 기본 프로모터는 반드시 그런 것은 아니지만, TATA 박스 및/또는 CAAT 박스를 함유한다.
본원에 사용된 바와 같이, 용어 "발현"은 일반적으로 핵산 서열 또는 폴리뉴클레오티드가 DNA 주형으로부터 전사되는 과정(예컨대, mRNA 또는 다른 RNA 전사체로) 및/또는 전사된 mRNA가 이후에 펩티드, 폴리펩티드 또는 단백질로 번역되는 과정을 지칭한다. 전사체 및 코딩된 폴리펩티드는 집합적으로 "유전자 산물"로 지칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에 사용된 바와 같이, "작동 가능하게 연결된", "작동 가능한 연결", "작동적으로 연결된" 또는 이의 문법적 등가물은 일반적으로 유전 요소, 예를 들어 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 지칭하며, 여기서 요소들은 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소는 조절 요소가 코딩 서열의 전사 개시를 돕는 경우 코딩 영역에 작동 가능하게 연결된 것이다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 중간 잔기가 있을 수 있다.
본원에 사용된 바와 같이, "벡터"는 일반적으로 폴리뉴클레오티드를 포함하거나 이와 회합하고 폴리뉴클레오티드를 세포로 전달하는 것을 매개하는 데 사용될 수 있는 거대분자 또는 거대분자의 회합체를 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포솜 및 기타 유전자 전달 비히클을 포함한다. 벡터는 일반적으로 표적에서 유전자의 발현을 촉진하기 위해 유전자에 작동 가능하게 연결된 유전 요소, 예를 들어 조절 요소를 포함한다.
본원에 사용된 바와 같이, "발현 카세트" 및 "핵산 카세트"는 일반적으로 함께 발현되거나 발현을 위해 작동 가능하게 연결된 핵산 서열 또는 요소의 조합물을 지칭하기 위해 상호교환 가능하게 사용된다. 일부 경우에, 발현 카세트는 조절 요소 및 발현을 위해 작동 가능하게 연결된 유전자 또는 유전자들의 조합물을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 일반적으로 전장 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적 활성(기능적 또는 구조적)을 보유하는 단편을 지칭한다. DNA 서열의 생물학적 활성은 전장 서열에 기인하는 것으로 알려진 방식으로 발현에 영향을 미치는 능력일 수 있다.
본원에 사용된 바와 같이, "조작된" 대상은 일반적으로 대상이 인간의 개입에 의해 변형되었음을 나타낸다. 비제한적 예에 따르면, 핵산은 자연에서 발생하지 않는 서열로 이의 서열을 변경함으로써 변형될 수 있으며; 핵산은 라이게이션된 산물이 원래 핵산에 존재하지 않는 기능을 갖도록 자연에서는 회합되지 않는 핵산에 핵산을 라이게이션시킴으로써 변형될 수 있고; 조작된 핵산은 자연에 존재하지 않는 서열로 시험관 내에서 합성될 수 있고; 단백질은 이의 아미노산 서열을 자연에 존재하지 않는 서열로 변경함으로써 변형될 수 있고; 조작된 단백질은 새로운 기능 또는 특성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에 사용된 바와 같이, "합성" 및 "인공"은 자연 발생 인간 단백질에 대한 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 이의 도메인을 지칭하기 위해 상호교환 가능하게 사용될 수 있다. 예를 들어, VPR 및 VP64 도메인은 합성 전이활성화(transactivation) 도메인이다.
본원에 사용된 용어 "tracrRNA" 또는 "tracr 서열"은 일반적으로 예시적인 야생형 tracrRNA 서열(예를 들어, 에스. 피오게네스(S. pyogenes) 에스. 아우레우스(S. aureus) 등으로부터의 tracrRNA)에 대해 적어도 약 5%, 10%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 핵산을 지칭할 수 있다. tracrRNA는 예시적인 야생형 tracrRNA 서열(예를 들어, 에스. 피오게네스 에스. 아우레우스 등으로부터의 tracrRNA)에 대해 최대 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 핵산을 지칭할 수 있다. tracrRNA는 결실, 삽입, 또는 치환, 변이체, 돌연변이 또는 키메라와 같은 뉴클레오티드 변화를 포함할 수 있는 tracrRNA의 변형된 형태를 지칭할 수 있다. tracrRNA는 적어도 6개의 인접한 뉴클레오티드의 스트레치에 걸쳐 예시적인 야생형 tracrRNA(예를 들어, 에스. 피오게네스 에스. 아우레우스 등으로부터의 tracrRNA) 서열과 적어도 약 60% 동일할 수 있는 핵산을 지칭할 수 있다. 예를 들어, tracrRNA 서열은 적어도 6개의 인접한 뉴클레오티드의 스트레치에 걸쳐 적어도 약 60% 동일하거나, 적어도 약 65% 동일하거나, 적어도 약 70% 동일하거나, 적어도 약 75% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 85% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 100% 동일할 수 있다. 타입 II tracrRNA 서열은 인접한 CRISPR 어레이에서 반복 서열의 일부에 상보성을 갖는 영역을 식별함으로써 게놈 서열 상에서 예측될 수 있다.
본원에 사용된 바와 같이, "가이드 핵산"은 일반적으로 또 다른 핵산에 혼성화할 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 핵산 서열에 부위-특이적으로 결합하도록 프로그래밍될 수 있다. 표적화될 핵산, 또는 표적 핵산은 뉴클레오티드를 포함할 수 있다. 가이드 핵산은 뉴클레오티드를 포함할 수 있다. 표적 핵산의 일부는 가이드 핵산의 일부에 상보적일 수 있다. 가이드 핵산에 상보적이고 이와 혼성화하는 이중 가닥 표적 폴리뉴클레오티드의 가닥은 상보적 가닥이라 불릴 수 있다. 상보적 가닥에 상보적이고 따라서 가이드 핵산에 상보적이지 않을 수 있는 이중 가닥 표적 폴리뉴클레오티드의 가닥은 비상보적 가닥이라 불릴 수 있다. 가이드 핵산은 폴리뉴클레오티드 사슬을 포함할 수 있으며, "단일 가이드 핵산"이라 불릴 수 있다. 가이드 핵산은 2개의 폴리뉴클레오티드 사슬을 포함할 수 있으며, "이중 가이드 핵산"으로 불릴 수 있다. 달리 명시되지 않은 경우, 용어 "가이드 핵산"은 단일 가이드 핵산과 이중 가이드 핵산 둘 모두를 지칭하는 포괄적인 의미일 수 있다. 가이드 핵산은 "핵산 표적화 세그먼트" 또는 "핵산 표적화 서열 서열"로 지칭될 수 있는 세그먼트를 포함할 수 있다. 핵산 표적화 세그먼트는 "단백질 결합 세그먼트" 또는 "단백질 결합 서열" 또는 "Cas 단백질 결합 세그먼트"로 지칭될 수 있는 하위 세그먼트를 포함할 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "서열 동일성" 또는 "동일성 퍼센트"는 일반적으로 서열 비교 알고리즘을 사용하여 측정할 때 국소적 또는 전체적 비교 윈도우에 걸쳐 최대 일치를 위해 비교되고 정렬될 때 동일한, 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 지정된 백분율을 갖는 2개(예를 들어, 쌍별 정렬) 이상(예를 들어, 다중 서열 정렬)의 서열을 지칭한다. 폴리펩티드 서열에 적합한 서열 비교 알고리즘은 예를 들어 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고 30개 잔기보다 긴 폴리펩티드 서열에 대한 조건부 조성 점수 매트릭스 조정을 사용하는 BLASTP; 단어 길이(W) 2, 기대값(E) 1000000, 및 30개 미만의 잔기의 서열에 대한 오픈 갭 9 및 연장 갭 1의 PAM30 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하는 BLASTP(이들은 https://blast.ncbi.nlm.nih.gov에서 이용 가능한 BLAST 스위트의 BLASTP에 대한 디폴트 매개변수임); 의 매개변수를 갖는 CLUSTALW; 일치 2, 불일치 -1 및 갭 -1의 매개변수를 갖는 스미스-워터맨 상동성 검색 알고리즘; 디폴트 매개변수를 갖는 MUSCLE; retree가 2이고 최대 반복이 1000인 매개변수를 갖는 MAFFT; 디폴트 매개변수를 갖는 Novafold; 디폴트 매개변수를 갖는 HMMER hmmalign을 포함한다.
본원에 사용된 바와 같이, 용어 "RuvC_III 도메인"은 일반적으로 RuvC 엔도뉴클레아제 도메인(RuvC 뉴클레아제 도메인은 3개의 불연속적인 세그먼트, 즉 RuvC_I, RuvC_II, 및 RuvC_III로 이루어짐)의 불연속적인 3번째 세그먼트를 지칭한다. RuvC 도메인 또는 이의 세그먼트는 일반적으로 알려진 도메인 서열에 대한 정렬, 주석이 달린 도메인을 갖는 단백질에 대한 구조적 정렬에 의해, 또는 알려진 도메인 서열(예를 들어, RuvC_III에 대한 Pfam HMM PF18541)에 기초하여 구축된 히든 마르코프 모델(HMM)과 비교함으로써 식별될 수 있다.
본원에 사용된 바와 같이, 용어 "HNH 도메인"은 일반적으로 특징적인 히스티딘 및 아스파라긴 잔기를 갖는 엔도뉴클레아제 도메인을 지칭한다. HNH 도메인은 일반적으로 알려진 도메인 서열에 대한 정렬, 주석이 달린 도메인을 갖는 단백질에 대한 구조적 정렬에 의해, 또는 알려진 도메인 서열(예를 들어, 도메인 HNH에 대한 Pfam HMM PF01844)에 기초하여 구축된 히든 마르코프 모델(HMM)과 비교함으로써 식별될 수 있다.
본원에 사용된 바와 같이, 용어 "염기 편집기"는 일반적으로 이중 가닥 파손(double-strand break)의 생성 및 복구를 필요로 하지 않으면서 하나의 표적 염기 또는 염기쌍의 다른 것으로의 전환(예를 들어, A:T에서 G:C로, C:G에서 T:A로)을 촉매하는 효소를 지칭한다. 일부 실시양태에서, 염기 편집기는 데아미나제이다.
본원에 사용된 바와 같이, 용어 "데아미나제"는 일반적으로 탈아미노화 반응을 촉매하는 단백질 또는 효소를 지칭한다. 일부 실시양태에서, 데아미나제는 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매하는 아데노신 데아미나제(예를 들어, DNA에서 아데노신을 탈아미노화하는 조작된 아데노신 데아미나제)이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 각각 시티딘(또는 시토신) 또는 데옥시시티딘의 우리딘(또는 우라실) 또는 데옥시우리딘으로의 가수분해성 탈아미노화를 촉매하는 시티딘(또는 시토신) 데아미나제이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 시토신(또는 시토신)의 우라실(또는 우리딘)로의 가수분해성 탈아미노화를 촉매하는 시티딘(또는 시토신) 데아미나제 도메인이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 인간, 침팬지, 고릴라, 원숭이, 소, 개, 래트, 마우스 또는 박테리아(예를 들어, 이. 콜라이)와 같은 유기체로부터의 자연 발생 데아미나제이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 자연에서 발생하지 않는 유기체로부터의 자연 발생 데아미나제의 변이체이다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "최적으로 정렬된"은 일반적으로, 예를 들어, 가장 높은 또는 "최적화된" 동일성 퍼센트 점수를 생성하는 정렬에 의해 결정하는 경우 아미노산 잔기 또는 뉴클레오티드의 최대 일치성으로 정렬된 2개(예를 들어, 쌍별 정렬) 이상(예를 들어, 다중 서열 정렬)의 서열을 지칭한다.
본 개시내용에는 하나 이상의 보존적 아미노산 치환을 갖는 본원에 기재된 임의의 효소의 변이체가 포함된다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 방해하지 않으면서 폴리펩티드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 서로에 대해 유사한 소수성, 극성, 및 R 사슬 길이를 갖는 아미노산을 치환함으로써 달성될 수 있다. 추가로 또는 대안적으로, 상이한 종으로부터의 상동성 단백질의 정렬된 서열을 비교함으로써, 코딩된 단백질의 기본 기능을 변경하지 않으면서 종 사이에서 돌연변이된 아미노산 잔기(예를 들어, 비-보존된 잔기)를 위치시킴으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기재된 엔도뉴클레아제 단백질 서열 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%의 동일성을 갖는 변이체를 포함할 수 있다. 일부 실시양태에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 엔도뉴클레아제의 하나 이상의 중요한 활성 부위 잔기 또는 가이드 RNA 결합 잔기의 활성이 파괴되지 않도록 치환을 갖는 서열을 포함할 수 있다.
또한, 본 개시내용에는 효소의 활성을 감소시키거나 제거하기 위한 하나 이상의 촉매 잔기의 치환을 갖는 본원에 기재된 임의의 효소의 변이체(예를 들어, 감소된-활성 변이체)가 포함된다. 일부 실시양태에서, 본원에 기재된 단백질과 같은 감소된 활성 변이체는 적어도 1개, 적어도 2개, 또는 3개 모두의 촉매 잔기의 파괴성 치환을 포함한다. 일부 실시양태에서, 본원에 기재된 임의의 엔도뉴클레아제는 닉카제 돌연변이를 포함할 수 있다. 일부 실시양태에서, 본원에 기재된 임의의 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함할 수 있다. 일부 실시양태에서, 본원에 기재된 임의의 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성될 수 있다. 일부 실시양태에서, 본원에 기재된 임의의 엔도뉴클레아제는 엔도뉴클레아제 활성이 결여되거나 촉매적으로 사멸되도록 포함할 수 있고 구성될 수 있다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참고문헌으로부터 이용 가능하다(예를 들어, 문헌[Creighton, Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2nd edition (December 1993)] 참조). 하기 8개의 그룹은 각각 서로에 대해 보존적 치환인 아미노산을 함유한다:
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 리신(K);
5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M)
개요
고유한 기능 및 구조를 갖는 새로운 Cas 효소의 발견은 데옥시리보핵산(DNA) 편집 기술을 추가로 변경하여 속도, 특이성, 기능 및 사용 용이성을 개선할 잠재력을 제공할 수 있다. 미생물에서 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(CRISPR) 시스템의 예측된 유병률 및 미생물 종의 완전한 다양성에 비해, 기능적으로 특성규명된 CRISPR/Cas 효소는 문헌에 비교적 거의 없다. 이것은 부분적으로 엄청난 수의 미생물 종들이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 다수의 미생물 종을 나타내는 자연 환경적 지위(environmental niche)로부터 메타게놈 시퀀싱은 알려진 새로운 CRISPR/Cas 시스템의 수를 크게 증가시키고, 새로운 올리고뉴클레오티드 편집 기능의 발견을 가속화할 잠재성을 제공할 수 있다. 이러한 접근법의 결실에 대한 최근의 예는 2016년에 천연 미생물 군집의 메타게놈 분석으로부터 CasX/CasY CRISPR 시스템의 발견으로 입증되었다.
CRISPR/Cas 시스템은 미생물에서 적응 면역 시스템으로서 기능하는 것으로 기재된 RNA-유도 뉴클레아제 복합체이다. 자연적 맥락에서, CRISPR/Cas 시스템은 CRISPR(일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열) 오페론 또는 유전자좌에서 발생하며, 일반적으로 2개의 부분: (i) RNA 기반 표적화 요소를 코딩하는 동등하게 짧은 스페이서 서열에 의해 분리된 짧은 반복 서열(30-40 bp)의 어레이 및 (ii) 부속 단백질/효소와 함께 RNA 기반 표적화 요소에 의해 유도되는 뉴클레아제 폴리펩티드를 코딩하는 Cas를 코딩하는 ORF를 포함한다. 특정 표적 핵산 서열의 효율적인 뉴클레아제 표적화는 일반적으로 (i) 표적의 처음 6-8개의 핵산(표적 시드)과 crRNA 가이드 사이의 상보적 혼성화; 및 (ii) 표적 시드의 정의된 부근 내에 프로토스페이서 인접 모티프(PAM) 서열의 존재(PAM은 일반적으로 숙주 게놈 내에서 통상적으로 나타내지 않는 서열임) 둘 모두를 필요로 한다. 시스템의 정확한 기능 및 조직화에 따라, CRISPR-Cas 시스템은 공유된 기능적 특성 및 진화적 유사성에 기반하여 일반적으로 2가지 클래스, 5가지 타입 및 16가지 서브타입으로 조직화된다(도 1 참조).
클래스 I CRISPR-Cas 시스템은 대형 다중서브유닛 효과기 복합체를 가지며, 타입 I, III 및 IV를 포함한다.
타입 I CRISPR-Cas 시스템은 구성요소의 측면에서 중간 정도로 복잡한 것으로 간주된다. 타입 I CRISPR-Cas 시스템에서, RNA-표적화 요소의 어레이는 이들 다음에 프로토스페이서-인접 모티프(PAM)라 불리는 적합한 짧은 컨센서스(consensus) 서열이 뒤따를 때 뉴클레아제 복합체를 핵산 표적으로 유도하는 짧고 성숙한 crRNA를 방출시키도록 반복 요소에서 프로세싱되는 긴 전구체 crRNA(프리-crRNA)로서 전사된다. 이러한 프로세싱은 crRNA 유도 뉴클레아제 복합체의 뉴클레아제(Cas3) 단백질 구성요소를 또한 포함하는, 캐스케이드(Cascade)라 불리는 대형 엔도뉴클레아제 복합체의 엔도리보뉴클레아제 서브유닛(Cas6)을 통해 발생한다. Cas I 뉴클레아제는 주로 DNA 뉴클레아제로서 기능한다.
타입 III CRISPR 시스템은 Csm 또는 Cmr 단백질 서브유닛을 포함하는 반복체 관련 신비 단백질(repeat-associated mysterious protein: RAMP)과 함께, Cas10으로 알려진 중앙 뉴클레아제의 존재를 특징으로 할 수 있다. 타입 I 시스템에서와 같이, 성숙한 crRNA는 Cas6 유사 효소를 사용하여 프리-crRNA로부터 프로세싱된다. 타입 I 및 II 시스템과 달리, 타입 III 시스템은 DNA-RNA 듀플렉스(예컨대, RNA 폴리머라제에 대한 주형으로 사용되는 DNA 가닥)를 표적화하여 절단하는 것으로 보인다.
타입 IV CRISPR-Cas 시스템은 고도로 감소된 대형 서브유닛 뉴클레아제(csf1), Cas5(csf3) 및 Cas7(csf2) 그룹의 RAMP 단백질에 대한 2개의 유전자, 및 일부 경우에, 예측된 소형 서브유닛에 대한 유전자로 이루어진 효과기 복합체를 보유하고; 이러한 시스템은 통상적으로 내인성 플라스미드에서 발견된다.
클래스 II CRISPR-Cas 시스템은 일반적으로 단일 폴리펩티드 다중도메인 뉴클레아제 효과기를 가지며, 타입 II, V 및 VI를 포함한다.
타입 II CRISPR-Cas 시스템은 구성요소 측면에서 가장 단순한 것으로 간주된다. 타입 II CRISPR-Cas 시스템에서, CRISPR 어레이의 성숙한 crRNA로의 프로세싱은 특별한 엔도뉴클레아제 서브유닛의 존재를 필요로 하지 않고, 오히려 어레이 반복 서열에 상보적인 영역을 갖는 작은 트랜스-코딩된 crRNA(tracrRNA)를 필요로 하고; tracrRNA는 이의 상응하는 효과기 뉴클레아제(예를 들어, Cas9) 및 반복 서열 둘 모두와 상호작용하여 전구체 dsRNA 구조를 형성하고, 이는 내인성 RNAse III에 의해 절단되어 tracrRNA 및 crRNA 둘 모두가 로딩된 성숙한 효과기 효소를 생성한다. Cas II 뉴클레아제는 DNA 뉴클레아제로 알려져 있다. 타입 2 효과기는 일반적으로 RuvC 유사 뉴클레아제 도메인의 폴드 내에 삽입된 관련 없는 HNH 뉴클레아제 도메인과 함께 RNase H 폴드를 채택하는 RuvC 유사 엔도뉴클레아제 도메인으로 이루어진 구조를 나타낸다. RuvC 유사 도메인은 표적(예를 들어, crRNA 상보적) DNA 가닥의 절단을 담당하는 반면, HNH 도메인은 대체된 DNA 가닥의 절단을 담당한다.
타입 V CRISPR-Cas 시스템은 RuvC 유사 도메인을 포함하여, 타입 II 효과기와 유사한 뉴클레아제 효과기(예를 들어, Cas12) 구조를 특징으로 한다. 타입 II와 유사하게, 타입 V CRISPR 시스템의 대부분(전부는 아님)은 tracrRNA를 사용하여 프리-crRNA를 성숙한 crRNA로 프로세싱하지만, 프리-crRNA를 다수의 crRNA로 절단하기 위해 RNAse III를 필요로 하는 타입 II 시스템과는 달리, 타입 V 시스템은 효과기 뉴클레아제 자체를 사용하여 프리-crRNA를 절단할 수 있다. 타입-II CRISPR-Cas 시스템과 마찬가지로, 타입 V CRISPR-Cas 시스템은 다시 DNA 뉴클레아제로 알려져 있다. 타입 II CRISPR-Cas 시스템과 달리, 일부 타입 V 효소(예를 들어, Cas12a)는 이중 가닥 표적 서열의 첫 번째 crRNA 유도 절단에 의해 활성화되는 강력한 단일 가닥의 비특이적 데옥시리보뉴클레아제 활성을 갖는 것으로 보인다.
타입 VI CRIPSR-Cas 시스템은 RNA 가이드된 RNA 엔도뉴클레아제를 갖는다. RuvC 유사 도메인 대신에, 타입 VI 시스템(예를 들어, Cas13)의 단일 폴리펩티드 효과기는 2개의 HEPN 리보뉴클레아제 도메인을 포함한다. 타입 II 및 V 시스템 둘 모두와 달리, 타입 VI 시스템은 또한 프리-crRNA를 crRNA로 프로세싱하기 위해 tracrRNA를 필요로 하지 않는 것으로 보인다. 그러나, 타입 V 시스템과 유사하게, 일부 타입 VI 시스템(예를 들어, C2C2)은 표적 RNA의 첫 번째 crRNA 유도 절단에 의해 활성화된 강력한 단일 가닥의 비특이적 뉴클레아제(리보뉴클레아제) 활성을 보유하는 것으로 보인다.
이의 더 단순한 구조 때문에, 클래스 II CRISPR-Cas는 디자이너 뉴클레아제/게놈 편집 활용으로서 조작 및 개발을 위해 가장 널리 채택되어 왔다.
시험관내 사용을 위한 이러한 시스템의 초기 변경 중 하나는 문헌[Jinek et al. (Science. 2012 Aug 17;337(6096):816-21, 그 전체가 본원에 참고로 포함됨)]에서 찾을 수 있다. Jinek 연구는 처음으로 (i) 에스. 피오게네스 SF370으로부터 단리된, 재조합에 의해 발현되고 정제된 전장 Cas9(예를 들어, 클래스 II, 타입 II Cas 효소), (ii) 절단하고자 하는 표적 DNA 서열에 상보적인 ∼20 nt 5' 서열, 이어서 3' tracr-결합 서열을 갖는 정제된 성숙한 ~42 nt crRNA(전체 crRNA는 T7 프로모터 서열을 갖는 합성 DNA 주형으로부터 시험관내에서 전사됨); (iii) T7 프로모터 서열을 갖는 합성 DNA 주형으로부터 전사된, 시험관내에서 정제된 tracrRNA, 및 (iv) Mg2+를 포함하는 시스템을 기술하였다. Jinek은 이후 (ii)의 crRNA가 링커(예를 들어, GAAA)에 의해 (iii)의 5' 말단에 연결되어 Cas9를 그 자체로 표적으로 유도할 수 있는 단일 융합 합성 가이드 RNA(sgRNA)를 형성하는 개선된 조작된 시스템을 기술하였다.
그 전체가 본원에 참조로 포함된 문헌[Mali et al. (Science. 2013 Feb 15; 339(6121): 823-826.)]은 이후에 (i) C 말단 핵 국소화 서열(예를 들어, SV40 NLS) 및 적합한 폴리아데닐화 신호(예를 들어, TK pA 신호)와 함께 적합한 포유동물 프로모터 하의 코돈 최적화된 Cas9(예를 들어, 클래스 II, 타입 II Cas 효소)를 코딩하는 ORF; 및 (ii) 적합한 폴리머라제 III 프로모터(예를 들어, U6 프로모터) 하의 sgRNA(G로 시작하는 5' 서열에 이어서, 3' tracr-결합 서열에 결합된 20 nt의 상보적인 표적화 핵산 서열, 링커 및 tracrRNA 서열을 가짐)를 코딩하는 ORF를 코딩하는 DNA 벡터를 제공함으로써 포유동물 세포에서 사용하기 위해 상기 시스템을 변경하였다.
염기 편집
염기 편집은 이중 가닥 파손의 생성 및 복구를 필요로 하지 않는 하나의 표적 염기 또는 염기쌍의 다른 것으로의 전환(예를 들어, A:T에서 G:C로, C:G에서 T:A로)이다. 염기 편집은 DNA 또는 RNA 내의 특정 부위에 점 돌연변이를 도입할 수 있게 하는 DNA 및 RNA 염기 편집기의 도움으로 달성될 수 있다. 일반적으로, DNA 염기 편집기는 촉매적 불활성 뉴클레아제와, 단일 가닥 DNA(ssDNA)에만 작용하는 촉매적 활성 염기-변형 효소의 융합을 포함할 수 있다. RNA 염기 편집기는 유사한 RNA 특이적 효소로 구성될 수 있다. 염기 편집은 DNA 내의 비표적(off-target) 및 무작위 돌연변이를 감소시키면서 유전자 변형의 효율을 증가시킬 수 있다.
DNA 염기 편집기는 세포 및 유기체에서 단일 염기 치환을 위한 도구 역할을 하는 조작된 리보핵단백질 복합체이다. 이들은 조작된 염기-변형 효소를 dsDNA를 절단할 수 없는 촉매적으로 결핍된 Cas 변이체와 융합시켜 생성될 수 있지만, 프로토스페이서 인접 모티프(PAM) 서열 의존적 방식으로 dsDNA를 풀어서(unfold) 가이드 RNA가 이의 상보적인 표적을 찾아서 ssDNA 절단 부위를 나타내도록 할 수 있다. 가이드 RNA는 상보적 DNA에 어닐링하여, ssDNA의 단편을 대체하고 Cas '가위(scissors)'를 염기 변형 부위로 유도한다. 세포 복구 기구는 상보적인 편집된 주형으로부터의 정보를 사용하여 닉킹된(nicked) 비편집된 가닥을 복구할 것이다.
지금까지, 2가지 타입의 DNA 편집기, 시토신 염기(CBE) 및 아데닌 염기 편집기(ABE)가 개발되었다. 이들은 최소한의 비표적 DNA 편집으로 DNA 내의 점 돌연변이를 효율적이고 정확하게 편집하는 것으로 나타났다(문헌[Nat Biotechnol. 2017;35:435-437, Nat Biotechnol. 2017;35:438-440 and Nat Biotechnol. 2017;35:475-480, 이들 각각은 전체가 본원에 참조로 포함됨] 참조). 그러나, 최근의 연구 결과는 DNA에 비표적 변형이 존재하고 많은 비표적 변형이 DNA 염기 편집기에 의해 RNA에도 도입된다는 것을 나타낸다.
MG 염기 편집기
일부 양상에서, 본 개시내용은 (a) RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; (b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 경우에, RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 경우에, 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 경우에, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 경우에 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 tracr 서열을 포함한다.
일부 양상에서, 본 개시내용은 (a) 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 경우에 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 tracr 서열을 포함한다. 일부 경우에, RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 경우에, 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 경우에, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다.
일부 양상에서, 본 개시내용은 (a) 서열번호 360-368 또는 598 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 (b) 엔도뉴클레아제에 커플링된 염기 편집기; 및 (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 tracr 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 경우에, RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 경우에, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, tracr 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, tracr 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 (a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) tracr 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체로서, 상기 tracr 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 구조체; 및 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, 타입 II Cas 엔도뉴클레아제를 포함하는 조작된 핵산 편집 시스템을 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 360, 362 또는 368 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475 또는 595 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제이다.일부 실시양태에서, 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 조작된 핵산 편집 시스템은 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 조작된 가이드 리보핵산 구조체는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 조작된 가이드 리보핵산 구조체는 가이드 리보핵산 서열 및 tracr 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물 또는 인간 게놈 서열에 상보적이다. 일부 실시양태에서, 가이드 리보핵산 서열은 길이가 15 내지 24 개의 뉴클레오티드이다. 일부 실시양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다.
NLS는 하기 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다:
표 1: 본 개시내용에 따라 Cas 효과기와 함께 사용될 수 있는 예시적인 NLS 서열
Figure pct00001
일부 실시양태에서, 엔도뉴클레아제는 염기 편집기에 직접 공유 결합되거나, 링커를 통해 염기 편집기에 공유 결합된다. 일부 실시양태에서, 본원에 기재된 임의의 효소 또는 도메인을 연결시키는 링커는 SGGSSGGSSGSETPGTSESATPESSGGSSGGS, SGSETPGTSESATPESA, GSGGS, SGSETPGTSESATPES, SGGSS, 또는 GAAA, 또는 본원에 기재된 임의의 다른 링커 서열에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열의 하나 또는 다수의 카피를 포함할 수 있다. 일부 실시양태에서, 폴리펩티드는 엔도뉴클레아제 및 염기 편집기를 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시스템은 Mg2+ 공급원을 추가로 포함한다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 70 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 88의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 360을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 71 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 89 중 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 361을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 73 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 91의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 363을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 75 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 93의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 365를 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 76 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 94의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 366을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 77 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 95의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 367을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 78 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 96의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 368을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 염기 편집기는 아데닌 데아미나제를 포함한다. 일부 실시양태에서, 아데닌 데아미나제는 서열번호 57 또는 이의 변이체를 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제를 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58 또는 이의 변이체를 포함한다. 일부 실시양태에서, 본원에 기재된 조작된 핵산 편집 시스템은 우라실 DNA 글리코실화 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실화 억제제는 서열번호 67 또는 이의 변이체를 포함한다.
일부 실시양태에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT 또는 스미스-워터맨 상동성 검색 알고리즘에 의해 결정된다. 일부 실시양태에서, 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고 조건부 조성 점수 매트릭스 조정을 사용하여 상기 BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 핵산을 제공한다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된, 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 엔도뉴클레아제를 코딩하는 것인 핵산을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시양태에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간이다.
일부 양상에서, 본 개시내용은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 벡터로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 벡터를 제공한다. 일부 실시양태에서, 벡터는 본원에 기재된 핵산을 포함한다. 일부 실시양태에서, 벡터는 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 코딩하는 핵산을 추가로 포함한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래의 비리온 또는 렌티바이러스이다. 일부 양상에서, 본 개시내용은 본원에 기재된 벡터를 포함하는 세포를 제공한다. 일부 양상에서, 본 개시내용은 본원에 기재된 세포를 배양하는 단계를 포함하는, 엔도뉴클레아제의 제조 방법을 제공한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고, 여기서 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하는 것인 방법을 제공한다.
일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제는 염기 편집기에 직접 공유 결합되거나, 링커를 통해 염기 편집기에 공유 결합된다. 일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, 클래스 2, 타입 II Cas 엔도뉴클레아제, 엔도뉴클레아제에 커플링된 염기 편집기 및 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 여기서 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고; 상기 PAM은 서열번호 360-368 또는 598 또는 이의 변이체로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법을 제공한다.
일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 염기 편집기에 공유 결합되거나, 링커를 통해 염기 편집기에 커플링된다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 또는 이의 변이체로부터 선택된 서열에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제를 포함하고; 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 아데닌을 포함하고; 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 아데닌 데아미나제는 서열번호 57 또는 이의 변이체에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 염기 편집기는 시토신 데아미나제를 포함하고; 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 시토신을 포함하고; 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 시토신을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58 또는 이의 변이체에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 59-66 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 복합체는 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시양태에서, PAM은 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열의 3' 말단에 바로 인접한다.
일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 양상에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 본원에 기재된 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 여기서 엔도뉴클레아제는 조작된 가이드 리보핵산 구조체와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법을 제공한다.
일부 실시양태에서, 조작된 핵산 편집 시스템은 아데닌 데아미나제를 포함하고, 뉴클레오티드는 아데닌이고, 표적 핵산 유전자좌를 변형시키는 것은 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템은 시티딘 데아미나제 및 우라실 DNA 글리코실라제 억제제를 포함하고, 뉴클레오티드는 시토신이고 표적 핵산 유전자좌를 변형시키는 것은 아데닌을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA 또는 박테리아 DNA를 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 시험관내에 있다. 일부 실시양태에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시양태에서, 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포 또는 인간 세포이다. 일부 실시양태에서, 세포는 동물 내에 있다.
일부 실시양태에서, 세포는 달팽이관 내에 있다. 일부 실시양태에서, 세포는 배아 내에 있다. 일부 실시양태에서, 배아는 2세포 배아이다. 일부 실시양태에서, 배아는 마우스 배아이다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 본원에 기재된 핵산 또는 본원에 기재된 벡터를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함한다.
일부 실시양태에서, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동 가능하게 연결된 프로모터를 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 캡핑된 mRNA를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 번역된 폴리펩타이드를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 리보핵산 구조체를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함한다.
일부 양상에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다.
일부 양상에서, 본 개시내용은 서열번호 360-368 또는 598 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제이다.일부 실시양태에서, 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
본 개시내용의 시스템은 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열-특이적 결합)과 같은 다양한 적용을 위해 사용될 수 있다. 이러한 시스템은, 예를 들어, 대상체에서 질환을 유발할 수 있는 유전적으로 유전된 돌연변이를 해결(예를 들어, 제거 또는 대체)하여 유전자를 불활성화시킴으로써 세포에서 이의 기능을 확인하기 위해, 질환 유발 유전 요소를 검출하기 위한 진단 도구로서(예를 들어, 역전사된 바이러스 RNA 또는 질환 유발 돌연변이를 코딩하는 증폭된 DNA 서열의 절단을 통해), 특정 뉴클레오티드 서열(예를 들어, 박테리아에서 항생제 내성을 코딩하는 서열)을 표적화하고 검출하기 위한 프로브와 조합된 불활성화된 효소로서, 바이러스를 불활성화하거나 바이러스 게놈을 표적화하여 숙주 세포를 감염시킬 수 없도록 하기 위해, 가치있는 소분자, 거대분자 또는 2차 대사산물을 생산하도록 유기체를 조작하기 위해 유전자를 추가하거나 대사 경로를 수정하기 위해, 진화적 선택을 위한 유전자 구동 요소를 확립하기 위해, 바이오센서로서 외래 소분자 및 뉴클레오티드에 의한 세포 변화를 검출하기 위해 사용될 수 있다.
표 2: 본원에 언급된 단백질 및 핵산 서열의 서열 목록
Figure pct00002
Figure pct00003
Figure pct00004
실시예
실시예 1. - 염기 편집기를 위한 플라스미드 작제
염기 편집을 표적화하기 위해 CRISPR 기능을 이용하는 염기 편집 효소를 생성하기 위해, Cas 효과기 효소를 본원에 기재된 예시적인 데아미나제에 다양한 구성으로 융합시켰다. 이 과정은 융합 효소를 생성하기에 적합한 벡터를 작제하는 첫 번째 단계를 포함한다. 2개의 진입 플라스미드 벡터, MGA 및 MGC를 먼저 작제하였다.
T7 프로모터-His 태그-TadA*(ABE8.17m)-SV40 NLS를 함유하는 MGA(Metagenomi 아데닌 염기 편집기) 진입 플라스미드를 작제하기 위해, 3개의 DNA 단편을 pAL6으로부터 증폭시켰다. T7 프로모터-His 태그-APOBEC1(BE3)-UGI-SV40 NLS를 함유하는 MGC(Metagenomi 시토신 염기 편집기) 진입 플라스미드를 작제하기 위해, APOBEC1 및 UGI-SV40 NLS를 pAL9로부터 증폭시키고, 두 조각의 벡터 백본을 pAL6로부터 증폭시켰다(도 3 참조).
효과기 내로 돌연변이를 도입하기 위해, MG1-4, MG1-6, MG3-6, MG3-7, MG3-8, MG4-5, MG14-1, MG15-1 또는 MG18-1 효과기 유전자 서열을 함유하는 소스 플라스미드를 적절한 돌연변이를 포함하는 정방향 프라이머 및 역방향 프라이머를 사용하여 Q5 DNA 폴리머라제에 의해 증폭시켰다. 그 다음, 선형 DNA 단편을 인산화하고 라이게이션하였다. DNA 주형을 제조업체의 지침에 따라 KLD 효소 믹스(New England Biolabs)를 사용하여 DpnI로 분해시켰다.
pMGA 및 pMGC 발현 플라스미드를 생성하기 위해, 돌연변이된 효과기를 보유하는 플라스미드로부터 유전자를 증폭시키고 각각 XhoI 및 SacII 부위를 통해 MGA 및 MGC 진입 플라스미드로 클로닝하였다. T7 프로모터-sgRNA-양방향 터미네이터를 포함하는 sgRNA 발현 카세트를 BE 발현 플라스미드로 클로닝하기 위해, 한 세트의 프라이머(정방향 프라이머로서 P366)를 사용하여 T7 프로모터-스페이서 서열을 증폭시키는 한편, 또 다른 세토의 프라이머(역방향 프라이머로서 P367)를 사용하여 스페이서 서열-sgRNA 스캐폴드-양방향 터미네이터를 증폭시켰고, 여기서 pTCM 플라스미드를 주형으로서 사용하였다(도 2 참조). 2개의 단편을 XbaI 부위를 통해 pMGA 및 pMGC로 조립하여 각각 pMGA-sgRNA 및 pMGC-sgRNA를 생성하였다.
표 3 - 본원에 기재된 ABE 스크리닝 시스템을 위해 제조된 작제물의 요약
Figure pct00005
Figure pct00006
증폭된 모든 DNA 단편을 QIAquick 겔 추출 키트(Qiagen)에 의해 정제하고, NEBuilder HiFi DNA Assembly(New England Biolabs)를 통해 조립하고, 생성된 조립체를 제조업체의 지침에 따라 Endura 전기천공적격(Electrocompetent) 세포(Lucergen)를 통해 증식하였다(도 4 및 5 참조). 클로닝된 모든 유전자의 DNA 서열은 ELIM BIOPHARM에서 확인되었다.
표 4 - 본원에 기재된 선택된 시스템에 대해 분석된 보존된 촉매 잔기
Figure pct00007
실시예 2.- 단백질 발현 및 정제
pMGA 및 pMGC 플라스미드에서 T7 프로모터 구동된 돌연변이된 효과기 유전자를 상기 실시예 1에 기재된 각각의 플라스미드로 형질전환시킴으로써 제조업체의 지침(Thermo)에 따라 Magic Media 중의 이. 콜라이 BL21(DE3) 세포에서 발현시켰다. 16℃에서 40시간 인큐베이션한 후, 형질전환된 세포를 수거하고, 용해 완충액(HisTrap 평형 완충액: 20 mM Tris(Sigma T2319-100 ML), 300 mM 염화나트륨(VWR VWRVE529-500 ML), 5% 글리세롤, 10 mM MgCl2, 10 mM 이미다졸(Sigma 68268-100 ML-F) 포함; pH 7.5) 및 EDTA-무함유 프로테아제 억제제(Pierce)에 현??시키고, -80℃ 냉동고에서 냉동시켰다. 그 다음, 세포를 얼음 위에서 해동하고, 초음파 처리하고, 정화하고, 친화성 정제 전에 여과하였다. 단백질을 제조업체의 사양에 따라 Akta Avant FPLC 상의 Cytiva 5ml HisTrap FF 컬럼에 적용하고 단백질을 20 mM Tris(Sigma T2319-100 ML), 300 mM 염화나트륨(VWR VWRVE529-500 ML), 5% 글리세롤, 10 mM MgCl2, 250 mM 이미다졸 포함(Sigma 68268-100 ML-F); pH 7.5의 등용매 용출로 용출시켰다. His-태그된 효과기 단백질을 함유하는 용출된 분획을 농축시키고 50 mM Tris-HCl, 300 mM NaCl, 1 mM TCEP, 5% 글리세롤; pH 7.5로 완충액 교환하였다. Image Lab(Bio-Rad)에서 SDS PAGE 농도계로 상대적 순도를 결정한 후 단백질 농도를 비신코닌산 분석(Thermo)으로 결정하고 조정하였다(도 7 참조).
실시예 3. - 시험관내 닉카제 분석
IDT에 의해 합성된 6-카르복시플루오레세인(6-FAM) 표지된 프라이머 P141 및 P146(서열번호 179 및 180)을, Q5 DNA 폴리머라제를 사용하여 효과기의 표적화 서열을 함유하는 LacZ의 선형 단편을 증폭시키는 데 사용하였다. T7 프로모터에 이어서 20-bp 또는 22-bp 스페이서 서열을 함유하는 sgRNA를 함유하는 DNA 단편을 제조업체의 지침에 따라 HiScribe T7 고수율 RNA 합성 키트(New England Biolabs)를 사용하여 시험관내에서 전사하였다. 서열 목록에서 명명된 sgRNA에 상응하는 서열을 갖는 합성 sgRNA를 사용자 매뉴얼에 따라 Monarch RNA Cleanup 키트(New England Biolabs)로 정제하고 농도를 Nanodrop으로 측정하였다.
DNA 닉카제 활성을 결정하기 위해, 각각의 정제된 돌연변이된 효과기를 먼저 이의 동족 sgRNA로 보충하였다. 10 mM Tris pH 7.5, 10 mM MgCl2, 100 mM NaCl, 150 nM 효소, 150 nM RNA 및 15 nM DNA를 함유하는 15 μL 반응 혼합물에 선형 DNA 기질을 첨가하여 반응을 개시하였다. 반응물을 37℃에서 2시간 동안 인큐베이션하였다. 분해된 DNA를 AMPure XP SPRI 상자성 비드(Beckman Coulter)를 사용하여 정제하고 6 μL TE 완충액(10 mM Tris, 1 mM EDTA; pH 8.0)으로 용출시켰다. 닉킹된 DNA를 10% TBE-우레아 변성 겔(Biorad)에서 분해시키고 ChemiDoc(Bio-Rad)에 의해 이미지화하였다(도 7 참조, 이는 야생형 효소의 경우에 400개 및 200개 염기인 것에 비해 도시된 효소는 600개 및 200개 염기의 밴드의 생성에 의해 닉카제 활성을 나타냄을 보여준다). 결과는 결정적이지 않은 MG4-5(D17A)를 제외한 도 7에서 테스트된 모든 닉카제 돌연변이가 야생형 절단 활성 대신 예상된 닉카제 활성을 나타냈음을 보여주었다.
실시예 4.- 이. 콜라이 내로의 염기 편집기 도입
플라스미드를 제조업체의 지침에 따라 Lucergen의 전기천공적격 BL21(DE3) 세포로 형질전환시켰다. 전기천공 후, 세포를 37℃에서 1시간 동안 발현 회수 배지로 회수하고 100 L/mg 암피실린 및 0.1 mM IPTG를 함유하는 LB 플레이트에 도말하였다. 37℃에서 밤새 성장시킨 후, 콜로니를 채취하고 lacZ 유전자를 프라이머 P137 및 P360을 사용하여 Q5 DNA 폴리머라제(New England Biolabs)에 의해 증폭시켰다. 생성된 PCR 산물을 정제하고 ELIM BIOPHARM에서 생어 시퀀싱에 의해 시퀀싱하였다. 시토신 염기 편집기 또는 아데닌 염기 편집기 각각에 대한 표적화된 프로토스페이서 영역에 C에서 T로의 전환 또는 A에서 G로의 전환이 존재하는지 여부를 조사하여 염기 편집을 결정하였다.
이. 콜라이에서 편집 효율을 평가하기 위해, 플라스미드를 전기천공적격 BL21(DE3)(Lucergen)로 형질전환시키고 전기천공된 세포를 37℃에서 1시간 동안 발현 회수 배지로 회수하였다. 10 μL의 회수된 세포를 96웰 딥 웰 플레이트에서 100 μL/mg 암피실린 및 0.1 mM IPTG를 함유하는 990 μL SOB에 접종하고, 37℃에서 20시간 동안 성장시켰다. 염기 편집기 발현을 위해 유도된 1 μL 세포를 프라이머 P137 및 P360을 사용한 20 μL PCR 반응(Q5 DNA 폴리머라제)에서 lacZ 유전자의 증폭을 위해 사용하였다. 생성된 PCR 산물을 정제하고 ELIM BIOPHARM에서 생어 시퀀싱에 의해 시퀀싱하였다. 편집 효율의 정량화는 실시예 12에 기재된 바와 같이 Edit R에 의해 처리하였다.
표 5 - 관련 PAM 및 데아미나제와 함께 본원에 기재된 MG 염기 편집기
Figure pct00008
실시예 5. - 포유동물 세포에서의 단백질 뉴클레오펙션 및 앰플리콘 seq(예측)
뉴클레오펙션은 Lonza 4D 뉴클레오펙터(nucleofector) 및 Lonza SF 세포주 4D-Nucleofector X 키트 S(카탈로그 번호 V4XC-2032)를 사용하여 제조업체의 권장사항에 따라 포유동물 세포(예를 들어, K-562, Neuro-2A 또는 RAW264.7)에서 수행한다. SF 뉴클레오펙션 완충액을 조제한 후, 200,000개의 세포를 뉴클레오펙션당 5 μl의 완충액에 재현탁한다. 뉴클레오펙션당 나머지 15 μl의 완충액에서, Synthego의 20 pmol의 화학적으로 변형된 sgRNA를 18 pmol의 염기 편집 효소(예를 들어, ABE8e)와 합하고 실온에서 5분 동안 인큐베이션하여 복합체를 제조한다. 세포를 20 μl 뉴클레오펙션 큐벳에 첨가한 후, 단백질 용액을 첨가하고, 혼합물을 분쇄하여 혼합한다. 세포를 프로그램 CM-130으로 뉴클레오펙션하고, 그 직후에 회수를 위해 80 μl의 가온된 배지를 각 웰에 첨가한다. 5분 후, 각 샘플로부터의 25 μl를 48웰 폴리-d-리신 플레이트(Corning) 내의 250 μl의 신선한 배지에 첨가한다. 그 다음, 세포를 3일 더 배양한 후 게놈 DNA 추출을 위해 상기 리포펙션된 세포와 동일한 방식으로 처리한다.
Illumina 바코딩 후, PCR 산물을 30 μl H2O로 용출시키면서 Monarch DNA 겔 추출 키트(New England Biolabs)를 사용하여 2% 아가로스 겔로 전기영동하여 풀링하고 정제한다. DNA 농도를 Qubit dsDNA 고감도 분석 키트(Thermo Fisher Scientific)로 정량화하고 제조업체의 프로토콜에 따라 Illumina MiSeq 기기(페어드 엔드 리드(paired-end read), R1: 250 내지 280 사이클, R2: 0 사이클)에서 시퀀싱한다.
시퀀싱 리드를 MiSeq 리포터(Illumina)를 사용하여 역다중화하고 CRISPResso2를 사용하여 FASTQ 파일을 분석한다. 개별 대립유전자의 이중 편집을 Python 스크립트에 의해 분석한다. 염기 편집 값은 상이한 연구원들에 의해 수집된 n = 3개의 독립적인 생물학적 복제물을 대표하며, 평균 ± 표준 편차가 표시된다. 염기 편집 값은 정렬된 총 리드에 걸쳐 아데닌 돌연변이유발을 갖는 리드 수의 백분율로서 보고된다.
실시예 6. - 포유동물 세포에서 플라스미드 뉴클레오펙션 및 전체 게놈 seq(예측)
모든 플라스미드는 우라실 특이적 절제 시약(USER) 클로닝 방법에 의해 조립한다. SpCas9, SaCas9 및 모든 조작된 변형에 대한 가이드 RNA 플라스미드를 조립한다. 포유동물 세포 형질감염을 위한 플라스미드는 ZymoPURE Plasmid Midiprep 키트(Zymo Research Corporation)를 사용하여 제조한다. HEK293T 세포(ATCC CRL-3216)는 10% 소 태아 혈청(ThermoFisher Scientific)이 보충된 둘베코 변형 이글 배지(Dulbecco's modified Eagle's medium)(Corning)에서 배양하고 37℃에서 5% CO2로 유지한다.
HEK293T 세포를 동일한 배양 배지에서 48웰 폴리-d-리신 플레이트(Corning)에 시딩한다. 1.5 μl 리포펙타민 2000(ThermoFisher Scientific)으로 플레이팅한지 12 내지 16시간 후에 세포를 750 ng 염기 편집기 플라스미드, 250 ng 가이드 RNA 플라스미드 및 형질감염 대조군으로서 10 ng 녹색 형광 단백질을 사용하여 형질감염시킨다. 첫날 후 3일마다 배지를 교환하면서 세포를 배양한 다음, Å~1 PBS(ThermoFisher Scientific)로 세척한 후, 100 μl의 새로 준비된 용해 완충액(10 mM Tris-HCl, pH 7.5, 0.05% SDS, 25 ㎍ ml-1 프로테이나제 K(ThermoFisher Scientific))를 각각의 형질감염된 웰에 직접 첨가하여 게놈 DNA를 추출한다. 혼합물을 37℃에서 1시간 동안 인큐베이션한 다음, 80℃에서 30분 동안 열 불활성화한다. 이후 게놈 DNA 용해물을 고처리량 시퀀싱(HTS)을 위해 즉시 사용한다.
HEK293T 세포로부터의 게놈 DNA의 HTS를 수행한다. Illumina 바코딩 후, PCR 산물을 30μl H2O로 용출시키면서 Monarch DNA 겔 추출 키트(NEB)를 사용하여 2% 아가로스 겔로 전기영동하여 풀링하고 정제한다. DNA 농도를 Qubit dsDNA 고감도 분석 키트(Thermo Fisher Scientific)로 정량화화고 제조업체의 프로토콜에 따라 Illumina MiSeq 기기(페어드 엔드 리드, R1: 250 내지 280 사이클, R2: 0 사이클)에서 시퀀싱한다.
실시예 7. - 편집 윈도우의 결정(예측)
편집 윈도우 영역을 조사하기 위해, 지정된 sgRNA에서 가장 높은 C-T 전환 빈도를 나타내는 시토신을 1로 정규화하고, 이후에 동일한 sgRNA의 PAM 서열의 30nt 상류부터 10nt 하류에 이르는 위치에 있는 다른 시토신(총 43 bp)을 정규화한다. 그 다음, 정규화된 C-T 전환 빈도를 지정된 염기 편집기의 모든 테스트된 sgRNA에 대해 위치에 따라 분류하고 비교한다. 포괄적인 편집 윈도우(comprehensive editing window: CEW)는 정규화 후 평균 C-T 전환 효율이 0.6을 초과하는 위치에 걸쳐있는 것으로 정의된다.
각 시티딘 데아미나제에 대한 기질 선호도를 조사하기 위해, C 부위를 초기에 sgRNA 표적화 영역 내의 이의 위치에 따라 분류하고, 정규화된 C-T 전환 빈도가 0.8 이상인 적어도 하나의 C 부위를 함유하는 위치를 후속 분석에 포함시킨다. 그 다음, 선택된 C 부위를 편집된 시토신(NC 또는 CN)의 상류 또는 하류에 있는 염기 유형에 따라 비교한다. 엔도뉴클레아제의 N-말단과 C-말단 둘 모두에서 효율적인 C-T 전환을 나타내는 시티딘 데아미나제에 대해, 각각의 NT- 및 CT-CBE를 함께 통합하여 기질 선호도를 평가한다. 통계 분석을 위해, 일원 분산분석을 사용하고 p < 0.05를 유의한 것으로 간주한다.
실시예 8a.- 포유동물 세포에서 전체 게놈 시퀀싱 및 전사체학을 통한 비표적 분석 테스트(예측)
리포펙션 16 내지 20시간 전에, HEK293T 세포를 항생제가 없는 DMEM+GlutaMAX 배지(Thermo Fisher Scientific)에서 웰당 3.104개 세포의 밀도로 48웰 폴리-d-리신-코팅된 플레이트에 플레이팅한다. 750ng 닉카제 또는 염기 편집기 발현 플라스미드 DNA를 15μl Opti-MEM+GlutaMAX에서 250ng의 sgRNA 발현 플라스미드 DNA와 합한다. 이것을 웰당 1.5 μl 리포펙타민 2000 및 8.5 μl Opti-MEM + GlutaMAX를 포함하는 10μl의 지질 혼합물과 합한다. 형질감염 3일 후 세포를 수거하고 DNA 또는 RNA를 수거한다. DNA 분석을 위해, 세포를 PBS로 1회 세척한 다음, 제조업체의 지침에 따라 100 μl QuickExtract 완충액(Lucigen)에 용해시킨다. RNA 수거의 경우, MagMAX mirVana 총 RNA 단리 키트(Thermo Fisher Scientific)를 KingFisher Flex와 함께 사용한다.
포유동물 세포로부터의 게놈 DNA를 제조업체의 지침에 따라 96웰 플레이트 Nextera 인덱싱 프라이머(Illumina)를 사용하는 Nextera DNA Flex 라이브러리 준비 키트(Illumina)를 사용하여 단편화하고 어댑터-라이게션한다. 라이브러리 크기 및 농도를 단편 분석기(Agilent)로 확인하고 DNA를 Illumina HiSeq 시스템을 사용한 WGS를 위해 Novogene로 보낸다.
모든 표적화 NGS 데이터는 하기의 일반적인 4단계를 수행하여 분석한다. (1) 정렬; (2) 중복 마킹; (3) 변이체 호출; 및 (4) 아티팩트 및 생식계열 돌연변이를 제거하기 위한 변이체의 백그라운드 여과. 돌연변이 참조 및 대체 대립유전자는 참조 게놈의 플러스 가닥과 관련하여 보고된다.
전체 전사체 시퀀싱을 위해, NEBNext 폴리(A) mRNA 마그네틱 단리 모듈(New England BioLabs)을 사용하여 mRNA 선택을 수행한다. Illumina용 NEBNext Ultra II RNA 라이브러리 준비 키트(New England BioLabs)를 사용하여 RNA 라이브러리 준비를 수행한다. RNA 입력량에 기초하여, 어댑터 라이게이션된 DNA의 PCR 농축을 위해 12의 사이클 횟수를 사용한다. 이 방법으로 수행되는 모든 크기 선별을 위해 전반적으로 NEBNext 샘플 정제 비드(New England BioLabs)를 사용한다. Illumina(New England BioLabs)용 NEBNext Multiplex Oligos는 프로토콜에 설명된 PCR 레시피에 따라 멀티플렉스 인덱스를 위해 사용한다. 시퀀싱 전에, 4200 TapeStation System(Agilent)에서 고감도 D1000 ScreenTape를 사용하여 샘플을 품질 확인한다. NovaSeq(Novogene)를 사용하여 라이브러리를 풀링하고 시퀀싱한다. 그 다음, 표적화 RNA 시퀀싱을 수행한다. 제조업체의 지침에 따라 EZDnase(Thermo Fisher Scientific)가 포함된 SuperScript IV 원-스텝 RT-PCR 시스템을 사용하여 단리된 RNA로부터 역전사(RT-PCR)를 통한 PCR에 의해 상보적 DNA를 생성한다.
하기 프로그램을 사용한다: 58℃에서 12분 동안; 98℃에서 2분 동안; 이어서 앰플리콘에 따라 달라지는 PCR 사이클: CTNNB1 및 IP90의 경우; 32 사이클(98℃에서 10초 동안, 60℃에서 10초 동안, 72℃에서 30초 동안). 조합된 RT-PCR 후, 앰플리콘을 상기 설명한 바와 같이 바코딩하고 Illumina MiSeq 시퀀서를 사용하여 시퀀싱한다. 각 앰플리콘의 정방향 프라이머의 말단 후에 첫 번째 염기에서 시작하는 각 앰플리콘의 처음 125개 뉴클레오티드를 참조 서열에 대해 정렬하고 각 앰플리콘에서 최대 A-대-I 빈도 분석을 위해 사용한다. 프라이머를 사용하고 2단계 PCR 및 바코딩 방법을 사용하여 비표적 DNA 시퀀싱을 수행하여, 상기와 같이 Illumina MiSeq 시퀀서를 사용하여 시퀀싱할 샘플을 준비한다.
실시예 8b. - 전체 게놈 시퀀싱 및 전사체학에 의한 비표적 편집의 분석(예측)
실시예 8a에서와 같이 제조된 형질감염된 세포를 3일 후에 수거하고 제조업체의 지침에 따라 Agencourt DNAdvance 게놈 DNA 단리 키트(Beckman Coulter)를 사용하여 게놈 DNA를 단리한다. 관심대상의 온-타겟 및 비표적 게놈 영역을 측접 HTS 프라이머 쌍을 사용하여 PCR로 증폭시킨다. 주형으로서 5 ng의 게놈 DNA를 사용하여 제조업체의 지침에 따라 Phusion 고충실도 DNA 폴리머라제(ThermoFisher)로 PCR 증폭을 수행한다. 반응이 증폭의 선형 범위(각각 EMX1, FANCF, HEK293 부위 2, HEK293 부위 3, HEK293 부위 4 및 RNF2 프라이머에 대해 30, 28, 28, 28, 32 및 32 사이클)에서 중단된 것을 보장하기 위해 사이클 횟수를 각 프라이머 쌍에 대해 개별적으로 결정한다. PCR 산물을 RapidTips(Diffinity Genomics)를 사용하여 정제한다. 정제된 DNA를 시퀀싱 어댑터를 함유하는 프라이머를 이용한 PCR에 의해 증폭시킨다. 생성물을 Quant-iT™ PicoGreen dsDNA 분석 키트(ThermoFisher) 및 KAPA 라이브러리 정량화 키트-Illumina(KAPA Biosystems)를 사용하여 겔 정제하고 정량화한다. 샘플을 이전에 설명한 바와 같이 Illumina MiSeq에서 시퀀싱한다.
시퀀싱 리드를 MiSeq Reporter(Illumina)를 사용하여 자동으로 역다중화하고, 개별 FASTQ 파일을 맞춤형 Matlab 스크립트를 이용하여 분석한다. 각 리드를 스미스-워터맨 알고리즘을 사용하여 적절한 참조 서열에 쌍별로 정렬한다. Q-점수가 31 미만인 염기 호출은 N으로 대체되므로 뉴클레오티드 빈도의 계산에서 제외된다. 이러한 처리는 약 1/1,000의 예상 MiSeq 염기-호출 오류율을 산출한다. 리드 및 참조 서열이 갭을 함유하지 않은 정렬된 서열은 정렬 표에 저장되며, 여기에는 각 유전자좌에 대한 염기 빈도가 표 형식으로 기재되어 있다. 인델(indel) 빈도는 맞춤형 Matlab 스크립트를 이용하여 정량화하였다.
인델이 발생할 수 있는 윈도의 양쪽에 측접한 2개의 10-bp 서열에 대한 정확한 일치를 위해 시퀀싱 리드를 스캔한다. 정확한 일치가 위치하지 않으면, 리드는 분석에서 제외된다. 이러한 인델 윈도우의 길이가 참조 서열과 정확히 일치한다면, 리드는 인델을 함유하지 않는 것으로 분류된다. 인델 윈도우가 참조 서열보다 2개 이상의 염기가 길거나 짧다면, 시퀀싱 리드는 각각 삽입 또는 결실로 분류된다.
실시예 9. - 마우스 편집 실험(예측)
신규 데아미나제 도메인에 융합된 신규 DNA 표적화 뉴클레아제 도메인으로 이루어진 염기 편집기를 질환의 적절한 마우스 모델에서 테스트함으로써 치료 후보로서 검증될 수 있을 것으로 예상된다.
적절한 모델의 일례는 예를 들어 Herbert 등(10.1161/ATVBAHA.110.204040)에 의해 설명된 바와 같이 인간 PCSK9 단백질을 발현하도록 조작된 마우스를 포함한다. PCSK9 단백질은 LDL 수용체(LDLR) 수준을 조절하고 혈청 콜레스테롤 수준에 영향을 미친다. 인간 PCSK9 단백질을 발현하는 마우스는 상승된 콜레스테롤 수준 및 더 빠른 죽상동맥경화증 발달을 나타낸다. PCSK9는 비정상적으로 높은 혈장 지질 수준으로 인해 심혈관 질환의 위험이 증가된 사람들에서 지질 수준의 감소를 위한 검증된 약물 표적이다(https://doi.org/10.1038/s41569-018-0107-8). 게놈 편집을 통한 PCSK9 수준의 감소는 개체의 일생 동안 지질 수준을 영구적으로 저하시켜 일생 동안 지속되는 심혈관 질환 위험의 감소를 제공할 것으로 예상된다. 게놈 편집 접근법 중 하나는 서열을 편집하여 미성숙 정지 코돈을 생성함으로써 PCSK9 mRNA가 기능적 단백질로 번역되는 것을 방지하는 것을 목표로 PCSK9 유전자의 코딩 서열을 표적화는 것을 포함할 수 있다. 대부분의 단백질의 번역을 차단하기 위해 코딩 서열의 5' 말단에 가까운 영역을 표적화하는 것은 유용하다. 높은 효율 및 특이성을 갖는 정지 코돈(TGA, TAA, TAG)을 생성하는 것은 PCSK9 코딩 서열의 영역을 표적화하는 것을 필요로 할 것이며, 여기서 편집 윈도우는 가장 높은 빈도의 편집 이벤트가 정지 코돈을 초래하도록 적절한 서열 위에 배치될 것이다. 따라서, 광범위한 PAM을 갖는 다수의 염기 편집 시스템 또는 축퇴성 PAM을 갖는 염기 편집 시스템의 이용가능성은 PCSK9 유전자에서 더 많은 수의 잠재적 표적 부위에 접근하는 데 유용하다. 또한, 비표적 편집의 빈도가 낮은(예를 들어, 온-타겟 편집 이벤트의 1% 이하 범위) 추가적인 편집 시스템도 이러한 맥락에서 유전자 편집을 수행하는 데 유용하다.
치료 효과를 위해 요구되는 염기 편집의 효율은 혈장 지질 수준의 상당한 감소를 달성하기 위한 50% 이상의 범위 내이다. PCSK9 유전자에서 정지 코돈을 생성하기 위해 염기 편집기를 사용하는 예는 Carreras 등(https://doi.org/10.1186/s12915-018-0624-2)의 것으로, 여기서 PCSK9 대립유전자의 10% 내지 34%가 편집되어 정지 코돈을 생성하였다. 이러한 수준의 편집이 마우스에서 혈장 지질 수준의 측정 가능한 감소를 초래하기에 충분하였지만, 인간에서의 치료적 사용을 위해서는 더 높은 편집 효율이 요구될 것이다.
PCSK9 유전자에서 정지 코돈을 도입하기 위한 최적의 염기 편집(BE) 시스템 및 가이드를 식별하기 위해, Hepa1-6 세포와 같은 마우스 간 세포주에서 스크리닝을 수행할 수 있다. 이용가능한 다양한 BE 시스템으로 PCSK9 유전자를 표적화하는 가이드를 식별하기 위해 먼저 인 실리코(In silico) 스크리닝을 사용할 수 있다. 다수의 가능한 가이드 중에서 선택하기 위해, 인-실리코 분석을 수행하여, 편집될 때 정지 코돈을 생성할 수 있는 서열을 포함하는 편집 윈도우를 어느 가이드가 갖는지를 결정할 수 있다. 그 다음, 코딩 서열의 5' 말단에 더 가까운 가이드가 선호될 수 있다. 생성된 일련의 가이드와 BE 단백질을 조합하여 리보핵단백질 복합체(RNP)를 형성할 수 있고 Hepa1-6 세포로 뉴클레오펙션할 수 있다. 72시간 후, 표적 부위에서의 편집 효율을 NGS 분석에 의해 결정할 수 있다. 이들 시험관내 결과에 기초하여, 가장 높은 빈도의 정지 코돈 형성을 초래한 하나 이상의 BE/가이드 조합을 생체내 시험을 위해 선택할 수 있다.
인간 치료 환경에 적용하기 위해, 염기 편집기 및 가이드 RNA를 포함하는 염기 편집 구성요소를 전달하는 안전하고 효과적인 방법이 요구된다. 생체내 전달 방법은 바이러스성 또는 비바이러스성 방법으로 나뉠 수 있다. 바이러스 벡터 중에서, 아데노 관련 바이러스(AAV)는 이의 안전성 기록, 다수의 조직 및 세포 유형으로의 효율적인 전달 및 확립된 제조 공정으로 인해 임상 용도로 선택되는 바이러스이다. 큰 크기의 염기 편집기(BE)는 AAV의 패키징 용량을 초과하여 단일 아데노바이러스 관련 바이러스의 패키징을 방해한다. 스플릿 인테인(split intein) 기술을 사용하여 BE를 2개의 AAV로 패키징하는 접근법이 마우스에서 성공적인 것으로 입증되었지만(https://doi.org/10.1038/s41551-019-0501-5), 2개의 바이러스에 대한 필요성은 개발 및 제조를 복잡하게 만든다. AAV의 추가 단점은, 바이러스가 숙주 세포의 게놈 내로의 통합을 촉진하는 메커니즘을 가지고 있지 않고 대부분의 AAV 게놈이 에피솜으로 남아 있는 반면, AAV 게놈의 일부는 세포에서 자연적으로 발생하는 무작위 이중 가닥 파손에서 통합된다는 점이다(Curr Opin Mol Ther. 2009 August; 11(4): 442-447). 이는 유기체의 일생 동안 BE를 발현하는 유전자 서열의 지속을 야기할 수 있다. 더욱이, AAV 게놈은 형질도입된 세포의 핵 내부에서 에피솜으로서 지속되고 수년 동안 유지될 수 있으며, 이는 이들 세포에서 BE의 장기간 발현을 초래하여 비표적 효과의 위험을 증가시킬 수 있는데, 비표적 이벤트의 발생 위험이 편집 효소가 활성인 시간의 함수이기 때문이다. 아데노바이러스(Ad), 예컨대 Ad5는 DNA 페이로드를 포유동물의 간으로 효율적으로 전달할 수 있으며 최대 45kb의 DNA를 패키징할 수 있다. 그러나, 아데노바이러스는 사망을 포함한 심각한 이상반응(adverse event)을 초래할 수 있는 환자에서의 반응(https:// doi.org/10.1016/j.ymthe.2020.02.010)을 포함하여, 포유동물(http://dx.doi.org/10.1136/gut.48.5.733)에서 강력한 면역 반응을 유도하는 것으로 알려져 있다.
지질 나노입자 및 중합체 나노입자를 포함하는 비바이러스성 전달 벡터(doi:10.1038/mt.2012.79에서 검토됨)는 바이러스성 전달 벡터에 비해, 낮은 면역원성 및 핵산 카고(cargo)의 일시적인 발현을 포함하는 몇 가지 이점이 있다. 비바이러스성 전달 벡터에 의해 유발된 일시적인 발현은 비표적 이벤트를 최소화할 것으로 예상되기 때문에 게놈 편집 응용 분야에 특히 적합하다. 또한, 바이러스 벡터와 달리 비바이러스성 전달은 치료 효과를 달성하기 위해 반복 투여할 수 있는 잠재성이 있다. 또한, 실제로는 핵산의 크기가 증가하고 입자 크기가 증가할수록 패키징이 덜 효율적이 되지만, 비바이러스 벡터에 패키징될 수 있는 핵산 분자의 크기에 이론적인 제한은 없다.
BE는 가이드 RNA와 함께 BE를 코딩하는 합성 mRNA를 LNP로 캡슐화함으로써 지질 나노입자(LNP)와 같은 비바이러스 벡터를 사용하여 생체내에서 전달할 수 있다. 이것은 예를 들어 Finn 등(DOI: 10.1016/j.celrep.2018.02.014) 또는 Yin 등(doi:10.1038/nbt.3471)에 의해 설명된 바와 같이 당업계에 잘 알려진 방법론을 사용하여 수행할 수 있다. 전형적으로, LNP는 PCSK9 유전자의 발현을 방해하고자 시도할 때 표적 기관/세포 유형이기도 한 간의 간세포로 주로 카고를 전달한다. 이 접근법에 대한 개념 증명을 입증하기 위해, 본 발명자들은 데아미나제 도메인에 융합된 새로운 게놈 편집 단백질로 구성된 BE가 합성 mRNA로 코딩되고, 마우스의 PCSK9 유전자 내의 선택된 부위를 표적화하는 적절한 가이드 RNA와 함께 LNP에 패키징될 수 있을 것으로 예상하고 있다. 인간 PCSK9 유전자를 발현하도록 조작된 마우스의 경우, 가이드는 인간 PCSK9 유전자만을 표적화하거나 인간과 마우스 PCSK9 유전자 둘 모두를 표적화하도록 설계할 수 있다. 이들 LNP의 주입 후, 간 세포의 게놈 내의 표적 위치에서의 편집 효율을 앰플리콘 시퀀싱 또는 분해에 의한 인델 추적과 같은 기타 방법에 의해 분석할 수 있다(doi: 10.1093/nar/gku936). 생리학적 영향은 표준 방법을 사용하여 총 콜레스테롤 및 트리글리세리드 수준을 포함하는 마우스의 혈중 지질 수준을 측정함으로써 결정할 수 있다.
신규 BE를 평가하기 위해 마우스에서 모델링될 수 있는 질환의 또 다른 예는 원발성 고수산뇨증 I형이다. 원발성 고수산뇨증 I형(PH1)은 효소 알라닌-글리옥실레이트 아미노트랜스퍼라제를 코딩하는 AGXT 유전자의 결함에 의해 유발되는 희귀한 상염색체 열성 질환이다. 이는 글리옥실레이트 대사의 결함 및 독성 대사산물 옥살레이트의 축적을 초래한다. 이 질환을 치료하는 한 가지 접근법은 글리콜레이트로부터 글리옥실레이트를 생성하는 효소 글리콜레이트 옥시다제(GO)의 발현을 감소시켜 옥살레이트 형성에 이용가능한 기질(글리옥실레이트)의 양을 감소시키는 것이다. PH1은, AGXT 유전자의 두 카피 모두가 녹아웃되어(agxt -/- 마우스) 야생형 대조군에 비해 소변 중 옥살레이트 수준의 유의한 3배 증가가 초래된 마우스에서 모델링될 수 있다. 따라서, agxt -/- 마우스를 사용하여 내인성 마우스 GO 유전자의 코딩 서열에서 정지 코돈을 생성하도록 설계된 신규 염기 편집기의 효능을 평가할 수 있다. GO 유전자에 정지 코돈을 도입하기기 위한 최적의 BE 시스템 및 가이드를 식별하기 위해, Hepa1-6 세포와 같은 마우스 간 세포주에서 스크리닝을 수행할 수 있다. 인 실리코 스크리닝을 먼저 사용하여 이용가능한 다양한 BE 시스템으로 GO 유전자를 표적화하는 가이드를 식별할 수 있다. 다수의 가능한 가이드 중에서 선택하기 위해, 인-실리코 분석을 수행하여, 편집될 때 정지 코돈을 생성할 수 있는 서열을 포함하는 편집 윈도우를 어느 가이드가 갖는지를 결정할 수 있다. 그 다음, 코딩 서열의 5' 말단에 더 가까운 가이드가 선호될 수 있다. 생성된 일련의 가이드와 BE 단백질을 조합하여 리보핵단백질 복합체(RNP)를 형성할 수 있고 Hepa1-6 세포로 뉴클레오펙션할 수 있다. 72시간 후, 표적 부위에서의 편집 효율을 NGS 분석에 의해 결정할 수 있다. 이들 시험관내 결과에 기초하여, 가장 높은 빈도의 정지 코돈 형성을 초래한 하나 이상의 BE/가이드 조합을 생체내 시험을 위해 선택할 수 있다.
BE 및 가이드는 AAV 바이러스와 함께 BE를 발현하기 위한 스플릿 인테인 시스템 및 가이드를 전달하기 위한 제3 AAV를 사용하여 마우스에 전달할 수 있다. 대안적으로, 아데노바이러스의 >40Kb 패키징 용량 때문에 아데노바이러스 유형 5를 사용하여 BE 및 가이드를 단일 바이러스로 전달할 수 있다. 또한, BE를 적절한 LNP에 패키징된 가이드 RNA와 함께 mRNA로서 전달할 수 있다. LNP를 agxt -/- 마우스에 정맥내 주사한 후, 소변 중 옥살레이트 수준을 시간 경과에 따라 모니터링하여 옥살레이트 수준이 감소되었는지 여부를 결정할 수 있으며, 이는 BE가 활성이고 예상되는 치료 효과를 가졌다는 것을 암시한다. BE가 정지 코돈을 도입하였는지 여부를 결정하기 위해, GO 유전자의 적절한 영역을 처리된 마우스 및 대조군 마우스의 간으로부터 추출된 게놈 DNA로부터 PCR 증폭시킬 수 있다. 생성된 PCR 산물을 차세대 시퀀싱을 사용하여 시퀀싱하여 서열 변화의 빈도를 결정할 수 있다.
실시예 10. - 새로운 데아미나제의 유전자 발견
다양한 환경(토양, 퇴적물, 지하수, 호열성, 인간 및 비인간 마이크로바이옴)로부터의 4Tbp(테라 염기쌍)의 독점적 및 공개 조립된 메타게놈 시퀀싱 데이터를 마이닝하여 신규 탈아민 분해 효소를 발견하였다. 알려진 데아미나제의 HMM 프로필을 구축하고 HMMER3(hmmer.org)를 사용하여 예측된 모든 단백질에 대해 검색하여 본 발명자들의 데이터베이스로부터 데아미나제를 식별하였다. 예측된 및 참조(예를 들어, 진핵생물 APOBEC1, 박테리아 TadA) 데아미나제를 MAFFT를 사용하여 정렬하고, FastTree2를 사용하여 계통발생수(phylogenetic tree)를 추론하였다. 신규 패밀리 및 서브패밀리는 본원에 개시된 서열로 구성된 클레이드(clade)를 식별함으로써 정의하였다. 효소 기능을 나타내는 중요한 촉매 잔기의 존재에 기초하여 후보를 선택하였다(예를 들어, 서열번호 1-51, 385-386, 387-443, 444-447, 또는 488-475 참조).
실시예 11. - 플라스미드 작제
유전자의 DNA 단편은 Twist Bioscience 또는 Integrated DNA Technologies(IDT)에서 합성되었다. 플라스미드 DNA를 Endura 전기천공적격 세포(Lucigen)에서 증폭시키고 QIAprep Spin Miniprep Kit(Qiagen)에 의해 단리하였다. 플라스미드의 제한 효소 분해에 의해 벡터 백본을 제조하였다. 삽입체를 Elim BIOPHARM 또는 IDT에서 주문한 프라이머를 사용하여 Q5 고충실도 DNA 폴리머라제(New England Biolabs)에 의해 증폭시켰다. 벡터 백본과 삽입체 둘 모두를 Gel DNA 회수 키트(Zymo Research)를 사용하여 겔 추출에 의해 정제하였다. 하나 또는 다수의 DNA 단편을 NEBuilder HiFi DNA 조립(New England Biolabs)(서열번호 483-487)을 통해 벡터로 조립하였다.
실시예 12. - 시퀀싱에 의한 이. 콜라이에서의 염기 편집 효율의 평가
실시예 4에서와 같이 제조된 5 ng의 추출된 DNA를 주형으로서 사용하고, 프라이머(P137 및 P360)를 PCR 증폭을 위해 사용하고, 생성된 산물을 ELIM BIOPHARM에서 생어 시퀀싱을 위해 제출하였다. 시퀀싱을 위해 사용된 프라이머는 표 6 및 7(서열번호 523-531)에 나타낸다.
표 6 - 이. 콜라이에서 lacZ 유전자의 염기 편집 분석에 사용된 프라이머
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
표 7 - 이. 콜라이에서 우라실 글리코실라제 억제제(UGI)의 효과의 염기 편집 분석을 위해 사용된 프라이머
Figure pct00014
도 8은 생어 시퀀싱에 의해 평가된, 본 실험에 의해 조사된 효소에 의한 예시적인 염기 편집을 도시한다.
도 10은 표 3에 따른 TadA(ABE8.17m)(서열번호 596) 및 MG 닉카제를 사용한 아데닌 염기 편집기(ABE)의 염기 편집 효율을 도시한다. TadA는 tRNA 아데닌 데아미나제이고; TadA(ABE8.17m)는 이. 콜라이 TadA의 조작된 변이체이다. TadA(ABE8.17m)와 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 각 위치에서 Edit R에 의해 정량화된 A에서 G로의 전환의 백분율을 나타낸다. ABE8.17m은 실험의 양성 대조군으로서 사용하였다.
도 11은 래트 APOBEC1, MG 닉카제 및 바실러스 서브틸리스 박테리오파지(UGI(PBS1))의 우라실 글리코실라제 억제제를 포함하는 시토신 염기 편집기(CBE)의 염기 편집 효율을 도시한다. APOBEC1은 시토신 데아미나제이다. N-말단에서 rAPOBEC1와 융합되고 C-말단에서 UGI와 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 Edit R에 의해 정량화된 C에서 T로의 전환의 백분율을 나타낸다. BE3는 실험에서 양성 대조군으로서 사용하였다.
도 12는 CBE의 염기 편집 활성에 미치는 MG 우라실 글리코실라제 억제제(UGI)의 효과를 도시한다. (a) MGC15-1은 N-말단 APOBEC1, MG15-1 닉카제 및 C-말단 UGI로 구성된다. 3가지 MG UGI를 이. 콜라이에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. (b) BE3은 N-말단 rAPOBEC1, SpCas9 닉카제 및 C-말단 UGI를 포함한다. 2가지 MG UGI를 HEK293T 세포에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. 편집 효율은 Edit R에 의해 정량화하였다.
실시예 13. - 세포 배양, 형질감염, 차세대 시퀀싱 및 염기 편집 분석
HEK293T 세포를 성장시키고 37℃, 5% CO2에서 10%(v/v) 소 태아 혈청(Gibco)이 보충된 둘베코 변형 이글 배지와 GlutaMAX(Gibco)에서 계대하였다. 5 x 104개의 세포를 세포 부착을 위해 처리된 96웰 세포 배양 플레이트(Costar)에 시딩하고, 20 내지 24시간 동안 성장시키고, 소비된 배지를 형질감염 직전에 새로운 배지로 재생하였다. 200 ng 발현 플라스미드 및 1 μL 리포펙타민 2000(ThermoFisher Scientific)을 제조업체의 지침에 따라 웰당 형질감염을 위해 사용하였다. 형질감염된 세포를 3일 동안 성장시키고, 수거하고, 제조업체의 지침에 따라 QuickExtract(Lucigen)를 이용하여 gDNA를 추출하였다. 염기 편집을 위한 표적화 영역을 표 8 및 9(서열번호 538-585)에 열거된 프라이머와 함께 Q5 고충실도 DNA 폴리머라제(New England Biolabs)를 사용하여 증폭시키고 주형으로서 DNA를 추출하였다.
표 8 - HEK293T에서 UGI 효과의 염기 편집 분석을 위해 사용된 프라이머
Figure pct00015
표 9a - A0A2K5RND7-MG 닉카제-MG69-1로 형질감염된 HEK293T 세포에서 표적화된 영역을 증폭시키기 위해 사용된 프라이머
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
제조업체의 지침에 따라 HighPrep PCR Clean-up System(MAGBIO)을 사용하여 PCR 산물을 정제하였다. 후보 효소의 염기 편집에 미치는 우라실 글리코실라제 억제제(UGI)의 효과는 생어 시퀀싱을 위해 PCR 산물을 Elim BIOPHARM에 제출하여 분석하였고, 효율은 Edit R로 정량화하였다. A0A2K5RND7-MG 닉카제-MG69-1의 염기 편집을 분석하기 위해, 차세대 시퀀싱(NGS)을 위해 사용된 어댑터를 KAPA HiFi HotStart ReadyMix PCR 키트(Roche) 및 TruSeq DNA 라이브러리 준비 키트(illumina)와 호환되는 프라이머를 사용한 후속 PCR 반응에 의해 PCR 산물에 추가하였다. 생성된 산물의 DNA 농도를 TapeStation(Agilent)으로 정량화하고, 샘플을 함께 풀링하여 NGS 분석을 위한 라이브러리를 제조하였다. 생성된 라이브러리를 Aria 실시간 PCR 시스템(Agilent)을 사용하여 qPCR에 의해 정량화하고, 제조업체의 지침에 따라 Illumina Miseq 기기를 사용하여 고처리량 시퀀싱을 수행하였다. 시퀀싱 데이터를 Cripresso2에 의해 염기 편집에 대해 분석하였다.
도 13은 CMP/dCMP-타입 데아미나제 도메인 함유 단백질(uniprot 수탁번호 A0A2K5RDN7), MG 닉카제 및 MG UGI를 포함하는 시토신 염기 편집기의 염기 편집 효율을 보여주는 염기 편집기가 표적화하는 부위의 지도를 도시한다. 작제물은 N-말단 A0A2K5RDN7, MG 닉카제 및 C-말단 MG69-1을 포함한다. 단순화를 위해, 도면에는 MG 닉카제의 정체만이 도시된다. BE3(APOBEC1)은 염기 편집에 대한 양성 대조군으로서 사용하였다. 음성 대조군으로는 공 벡터를 사용하였다. 상이한 날에 3회의 독립적인 실험을 수행하였다. 약어: R, 반복; NEG, 음성 대조군.
표 9b: 실시예 13의 작제물에 사용된 단백질 도메인
Figure pct00020
실시예 14. - 이. 콜라이에서 염기 편집기 돌연변이의 양성 선택
도 14는 이. 콜라이에서의 TadA 특성규명을 위한 양성 선택 방법을 도시한다. 패널 (a)는 TadA 선택에 사용된 한 가지 플라스미드 시스템의 지도를 도시한다. 벡터는 CAT(H193Y), CAT를 표적화는 sgRNA 발현 카세트 및 ABE 발현 카세트를 포함한다. 본 도면에는, 이. 콜라이로부터의 N-말단 TadA 및 스트렙토코커스 피오게네스로부터의 C-말단 SpCas9(D10A)가 도시되어 있다. 패널 (b)는 이. 콜라이 세포 내로 도입/형질전환될 때 CAT(H193Y)의 주형 가닥의 A2 위치가 편집되어 H193Y 돌연변이를 야생형으로 되돌리고 이의 활성을 복원시킴을 입증하는 시퀀싱 추적을 도시한다. 약어: CAT, 클로람페니콜 아세틸트랜스퍼라제.
농도가 10 ng/μL인 플라스미드 용액 1μL를 25μL BL21(DE3) 전기천공적격 세포(Lucigen)로 형질전환시키고, 37℃에서 1시간 동안 975μL 발현 회수 배지로 회수하였다. 50 μL의 생성된 세포를 100 ㎍/mL 카르베니실린, 0.1 mM IPTG 및 적당량의 클로람페니콜을 함유하는 LB 한천 플레이트에 도말하였다. 콜로니를 채취할 수 있을 때까지 플레이트를 37℃에서 인큐베이션하였다. 콜로니 PCR을 사용하여 염기 편집을 함유하는 게놈 영역을 증폭시키고, 생성된 산물을 생어 시퀀싱을 위해 ELIM BIOPHARM에 제출하였다. PCR 및 시퀀싱을 위해 사용된 프라이머는 표 10에 나열되어 있다(서열번호 532-537).
표 10 - CAT(H193Y)의 염기 편집 분석을 위해 사용된 프라이머
Figure pct00021
도 15는 TadA에 의해 유발된 돌연변이가 클로람페니콜(Cm)의 높은 내용성을 가능하게 함을 도시한다. 패널 (a)는 이. 콜라이의 항생제 내성을 선택하기 위해 상이한 농도의 클로람페니콜이 사용된 성장 플레이트의 사진을 도시한다. 이 예에서, 이. 콜라이(EcTadA)로부터의 TadA의 야생형 및 변이체 2가지를 테스트하였다. 패널 (b)는 돌연변이된 TadA를 보유하는 ABE가 야생형보다 더 높은 편집 효율을 나타낸다는 것을 입증하는 결과 요약 표를 도시한다. 이들 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다. 단순화를 위해, 표에는 데아미나제의 정체만이 도시되어 있지만, 효과기(SpCas9) 및 작제물 구성은 상기 도면에 도시되어 있다.
도 16은 양성 선택에서 MG TadA 활성의 조사를 도시한다. 패널 (a)는 8개의 MG68 TadA 후보를 0 내지 2 ㎍/mL의 클로람페니콜에 대해 테스트한 실험으로부터의 성장 플레이트의 사진(ABE는 N-말단 TadA 변이체 및 C-말단 SpCas9(D10A) 닉카제를 포함함)을 도시한다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 패널 (b)는 MG TadA 후보의 편집 효율을 나타내는 요약 표를 도시한다. 패널 (b)는 MG68-3 및 MG68-4가 아데닌의 염기 편집을 구동하였음을 입증한다. 이 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 17은 MG68-4 상의 D109N 돌연변이를 통한 MG68-4_nSpCas9의 염기 편집 효율의 개선을 보여준다. 패널 (a)는 야생형 MG68-4 및 이의 변이체가 0 내지 4㎍mL의 클로람페니콜에 대해 테스트된 성장 플레이트의 사진을 도시한다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 이 실험에서 아데닌 염기 편집기는 N-말단 TadA 변이체와 C-말단 SpCas9(D10A) 닉카제를 포함한다. 패널 (b)는 MG TadA 후보의 편집 효율을 나타내는 요약 표를 도시한다. 패널 (b)는 MG68-4 및 MG68-4(D109N)가 아데닌의 염기 편집을 나타내고 D109N 돌연변이가 증가된 활성을 나타냄을 입증한다. 이 실험에서 콜로니는 0.5 ㎍mL Cm 이상인 플레이트로부터 채취하였다.
도 18은 MG68-4(D109N)_nMG34-1의 염기 편집을 도시한다. 패널 (a)는 N-말단 MG68-4(D109N) 및 C-말단 SpCas9(D10A) 닉카제를 포함하는 ABE가 0 내지 2 ㎍/mL의 클로람페니콜에 대해 테스트된 실험의 성장 플레이트의 사진을 도시한다. 패널 (b)는 sgRNA의 존재 및 부재 하의 편집 효율을 나타내는 요약 표를 도시한다. 이 실험에서, 콜로니는 1 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 19는 MG68-4-nMG34-1 염기 편집 활성의 개선을 위해 설계된 28가지의 MG68-4 변이체를 도시한다. 효소의 편집을 개선하기 위한 표적화 돌연변이유발을 위해 12개 잔기를 선택하였다.
본 개시내용의 바람직한 실시양태가 본원에 도시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명은 명세서 내에 제공된 특정 실시예에 의해 제한되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 설명되었지만, 본원의 실시양태의 설명 및 예시는 제한적인 의미로 해석되는 것을 의미하지 않는다. 수많은 변경, 변화 및 치환이 본 개시내용에서 벗어나지 않고 당업자에게 일어날 것이다. 또한, 본 발명의 모든 양상은 다양한 조건 및 변수에 의존하는 본원에 제시된 특정 묘사, 구성 또는 상대적 비율에 제한되지 않는 것으로 이해되어야 한다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실행하는데 사용될 수 있는 것으로 이해되어야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변경, 변화 또는 등가물도 포함하는 것으로 고려된다. 하기 청구범위는 본 발명의 범위를 정의하고, 이러한 청구범위 내의 방법 및 구조 및 이의 등가물이 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING <110> METAGENOMI IP TECHNOLOGIES, LLC <120> BASE EDITING ENZYMES <130> 55921-715.601 <140> <141> <150> 63/222,351 <151> 2021-07-15 <150> 63/077,057 <151> 2020-09-11 <160> 593 <170> PatentIn version 3.5 <210> 1 <211> 186 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-2 deaminase <400> 1 Met Ala Arg Val Leu Gly Leu Asp Pro Gly Phe Ala Thr Cys Gly Tyr 1 5 10 15 Ala Leu Val Asp Leu Thr Arg Lys Asp Gly Ala Pro Phe Val Asp Val 20 25 30 Arg Ser Leu Gly Thr Leu Arg Thr Ala Lys Ala Asp Lys Lys Arg Lys 35 40 45 Val Leu Ala Ala Asp Asp Asn Leu Arg Arg Ala Gln Glu Leu Ile Arg 50 55 60 Ala Leu Tyr Pro Leu Ala Ser Asn Ala Gln Ala Ile Val Ala Glu Ser 65 70 75 80 Met Ser Phe Pro Arg Asn Ser Ala Ala Ala Ala Lys Met Ala Met Cys 85 90 95 Trp Gly Ile Val Ala Thr Leu Ala Glu Met Asn Asp Leu Pro Ile Val 100 105 110 Gln Ala Thr Pro Lys Glu Ile Lys Ile Ala Val Ala Gly Val Gly Thr 115 120 125 Ala Thr Lys Glu Asp Val Ala Ala Ala Val Cys Ala Lys Cys Gly Arg 130 135 140 Gln Phe Ser Glu Glu Leu Leu Ala Gln Gly Leu Pro Lys Gly Met His 145 150 155 160 Glu His Ala Tyr Asp Ala Val Ala Ser Val Leu Ala Cys Leu Asn Ser 165 170 175 Asp Val Leu Arg Ala Ile Arg Arg Ala Gly 180 185 <210> 2 <211> 164 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-3 deaminase <400> 2 Met Asp Arg Leu Ser Leu His Gln Tyr Ala Ile Ala Leu Ala Trp Val 1 5 10 15 Ala Ala Thr Arg Ser Glu Asp Pro Tyr Thr Arg Val Gly Cys Val Ala 20 25 30 Leu Ser Glu Gln Gly Asn Val Leu Ala Thr Ala Tyr Asn Gly Leu Lys 35 40 45 Pro Lys Ala Thr Phe Gly Pro Glu Phe Trp Asn Asn Arg Glu Ser Arg 50 55 60 Leu Pro Phe Met Val His Ala Glu Met Asn Leu Val Ser Leu Thr Lys 65 70 75 80 Arg Asn Glu Val His Thr Val Ala Ile Asn Ile Leu Pro Cys Pro Thr 85 90 95 Cys Ala Ala Phe Leu Ala Thr His Gly Val Gln Gln Val Val Tyr Ser 100 105 110 Glu Val Tyr His Arg Asp Lys Gly Thr Val Gly Leu Thr Val Leu Arg 115 120 125 Glu Tyr Gly Val Glu Ile His His Leu Pro Tyr Tyr Arg Val Arg Pro 130 135 140 Val Phe Leu Asp Met Asp Glu Ala His Arg Lys Val Arg Ser Glu Gln 145 150 155 160 Arg Thr Ala Ala <210> 3 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-4 deaminase <400> 3 Met Arg Glu Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 His Val Val Ser Ser Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Thr Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His His Gly Glu Glu 130 135 <210> 4 <211> 160 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-5 deaminase <400> 4 Met Ser Asn Thr Gln Ser Leu His Thr Thr Phe Met His Ile Leu Phe 1 5 10 15 Glu Phe Ser Lys Leu Ser His Cys Val Ser Lys Gln Val Ala Ala Met 20 25 30 Ala Val Lys Asp Gly Arg Ile Ile Ser Thr Gly Ile Asn Gly Thr Ala 35 40 45 Pro Gly Tyr Thr Asn Cys Asp Asp Ile Phe Asn Lys Ser Asp Phe Asn 50 55 60 Arg Glu Leu His His Gln Phe Ser Asn Thr Tyr Glu Ile His Ala Glu 65 70 75 80 Met Asn Met Ile Leu Tyr Ala Ala Lys Asn Gly Ile Ser Leu Asp Gly 85 90 95 Ala Thr Leu Tyr Cys Ser Met Leu Pro Cys Trp Asn Cys Ile Lys His 100 105 110 Ile Ser Val Thr Gly Ile Lys His Ile Ile Tyr Ala Lys Arg Tyr Asp 115 120 125 Met Leu Ser Leu Glu Asp Glu Lys Asn Ile Tyr Tyr Tyr Cys Lys Lys 130 135 140 Leu Gly Ile Thr Ile Gln Gln Phe Asp Pro Asp Thr Leu Gly Ser Phe 145 150 155 160 <210> 5 <211> 124 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-6 deaminase <400> 5 Met Thr Ser Gly Ile Leu Lys Leu Ala Leu Glu Glu Ala Glu Ser Ser 1 5 10 15 Thr Tyr Arg Phe Arg Val Gly Ala Val Val Phe Lys Gly Ser Arg Ile 20 25 30 Leu Ala Ser Gly His Asn Gly Ile Arg Ser Ser Arg Ile His Pro Leu 35 40 45 His Lys Asn Tyr Asn Asn Ala Leu His Ala Glu Gln Asp Ala Ile Leu 50 55 60 Asn Val Lys Asp Trp Ser Thr Leu Lys Gly Cys Ser Ile Leu Val Val 65 70 75 80 Lys Val Ser Lys Thr Lys Gly Thr Ile Ser Met Ala Lys Pro Cys Pro 85 90 95 Met Cys Gln Gln Leu Leu Arg His Val Gly Ile Lys Thr Met Tyr Phe 100 105 110 Ser Asn Glu Asn Gly Glu Ile Ile Ser Glu Lys Leu 115 120 <210> 6 <211> 132 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-7 deaminase <400> 6 Met Thr Lys Arg Glu Ile Ala Tyr Phe Asn Ala Ala Lys Ala Val Ser 1 5 10 15 Ser Leu Ser Asp His Lys Tyr Lys Met Gly Cys Val Ile Val Asn Lys 20 25 30 His Arg Ile Ile Ser Ser Gly Phe Asn Ser Glu Thr Lys Cys His Arg 35 40 45 Ile Gln Ala Glu Leu Asp Met Asn Glu Tyr Lys Met His Ser Ser Gly 50 55 60 Lys Val His Ala Glu Thr Ser Ala Leu Leu Ser Leu Arg His Ile Asp 65 70 75 80 Leu Ser Lys Ala Ser Ile Phe Ile Tyr Arg Glu Leu Lys Asp Gly Thr 85 90 95 Lys Ala Leu Ala Arg Pro Cys Pro Cys Cys Gln Lys Leu Ile Arg Lys 100 105 110 Ala Gly Ile Lys His Val Tyr Tyr Thr Gly Asn Asn Ser Leu Ile Tyr 115 120 125 Glu Glu Phe Ile 130 <210> 7 <211> 142 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-8 deaminase <400> 7 Ala Ala Gly Asp Phe Val Gln Val Arg Glu Tyr Ile Lys Ala Ala Arg 1 5 10 15 Asp Glu Ala Ala Lys Ser Arg Cys Asp Arg Ala His Val Gly Cys Val 20 25 30 Ile Val Asp Arg Val Thr Gly Arg Val Val Ser Arg Ala Phe Asn Glu 35 40 45 Thr Pro His Gly Leu Glu Pro Cys Asp Thr Gly Gly His Arg Met Ile 50 55 60 Asp Gly His Cys Val Asn Thr Val His Ala Glu Arg Asn Ala Ile Arg 65 70 75 80 Lys Met Lys Glu His Glu Ser Glu Tyr Thr Leu Tyr Val Thr His Tyr 85 90 95 Pro Cys Gln Gly Cys Ala His Leu Ile Ala Ser Cys Pro Glu Ile Val 100 105 110 Glu Val Val Tyr Leu Gly Asp Tyr Arg Asn Ser Lys Glu Ala Thr Ala 115 120 125 Leu Leu Met Gly Leu Ser Lys Gly Val His Arg Gly Glu Glu 130 135 140 <210> 8 <211> 82 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-9 deaminase <400> 8 His Arg Ile Val Asp Asn His Cys Val Asn Thr Val His Ala Glu Arg 1 5 10 15 Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser Glu Tyr Thr Leu Tyr 20 25 30 Val Thr His Tyr Pro Cys Gln Gly Cys Ala His Leu Ile Ser Ser Cys 35 40 45 Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp Tyr Arg Asn Ser Ser 50 55 60 Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys Gly Val His Arg Gly 65 70 75 80 Glu Glu <210> 9 <211> 115 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-10 deaminase <400> 9 His Val Gly Cys Val Ile Val Asp His Ala Thr Gly Gln Val Val Ser 1 5 10 15 Ser Ala Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro Cys Asp Thr Gly 20 25 30 Gly His Arg Ile Val Asp Asp His Cys Val Asn Thr Val His Ala Glu 35 40 45 Arg Gly Ala Ile Arg Lys Met Ala Glu His Gly Ser Glu Tyr Thr Leu 50 55 60 Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His Leu Ile Ser Ser 65 70 75 80 Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp Tyr Asn Asn Ser 85 90 95 Ser Glu Ala Thr Asp Leu Leu Met Ser Leu Ser Lys Gly Val His Arg 100 105 110 Ala Glu Glu 115 <210> 10 <211> 186 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-11 deaminase <400> 10 Met Ala Arg Val Leu Gly Leu Asp Pro Gly Phe Ala Thr Cys Gly Tyr 1 5 10 15 Ala Leu Val Asp Leu Thr Arg Lys Asp Gly Ala Pro Phe Val Asp Val 20 25 30 Arg Ser Leu Gly Thr Leu Arg Thr Ala Lys Ala Asp Lys Lys Arg Lys 35 40 45 Val Leu Ala Ala Asp Asp Asn Leu Arg Arg Ala Gln Glu Leu Ile Arg 50 55 60 Ala Leu Tyr Pro Leu Ala Ser Asn Ala Gln Ala Ile Val Ala Glu Ser 65 70 75 80 Met Ser Phe Pro Arg Asn Ser Ala Ala Ala Ala Lys Met Ala Met Cys 85 90 95 Trp Gly Ile Val Ala Thr Leu Ala Glu Met Asn Asp Leu Pro Ile Val 100 105 110 Gln Ala Thr Pro Lys Glu Ile Lys Ile Ala Val Ala Gly Val Gly Thr 115 120 125 Ala Thr Lys Glu Asp Val Ala Ala Ala Val Cys Ala Lys Cys Gly Arg 130 135 140 Gln Phe Ser Glu Glu Leu Leu Ala Gln Gly Leu Pro Lys Gly Met His 145 150 155 160 Glu His Ala Tyr Asp Ala Val Ala Ser Val Leu Ala Cys Leu Asn Ser 165 170 175 Asp Val Leu Arg Ala Ile Arg Arg Ala Gly 180 185 <210> 11 <211> 232 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-12 deaminase <400> 11 Met Asp Asn Leu Pro Lys Tyr Glu Tyr Leu Asn Val Leu Asp Pro Glu 1 5 10 15 Arg Thr Gly Ile Ser Glu Thr Trp Leu Ser Tyr Phe Met Asn Ile Ala 20 25 30 Arg Val Ile Ala Thr Lys Ser Lys Asp Pro Ser Thr Lys Val Gly Ala 35 40 45 Val Ala Val Asp Thr Asn Thr Lys Arg Ile Leu Ala Thr Gly Tyr Asn 50 55 60 Gly Phe Pro Ala Gly Val Lys Glu Arg Pro Glu Arg Trp Glu Arg Pro 65 70 75 80 Val Lys Tyr Ser Tyr Ile Val His Ser Glu Ala Asn Ile Val Ala Ser 85 90 95 Ala Ala Arg Phe Gly Ile Asn Leu Thr Gly Ser Thr Leu Phe Val Thr 100 105 110 Leu His Pro Cys Val Asp Cys Ala Lys Ile Val Ala Ser Ala Gly Phe 115 120 125 Lys Asn Val Ile Tyr Ile Asp Thr Glu Ile Lys Ala Gln Val Gly Arg 130 135 140 Glu Trp Ile Thr Leu Leu Gln His Ser Lys Asn Ile Phe Glu Glu Ser 145 150 155 160 Arg Ile Gly Leu Tyr Ala Cys Arg Glu Val Pro Ala Lys Lys Lys Glu 165 170 175 Glu Pro Lys Leu Tyr Lys Thr Tyr Lys Gly Thr Val Glu Thr Thr Thr 180 185 190 Glu Leu Asn Asn Lys Arg Asp Lys Gln Leu Gly Asp Leu Val Phe Val 195 200 205 Lys Ser Arg Asn Thr Leu Tyr Glu Trp Asn Gly Val Ile Trp Thr Val 210 215 220 Ile Gly Glu Tyr Gln His Leu Leu 225 230 <210> 12 <211> 113 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-13 deaminase <400> 12 Met Asp Asn Leu Pro Lys Tyr Glu Tyr Leu Asn Val Leu Asp Pro Glu 1 5 10 15 Arg Thr Arg Ile Ser Glu Thr Trp Leu Ser Tyr Phe Met Asn Ile Ala 20 25 30 Arg Val Ile Ala Thr Lys Ser Lys Asp Pro Ser Thr Lys Val Gly Ala 35 40 45 Val Ala Val Asp Thr Asn Thr Lys Arg Ile Leu Ala Thr Gly Tyr Asn 50 55 60 Gly Phe Pro Ala Gly Val Lys Glu Arg Pro Glu Arg Trp Glu Arg Pro 65 70 75 80 Val Lys Tyr Ser Tyr Ile Val His Ser Glu Ala Asn Ile Val Ala Ser 85 90 95 Ala Ala Arg Phe Gly Ile Asn Leu Thr Gly Ser Thr Leu Phe Val Thr 100 105 110 Leu <210> 13 <211> 232 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-14 deaminase <400> 13 Met Asp Asn Leu Pro Lys Tyr Glu Tyr Leu Asn Val Leu Asp Pro Glu 1 5 10 15 Arg Thr Arg Ile Ser Glu Thr Trp Leu Ser Tyr Phe Met Asn Ile Ala 20 25 30 Arg Val Ile Ala Thr Lys Ser Lys Asp Pro Ser Thr Lys Val Gly Ala 35 40 45 Val Ala Val Asp Thr Asn Thr Lys Arg Ile Leu Ala Thr Gly Tyr Asn 50 55 60 Gly Phe Pro Ala Gly Val Lys Glu Arg Pro Glu Arg Trp Glu Arg Pro 65 70 75 80 Val Lys Tyr Ser Tyr Ile Val His Ser Glu Ala Asn Ile Val Ala Ser 85 90 95 Ala Ala Arg Phe Gly Ile Asn Leu Thr Gly Ser Thr Leu Phe Val Thr 100 105 110 Leu His Pro Cys Val Asp Cys Ala Lys Ile Val Ala Ser Ala Gly Phe 115 120 125 Lys Asn Val Ile Tyr Ile Asp Thr Glu Ile Lys Pro Gln Val Gly Arg 130 135 140 Glu Trp Ile Thr Leu Leu Gln His Ser Lys Asn Ile Phe Glu Glu Ser 145 150 155 160 Arg Ile Gly Leu Tyr Ala Cys Arg Glu Val Pro Ala Lys Lys Lys Glu 165 170 175 Glu Pro Lys Leu Tyr Lys Thr Phe Lys Gly Thr Val Glu Thr Thr Val 180 185 190 Glu Leu Asn Asn Lys Arg Asp Lys Gln Leu Gly Asp Leu Val Phe Val 195 200 205 Lys Ser Arg Asn Thr Leu Tyr Glu Trp Asn Gly Val Ile Trp Thr Val 210 215 220 Ile Gly Glu Tyr Gln His Leu Leu 225 230 <210> 14 <211> 164 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-15 deaminase <400> 14 Met Asp Arg Leu Ser Leu His Gln Tyr Ala Ile Ala Leu Ala Trp Val 1 5 10 15 Ala Ala Thr Arg Ser Glu Asp Pro Tyr Thr Arg Val Gly Cys Val Ala 20 25 30 Leu Ser Glu Gln Gly Asn Val Leu Ala Thr Ala Tyr Asn Gly Leu Lys 35 40 45 Pro Lys Ala Thr Phe Gly Pro Glu Phe Trp Asn Asn Arg Glu Ser Arg 50 55 60 Leu Pro Phe Met Val His Ala Glu Met Asn Leu Val Ser Leu Thr Lys 65 70 75 80 Arg Asn Glu Val His Thr Val Ala Ile Asn Ile Leu Pro Cys Pro Thr 85 90 95 Cys Ala Ala Phe Leu Ala Thr His Gly Val Gln Gln Val Val Tyr Ser 100 105 110 Glu Val Tyr His Arg Asp Lys Gly Thr Val Gly Leu Thr Val Leu Arg 115 120 125 Glu Tyr Gly Val Glu Ile His His Leu Pro Tyr Tyr Arg Val Arg Pro 130 135 140 Val Phe Leu Asp Met Asp Glu Ala His Arg Lys Val Arg Ser Glu Gln 145 150 155 160 Arg Thr Ala Ala <210> 15 <211> 50 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-18 deaminase <400> 15 Met Lys Gln Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp 50 <210> 16 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-19 deaminase <400> 16 Met Lys Gln Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 17 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-20 deaminase <400> 17 Met Lys Gln Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Gln Met Lys Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Ile Glu Val Val Tyr Ile Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 18 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-21 deaminase <400> 18 Met Asn Ile Ala Arg Val Ile Ala Thr Lys Ser Lys Asp Pro Ser Thr 1 5 10 15 Lys Val Gly Ala Val Ala Val Asp Thr Asn Thr Lys Arg Ile Leu Ala 20 25 30 Thr Gly Tyr Asn Gly Phe Pro Ala Gly Val Lys Glu Arg Pro Glu Arg 35 40 45 Trp Glu Arg Pro Val Lys Tyr Ser Tyr Ile Val His Ser Glu Ala Asn 50 55 60 Ile Val Ala Ser Ala Ala Arg Phe Gly Ile Asn Leu Thr Gly Ser Thr 65 70 75 80 Leu Phe Val Thr Leu His Pro Cys Val Asp Cys Ala Lys Ile Val Ala 85 90 95 Ser Ala Gly Phe Lys Asn Val Ile Tyr Ile Asp Thr Glu Ile Lys Pro 100 105 110 Gln Val Gly Arg Glu Trp Ile Thr Leu Leu Gln His Ser Lys Asn Ile 115 120 125 Phe Glu Glu Ser Arg Ile Gly Leu Tyr Ala Cys Arg Glu Val Pro Ala 130 135 140 Lys Lys Lys Glu Glu Pro Lys Leu Tyr Lys Thr Phe Lys Gly Thr Val 145 150 155 160 Glu Thr Thr Val Glu Leu Asn Asn Lys Arg Asp Lys Gln Leu Gly Asp 165 170 175 Leu Ile Phe Val Arg Ser Arg Asn Thr Leu Tyr Glu Trp Asn Gly Val 180 185 190 Ile Trp Thr Val Ile Gly Glu Tyr Gln His Leu Leu 195 200 <210> 19 <211> 142 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-22 deaminase <400> 19 Met Arg Glu Phe Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Gln Ser His Asp Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Asp Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Asn Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Val His His Ala Glu Glu Asp Cys Ser Ser Ser Pro Ala 130 135 140 <210> 20 <211> 142 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-23 deaminase <400> 20 Met Arg Glu Phe Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Gln Ser His Asp Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Asn Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Val His His Ala Glu Glu Asp Cys Ser Ser Ser Pro Ala 130 135 140 <210> 21 <211> 142 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-24 deaminase <400> 21 Met Arg Glu Phe Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Gln Thr His Asp Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Asn Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Val His His Ala Glu Glu Asp Cys Ser Ser Ser Pro Ala 130 135 140 <210> 22 <211> 142 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-25 deaminase <400> 22 Met Arg Glu Phe Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Thr Ser His Asp Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Asn Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Val His His Ala Glu Glu Asp Cys Ser Ser Ser Pro Ala 130 135 140 <210> 23 <211> 136 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-26 deaminase <400> 23 Met Arg Glu Leu Gly Ile Lys Ala Ala Arg Asp Glu Ala Lys Lys Ser 1 5 10 15 Arg Cys Asp Arg Ala His Val Gly Cys Val Ile Ile Asp Arg Ala Ser 20 25 30 Gly Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro Pro Thr Leu Glu 35 40 45 Pro Cys Asp Thr Gly Gly His Arg Met Val Asp Gly His Cys Val Asn 50 55 60 Thr Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Ala Glu His Gly 65 70 75 80 Ser Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala 85 90 95 His Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly 100 105 110 Asp Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Met Ser Leu Ser 115 120 125 Lys Gly Val His Arg Val Lys Gly 130 135 <210> 24 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-27 deaminase <400> 24 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp His Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His 85 90 95 Leu Ile Ser Thr Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Glu Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 25 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-28 deaminase <400> 25 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Glu 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro Asn Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asp His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Arg Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 26 <211> 36 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-29 deaminase <400> 26 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser 35 <210> 27 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-30 deaminase <400> 27 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Gly Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 28 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-31 deaminase <400> 28 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 29 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-32 deaminase <400> 29 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Thr Asp His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 30 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-33 deaminase <400> 30 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Val Asp Asp His Cys Val Asn Thr 50 55 60 Ile His Ala Glu Arg Asn Ala Ile Arg Gln Met Lys Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His 85 90 95 Phe Ile Ser Thr Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 31 <211> 40 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-34 deaminase <400> 31 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Ser Ala Phe Asn 35 40 <210> 32 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-35 deaminase <400> 32 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Ser Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Gln Met Thr Asp His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 33 <211> 142 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-36 deaminase <400> 33 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Pro Ser His Asp Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Asp Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Glu Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Ile His Cys Ala Glu Glu Asp Arg Ser Ser Ser Pro Ala 130 135 140 <210> 34 <211> 142 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-37 deaminase <400> 34 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Pro Ser His Asp Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Asp Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Glu Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Val His Cys Ala Glu Glu Asp Arg Ser Ser Ser Pro Ala 130 135 140 <210> 35 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-38 deaminase <400> 35 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Ser Gly 20 25 30 Gln Val Val Ser Ser Ala Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Val Asp Asp His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Gly Ala Ile Leu Lys Met Ala Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Thr Leu Leu Met Ser Leu Ser Lys 115 120 125 Gly Val His His Val Glu Gly 130 135 <210> 36 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-39 deaminase <400> 36 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Lys Gly Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His His Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Ser Ala Ile Arg Lys Met Thr Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His 85 90 95 Leu Ile Thr Ser Cys Pro Glu Ile Met Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Glu Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Val His His Val Glu Gly 130 135 <210> 37 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-40 deaminase <400> 37 Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asp His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Arg Met Val Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 38 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-41 deaminase <400> 38 Met Arg Glu Tyr Ile Gln Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Ser Gly 20 25 30 Gln Val Val Ser Ser Ala Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Val Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Ala Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Met Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Thr Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Val His His Val Glu Glu 130 135 <210> 39 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-42 deaminase <400> 39 Met Arg Glu Tyr Ile Gln Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Arg Val Val Ser Ser Ala Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Val Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Ala Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Gly His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Val His His Val Glu Glu 130 135 <210> 40 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-43 deaminase <400> 40 Met Arg Glu Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ser Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Ile His Ala Glu Arg Asn Ala Ile Arg Lys Met Pro Thr His Asp Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 41 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-44 deaminase <400> 41 Met Arg Glu Tyr Ile Arg Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly 20 25 30 Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Thr Glu His Gly Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Glu Gly Leu Ser Lys 115 120 125 Gly Val His Arg Gly Glu Glu 130 135 <210> 42 <211> 135 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-45 deaminase <400> 42 Met Arg Glu Tyr Ile Arg Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg 1 5 10 15 Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Ser 20 25 30 Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Asp Pro 35 40 45 Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr 50 55 60 Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Pro Ser His Asp Ser 65 70 75 80 Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His 85 90 95 Leu Ile Ala Ser Cys Pro Asp Ile Val Glu Val Val Tyr Leu Gly Asp 100 105 110 Tyr Arg Asn Ser Lys Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys 115 120 125 Gly Ile His His Ala Glu Glu 130 135 <210> 43 <211> 151 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-46 deaminase <400> 43 Met Arg Val Arg Pro Asp Trp Asp Thr Tyr Phe Met Arg Ile Ala Lys 1 5 10 15 Val Val Ala Gln Arg Ser His Asp Glu Asp Thr Gln Val Gly Cys Val 20 25 30 Ile Val Ser Pro Asp Lys Arg Ile Leu Ser Thr Gly Tyr Asn Gly Phe 35 40 45 Pro Pro Gly Phe Pro Asp Gly Lys Leu Pro Arg Thr Arg Pro Gly Lys 50 55 60 Tyr Pro Tyr Ile Val His Ser Glu Ile Asn Ala Ile Val Ser Ala Leu 65 70 75 80 Asn Arg Asp Leu Arg Gly Ala Thr Leu Tyr Cys Arg Phe Thr Pro Cys 85 90 95 Lys Asp Cys Val Lys Ala Ile Ile Thr Ala Gly Ile Thr Arg Ile Val 100 105 110 Tyr Glu Glu Thr Tyr Ala Arg Asp Asn Thr Asp Ala Ala Val Val Phe 115 120 125 Glu Met Leu Glu Met Gly Gly Val Glu Ile Val Lys His Leu Glu His 130 135 140 Glu His Glu Ala Asp Ser Asp 145 150 <210> 44 <211> 159 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-47 deaminase <400> 44 Met Ser Asn Thr Gln Ser Leu His Thr Thr Phe Met His Ile Leu Phe 1 5 10 15 Glu Phe Ser Lys Leu Ser His Cys Val Ser Lys Gln Val Ala Ala Met 20 25 30 Ala Val Lys Asp Gly Arg Ile Ile Ser Thr Gly Ile Asn Gly Thr Ala 35 40 45 Pro Gly Tyr Thr Asn Cys Asp Asp Ile Phe Asn Lys Ser Asp Phe Asp 50 55 60 Arg Glu Leu His His Gln Phe Ser Asn Thr Tyr Glu Ile His Ala Glu 65 70 75 80 Met Asn Met Ile Leu Tyr Ala Ala Lys Asn Gly Ile Ser Leu Asp Gly 85 90 95 Ala Thr Leu Tyr Cys Ser Met Leu Pro Cys Trp Asn Cys Ile Lys His 100 105 110 Ile Ser Val Thr Gly Ile Lys His Ile Ile Tyr Ala Lys Arg Tyr Asp 115 120 125 Met Leu Ser Leu Glu Asp Glu Lys Asn Ile Tyr Tyr Tyr Cys Lys Lys 130 135 140 Leu Gly Ile Thr Ile Gln Gln Phe Asp Pro Asp Thr Leu Gly Ser 145 150 155 <210> 45 <211> 160 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-48 deaminase <400> 45 Met Ser Asn Thr Gln Ser Leu His Thr Thr Phe Met His Ile Leu Phe 1 5 10 15 Glu Phe Ser Lys Leu Ser His Cys Val Ser Lys Gln Val Ala Ala Met 20 25 30 Ala Val Lys Asp Gly Arg Ile Ile Ser Thr Gly Ile Asn Gly Thr Ala 35 40 45 Pro Gly Tyr Thr Asn Cys Asp Asp Ile Phe Asn Lys Ser Asp Phe Asp 50 55 60 Arg Glu Leu His His Gln Phe Ser Asn Thr Tyr Glu Ile His Ala Glu 65 70 75 80 Met Asn Met Ile Leu Tyr Ala Ala Lys Asn Gly Ile Ser Leu Asp Gly 85 90 95 Ala Thr Leu Tyr Cys Ser Met Leu Pro Cys Trp Asn Cys Ile Lys His 100 105 110 Ile Ser Val Thr Gly Ile Lys His Ile Ile Tyr Ala Lys Arg Tyr Asp 115 120 125 Met Leu Ser Leu Glu Asp Glu Lys Asn Ile Tyr Tyr Tyr Cys Lys Lys 130 135 140 Leu Gly Ile Thr Ile Gln Gln Phe Asp Pro Asp Thr Leu Gly Ser Phe 145 150 155 160 <210> 46 <211> 124 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-49 deaminase <400> 46 Met Thr Ser Gly Ile Leu Lys Leu Ala Leu Glu Glu Ala Glu Ser Ser 1 5 10 15 Thr Tyr Arg Phe Arg Val Gly Ala Val Val Phe Lys Gly Ser Arg Ile 20 25 30 Leu Ala Ser Gly His Asn Gly Ile Arg Ser Ser Arg Ile His Pro Leu 35 40 45 His Lys Asn Tyr Asn Asn Ala Leu His Ala Glu Gln Asp Ala Ile Leu 50 55 60 Asn Val Lys Asp Trp Ser Thr Leu Lys Gly Cys Ser Ile Leu Val Val 65 70 75 80 Lys Val Ser Lys Thr Lys Gly Thr Ile Ser Met Ala Lys Pro Cys Pro 85 90 95 Met Cys Gln Gln Leu Leu Arg His Val Gly Ile Lys Thr Met Tyr Phe 100 105 110 Ser Asn Glu Asn Gly Glu Ile Ile Ser Glu Lys Leu 115 120 <210> 47 <211> 80 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG66 putative cytidine deaminase <220> <223> Description: MG66-50 deaminase <400> 47 Met Val Asp Gly His Cys Val Asn Thr Val His Ala Glu Arg Gly Ala 1 5 10 15 Ile Arg Lys Met Thr Glu His Gly Ser Glu Tyr Thr Leu Tyr Val Thr 20 25 30 His Tyr Pro Cys Arg Gly Cys Ala His Leu Ile Ser Ser Cys Pro Glu 35 40 45 Ile Val Glu Val Val Tyr Leu Gly Asp Tyr Asn Asn Ser Ser Glu Ala 50 55 60 Thr Ala Leu Leu Met Gly Leu Ser Lys Gly Val His His Val Glu Gly 65 70 75 80 <210> 48 <211> 150 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG67 putative cytidine deaminase <220> <223> Description: MG67-2 deaminase <400> 48 Met Thr Ala Cys Lys Asp Lys Pro Val Cys Asn Val Ala Gln Ala Asp 1 5 10 15 Ala Thr Leu Leu Ser Thr Cys Leu Arg Leu Leu Gln Thr Ala His Glu 20 25 30 Ile Lys Gln Asn Ala Tyr Ala Pro Tyr Ser Gly Phe Gln Val Gly Ala 35 40 45 Ala Val Leu Ala Lys Asn Gly Ser Ile Ile Thr Gly Val Asn Val Glu 50 55 60 Asn Gly Ser Leu Gly Leu Thr Ile Cys Ala Glu Arg Thr Ala Leu Ser 65 70 75 80 Lys Ala Val Ser Glu Gly Tyr Arg Pro Gly Asp Phe Val Ala Ile Ala 85 90 95 Val Ala Ala Ser Ala Asp Gly Phe Ser Pro Cys Gly Ala Cys Arg Glu 100 105 110 Val Ile Asn Glu Phe Gly Gln Asn Met Leu Val Val Phe Glu Tyr Gln 115 120 125 Asp Glu Val Val Val Ala Pro Leu Lys Thr Leu Leu Ala Tyr Asn Phe 130 135 140 Val Lys Gly Lys Pro Ser 145 150 <210> 49 <211> 62 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG67 putative cytdidine deaminase <220> <223> Description: MG67-4 deaminase <400> 49 Met Ala Tyr Arg Pro Gly Asp Phe Val Ala Ile Ala Ile Ala Ala Ser 1 5 10 15 Ser Pro Asp Phe Ser Pro Cys Gly Ala Cys Arg Glu Val Ile Asn Glu 20 25 30 Phe Gly Asp Asp Met Ala Val Ile Phe Glu Ile Lys Gly Glu Thr Val 35 40 45 Val Ser Gln Leu Lys Glu His Leu Pro Tyr Asn Phe Lys Met 50 55 60 <210> 50 <211> 250 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-1 deaminase <400> 50 Met Gln His Val Lys His Met Arg Thr Ala Val Arg Leu Ala Arg Tyr 1 5 10 15 Ala Leu Asp His Asp Glu Thr Pro Val Ala Cys Ile Phe Val His Thr 20 25 30 Pro Thr Gly Gln Val Met Ala Tyr Gly Met Asn Asp Thr Asn Lys Ser 35 40 45 Leu Thr Gly Val Ala His Ala Glu Phe Met Gly Ile Asp Gln Ile Lys 50 55 60 Ala Met Leu Gly Ser Arg Gly Val Val Asp Val Phe Lys Asp Ile Thr 65 70 75 80 Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Lys 85 90 95 Gln Leu Gly Ile Gly Lys Val Val Phe Gly Cys Gly Asn Glu Arg Phe 100 105 110 Gly Gly Asn Gly Thr Val Leu Ser Val Asn His Asp Thr Cys Thr Leu 115 120 125 Val Pro Lys Asn Asn Ser Ala Ala Gly Tyr Glu Ser Ile Pro Gly Ile 130 135 140 Leu Arg Lys Glu Ala Ile Met Leu Leu Arg Tyr Phe Tyr Val Arg Gln 145 150 155 160 Asn Glu Arg Ala Pro Lys Pro Arg Ser Lys Ser Asp Arg Val Leu Asp 165 170 175 Lys Asn Thr Phe Pro Pro Met Glu Trp Ser Lys Tyr Leu Asn Glu Glu 180 185 190 Ala Phe Ile Glu Thr Phe Gly Asp Asp Tyr Lys Thr Cys Phe Ala Asn 195 200 205 Lys Val Asp Leu Ser Ser Asn Ser Val Asp Trp Asp Leu Ile Asp Ser 210 215 220 His Gln Asp Asn Ile Ile Gln Glu Leu Glu Glu Gln Cys Lys Met Phe 225 230 235 240 Arg Phe Asn Val His Lys Lys Ser Lys Val 245 250 <210> 51 <211> 239 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-2 deaminase <400> 51 Met Leu Leu Asn Lys Arg Ser Tyr Gly His Phe Tyr Phe Ile Ala Leu 1 5 10 15 Met Thr Glu Phe Ser Lys Trp Asp Glu Tyr Tyr Met Lys Leu Ala Leu 20 25 30 Met Glu Ala Glu Lys Ala Leu Asn Ser Asn Glu Val Pro Ile Gly Cys 35 40 45 Val Phe Val Lys Ser Asp Thr Glu Val Glu Ile Pro Pro Leu Pro Ser 50 55 60 Arg Tyr Ser Lys Asp Glu Phe His Ser Ser Val Ile Ala Ser Gly Arg 65 70 75 80 Asn Phe Thr Asn Glu Asn Tyr Asn Ala Thr His His Ala Glu Ile Met 85 90 95 Ala Leu Thr Asp Leu Ile Ser Cys Leu Glu Cys Asn Cys Lys Lys Ile 100 105 110 Asp Asn Met Gly Glu Pro Cys Lys Pro Thr Phe Ser Lys Asp Thr Glu 115 120 125 Cys Pro Gln Cys Asn Phe Asn Leu Lys Asn Val Thr Leu Tyr Val Thr 130 135 140 Ile Glu Pro Cys Ile Met Cys Ile Ser Ala Leu Met Glu Leu Gln Val 145 150 155 160 Ser Arg Ile Val Phe Gly Ala Asn Asn Asp Lys Phe Gly Gly Cys Gly 165 170 175 Gly Thr Leu Thr Asn Val Pro Glu Ile Leu Lys Asp Thr Cys Ser Lys 180 185 190 Asp Phe Glu Glu Ile Lys Ile Glu Arg Gly Leu Tyr Arg Glu Glu Ala 195 200 205 Val Ile Leu Leu Arg Lys Phe Tyr Leu Ile Gln Asn Pro Lys Ala Pro 210 215 220 Asn Pro Lys Lys Lys Ala Lys Arg Thr Leu Asn Leu Ile Val Asp 225 230 235 <210> 52 <211> 87 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG69 UGI <220> <223> Description: MG69-1 deaminase <400> 52 Met Ser Lys Thr Ile Lys Asp Leu Glu Glu Phe Ala Ala Glu Lys Leu 1 5 10 15 Gly Tyr Asp Ile Val Phe Gln Glu Ser Ile Ser Met Glu Pro Gln Glu 20 25 30 Val Glu His Leu Ile Thr Thr Asp Glu Lys Ser Val Leu Val Asn Ser 35 40 45 Thr Tyr Asp Asp Asn Lys Glu Ile Thr Ile Ser Met Ile Ser Thr Pro 50 55 60 His Pro Glu Tyr Arg Pro Ile Ala Leu Ile Ile Gln Asp Met Glu Gly 65 70 75 80 Glu Val Gln Arg Lys Glu Leu 85 <210> 53 <211> 88 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG69 UGI <220> <223> Description: MG69-2 deaminase <400> 53 Met Ser Lys Thr Ile Lys Asp Leu Glu Glu Phe Ala Ala Glu Lys Leu 1 5 10 15 Gly Tyr Asp Ile Val Phe Gln Glu Ser Ile Ser Met Glu Pro Gln Glu 20 25 30 Val Glu His Leu Ile Thr Thr Asp Glu Lys Ser Val Leu Val Asn Ser 35 40 45 Thr Tyr Asp Asp Asp Lys Glu Ile Thr Ile Ser Val Ile Ser Thr Pro 50 55 60 His Pro Glu Tyr Arg Pro Ile Ala Leu Val Ile Gln Asp Met Glu Gly 65 70 75 80 Glu Val Gln Arg Lys Glu Leu Tyr 85 <210> 54 <211> 84 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG69 UGI <220> <223> Description: MG69-3 deaminase <400> 54 Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu 1 5 10 15 Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val 20 25 30 Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp 35 40 45 Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu 50 55 60 Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys 65 70 75 80 Ile Lys Met Leu <210> 55 <211> 67 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG69 UGI <220> <223> Description: MG69-4 deaminase <400> 55 Met Ile Val Arg Val Thr Tyr Asn Val Glu Gln Glu Val Glu Ile Ser 1 5 10 15 Asn Lys Phe Asn Lys Asp Val Asp Ile Met Lys Pro Glu Glu Tyr Asp 20 25 30 Asp Tyr Ile Asp Asp Leu Met Phe Ala Leu Asn Glu Lys Leu Pro Glu 35 40 45 Tyr Ala Glu Ile Ser Cys Val Ile Asn Asp Asn Thr Gly Glu Val Leu 50 55 60 Phe Glu Gly 65 <210> 56 <211> 35 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG69 UGI <220> <223> Description: MG69-5 deaminase <400> 56 Met Ser Lys Thr Ile Lys Asp Leu Glu Glu Phe Ala Ala Glu Lys Leu 1 5 10 15 Gly Tyr Asp Ile Val Phe Gln Glu Ser Ile Ser Met Glu Pro Gln Glu 20 25 30 Val Glu His 35 <210> 57 <211> 167 <212> PRT <213> Escherichia coli <220> <223> Category: reference deaminase <220> <223> Description: P68398 TADA tRNA specific adenosine deaminase <400> 57 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp 165 <210> 58 <211> 229 <212> PRT <213> Rattus norvegicus <220> <223> Category: reference deaminase <220> <223> Description: P38483 APOBEC 1 C U editing deaminase <400> 58 Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg 1 5 10 15 Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu 20 25 30 Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His 35 40 45 Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val 50 55 60 Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr 65 70 75 80 Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys 85 90 95 Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu 100 105 110 Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg 115 120 125 Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met 130 135 140 Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser 145 150 155 160 Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg 165 170 175 Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys 180 185 190 Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile 195 200 205 Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp 210 215 220 Ala Thr Gly Leu Lys 225 <210> 59 <211> 251 <212> PRT <213> Heterocephalus glaber <220> <223> Category: reference deaminase <220> <223> Description: Aicda XM 004869540 cytidine deaminase <400> 59 Met Ala Val Gly Ser Lys Pro Lys Ala Ala Leu Val Gly Pro His Trp 1 5 10 15 Glu Arg Glu Arg Ile Trp Cys Phe Leu Cys Ser Thr Gly Leu Gly Thr 20 25 30 Gln Gln Thr Gly Gln Thr Ser Arg Trp Leu Arg Pro Ala Ala Thr Gln 35 40 45 Asp Pro Val Ser Pro Pro Arg Ser Leu Leu Met Lys Gln Arg Lys Phe 50 55 60 Leu Tyr His Phe Lys Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr 65 70 75 80 Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser 85 90 95 Leu Asp Phe Gly Tyr Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu 100 105 110 Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys 115 120 125 Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala 130 135 140 Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg 145 150 155 160 Ile Phe Thr Ala Arg Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro 165 170 175 Glu Gly Leu Arg Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile Met 180 185 190 Thr Phe Lys Asp Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His 195 200 205 Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg 210 215 220 Leu Ser Arg Gln Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp 225 230 235 240 Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu 245 250 <210> 60 <211> 224 <212> PRT <213> Petromyzon marinus <220> <223> Category: reference deaminase <220> <223> Description: PmCDA1 L1 AVN88313.1 cytidine deaminase <400> 60 Met Ala Gly Tyr Glu Cys Val Arg Val Ser Glu Lys Leu Asp Phe Asp 1 5 10 15 Thr Phe Glu Phe Gln Phe Glu Asn Leu His Tyr Ala Thr Glu Arg His 20 25 30 Arg Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Ala Gly Gly Arg 35 40 45 Ser Arg Arg Leu Trp Gly Tyr Ile Ile Asn Asn Pro Asn Val Cys His 50 55 60 Ala Glu Leu Ile Leu Met Ser Met Ile Asp Arg His Leu Glu Ser Asn 65 70 75 80 Pro Gly Val Tyr Ala Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Ala 85 90 95 Asn Cys Ser Ser Lys Leu Asn Pro Trp Leu Lys Asn Leu Leu Glu Glu 100 105 110 Gln Gly His Thr Leu Thr Met His Phe Ser Arg Ile Tyr Asp Arg Asp 115 120 125 Arg Glu Gly Asp His Arg Gly Leu Arg Gly Leu Lys His Val Ser Asn 130 135 140 Ser Phe Arg Met Gly Val Val Gly Arg Ala Glu Val Lys Glu Cys Leu 145 150 155 160 Ala Glu Tyr Val Glu Ala Ser Arg Arg Thr Leu Thr Trp Leu Asp Thr 165 170 175 Thr Glu Ser Met Ala Ala Lys Met Arg Arg Lys Leu Phe Cys Ile Leu 180 185 190 Val Arg Cys Ala Gly Met Arg Glu Ser Gly Ile Pro Leu His Leu Phe 195 200 205 Thr Leu Gln Thr Pro Leu Leu Ser Gly Arg Val Val Trp Trp Arg Val 210 215 220 <210> 61 <211> 208 <212> PRT <213> Petromyzon marinus <220> <223> Category: reference deaminase <220> <223> Description: PmCDA1 ABO15149.1 cytosine deaminase <400> 61 Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr 1 5 10 15 Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg 20 25 30 Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys 35 40 45 Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly 50 55 60 Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg 65 70 75 80 Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro 85 90 95 Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu 100 105 110 Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr 115 120 125 Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn 130 135 140 Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg 145 150 155 160 Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp 165 170 175 Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser 180 185 190 Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val 195 200 205 <210> 62 <211> 199 <212> PRT <213> Homo sapiens <220> <223> Category: reference deaminase <220> <223> Description: NP 663745.1 DNA dC- dU-editing deaminase APOBEC-3A isoform a <400> 62 Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His 1 5 10 15 Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr 20 25 30 Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met 35 40 45 Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys 50 55 60 Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro 65 70 75 80 Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile 85 90 95 Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala 100 105 110 Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg 115 120 125 Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg 130 135 140 Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His 145 150 155 160 Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp 165 170 175 Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala 180 185 190 Ile Leu Gln Asn Gln Gly Asn 195 <210> 63 <211> 198 <212> PRT <213> Homo sapiens <220> <223> Category: reference deaminase <220> <223> Description: Q9GZX7.1 AICDA Single-stranded DNA cytosine deaminase (Activation-induced cytidine deaminase, Cytidine aminohydrolase) <400> 63 Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys 1 5 10 15 Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val 20 25 30 Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr 35 40 45 Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr 50 55 60 Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp 65 70 75 80 Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp 85 90 95 Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg 100 105 110 Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg 115 120 125 Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr 130 135 140 Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys 145 150 155 160 Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu 165 170 175 Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala 180 185 190 Phe Arg Thr Leu Gly Leu 195 <210> 64 <211> 197 <212> PRT <213> Lampetra planeri <220> <223> Category: reference deaminase <220> <223> Description: LpCDA1L1 3 AVN88320.1 cytidine deaminase <400> 64 Met Ala Gly Asp Glu Asn Val Arg Val Ser Glu Lys Leu His Phe Asn 1 5 10 15 Thr Phe Glu Phe Glu Phe Glu Asn Leu His Tyr Ala Glu Gly Arg Gly 20 25 30 Gln Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Glu Gly Gly Arg 35 40 45 Gly Glu Arg Leu Trp Gly Tyr Val Arg Asn Lys Pro Leu Gly Asp His 50 55 60 Ala Glu Val Ile Leu Met Ser Lys Ile Asn Asp His Leu Glu Thr His 65 70 75 80 Gln Asp Asn Tyr Thr Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Gly 85 90 95 Lys Cys Ser Ser Glu Leu Val Pro Trp Leu Gln Asn Leu Leu Lys Lys 100 105 110 Gln His Lys Leu Thr Met His Phe Ser Arg Ile Tyr Asp Lys Asp Arg 115 120 125 Ala Val Asp His Arg Gly Leu Cys Asp Leu Gln His Val Val Ser Asn 130 135 140 Gly Phe Gln Met Gly Val Met Gly Gln Thr Glu Val Asp Thr Cys Leu 145 150 155 160 Ala Glu Tyr Val Glu Ala Ser Gly Cys Pro Pro Leu Lys Trp Leu His 165 170 175 Met Thr Asp Ser Asn Ala Thr Gln Met Gln Asp Lys Leu Ser Ser Ile 180 185 190 Leu Met Asn Arg Phe 195 <210> 65 <211> 198 <212> PRT <213> Lampetra planeri <220> <223> Category: reference deaminase <220> <223> Description: LpCDA1L1 1 AVN88319.1 cytidine deaminase <400> 65 Met Ala Gly Asp Glu Asn Val Arg Val Ser Lys Lys Leu Asp Phe Asn 1 5 10 15 Thr Phe Glu Phe Glu Phe Glu Asn Leu His Tyr Ala Glu Gly Arg Gly 20 25 30 Arg Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Glu Gly Gly Arg 35 40 45 Gly Glu Arg Leu Trp Gly Tyr Val Arg Asn Asn Pro Leu Asp Asp His 50 55 60 Ala Glu Val Ile Leu Met Ser Lys Ile Asn Asp His Leu Glu Thr His 65 70 75 80 Gln Gly Asn Tyr Thr Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Gly 85 90 95 Asn Cys Ser Ser Glu Leu Val Pro Trp Leu Gln Asn Leu Leu Glu Glu 100 105 110 Gln Gln His Thr Leu Thr Met Tyr Phe Ser Arg Ile Tyr Asp Lys Asp 115 120 125 Arg Ala Val Asp His Arg Gly Leu Cys Asp Leu Gln His Val Val Ser 130 135 140 Asn Gly Phe Gln Met Gly Val Met Gly Gln Thr Glu Val Asp Thr Cys 145 150 155 160 Leu Ala Glu Tyr Val Glu Ala Ser Gly Cys Pro Pro Leu Lys Trp Leu 165 170 175 His Met Thr Asp Ser Asn Ala Thr Gln Thr Gln Asp Lys Leu Ser Ser 180 185 190 Ile Leu Met Asn Arg Phe 195 <210> 66 <211> 642 <212> DNA <213> Lampetra planeri <220> <223> Category: reference deaminase <220> <223> Description: ljCDA1 cytidine deaminase <400> 66 gccaacgccg agtacgtgcg cgtgggcgag aagctggaca gctgcacctt ccgcacccag 60 ttcctgaact accgccgcag ccgcagccgc cgctgctgcg tgatcttcga gctgaagcgc 120 cagaacagcc gcgtgcgctt ctggggctac gccatgaaca agccctggag caacgccgac 180 gtgggcatcc acgccgagtt cttctgcatc aagaaggtga agaagtacct gcgcaagaac 240 cccggcatct acaccatcaa ctggtacagc agctggagcc cctgcgccaa ctgcgccgag 300 aagatcctga actggtacaa caagaagctg atgggcaagg gccacaccct gaagatttgg 360 gcctgcaagc tgtacttcga gaacatcaag cgcaaccaga tcggcctgtg gaacctgcgc 420 aacaacggcg tgggcctggc catcatgctg ggcgagcact accagtggtg ctggaacaac 480 tacatccaga ccctgggccg caacctgaac gagaacaagt ggctgaaaaa gaccagcaac 540 cgcgcccgca cccgccgcag cgagctgagc atcatgatcc acgtgaagcg cctgcacacc 600 gcccgcctgc tgctgttcaa gcgcctgtgc ggctggttca gc 642 <210> 67 <211> 84 <212> PRT <213> Unknown <220> <223> Description of Unknown: Bacillus phage PBS2 sequence <220> <223> Category: reference UGI <220> <223> Description: P14739 UNGI BPPB2 (UGI) <400> 67 Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu 1 5 10 15 Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val 20 25 30 Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp 35 40 45 Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu 50 55 60 Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys 65 70 75 80 Ile Lys Met Leu <210> 68 <211> 1245 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: adenine base editor <220> <223> Description: linker-His tag-adenine deaminse-linker-nickase -linker-SV40 NLS <400> 68 Met Gly Ser Ser His His His His His His Ser Glu Val Glu Phe Ser 1 5 10 15 His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg 20 25 30 Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg 35 40 45 Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr 50 55 60 Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln 65 70 75 80 Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Ser Thr Phe Glu Pro Cys 85 90 95 Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val 100 105 110 Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp 115 120 125 Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly 130 135 140 Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met 145 150 155 160 Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp 165 170 175 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 180 185 190 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 195 200 205 Met Lys Lys Lys Val Phe Ala Phe Ala Leu Gly Lys Ala Ser Ile Gly 210 215 220 Tyr Cys Val Arg Asp Gly Phe Asn Ile Asn Glu Ala Asn Ser Ile Ile 225 230 235 240 Ile Asp Lys Asp His Ala Glu Thr Met Ser Leu Arg Asp Arg Arg Arg 245 250 255 Ile Lys Lys Thr Leu Asp Ala His His Ala Arg Glu Glu Tyr Phe Asn 260 265 270 Lys Val Trp Ser Gly Val Gly Leu Asn Ile Leu Asp Lys Asn Asn Asn 275 280 285 Asn Phe Lys Lys Glu Phe Pro Ser Lys Asn Glu Asp Val Ile Tyr Thr 290 295 300 Ser Cys Leu Leu Arg Ile Ala Leu Leu Gln Asn Gln Lys Leu Glu Glu 305 310 315 320 Trp Gln Ile Tyr Lys Ala Leu Tyr Asn Ala Phe Gln Arg Arg Gly Tyr 325 330 335 Asp Val Asn Ile Ala Trp Lys Ser Val Gln Thr Asp Asp Asp Lys Glu 340 345 350 Asn Ile Glu Arg Met Lys Lys Tyr Thr Cys Glu Asn Asp Ile Glu Leu 355 360 365 Ile Ile Ser Asp Glu Tyr Lys Tyr Pro Cys Tyr Tyr Asp Ala Leu Arg 370 375 380 Leu Gly Leu Trp Asn Glu Asp Glu Pro Thr Lys Leu Asn Arg Ser Ile 385 390 395 400 Pro Gln His Asn Ser Asn Lys Val Arg Thr Thr Glu Tyr Val Ala Pro 405 410 415 Arg Glu Leu Val Glu Lys Glu Leu Lys Gln Leu Trp Leu Asn Ala Gln 420 425 430 Leu Gln Leu Pro Gln Leu Asn Ser Ile Ser Ala Glu Glu Phe Leu Tyr 435 440 445 Gly Glu Tyr Lys Ile Pro Tyr Gly Ser Cys Val Gln Lys Glu Phe Lys 450 455 460 Gln Tyr Arg Gly Thr Lys Lys Asp Trp Gln Gly Val Leu Cys Gln Lys 465 470 475 480 Ile Pro Arg Phe Asp Asn Arg Ile Ile Ala Lys Cys Lys Leu Leu Pro 485 490 495 Lys Arg Asn Val Cys Lys Ala Asn Thr Ile Glu Asn Val Ser Phe Val 500 505 510 Leu Leu Met Lys Leu Lys Asn Leu Arg Phe Thr Val Ile Ser Gly Glu 515 520 525 Lys Leu Arg Leu Ser Pro Val Gln Ile Lys Gln Ile Tyr Glu Asn Trp 530 535 540 Leu Glu Lys Val Glu Asp Thr Tyr Asn Lys Asp Leu Glu Lys Ala Glu 545 550 555 560 Lys Leu Gly Lys Glu Asn Pro Glu Lys Arg Leu Asn Ile Thr Ile Thr 565 570 575 Arg Gln Glu Ile Glu Lys Ile Ile Gly Glu Lys Ile Ile Asp Lys Ile 580 585 590 Glu Pro Met Lys Ala Asp Ile Ser Gly Arg Ser Ser Phe Cys Arg Arg 595 600 605 Ala Cys Gln Ile Met Asn Lys Ile Ile Leu Asp Gly Glu Leu Tyr Pro 610 615 620 Gln Asn Val Asp Ile Ser Glu Phe Val Asp Arg Asp Asn Ala Lys Asn 625 630 635 640 Gly Ile Thr Glu Glu Glu Ile Gln Ser Met Leu Ser Lys Ile Gly Asp 645 650 655 Trp Asn Asn Leu Tyr Ile Pro Asp Asn Arg Glu Glu Asn Ala Gln Asn 660 665 670 Ala Ser Asn Ser Arg Ile Lys Thr Asp Ile Met Leu Gly Asn Ile Thr 675 680 685 Asn Pro Ile Val Arg Asn Arg Leu Gln Ile Phe Arg Asp Leu Leu Leu 690 695 700 Asn Leu Ala Glu Lys Tyr Gly Thr Pro Asp Glu Val Ile Phe Glu Phe 705 710 715 720 Val Arg Asp Gly Ala Asp Asn Ser Leu Tyr Gly Ser Lys Lys Ala Gln 725 730 735 Asp Thr Glu Arg Phe Met Lys Gln Gln Glu Lys Glu Asn Glu Gln Ile 740 745 750 Ile Asn Glu Leu Lys Asp Ala Gly Leu Tyr Val Asn Gly Gln Asn His 755 760 765 Ala Asn Ala Thr Tyr Phe Leu Met His Lys Leu Leu Lys Ser Gln Gly 770 775 780 Gly Lys Cys Ile Tyr Ser Gly Gln Asn Ile Ser Pro Ser Asn Tyr Asp 785 790 795 800 Glu Cys Glu Ile Asp His Ile Tyr Pro Arg Thr Leu Gly Gly Asn Asp 805 810 815 Ala Leu Tyr Asn Lys Val Val Cys Tyr Arg Arg Glu Asn Gln Asp Lys 820 825 830 Lys Gly Arg Thr Pro Tyr Glu Trp Leu Ser Pro Asp Ser Asp Lys Trp 835 840 845 Ala Asn Tyr Val Asn Arg Leu Asn Lys Ile Lys Lys Gln Leu Gly Lys 850 855 860 Lys Lys Phe Glu Leu Leu Thr Ser Lys Pro Glu Asp Cys Glu Lys Leu 865 870 875 880 Ile Glu Ser Tyr Asn Gly Leu Ala Glu Thr Ser His Ile Ala Arg Val 885 890 895 Ala Gln Gln Met Thr Ala Phe Ile Phe Gly Trp Gly Leu Gln Ile Gln 900 905 910 Gly Glu Ser Arg Arg Ile Phe Val Asn Asn Gly Ser Ser Thr Cys Ala 915 920 925 Ile Arg Lys Arg Tyr Gly Leu Asn Lys Leu Leu Gly Asp Asn Leu Lys 930 935 940 Lys Asn Arg Ser Asn Asp Lys His His Ala Leu Asp Ala Ile Cys Ile 945 950 955 960 Ser Phe Ser Arg Asp Phe Lys Tyr Asp Lys Glu Ile Lys Lys Asp Ile 965 970 975 Ile Lys Gly Phe Asn Pro Glu Ile Val Lys Asn Ala Ile Asp Lys Ile 980 985 990 Met Pro Tyr Pro Tyr Ala Asn Asp Lys Pro Phe Lys Gly Asn Thr Lys 995 1000 1005 Pro Leu Glu Thr Ile Tyr Gly Leu Arg Thr Tyr Gly Asp Lys Ser 1010 1015 1020 Tyr Ile Thr Gln Arg Val Glu Leu Asn Ser Ile Asp Lys Lys Ala 1025 1030 1035 Thr Lys Ile Lys Ser Ile Ile Asp Glu Thr Ile Lys Asn Asp Leu 1040 1045 1050 Leu Asn Lys Leu Lys Glu Asn Pro Thr Glu Gln Glu Trp Lys Leu 1055 1060 1065 Met Leu Gln Asn Tyr Ile His Pro Lys Lys Gln Thr Lys Val Lys 1070 1075 1080 Lys Val Met Ile Ser Val Ser Glu Gly Glu Ile Thr Lys Asp Ser 1085 1090 1095 Asn Asn Arg Glu Arg Met Gly Glu Phe Val Asp Phe Gly Thr Lys 1100 1105 1110 Gly Thr Gln His Gln Phe Lys His Ser Lys Arg His Lys Gly Gln 1115 1120 1125 Ile Leu Tyr Phe Asn Glu Lys Gly Val Val Glu Val Met Pro Val 1130 1135 1140 Tyr Ser Asn Ile Lys Thr Thr Asp Val Lys Asp Lys Leu Gln Asn 1145 1150 1155 Met Gly Cys Lys Leu Tyr Asn Lys Gly Gln Met Phe Tyr Ser Gly 1160 1165 1170 Cys Leu Val Asp Ile Pro Lys Pro Phe Lys Ala Gly Ser Lys Glu 1175 1180 1185 Tyr Pro Ala Gly Arg Tyr Gln Ile Lys Thr Ile Arg Ser Asp Lys 1190 1195 1200 Val Ala Glu Leu Glu Asp Ala Cys Gly Asn Lys Ile Ser Thr Asn 1205 1210 1215 Val Lys Tyr Leu Val Pro Ala Glu Phe Lys Lys Val Glu Ser Lys 1220 1225 1230 Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1235 1240 1245 <210> 69 <211> 1380 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: cytosine base editor <220> <223> Description: linker-His tag-cytidine deaminase-linker-nickase -linker-uracil glycosylase inhibitor-linker-SV40 NLS <400> 69 Met Gly Ser Ser His His His His His His Met Ser Ser Glu Thr Gly 1 5 10 15 Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu 20 25 30 Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu 35 40 45 Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr 50 55 60 Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe 65 70 75 80 Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp 85 90 95 Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu 100 105 110 Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg 115 120 125 Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu 130 135 140 Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly 145 150 155 160 Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His 165 170 175 Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu 180 185 190 Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg 195 200 205 Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His 210 215 220 Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser 225 230 235 240 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ala 245 250 255 Met Lys Lys Lys Val Phe Ala Phe Ala Leu Gly Lys Ala Ser Ile Gly 260 265 270 Tyr Cys Val Arg Asp Gly Phe Asn Ile Asn Glu Ala Asn Ser Ile Ile 275 280 285 Ile Asp Lys Asp His Ala Glu Thr Met Ser Leu Arg Asp Arg Arg Arg 290 295 300 Ile Lys Lys Thr Leu Asp Ala His His Ala Arg Glu Glu Tyr Phe Asn 305 310 315 320 Lys Val Trp Ser Gly Val Gly Leu Asn Ile Leu Asp Lys Asn Asn Asn 325 330 335 Asn Phe Lys Lys Glu Phe Pro Ser Lys Asn Glu Asp Val Ile Tyr Thr 340 345 350 Ser Cys Leu Leu Arg Ile Ala Leu Leu Gln Asn Gln Lys Leu Glu Glu 355 360 365 Trp Gln Ile Tyr Lys Ala Leu Tyr Asn Ala Phe Gln Arg Arg Gly Tyr 370 375 380 Asp Val Asn Ile Ala Trp Lys Ser Val Gln Thr Asp Asp Asp Lys Glu 385 390 395 400 Asn Ile Glu Arg Met Lys Lys Tyr Thr Cys Glu Asn Asp Ile Glu Leu 405 410 415 Ile Ile Ser Asp Glu Tyr Lys Tyr Pro Cys Tyr Tyr Asp Ala Leu Arg 420 425 430 Leu Gly Leu Trp Asn Glu Asp Glu Pro Thr Lys Leu Asn Arg Ser Ile 435 440 445 Pro Gln His Asn Ser Asn Lys Val Arg Thr Thr Glu Tyr Val Ala Pro 450 455 460 Arg Glu Leu Val Glu Lys Glu Leu Lys Gln Leu Trp Leu Asn Ala Gln 465 470 475 480 Leu Gln Leu Pro Gln Leu Asn Ser Ile Ser Ala Glu Glu Phe Leu Tyr 485 490 495 Gly Glu Tyr Lys Ile Pro Tyr Gly Ser Cys Val Gln Lys Glu Phe Lys 500 505 510 Gln Tyr Arg Gly Thr Lys Lys Asp Trp Gln Gly Val Leu Cys Gln Lys 515 520 525 Ile Pro Arg Phe Asp Asn Arg Ile Ile Ala Lys Cys Lys Leu Leu Pro 530 535 540 Lys Arg Asn Val Cys Lys Ala Asn Thr Ile Glu Asn Val Ser Phe Val 545 550 555 560 Leu Leu Met Lys Leu Lys Asn Leu Arg Phe Thr Val Ile Ser Gly Glu 565 570 575 Lys Leu Arg Leu Ser Pro Val Gln Ile Lys Gln Ile Tyr Glu Asn Trp 580 585 590 Leu Glu Lys Val Glu Asp Thr Tyr Asn Lys Asp Leu Glu Lys Ala Glu 595 600 605 Lys Leu Gly Lys Glu Asn Pro Glu Lys Arg Leu Asn Ile Thr Ile Thr 610 615 620 Arg Gln Glu Ile Glu Lys Ile Ile Gly Glu Lys Ile Ile Asp Lys Ile 625 630 635 640 Glu Pro Met Lys Ala Asp Ile Ser Gly Arg Ser Ser Phe Cys Arg Arg 645 650 655 Ala Cys Gln Ile Met Asn Lys Ile Ile Leu Asp Gly Glu Leu Tyr Pro 660 665 670 Gln Asn Val Asp Ile Ser Glu Phe Val Asp Arg Asp Asn Ala Lys Asn 675 680 685 Gly Ile Thr Glu Glu Glu Ile Gln Ser Met Leu Ser Lys Ile Gly Asp 690 695 700 Trp Asn Asn Leu Tyr Ile Pro Asp Asn Arg Glu Glu Asn Ala Gln Asn 705 710 715 720 Ala Ser Asn Ser Arg Ile Lys Thr Asp Ile Met Leu Gly Asn Ile Thr 725 730 735 Asn Pro Ile Val Arg Asn Arg Leu Gln Ile Phe Arg Asp Leu Leu Leu 740 745 750 Asn Leu Ala Glu Lys Tyr Gly Thr Pro Asp Glu Val Ile Phe Glu Phe 755 760 765 Val Arg Asp Gly Ala Asp Asn Ser Leu Tyr Gly Ser Lys Lys Ala Gln 770 775 780 Asp Thr Glu Arg Phe Met Lys Gln Gln Glu Lys Glu Asn Glu Gln Ile 785 790 795 800 Ile Asn Glu Leu Lys Asp Ala Gly Leu Tyr Val Asn Gly Gln Asn His 805 810 815 Ala Asn Ala Thr Tyr Phe Leu Met His Lys Leu Leu Lys Ser Gln Gly 820 825 830 Gly Lys Cys Ile Tyr Ser Gly Gln Asn Ile Ser Pro Ser Asn Tyr Asp 835 840 845 Glu Cys Glu Ile Asp His Ile Tyr Pro Arg Thr Leu Gly Gly Asn Asp 850 855 860 Ala Leu Tyr Asn Lys Val Val Cys Tyr Arg Arg Glu Asn Gln Asp Lys 865 870 875 880 Lys Gly Arg Thr Pro Tyr Glu Trp Leu Ser Pro Asp Ser Asp Lys Trp 885 890 895 Ala Asn Tyr Val Asn Arg Leu Asn Lys Ile Lys Lys Gln Leu Gly Lys 900 905 910 Lys Lys Phe Glu Leu Leu Thr Ser Lys Pro Glu Asp Cys Glu Lys Leu 915 920 925 Ile Glu Ser Tyr Asn Gly Leu Ala Glu Thr Ser His Ile Ala Arg Val 930 935 940 Ala Gln Gln Met Thr Ala Phe Ile Phe Gly Trp Gly Leu Gln Ile Gln 945 950 955 960 Gly Glu Ser Arg Arg Ile Phe Val Asn Asn Gly Ser Ser Thr Cys Ala 965 970 975 Ile Arg Lys Arg Tyr Gly Leu Asn Lys Leu Leu Gly Asp Asn Leu Lys 980 985 990 Lys Asn Arg Ser Asn Asp Lys His His Ala Leu Asp Ala Ile Cys Ile 995 1000 1005 Ser Phe Ser Arg Asp Phe Lys Tyr Asp Lys Glu Ile Lys Lys Asp 1010 1015 1020 Ile Ile Lys Gly Phe Asn Pro Glu Ile Val Lys Asn Ala Ile Asp 1025 1030 1035 Lys Ile Met Pro Tyr Pro Tyr Ala Asn Asp Lys Pro Phe Lys Gly 1040 1045 1050 Asn Thr Lys Pro Leu Glu Thr Ile Tyr Gly Leu Arg Thr Tyr Gly 1055 1060 1065 Asp Lys Ser Tyr Ile Thr Gln Arg Val Glu Leu Asn Ser Ile Asp 1070 1075 1080 Lys Lys Ala Thr Lys Ile Lys Ser Ile Ile Asp Glu Thr Ile Lys 1085 1090 1095 Asn Asp Leu Leu Asn Lys Leu Lys Glu Asn Pro Thr Glu Gln Glu 1100 1105 1110 Trp Lys Leu Met Leu Gln Asn Tyr Ile His Pro Lys Lys Gln Thr 1115 1120 1125 Lys Val Lys Lys Val Met Ile Ser Val Ser Glu Gly Glu Ile Thr 1130 1135 1140 Lys Asp Ser Asn Asn Arg Glu Arg Met Gly Glu Phe Val Asp Phe 1145 1150 1155 Gly Thr Lys Gly Thr Gln His Gln Phe Lys His Ser Lys Arg His 1160 1165 1170 Lys Gly Gln Ile Leu Tyr Phe Asn Glu Lys Gly Val Val Glu Val 1175 1180 1185 Met Pro Val Tyr Ser Asn Ile Lys Thr Thr Asp Val Lys Asp Lys 1190 1195 1200 Leu Gln Asn Met Gly Cys Lys Leu Tyr Asn Lys Gly Gln Met Phe 1205 1210 1215 Tyr Ser Gly Cys Leu Val Asp Ile Pro Lys Pro Phe Lys Ala Gly 1220 1225 1230 Ser Lys Glu Tyr Pro Ala Gly Arg Tyr Gln Ile Lys Thr Ile Arg 1235 1240 1245 Ser Asp Lys Val Ala Glu Leu Glu Asp Ala Cys Gly Asn Lys Ile 1250 1255 1260 Ser Thr Asn Val Lys Tyr Leu Val Pro Ala Glu Phe Lys Lys Val 1265 1270 1275 Glu Ser Lys Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile 1280 1285 1290 Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu 1295 1300 1305 Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu 1310 1315 1320 Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu 1325 1330 1335 Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp 1340 1345 1350 Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met 1355 1360 1365 Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1370 1375 1380 <210> 70 <211> 1025 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG1-4 (D9A) nickase <400> 70 Met Lys Lys Lys Val Phe Ala Phe Ala Leu Gly Lys Ala Ser Ile Gly 1 5 10 15 Tyr Cys Val Arg Asp Gly Phe Asn Ile Asn Glu Ala Asn Ser Ile Ile 20 25 30 Ile Asp Lys Asp His Ala Glu Thr Met Ser Leu Arg Asp Arg Arg Arg 35 40 45 Ile Lys Lys Thr Leu Asp Ala His His Ala Arg Glu Glu Tyr Phe Asn 50 55 60 Lys Val Trp Ser Gly Val Gly Leu Asn Ile Leu Asp Lys Asn Asn Asn 65 70 75 80 Asn Phe Lys Lys Glu Phe Pro Ser Lys Asn Glu Asp Val Ile Tyr Thr 85 90 95 Ser Cys Leu Leu Arg Ile Ala Leu Leu Gln Asn Gln Lys Leu Glu Glu 100 105 110 Trp Gln Ile Tyr Lys Ala Leu Tyr Asn Ala Phe Gln Arg Arg Gly Tyr 115 120 125 Asp Val Asn Ile Ala Trp Lys Ser Val Gln Thr Asp Asp Asp Lys Glu 130 135 140 Asn Ile Glu Arg Met Lys Lys Tyr Thr Cys Glu Asn Asp Ile Glu Leu 145 150 155 160 Ile Ile Ser Asp Glu Tyr Lys Tyr Pro Cys Tyr Tyr Asp Ala Leu Arg 165 170 175 Leu Gly Leu Trp Asn Glu Asp Glu Pro Thr Lys Leu Asn Arg Ser Ile 180 185 190 Pro Gln His Asn Ser Asn Lys Val Arg Thr Thr Glu Tyr Val Ala Pro 195 200 205 Arg Glu Leu Val Glu Lys Glu Leu Lys Gln Leu Trp Leu Asn Ala Gln 210 215 220 Leu Gln Leu Pro Gln Leu Asn Ser Ile Ser Ala Glu Glu Phe Leu Tyr 225 230 235 240 Gly Glu Tyr Lys Ile Pro Tyr Gly Ser Cys Val Gln Lys Glu Phe Lys 245 250 255 Gln Tyr Arg Gly Thr Lys Lys Asp Trp Gln Gly Val Leu Cys Gln Lys 260 265 270 Ile Pro Arg Phe Asp Asn Arg Ile Ile Ala Lys Cys Lys Leu Leu Pro 275 280 285 Lys Arg Asn Val Cys Lys Ala Asn Thr Ile Glu Asn Val Ser Phe Val 290 295 300 Leu Leu Met Lys Leu Lys Asn Leu Arg Phe Thr Val Ile Ser Gly Glu 305 310 315 320 Lys Leu Arg Leu Ser Pro Val Gln Ile Lys Gln Ile Tyr Glu Asn Trp 325 330 335 Leu Glu Lys Val Glu Asp Thr Tyr Asn Lys Asp Leu Glu Lys Ala Glu 340 345 350 Lys Leu Gly Lys Glu Asn Pro Glu Lys Arg Leu Asn Ile Thr Ile Thr 355 360 365 Arg Gln Glu Ile Glu Lys Ile Ile Gly Glu Lys Ile Ile Asp Lys Ile 370 375 380 Glu Pro Met Lys Ala Asp Ile Ser Gly Arg Ser Ser Phe Cys Arg Arg 385 390 395 400 Ala Cys Gln Ile Met Asn Lys Ile Ile Leu Asp Gly Glu Leu Tyr Pro 405 410 415 Gln Asn Val Asp Ile Ser Glu Phe Val Asp Arg Asp Asn Ala Lys Asn 420 425 430 Gly Ile Thr Glu Glu Glu Ile Gln Ser Met Leu Ser Lys Ile Gly Asp 435 440 445 Trp Asn Asn Leu Tyr Ile Pro Asp Asn Arg Glu Glu Asn Ala Gln Asn 450 455 460 Ala Ser Asn Ser Arg Ile Lys Thr Asp Ile Met Leu Gly Asn Ile Thr 465 470 475 480 Asn Pro Ile Val Arg Asn Arg Leu Gln Ile Phe Arg Asp Leu Leu Leu 485 490 495 Asn Leu Ala Glu Lys Tyr Gly Thr Pro Asp Glu Val Ile Phe Glu Phe 500 505 510 Val Arg Asp Gly Ala Asp Asn Ser Leu Tyr Gly Ser Lys Lys Ala Gln 515 520 525 Asp Thr Glu Arg Phe Met Lys Gln Gln Glu Lys Glu Asn Glu Gln Ile 530 535 540 Ile Asn Glu Leu Lys Asp Ala Gly Leu Tyr Val Asn Gly Gln Asn His 545 550 555 560 Ala Asn Ala Thr Tyr Phe Leu Met His Lys Leu Leu Lys Ser Gln Gly 565 570 575 Gly Lys Cys Ile Tyr Ser Gly Gln Asn Ile Ser Pro Ser Asn Tyr Asp 580 585 590 Glu Cys Glu Ile Asp His Ile Tyr Pro Arg Thr Leu Gly Gly Asn Asp 595 600 605 Ala Leu Tyr Asn Lys Val Val Cys Tyr Arg Arg Glu Asn Gln Asp Lys 610 615 620 Lys Gly Arg Thr Pro Tyr Glu Trp Leu Ser Pro Asp Ser Asp Lys Trp 625 630 635 640 Ala Asn Tyr Val Asn Arg Leu Asn Lys Ile Lys Lys Gln Leu Gly Lys 645 650 655 Lys Lys Phe Glu Leu Leu Thr Ser Lys Pro Glu Asp Cys Glu Lys Leu 660 665 670 Ile Glu Ser Tyr Asn Gly Leu Ala Glu Thr Ser His Ile Ala Arg Val 675 680 685 Ala Gln Gln Met Thr Ala Phe Ile Phe Gly Trp Gly Leu Gln Ile Gln 690 695 700 Gly Glu Ser Arg Arg Ile Phe Val Asn Asn Gly Ser Ser Thr Cys Ala 705 710 715 720 Ile Arg Lys Arg Tyr Gly Leu Asn Lys Leu Leu Gly Asp Asn Leu Lys 725 730 735 Lys Asn Arg Ser Asn Asp Lys His His Ala Leu Asp Ala Ile Cys Ile 740 745 750 Ser Phe Ser Arg Asp Phe Lys Tyr Asp Lys Glu Ile Lys Lys Asp Ile 755 760 765 Ile Lys Gly Phe Asn Pro Glu Ile Val Lys Asn Ala Ile Asp Lys Ile 770 775 780 Met Pro Tyr Pro Tyr Ala Asn Asp Lys Pro Phe Lys Gly Asn Thr Lys 785 790 795 800 Pro Leu Glu Thr Ile Tyr Gly Leu Arg Thr Tyr Gly Asp Lys Ser Tyr 805 810 815 Ile Thr Gln Arg Val Glu Leu Asn Ser Ile Asp Lys Lys Ala Thr Lys 820 825 830 Ile Lys Ser Ile Ile Asp Glu Thr Ile Lys Asn Asp Leu Leu Asn Lys 835 840 845 Leu Lys Glu Asn Pro Thr Glu Gln Glu Trp Lys Leu Met Leu Gln Asn 850 855 860 Tyr Ile His Pro Lys Lys Gln Thr Lys Val Lys Lys Val Met Ile Ser 865 870 875 880 Val Ser Glu Gly Glu Ile Thr Lys Asp Ser Asn Asn Arg Glu Arg Met 885 890 895 Gly Glu Phe Val Asp Phe Gly Thr Lys Gly Thr Gln His Gln Phe Lys 900 905 910 His Ser Lys Arg His Lys Gly Gln Ile Leu Tyr Phe Asn Glu Lys Gly 915 920 925 Val Val Glu Val Met Pro Val Tyr Ser Asn Ile Lys Thr Thr Asp Val 930 935 940 Lys Asp Lys Leu Gln Asn Met Gly Cys Lys Leu Tyr Asn Lys Gly Gln 945 950 955 960 Met Phe Tyr Ser Gly Cys Leu Val Asp Ile Pro Lys Pro Phe Lys Ala 965 970 975 Gly Ser Lys Glu Tyr Pro Ala Gly Arg Tyr Gln Ile Lys Thr Ile Arg 980 985 990 Ser Asp Lys Val Ala Glu Leu Glu Asp Ala Cys Gly Asn Lys Ile Ser 995 1000 1005 Thr Asn Val Lys Tyr Leu Val Pro Ala Glu Phe Lys Lys Val Glu 1010 1015 1020 Ser Lys 1025 <210> 71 <211> 1059 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG1-6 (D13A) nickase <400> 71 Met Glu Lys Glu Lys Asn Asn His Val Trp Gly Phe Ala Ile Gly Lys 1 5 10 15 Gly Ser Leu Gly Glu Ala Val Arg Val Gly Gly Asp Phe Lys His Ile 20 25 30 Ala Ser Val Leu Leu Asp Pro Glu Phe Gly Glu Ile Lys Thr Ala Ala 35 40 45 Leu Ala Arg Arg Gln Met Arg Thr Arg Lys Ala His Lys Ala Arg Glu 50 55 60 Lys Trp Leu Glu Glu Cys Leu Asp Gly Thr Gly Val Glu Ile Leu Lys 65 70 75 80 Arg Arg Glu Val Gly Ile Val Asp Gly Gln Trp Arg Leu Ile Ser Lys 85 90 95 Gly Asp Glu Arg Leu Glu Arg Glu Phe Pro Pro Asn Gly Glu Glu Val 100 105 110 Cys Tyr Asn Ser Ile Ala Leu Arg Cys Lys Leu Leu Leu Gly Glu Lys 115 120 125 Leu Glu Gly Trp Gln Val Phe Lys Ala Leu Asn Ser Ala Ile Gln Lys 130 135 140 Arg Gly Tyr Asp Glu Asn Ile Pro Trp Gly Glu Ala Glu Glu Lys Ser 145 150 155 160 Ser Lys Lys Asp Glu Asp Asp Tyr Ala Gln Lys Leu Ser Gln Tyr Glu 165 170 175 Arg Glu Lys Ser Glu Leu Phe Glu Ser Phe Ala Asp Gly Glu Lys Tyr 180 185 190 Asp Phe Pro Cys Phe Phe Lys Ala Tyr Lys Met Gly Leu Trp Ser Pro 195 200 205 Glu Asn Pro Arg Arg Val Glu Val Arg Ile Asp Cys Arg Ala Gln Lys 210 215 220 Ala Lys Ser Tyr Val Val Ala Arg Lys Tyr Val Glu Arg Glu Phe Glu 225 230 235 240 Cys Leu Val Glu Ala Ala Ala Lys Phe Phe Pro Lys Leu Lys Gly Arg 245 250 255 Ala Lys Phe Ile Leu Tyr Gly Val Ser Glu Thr Pro Tyr Ala Ser Tyr 260 265 270 Tyr Gly Asn Met Arg Lys Lys Phe Gly Leu Lys Arg Gly Ala Glu Ser 275 280 285 Asp Trp Thr Ala Leu Gly Gln Lys Val Pro Arg Phe Asp Asn Arg Ile 290 295 300 Ile Asp Lys Cys Arg Leu Ile Pro Arg Met Asn Val Cys Lys Ile Arg 305 310 315 320 Pro Leu Asn Glu Ala Arg Asn Glu Lys Asp Leu Leu Tyr Tyr Glu Val 325 330 335 Thr Leu Ala Leu Lys Leu Leu Asn Leu Arg Phe Phe Arg Asn Ser Asn 340 345 350 Ile Glu Gln Leu Thr Phe Glu Glu Phe Lys Lys Ala Phe Glu Ile Ala 355 360 365 Ser Gly Ala Lys Tyr Lys Met Thr Lys Thr Ala Met Lys Lys Phe Leu 370 375 380 Lys Ser Ile Ser Ala Thr Ala Leu Gly Asp Asp Tyr Ala Glu Ile Glu 385 390 395 400 Pro Pro Lys Glu Ser Gly Arg Ala Ser Phe Ser Arg Pro Ala Met Asp 405 410 415 Ile Leu Lys Glu Leu Ile Phe Ser Gly Met Pro Pro Arg Glu Phe Tyr 420 425 430 Gly Arg Lys Ile Pro Glu Ile Ser Asn Thr Asp Lys Asn Lys Gly Val 435 440 445 Val Ala Ser Asp Leu Asp Phe Ile Lys Leu Met Gly Asp Cys Pro Trp 450 455 460 Gly Gly Ile Phe Ile Pro Asp Val Gln Thr Tyr Gln Phe Ala Asn Ala 465 470 475 480 Ala Phe Pro Asn Pro Asp Ala Gln Ile Asn Lys Leu Ile Gly Ser Gln 485 490 495 Asn Asn Pro Ile Val Arg His Arg Leu Thr Phe Phe Phe Glu Arg Ile 500 505 510 Lys Phe Leu Glu Ser Lys Tyr Gly Val Pro Asp Lys Val Val Leu Glu 515 520 525 Phe Val Arg Asp Asp Phe Met Gly Glu Lys Glu Lys Lys Glu Met Arg 530 535 540 Ile Ala Met Lys Lys Arg Ala Glu Glu Lys Met Met Ile Ala Lys Asp 545 550 555 560 Leu Asp Glu His Gly Phe Lys Gly Gly Asn Leu Leu Leu Lys Met Glu 565 570 575 Leu Tyr Arg Lys Gln Asn Gly Ile Cys Leu Tyr Thr Gly Asp Ala Leu 580 585 590 Pro Leu Ser Glu Leu Ala Thr Leu Glu Ile Glu His Ile Val Pro Arg 595 600 605 Ser Arg Gly Gly Pro Asp Ala Gln Tyr Asn Tyr Val Ile Thr Arg Glu 610 615 620 Lys Thr Asn Lys Leu Lys Gly Asp Lys Thr Pro Tyr Glu Trp Leu Ser 625 630 635 640 Ser Asp Ala Lys Glu Trp Ala Ser Tyr Thr Asp Arg Val Asn Ala Cys 645 650 655 Ala Lys Ala Leu Gly Lys Lys Arg Cys Arg Leu Leu Leu Glu Lys Asp 660 665 670 Ala Glu Glu Leu Val Glu Lys Tyr Thr Ala Leu Ala Glu Thr Ala His 675 680 685 Ile Ala Lys Leu Ala Gln Lys Ile Val Cys Met His Phe Gly Phe Gln 690 695 700 Phe Gly Gly Leu Ser Gly Thr Lys Arg Val Phe Thr Val Pro Gly Ala 705 710 715 720 Leu Thr Ser Arg Ile Arg Lys Phe Tyr Gly Leu Asp Arg Ile Leu His 725 730 735 Asn Ala Ala Ala Glu Ser Glu Asn Leu Ser Phe Glu Glu Phe Leu Lys 740 745 750 Phe Ser Glu Asp Leu Glu Lys Lys Asn Arg Lys Asn Lys Lys His His 755 760 765 Ala Leu Asp Ala Met Cys Leu Cys Phe Ala Pro Thr Gly Val Asp Ser 770 775 780 Arg Arg Ala Lys Leu Gly Glu Ile Leu Pro Glu Lys Leu Arg Ser Glu 785 790 795 800 Lys Ala Ala Arg Glu Phe Phe Lys Ser Tyr Leu Asp Lys Ile Met Pro 805 810 815 Val Asp Val Ala Pro Lys Lys Pro Arg Leu Glu Asp Gly Ile Tyr Ser 820 825 830 Lys Arg Ile Ile Gly Gly Lys Ala Cys Met Val Lys Arg Asn Asn Leu 835 840 845 Val Asp Leu Ala Tyr Lys Ser Gly Leu Lys Pro Val Phe Asp Ile Pro 850 855 860 Thr Leu Ile Lys Leu Val Asp Lys Lys Glu Lys Gly Ile Ile Asn Pro 865 870 875 880 Gln Ile Arg Lys Met Ile Gly Glu Phe Ala Ala Thr Asn Pro Asp Glu 885 890 895 Ser Ala Trp Arg Lys Trp Cys Glu Glu Val Arg Leu Pro Ser Lys Ser 900 905 910 Gly Leu Gly Ala Arg Val Leu Arg Val Leu Val Tyr Tyr Gly Glu Ala 915 920 925 Asp Glu Tyr Lys Asp Leu Ser Lys Asp Gly Cys Gly Ala Tyr Arg Lys 930 935 940 Gly Asp Gly His Lys Gly Gln Val Val Trp Glu Ser Val Asp Gly Lys 945 950 955 960 Tyr Tyr Val Glu Pro Val Tyr Val His Ala Ser Lys Ala Gly Val Met 965 970 975 Ala Ala Leu Asn Ala Asn Pro Lys Lys Lys Arg Ile Cys Gly Met Phe 980 985 990 Asn Ser His Cys Thr Val Asp Val Gly Asp Val Tyr Asn Asp Arg Gly 995 1000 1005 Asp Phe Ile Leu Pro Ala Gly Arg Tyr Met Val Asn Thr Ile Leu 1010 1015 1020 Thr Thr Gly Arg Cys Val Leu Thr Asn Ala Asp Gly Glu Lys Arg 1025 1030 1035 Asn Pro Ile Asn Ile Asn Tyr Leu Met Arg Ala Gly Met Arg Arg 1040 1045 1050 Val Glu Leu Ser Glu Leu 1055 <210> 72 <211> 1134 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG3-6 (D13A) nickase <400> 72 Met Ser Thr Asp Met Lys Asn Tyr Arg Ile Gly Val Ala Val Gly Asp 1 5 10 15 Arg Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Asp Gly Leu Pro 20 25 30 Ile Gln Lys Leu Ala Leu Val Thr Phe Arg His Asp Gly Gly Leu Asp 35 40 45 Pro Thr Lys Asn Lys Thr Pro Met Ser Arg Lys Glu Thr Arg Gly Ile 50 55 60 Ala Arg Arg Thr Met Arg Met Asn Arg Glu Arg Lys Arg Arg Leu Arg 65 70 75 80 Asn Leu Asp Asn Val Leu Glu Asn Leu Gly Tyr Ser Val Pro Glu Gly 85 90 95 Pro Glu Pro Glu Thr Tyr Glu Ala Trp Thr Ser Arg Ala Leu Leu Ala 100 105 110 Ser Ile Lys Leu Ala Ser Ala Asp Glu Leu Asn Glu His Leu Val Arg 115 120 125 Ala Val Arg His Met Ala Arg His Arg Gly Trp Ala Asn Pro Trp Trp 130 135 140 Ser Leu Asp Gln Leu Glu Lys Ala Ser Gln Glu Pro Ser Glu Thr Phe 145 150 155 160 Glu Ile Ile Leu Ala Arg Ala Arg Glu Leu Phe Gly Glu Lys Val Pro 165 170 175 Ala Asn Pro Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Glu 180 185 190 Val Leu Leu Arg Pro Arg Asp Glu Lys Lys Arg Lys Thr Gly Tyr Val 195 200 205 Arg Gly Thr Pro Leu Met Phe Ala Gln Val Arg Gln Gly Asp Gln Leu 210 215 220 Ala Glu Leu Arg Arg Ile Cys Glu Val Gln Gly Ile Glu Asp Gln Tyr 225 230 235 240 Glu Ala Leu Arg Leu Gly Val Phe Asp His Lys His Pro Tyr Val Pro 245 250 255 Lys Glu Arg Val Gly Lys Asp Pro Leu Asn Pro Ser Thr Asn Arg Thr 260 265 270 Ile Arg Ala Ser Leu Glu Phe Gln Glu Phe Arg Ile Leu Asp Ser Val 275 280 285 Ala Asn Leu Arg Val Arg Ile Gly Ser Arg Ala Lys Arg Glu Leu Thr 290 295 300 Glu Ala Glu Tyr Asp Ala Ala Val Glu Phe Leu Met Asp Tyr Ala Asp 305 310 315 320 Lys Glu Gln Pro Ser Trp Ala Asp Val Ala Glu Lys Ile Gly Val Pro 325 330 335 Gly Asn Arg Leu Val Ala Pro Val Leu Glu Asp Val Gln Gln Lys Thr 340 345 350 Ala Pro Tyr Asp Arg Ser Ser Ala Ala Phe Glu Lys Ala Met Gly Lys 355 360 365 Lys Thr Glu Ala Arg Gln Trp Trp Glu Ser Thr Asp Asp Asp Gln Leu 370 375 380 Arg Ser Leu Leu Ile Ala Phe Leu Val Asp Ala Thr Asn Asp Thr Glu 385 390 395 400 Glu Ala Ala Ala Glu Ala Gly Leu Ser Glu Leu Tyr Lys Ser Trp Pro 405 410 415 Ala Glu Glu Arg Glu Ala Leu Ser Asn Ile Asp Phe Glu Lys Gly Arg 420 425 430 Val Ala Tyr Ser Gln Glu Thr Leu Ser Lys Leu Ser Glu Tyr Met His 435 440 445 Glu Tyr Arg Val Gly Leu His Glu Ala Arg Lys Ala Val Phe Gly Val 450 455 460 Asp Asp Thr Trp Arg Pro Pro Leu Asp Lys Leu Glu Glu Pro Thr Gly 465 470 475 480 Gln Pro Ala Val Asp Arg Val Leu Thr Ile Leu Arg Arg Phe Val Leu 485 490 495 Asp Cys Glu Arg Gln Trp Gly Arg Pro Arg Ala Ile Thr Val Glu His 500 505 510 Thr Arg Thr Gly Leu Met Gly Pro Thr Gln Arg Gln Lys Ile Leu Asn 515 520 525 Glu Gln Lys Lys Asn Arg Ala Asp Asn Glu Arg Ile Arg Asp Glu Leu 530 535 540 Arg Glu Ser Gly Val Asp Asn Pro Ser Arg Ala Glu Val Arg Arg His 545 550 555 560 Leu Ile Val Gln Glu Gln Glu Cys Gln Cys Leu Tyr Cys Gly Thr Met 565 570 575 Ile Thr Thr Thr Thr Ser Glu Leu Asp His Ile Val Pro Arg Ala Gly 580 585 590 Gly Gly Ser Ser Arg Arg Glu Asn Leu Ala Ala Val Cys Arg Ala Cys 595 600 605 Asn Ala Lys Lys Lys Arg Glu Leu Phe Tyr Ala Trp Ala Gly Pro Val 610 615 620 Lys Ser Gln Glu Thr Ile Glu Arg Val Arg Gln Leu Lys Ala Phe Lys 625 630 635 640 Asp Ser Lys Lys Ala Lys Met Phe Lys Asn Gln Ile Arg Arg Leu Asn 645 650 655 Gln Thr Glu Ala Asp Glu Pro Ile Asp Glu Arg Ser Leu Ala Ser Thr 660 665 670 Ser Tyr Ala Ala Val Ala Val Arg Glu Arg Leu Glu Gln His Phe Asn 675 680 685 Glu Gly Leu Ala Leu Asp Asp Lys Ser Arg Val Val Leu Asp Val Tyr 690 695 700 Ala Gly Ala Val Thr Arg Glu Ser Arg Arg Ala Gly Gly Ile Asp Glu 705 710 715 720 Arg Ile Leu Leu Arg Gly Glu Arg Asp Lys Asn Arg Phe Asp Val Arg 725 730 735 His His Ala Val Asp Ala Ala Val Met Thr Leu Leu Asn Arg Ser Val 740 745 750 Ala Leu Thr Leu Glu Gln Arg Ser Gln Leu Arg Arg Thr Phe Tyr Glu 755 760 765 Gln Gly Leu Asp Lys Leu Asp Arg Asn Gln Leu Lys Pro Glu Glu Asp 770 775 780 Trp Arg Asp Phe Thr Gly Leu Ala Pro Ala Ser Gln Glu Lys Phe Leu 785 790 795 800 Glu Trp Arg Lys Ala Ala Thr Ile Leu Gly Asp Leu Leu Ala Glu Ala 805 810 815 Ile Glu Asp Asp Ser Ile Ala Val Val Ser Pro Leu Arg Leu Arg Pro 820 825 830 Gln Asn Gly Ser Val His Leu Glu Thr Ile Ser Ala Val Lys Lys Gln 835 840 845 Thr Leu Gly Ser Asp Trp Pro Ala Asp Ala Val Lys Arg Ile Val Asp 850 855 860 Pro Glu Ile Tyr Leu Ala Met Lys Asp Ala Leu Gly Lys Leu Lys Glu 865 870 875 880 Leu Pro Glu Asp Ser Ala Arg Ser Leu Glu Leu Pro Asp Gly Arg Phe 885 890 895 Val Glu Ala Asp Asp Glu Val Leu Phe Phe Pro Glu Asn Ala Ala Ser 900 905 910 Ile Leu Thr Pro Arg Gly Val Ala Glu Ile Gly Gly Ser Ile His His 915 920 925 Ala Arg Leu Tyr Gly Trp Leu Thr Lys Lys Gly Glu Leu Lys Val Gly 930 935 940 Met Leu Arg Val Tyr Gly Ala Glu Phe Pro Trp Leu Met Arg Glu Ser 945 950 955 960 Gly Ser Arg Asn Val Leu Ser Met Pro Ile His Arg Gly Ser Gln Ser 965 970 975 Phe Arg Asp Met Gln Asp Thr Thr Arg Lys Ala Val Glu Ser Gly Glu 980 985 990 Ala Val Glu Phe Ala Trp Ile Thr Gln Asn Asp Glu Leu Glu Phe Asp 995 1000 1005 Pro Asp Asp Tyr Ile Ala His Gly Gly Lys Asp Glu Leu Arg Gln 1010 1015 1020 Phe Leu Gly Phe Met Pro Glu Cys Arg Trp Arg Val Asp Gly Phe 1025 1030 1035 Lys Lys Asn Tyr Gln Ile Arg Ile Arg Pro Ala Met Leu Ser Arg 1040 1045 1050 Glu Gln Leu Pro Ser Asp Ile Gln Arg Arg Leu Glu Ser Lys Thr 1055 1060 1065 Leu Thr Lys Asn Glu Ser Leu Leu Leu Lys Ala Leu Asp Thr Gly 1070 1075 1080 Leu Val Val Ala Ile Gly Gly Leu Leu Pro Leu Glu Thr Leu Lys 1085 1090 1095 Val Ile Arg Arg Asn Asn Leu Gly Phe Pro Arg Trp Arg Gly Asn 1100 1105 1110 Gly Asn Leu Pro Thr Ser Phe Glu Val Arg Ser Ser Ala Leu Arg 1115 1120 1125 Ala Leu Gly Val Glu Gly 1130 <210> 73 <211> 1131 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG3-7 (D12A) nickase <400> 73 Met Ser Glu His Thr Lys Tyr Arg Ile Gly Ile Ala Val Gly Asp Arg 1 5 10 15 Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Asp Gly Phe Pro Leu 20 25 30 Ser Asn Leu Ala Met Val Thr Tyr Arg His Asp Gly Gly Leu Asp Pro 35 40 45 Thr Thr Asn Lys Ser Pro Lys Ser Arg Lys Glu Thr Arg Gly Val Ala 50 55 60 Leu Arg Thr Met Arg Met Arg Arg Arg Lys Lys Ser Arg Leu Lys Asp 65 70 75 80 Leu Asp Lys Thr Leu Arg Ala Leu Gly Tyr Val Val Pro Ala Cys Glu 85 90 95 Glu Pro Gln Thr Tyr Glu Ala Trp Lys Ser Arg Ala Leu Leu Ala Thr 100 105 110 Thr Lys Val Glu Gly Ala Gln Glu Leu Gly Glu His Leu Val Arg Ala 115 120 125 Val Arg His Met Ala Arg His Arg Gly Trp Arg Asn Pro Trp Trp Thr 130 135 140 Phe Asn Gln Leu Glu Ile Ala Ser Thr Ala Pro Ser Asp Thr Phe Ala 145 150 155 160 Lys Ile Arg Glu Arg Ala Glu Lys Glu Trp Pro Gly Val Val Pro Glu 165 170 175 Glu Ala Thr Leu Gly Met Ile Gly Ala Leu Ala Ala Ser Asn Asn Val 180 185 190 Leu Leu Arg Pro Arg Thr Tyr Arg Lys Asp Gln Pro Arg His Ser Lys 195 200 205 Lys Leu Asn Val Leu Gly Gln Glu Pro Ile Leu Val Asp Lys Val Arg 210 215 220 Gln Glu Asp Leu Leu Ala Glu Leu Arg Thr Ile Cys Lys Lys Gln Asp 225 230 235 240 Ile Glu Asp Gln Tyr Glu Lys Leu Ala Gln Ala Val Phe Glu Gln Thr 245 250 255 Arg Pro Tyr Val Pro Leu Asp Arg Val Gly Lys Asp Pro Leu Gln Pro 260 265 270 Asn Lys Ser Arg Ala Ser Arg Ala Ser Leu Glu Phe Gln Arg Phe Arg 275 280 285 Ile Leu Asp Ala Val Ala His Leu Arg Val Arg Val Gly Ala Ser Asp 290 295 300 Arg Arg Ala Leu Thr Asp Glu Glu His Asp Lys Ala Val His Phe Leu 305 310 315 320 Met Gly Tyr Ser Lys Lys Asp Val Pro Thr Trp Gly Asp Val Ala Asp 325 330 335 Glu Ile Gly Val Glu Pro Ala His Leu Ile Ala Pro Val Ile Asp Asp 340 345 350 Val Arg Leu Asn Lys Ala Pro Tyr Asp Arg Ser Ser Thr Glu Phe Glu 355 360 365 Gln Lys Met Lys Lys Lys Thr Arg Ala Arg Gln Trp Trp Asp Glu Ala 370 375 380 Asn Leu Glu Ser Arg Ser Gln Leu Ile Leu Leu Val Ser Asp Pro Thr 385 390 395 400 Asp Glu Thr Met Arg Leu Ala Glu Val Ser Gly Leu Tyr Glu Val Phe 405 410 415 Glu Ser Trp Pro Asp Glu Glu Lys Glu Ala Leu Glu Gly Leu Lys Val 420 425 430 Glu Ser Gly Arg Ala Ala Tyr Ser Thr Asp Thr Leu Asn Lys Leu Ser 435 440 445 Asp His Met Arg Leu Lys Arg Ile Asp Leu His Glu Ala Arg Lys Ile 450 455 460 Ala Phe Gly Val Asp Asp Met Trp His Pro Pro Leu Asp Arg Ile Asp 465 470 475 480 Glu Pro Thr Gly Gln Pro Thr Val Asp Arg Val Leu Thr Ile Val Arg 485 490 495 Arg Phe Ile Phe Asp Cys Glu Arg Ala Trp Gly Cys Pro Glu Asn Val 500 505 510 Val Ile Glu His Ala Arg Thr Gly Leu Met Gly Pro Ala Gln Arg Ala 515 520 525 Asp Val Leu Asn Glu Ile Ala Lys Asn Arg Lys Lys Asn Asp Lys Ile 530 535 540 Arg Glu Asp Leu Arg Ala Gly Gly Ile Asn Asn Pro Thr Arg Ala Asp 545 550 555 560 Ile Arg Arg Asn Ala Ile Val Gln Asp Gln Glu Ser Gln Cys Leu Tyr 565 570 575 Cys Gly Ala Thr Ile Gly Val Ser Tyr Ser Glu Leu Asp His Ile Val 580 585 590 Pro Arg Ala Gly Gly Gly Ser Ser Arg Arg Glu Asn Leu Ala Ala Val 595 600 605 Cys Arg Ala Cys Asn Asp Ser Lys Lys Asp Thr Pro Phe Ala Val Trp 610 615 620 Ala Lys Asn Thr Ser Arg Pro Val Thr Leu Glu Gly Thr Ile Gln Arg 625 630 635 640 Leu Arg Glu Leu Lys Ala Phe Lys Arg Pro Lys Asp Arg Arg Met Val 645 650 655 Asp Leu Ile Ile Arg Arg Leu Lys Gln Thr Glu Lys Asp Asp Pro Ile 660 665 670 Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr Ala Ala Thr Ala Ile Arg 675 680 685 Glu Arg Ile Glu Gln Tyr Phe Asn Glu Lys Ala Glu Lys Leu Asp Leu 690 695 700 Ala Lys Val His Ile Asp Val Tyr Ser Gly Ser Leu Thr Arg Glu Ser 705 710 715 720 Arg Arg Ala Gly Gly Ile Asp Lys Met Val Leu Leu Arg Gly Gln Ser 725 730 735 Asp Lys Asn Arg Phe Asp Val Arg His His Ala Ile Asp Ala Ala Val 740 745 750 Leu Thr Leu Leu Asn Arg Ser Val Ala Val Thr Leu Glu Gln Arg Arg 755 760 765 Leu Ile Lys Gln Gln Arg Glu Tyr Ser Leu Glu Lys Ser Arg Arg Glu 770 775 780 Arg Asp Asn Val Trp Arg Asp Phe Met Gly Leu Gly Pro Ala Ala Gln 785 790 795 800 Glu Lys Phe Ala Lys Trp Lys Lys Thr Ala Tyr Val Leu Ala Asp Ile 805 810 815 Ile Lys Glu Ala Ile Ser Asn Asp Ala Ile Pro Val Val Ser Pro Leu 820 825 830 Arg Leu Arg Pro Gln Asn Gly Ser Val His Leu Asp Thr Val Asp Ala 835 840 845 Val Leu Glu Arg Thr Ile Gly Asp Ala Trp Thr Val Asp Gln Val His 850 855 860 Arg Ile Val Asn Pro Gln Ile Tyr Leu Ala Phe Ala Gly Tyr Leu Gly 865 870 875 880 Asn Gln Lys Ala Leu Asp Pro Asp Ser Ser Arg Val Leu Ala Leu Asn 885 890 895 Asp Gly Arg Lys Leu Thr Ala Glu Asp Val Ile Tyr Val Phe Pro Glu 900 905 910 Lys Ala Ala Ser Ile Leu Thr Pro Arg Gly Val Val Lys Ile Gly Glu 915 920 925 Ser Val His His Val Arg Leu Tyr Ala Trp Lys Asn Arg Lys Gly Lys 930 935 940 Ala Glu Val Gly Met Leu Arg Val Phe Gly Ala Glu Phe Pro Trp Leu 945 950 955 960 Met Arg Glu Ser Gly Val Lys Asp Val Leu Arg Val Pro Ile His Thr 965 970 975 Gly Ser Gln Ser Tyr Arg Asp Leu Ser Phe Thr Val Arg Lys Asn Ile 980 985 990 Glu Lys Gly Glu Ala Ala Glu Ile Gly Trp Leu Thr Gln Asn Glu Glu 995 1000 1005 Leu Glu Phe Asn Pro Glu Ser Tyr Leu Gln Glu Gly Gly Lys Asp 1010 1015 1020 Lys Leu Ala Lys Phe Leu Ala Phe Leu Pro Glu Thr Arg Trp Arg 1025 1030 1035 Val Asp Gly Phe Pro Met Pro Asp Lys Leu Arg Ile Arg Pro Ala 1040 1045 1050 Leu Leu Ser Arg Glu Glu Ile Pro Glu Gly Val Phe Arg Thr Glu 1055 1060 1065 Glu Gln Ser Leu Leu Glu Glu Ala Leu Thr Lys Gly Leu Ile Ile 1070 1075 1080 Ala Thr Lys Gly Leu Leu Ser Leu Pro Asp Val Lys Val Leu Arg 1085 1090 1095 Arg Asn Asn Leu Gly Ile Pro Arg Trp Arg Gly Gly Ser Tyr Arg 1100 1105 1110 Pro Val Ser Leu Asp Ile Gln Arg Ala Ala Leu Ala Ala Leu Asp 1115 1120 1125 Glu Gln Glu 1130 <210> 74 <211> 1132 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG3-8 (D13A) nickase <400> 74 Met Ser Thr Asp Met Lys Asn Tyr Arg Ile Gly Val Ala Val Gly Asp 1 5 10 15 Arg Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Ala Gly Phe Pro 20 25 30 Ile Gln Lys Leu Ala Leu Val Thr Phe Arg His Asp Gly Gly Leu Asp 35 40 45 Pro Thr Asp Asn Pro Lys Ser Arg Lys Glu Thr Arg Gly Glu Ala Arg 50 55 60 Arg Arg Met Arg Met Thr Arg Arg Arg Lys Gln Arg Leu Arg Asp Leu 65 70 75 80 Asp Lys Val Leu Glu Asn Leu Gly Tyr Thr Val Pro Glu Gly Pro Glu 85 90 95 Pro Glu Thr Tyr Glu Ala Trp Thr Ser Arg Ala Leu Leu Ala Ser Ile 100 105 110 Lys Leu Ala Ser Ala Asp Glu Leu Asn Glu His Leu Val Arg Ala Val 115 120 125 Arg His Ile Ala Arg His Arg Gly Trp Val Asn Pro Trp Trp Ser Leu 130 135 140 Asp Gln Leu Glu Arg Ala Ser Gln Glu Pro Ser Glu Thr Phe Glu Ile 145 150 155 160 Ile Leu Ala Arg Ala Arg Glu Leu Phe Gly Glu Arg Val Pro Ala Asn 165 170 175 Pro Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Glu Val Leu 180 185 190 Leu Arg Pro Arg Ala Glu Lys Lys Lys Lys Thr Gly Tyr Val Arg Gly 195 200 205 Thr Pro Leu Leu Ala Ala Gln Val Arg Gln Ile Asp Gln Val Ala Glu 210 215 220 Leu Arg Arg Ile Cys Glu Val Gln Gly Ile Glu Glu Gln Tyr Glu Thr 225 230 235 240 Leu Arg Asn Ala Ile Phe Ala His Lys Val Ala Tyr Val Pro Thr Glu 245 250 255 Arg Val Gly Lys Asp Pro Leu Ala Pro Ser Lys Asn Arg Thr Ile Arg 260 265 270 Ala Ser Leu Glu Phe Gln Glu Phe Arg Ile Leu Asp Ser Val Ala Asn 275 280 285 Leu Arg Val Arg Thr Asp Ser Arg Ala Lys Arg Glu Leu Thr Glu Gly 290 295 300 Glu Tyr Asp Ala Ala Val Glu Phe Leu Met Gly Tyr Thr Ala Lys Glu 305 310 315 320 Gln Pro Ser Trp Ala Asp Val Ala Glu Glu Ile Gly Val Pro Gly Asn 325 330 335 Arg Leu Ile Ala Pro Val Leu Glu Asp Val Gln Gln Lys Thr Ala Pro 340 345 350 Phe Asp Arg Ser Ser Ala Ala Phe Glu Lys Ala Met Ser Lys Arg Thr 355 360 365 Glu Ala Arg Gln Trp Trp Glu Ala Asn Asp Asp Asp Gln Leu Arg Ser 370 375 380 Leu Phe Ile Met Phe Leu Ala Asp Ala Thr Asn Asp Thr Glu Glu Ala 385 390 395 400 Ala Ala Val Ala Gly Leu Pro Glu Leu Tyr Met Ser Trp Pro Ala Glu 405 410 415 Glu Arg Glu Ala Leu Ser Asn Ile Asp Phe Glu Lys Gly Arg Val Ala 420 425 430 Tyr Ser His Glu Thr Leu Ser Lys Leu Ser Glu Tyr Met His Glu His 435 440 445 Arg Val Gly Leu His Glu Ala Arg Lys Ala Val Phe Gly Val Asp Asp 450 455 460 Thr Trp Arg Pro Pro Leu Ala Lys Leu Glu Glu Pro Thr Gly Gln Pro 465 470 475 480 Thr Val Asp Arg Val Leu Thr Ile Leu Arg Arg Phe Val Leu Asp Cys 485 490 495 Glu Arg Gln Trp Gly Arg Pro Arg Ala Ile Thr Val Glu His Ala Arg 500 505 510 Ile Gly Leu Val Gly Pro Ala Gln Arg Gln Asn Ile Leu Lys Glu Gln 515 520 525 Glu Asp Asn Arg Lys Asn Asn Glu Cys Ile Arg Asp Glu Leu Arg Lys 530 535 540 Ser Gly Val Glu Asn Pro Ser Arg Thr Glu Val Arg Arg His Leu Val 545 550 555 560 Val Gln Asp Gln Glu Ser Gln Cys Leu Tyr Cys Gly Ala Val Ile Arg 565 570 575 Thr Asp Thr Ser Glu Leu Asp His Ile Val Pro Arg Ala Gly Gly Gly 580 585 590 Ser Ser Arg Arg Glu Asn Leu Ala Ala Val Cys Arg Tyr Cys Asn Ser 595 600 605 Lys Lys Asp Arg Thr Leu Phe Tyr Asp Trp Ala Gly Ser Val Arg Leu 610 615 620 Gln Glu Thr Ile Asp Arg Val Arg Gln Leu Lys Ala Phe Lys Asp Ser 625 630 635 640 Lys Lys Ala Lys Met Phe Lys Asn Gln Ile Arg Arg Leu Arg Gln Thr 645 650 655 Glu Ala Asp Glu Pro Ile Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr 660 665 670 Ala Ala Val Ala Val Arg Glu Arg Leu Glu Gln His Phe Asn Glu Gly 675 680 685 Leu Ala Pro Asp Asp Lys Asn Arg Val Val Leu Asp Val Tyr Ala Gly 690 695 700 Ser Val Thr Arg Glu Ser Arg Arg Ala Gly Gly Ile Asp Glu Arg Ile 705 710 715 720 Leu Leu Arg Gly Glu Arg Asp Lys Asn Arg Phe Asp Val Arg His His 725 730 735 Ala Ile Asp Ala Ala Val Met Thr Leu Leu Asn Arg Ser Val Ala Leu 740 745 750 Thr Leu Glu Gln Arg Ser Gln Leu Arg Arg Ala Phe Tyr Glu Gln Gly 755 760 765 Leu Asp Lys Leu Asp Arg Asp Gln Leu Lys Pro Glu Glu Asp Trp Arg 770 775 780 Asn Phe Ile Gly Leu Ser Leu Ala Ser Gln Glu Lys Phe Leu Glu Trp 785 790 795 800 Lys Lys Val Thr Thr Val Leu Gly Asp Leu Leu Ala Glu Ala Ile Glu 805 810 815 Asp Asp Ser Ile Ala Val Val Ser Pro Leu Arg Leu Arg Pro Gln Asn 820 825 830 Gly Arg Val His Lys Asp Thr Ile Ala Ala Val Lys Lys Gln Thr Leu 835 840 845 Gly Ser Ala Trp Ser Ala Asp Ala Val Lys Arg Ile Val Asp Pro Glu 850 855 860 Ile Tyr Leu Ala Met Lys Asp Ala Leu Gly Lys Ser Lys Val Leu Pro 865 870 875 880 Glu Asp Ser Ala Arg Thr Leu Glu Leu Ser Asp Gly Arg Tyr Leu Glu 885 890 895 Ala Asp Asp Glu Val Leu Phe Phe Pro Lys Asn Ala Ala Ser Ile Leu 900 905 910 Thr Pro Arg Gly Val Ala Glu Ile Gly Gly Ser Ile His His Ala Arg 915 920 925 Leu Tyr Ser Trp Leu Thr Lys Lys Gly Glu Leu Lys Ile Gly Met Leu 930 935 940 Arg Val Tyr Gly Ala Glu Phe Pro Trp Leu Met Arg Glu Ser Gly Ser 945 950 955 960 His Asp Val Leu Arg Met Pro Ile His Pro Gly Ser Gln Ser Phe Arg 965 970 975 Asp Met Gln Asp Thr Thr Arg Lys Ala Val Glu Ser Ser Glu Ala Val 980 985 990 Glu Phe Ala Trp Ile Thr Gln Asn Asp Glu Leu Glu Phe Glu Pro Glu 995 1000 1005 Asp Tyr Ile Ala His Gly Gly Lys Asp Glu Leu Arg Gln Phe Leu 1010 1015 1020 Glu Phe Met Pro Glu Cys Arg Trp Arg Val Asp Gly Phe Lys Lys 1025 1030 1035 Asn Tyr Gln Ile Arg Ile Arg Pro Ala Met Leu Ser Arg Glu Gln 1040 1045 1050 Leu Pro Ser Asp Ile Gln Arg Arg Leu Glu Ser Lys Thr Leu Thr 1055 1060 1065 Glu Asn Glu Ser Leu Leu Leu Lys Ala Leu Asp Thr Gly Leu Val 1070 1075 1080 Val Ala Ile Gly Gly Leu Leu Pro Leu Gly Thr Leu Lys Val Ile 1085 1090 1095 Arg Arg Asn Asn Leu Gly Phe Pro Arg Trp Arg Gly Asn Gly Asn 1100 1105 1110 Leu Pro Thr Ser Phe Glu Val Arg Ser Ser Ala Leu Arg Ala Leu 1115 1120 1125 Gly Val Glu Gly 1130 <210> 75 <211> 1055 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG4-5 (D17A) nickase <400> 75 Met Gly Asp Gln Gln Thr Leu Gln Ala Thr Ser Tyr Cys Leu Gly Leu 1 5 10 15 Ala Val Gly Val Gln Gly Val Gly Trp Ala Val Ile Asp Leu Asp Asp 20 25 30 Gln Gly Gln Pro Leu Gly Val Arg Arg Thr Gly Val Arg Cys Phe Asp 35 40 45 Ser Gly Val Gly Ser Glu Thr Glu Phe Glu Lys Gly Val Asp Glu Pro 50 55 60 Pro Ser Thr Lys Arg Arg Gln Ala Arg Gln Gln Arg Arg Gln Leu Trp 65 70 75 80 Arg Arg Ala Gln Arg Gln Arg Arg Val Phe Arg Ala Leu Gln Glu Ala 85 90 95 Gly Leu Leu Pro Pro Gly Pro Pro Thr Pro Val Ser Arg Asp Lys Ile 100 105 110 Leu Arg Thr Leu Asp Ala Asp Leu Ala Ile Gln Phe Gly Ser Leu Glu 115 120 125 Asp Arg Ile Ala Ala His Leu Leu Pro Tyr Arg Leu Arg Ala Leu Ala 130 135 140 Leu Asp Thr Pro Leu Pro Pro Tyr Ala Leu Gly Arg Ala Phe Tyr His 145 150 155 160 Leu Ala Gln Arg Arg Gly Phe Leu Ser Asn Lys Lys Ala Leu Lys Glu 165 170 175 Glu Lys Glu Ala Gly Glu Val Lys Lys Gly Ile Ala Glu Leu Gln Glu 180 185 190 Glu Met Asn Arg Ala Gly Ala Arg Ala Leu Gly Glu Tyr Phe Ser Ser 195 200 205 Leu Asp Pro Glu Gln Arg Arg Ile Arg Asn Arg Trp Thr Ala Arg Gln 210 215 220 Met Tyr Leu Asp Glu Phe Asp Arg Val Trp Glu Ala Gln Ser Arg Tyr 225 230 235 240 His Pro Arg Leu Thr Asp Glu Leu Lys Thr Lys Val Arg Arg Ala Ile 245 250 255 Phe Phe Gln Arg Pro Leu Lys Ser Gln Lys Gly Leu Ile Gly Arg Cys 260 265 270 Glu Leu Glu Pro Arg His Arg Arg Ala Pro Leu Ala Ser Leu Leu Ala 275 280 285 Gln Arg Phe Arg Tyr Trp Gln Lys Ile Asn Asp Leu Glu Val Ile Gln 290 295 300 Pro Asp Gly Val Val Arg Pro Leu Ser Pro Glu Glu Arg His Lys Leu 305 310 315 320 Ala His Phe Leu Glu Thr Gln Ala Glu Ala Thr Phe Ala Arg Ile Arg 325 330 335 Lys Leu Leu Asp Leu Lys Lys Pro Lys Gly Ser Gln Glu Asp Phe Ala 340 345 350 Phe Asn Leu Glu Arg Gly Gly Glu Lys Arg Ile Leu Gly Asn Arg Thr 355 360 365 Ala Ala Lys Met Ala Ala Val Leu Gly Gln Arg Trp Ala Ala Met Asp 370 375 380 Asp Glu Asp Lys Arg Arg Leu Val Asn Glu Ile Leu Ser Phe Glu Lys 385 390 395 400 Glu Ala Pro Leu Ala Arg Arg Leu Val Arg Ala Trp Asn Leu Asp Glu 405 410 415 Pro Thr Ala Ala Gln Leu Ala Ala Leu Asp Phe Glu Pro Gly Tyr Ala 420 425 430 Ala Leu Ser Ala Arg Ala Ile Arg Lys Leu Leu Pro Leu Met Gln Arg 435 440 445 Glu Gly Met Arg Phe Ala Thr Ala Arg Lys Gln Val Tyr Gly Asp His 450 455 460 Leu Leu Gly Thr Arg Ala Tyr Asp Ala Leu Pro Pro Val Ala Lys Ala 465 470 475 480 Ile Pro Ser Leu Arg Asn Pro Ala Val Cys Arg Ala Leu Thr Glu Val 485 490 495 Arg Lys Val Val Asn Ala Leu Val Arg Ala Tyr Gly Lys Pro Ala Met 500 505 510 Val Arg Ile Glu Leu Ala Arg Asp Met Lys Arg Gly Arg Lys Gln Arg 515 520 525 Lys Glu Thr Trp Gln Ala Met Arg Glu Asn Glu Arg Cys Arg Leu Asp 530 535 540 Ala Arg Lys Leu Leu Gln Asp His Gly Ile Gln Glu Pro Arg Pro Ala 545 550 555 560 Asp Ile Leu Lys Val Leu Leu Ala Glu Glu Cys Asn Trp Glu Cys Pro 565 570 575 Tyr Thr Gly Lys Ala Ile Ser Met Asp Ala Leu Ile Gly Ser Gln Pro 580 585 590 Gln Phe Asp Val Glu His Ile Ile Pro Phe Ser Arg Ser Leu Asp Asn 595 600 605 Ser Phe Leu Asn Lys Thr Leu Cys Tyr His Glu Glu Asn Arg Asn Val 610 615 620 Lys Gln Asn Arg Thr Pro Phe Glu Ala Tyr Gly Gly Asp Glu Gln Arg 625 630 635 640 Trp His Glu Ile Leu Gln Arg Val Arg Arg Phe Arg Gly Ser Ala Ala 645 650 655 Glu Ser Lys Leu Arg Lys Phe Gln Leu Arg Gln Leu Pro Ala Asp Phe 660 665 670 Thr Asn Arg His Leu Asn Asp Thr Arg Tyr Ala Ser Arg Leu Ala Ala 675 680 685 Asp Tyr Leu Ala Leu Leu Tyr Gly Gly Arg Val Asp Ala Asn Gly Arg 690 695 700 Gln Arg Val Gln Val Gly Thr Gly Ala Thr Thr Gly Phe Leu Arg Asp 705 710 715 720 Glu Trp Gly Leu Asn Ala Ile Leu Gly Asp Asn Asp Glu Lys Glu Arg 725 730 735 Ala Asp His Arg His His Ala Ile Asp Ala Val Val Ile Ala Leu Thr 740 745 750 Gly Pro Gly Thr Val Gln Ala Leu Thr Arg Ala Ala Leu Arg Ala Lys 755 760 765 Glu Leu Gly Arg Arg Leu Phe Val Pro Leu Asp Pro Pro Trp Ala Asp 770 775 780 Arg Asp Ser Phe Leu Arg Asp Val Arg Ala Ser Val Glu Ala Ile Thr 785 790 795 800 Val Ser Tyr Arg Val Asp Arg Lys Val Ser Gly Gln Leu His Glu Glu 805 810 815 Ser Asn Tyr Ser Lys Pro His Met Thr Val Asp Asn Lys Gly Asn Leu 820 825 830 Val Glu His Arg His Ile Arg Lys Pro Leu Lys Asp Met Ser Val Glu 835 840 845 Glu Val Glu Ala Ile Val Asp Asp Arg Val Arg Lys Leu Val Gln Glu 850 855 860 Lys Leu Arg Gln Leu Gly Gln Glu Pro Lys Lys Ala Phe Ala Asp Glu 865 870 875 880 Ala Asn His Pro Tyr Phe Thr Thr Ala Asp Gly Arg Leu Val Pro Ile 885 890 895 His Lys Ala Arg Ile Arg Lys Thr Val Ala Thr Ile Thr Val Gly Pro 900 905 910 Pro Gln Cys Pro Arg His Val Ala Pro Gly Leu Asn His His Ile Glu 915 920 925 Ile Leu Ala Val Arg Asp Pro Ala Gly Ala Val Thr His Trp Glu Gly 930 935 940 Glu Leu Val Ser Leu Phe Glu Ala Ala Arg Arg Val Lys Ala Gly Glu 945 950 955 960 Pro Val Val Arg Arg Asn His Gly Pro Asn Lys Asp Phe Leu Phe Ser 965 970 975 Leu Ala Lys Gly Glu Tyr Val Glu Met Glu Leu Gln Pro Gly Lys Arg 980 985 990 Gln Leu Phe Arg Val Thr Val Ile Ser Ala Lys Gln Ile Glu Phe Arg 995 1000 1005 Leu His His Asp Ala Arg Pro Thr Met Leu Leu Arg Lys Thr Pro 1010 1015 1020 Gly Ala Arg Val Ile Arg Ser Pro Gly Ser Leu Phe Lys Ala Lys 1025 1030 1035 Ala Arg Lys Val Ala Val Asp Pro Leu Gly Asn Val Phe Pro Ala 1040 1045 1050 Asn Asp 1055 <210> 76 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG14-1 (D23A) nickase <400> 76 Met Glu Ile Thr Ile Asn Arg Glu Ile Gly Lys Leu Gly Leu Pro Arg 1 5 10 15 His Leu Val Leu Gly Met Ala Pro Gly Ile Ala Ser Cys Gly Phe Ala 20 25 30 Leu Ile Asp Thr Ala Asn His Glu Ile Leu Asp Leu Gly Val Arg Leu 35 40 45 Phe Asp Ser Pro Thr His Pro Lys Thr Gly Gln Ser Leu Ala Val Ile 50 55 60 Arg Arg Gly Phe Arg Ser Thr Arg Arg Asn Ile Asp Arg Thr Gln Ala 65 70 75 80 Arg Leu Lys His Cys Leu Gln Val Leu Lys Ala Tyr Gly Leu Ile Pro 85 90 95 Gln Asp Ala Thr Lys Glu Tyr Phe His Thr Thr Lys Gly Asp Lys Gln 100 105 110 Pro Leu Lys Leu Arg Val Asp Gly Leu Asp Arg Leu Leu Asn Asp Arg 115 120 125 Glu Trp Ala Leu Val Leu Tyr Ser Leu Cys Lys Arg Arg Gly Tyr Ile 130 135 140 Pro His Gly Glu Gly Asn Gln Asp Lys Ser Ser Glu Gly Gly Lys Val 145 150 155 160 Leu Ser Ala Leu Ala Ala Asn Lys Glu Ala Ile Ala Glu Thr Ser Cys 165 170 175 Arg Thr Val Gly Glu Trp Leu Ala Gln Gln Pro Gln Ser Arg Asn Arg 180 185 190 Gly Gly Asn Tyr Asp Lys Tyr Val Thr His Ala Gln Leu Ile Glu Glu 195 200 205 Thr His Ile Leu Phe Asp Ala Gln Arg Ser Phe Gly Ser Lys Tyr Ala 210 215 220 Ser Pro Glu Phe Glu Ala Ala Tyr Ile Glu Val Cys Asp Trp Glu Arg 225 230 235 240 Ser Arg Lys Asp Phe Asp Arg Arg Thr Tyr Asp Leu Val Gly His Cys 245 250 255 Ser Tyr Phe Pro Thr Glu Lys Arg Ala Ala Arg Cys Thr Leu Thr Ser 260 265 270 Glu Leu Val Ser Ala Tyr Gly Ala Leu Gly Asn Ile Thr Ile Ile His 275 280 285 Glu Asn Gly Thr Ser Arg Ala Leu Ser Ala Thr Glu Arg Asp Glu Cys 290 295 300 Ile Ala Ile Leu Phe Ser Cys Glu Pro Ile Arg Gly Asn Lys Asp Cys 305 310 315 320 Ala Val Lys Phe Gly Ala Leu Arg Lys Ala Leu Asp Leu Ser Ser Gly 325 330 335 Asp Tyr Phe Lys Gly Val Pro Ala Ala Asp Glu Lys Thr Arg Glu Val 340 345 350 Tyr Lys Pro Lys Gly Trp Arg Val Leu Arg Asn Thr Leu Asn Ala Ala 355 360 365 Asn Pro Ile Leu Leu Gln Arg Leu Arg Asp Asp Arg Asp Leu Ala Asp 370 375 380 Ala Val Met Glu Ala Val Ala Tyr Ser Ser Ala Leu Pro Val Leu Gln 385 390 395 400 Glu Gln Leu Gln Gly Leu Pro Leu Ser Glu Ala Glu Ile Glu Ala Leu 405 410 415 Cys Arg Leu Pro Tyr Ser Ser Lys Ala Leu Asn Gly Tyr Gly Asn Arg 420 425 430 Ser Lys Lys Ala Leu Asp Met Leu Leu Asp Cys Leu Glu Glu Pro Glu 435 440 445 Val Leu Asn Leu Thr Gln Ala Glu Asn Asp Cys Gly Leu Leu Gly Leu 450 455 460 Arg Ile Ala Gly Ala Gln Leu Glu Arg Ser Asp Arg Leu Met Pro Tyr 465 470 475 480 Glu Thr Trp Ile Glu Arg Thr Gly Arg Thr Asn Asn Asn Pro Val Val 485 490 495 Ile Arg Ser Met Ser Gln Met Arg Lys Val Val Asn Ala Ile Cys Arg 500 505 510 Lys Trp Gly Val Pro Asn Glu Ile His Val Glu Leu Asp Arg Glu Leu 515 520 525 Arg Leu Pro Gln Arg Ala Lys Asp Glu Ile Ala Lys Ala Asn Lys Lys 530 535 540 Asn Glu Lys Asn Arg Glu Arg Ile Ala Gly Gln Ile Ala Glu Leu Arg 545 550 555 560 Gly Cys Thr Ala Asp Glu Val Thr Gly Lys Gln Ile Glu Lys Tyr Arg 565 570 575 Leu Trp Glu Glu Gln Glu Tyr Phe Asp Leu Tyr Thr Gly Ala Lys Ile 580 585 590 Glu Val Asp Arg Leu Ile Ser Asp Asp Thr Tyr Thr Gln Ile Asp His 595 600 605 Ile Leu Pro Phe Ser Arg Thr Gly Glu Asn Ser Arg Asn Asn Lys Val 610 615 620 Leu Val Leu Ala Lys Ser Asn Gln Asp Lys Arg Glu Gln Thr Pro Tyr 625 630 635 640 Glu Trp Met Ser His Asp Gly Ala Pro Ser Trp Asp Ala Phe Glu Arg 645 650 655 Arg Val Gln Glu Asn Gln Lys Leu Ser Arg Arg Lys Lys Asn Phe Leu 660 665 670 Leu Glu Lys Asp Leu Asp Thr Lys Glu Gly Glu Phe Leu Ala Arg Ser 675 680 685 Phe Thr Asp Thr Ala Tyr Met Ser Arg Glu Val Cys Ala Tyr Leu Ala 690 695 700 Asp Cys Leu Leu Phe Pro Asp Asp Gly Ala Lys Ala His Val Val Pro 705 710 715 720 Thr Thr Gly Arg Ala Thr Ala Trp Leu Arg Arg Arg Trp Gly Leu Asn 725 730 735 Phe Gly Ser Asn Gly Glu Lys Asp Arg Ser Asp Asp Arg His His Ala 740 745 750 Thr Asp Ala Cys Val Ile Ala Ala Cys Ser Pro Ser Leu Val Ile Lys 755 760 765 Thr Ala Arg Ile Asn Gln Glu Thr His Trp Ser Ile Thr Arg Gly Met 770 775 780 Asn Glu Thr Gln Arg Arg Asp Ala Ile Met Lys Ala Leu Glu Ser Val 785 790 795 800 Met Pro Trp Glu Thr Phe Ala Asn Glu Val Arg Ala Ala His Asp Phe 805 810 815 Val Val Pro Thr Arg Phe Val Pro Arg Lys Gly Lys Gly Glu Leu Phe 820 825 830 Glu Gln Thr Val Tyr Arg Tyr Ala Gly Val Asn Ala Gln Gly Lys Asp 835 840 845 Ile Ala Arg Lys Ala Ser Ser Asp Lys Asp Ile Val Met Gly Asn Ala 850 855 860 Val Val Ser Ala Asp Glu Lys Ser Val Ile Lys Val Ser Glu Met Leu 865 870 875 880 Cys Leu Arg Leu Trp His Asp Pro Glu Ala Lys Lys Gly Gln Gly Ala 885 890 895 Trp Tyr Ala Asp Pro Val Tyr Lys Ala Asp Ile Pro Ala Leu Lys Asp 900 905 910 Gly Thr Tyr Val Pro Arg Ile Ala Lys Ala His Thr Gly Arg Lys Ala 915 920 925 Trp Lys Pro Val Pro Glu Ser Ala Met Ala Lys Pro Pro Leu Glu Ile 930 935 940 Tyr Phe Gly Asp Leu Val Gln Ile Gly Asp Phe Ile Gly Arg Phe Ser 945 950 955 960 Gly Tyr Asn Ile Asn Asn Ala Asn Trp Ser Phe Thr Asp Arg Leu Thr 965 970 975 Arg Leu Asn Leu Ser Cys Pro Thr Val Gly Gln Leu Asn Asn Asp Leu 980 985 990 Ser Pro Val Val Ile Arg Glu Ser Pro Ile Lys 995 1000 <210> 77 <211> 1082 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG15-1 (D8A) nickase <400> 77 Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly Trp 1 5 10 15 Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu Gly 20 25 30 Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly Ala 35 40 45 Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val Ile 50 55 60 Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys Lys 65 70 75 80 His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val Pro 85 90 95 Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu Lys 100 105 110 Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys His 115 120 125 Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp Glu 130 135 140 Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys Asn 145 150 155 160 Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg Lys 165 170 175 Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg Ala 180 185 190 Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn Leu 195 200 205 Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile Leu 210 215 220 Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser Pro 225 230 235 240 Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu Glu 245 250 255 Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met Ala 260 265 270 Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg Gly 275 280 285 Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp Leu 290 295 300 Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val Leu 305 310 315 320 Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu Lys 325 330 335 Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu Lys 340 345 350 Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala Leu 355 360 365 Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln Leu 370 375 380 Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr Ile 385 390 395 400 Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu Ala 405 410 415 Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser Leu 420 425 430 Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val Tyr 435 440 445 Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser Leu 450 455 460 Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile Ser 465 470 475 480 Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn Pro 485 490 495 Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe Arg 500 505 510 Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys Asn 515 520 525 Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg Pro 530 535 540 Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn Gly 545 550 555 560 Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu Lys 565 570 575 Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg Ser 580 585 590 Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu Asn 595 600 605 Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala Pro 610 615 620 Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg Asn 625 630 635 640 Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr Thr 645 650 655 Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile Ser 660 665 670 Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys Gly 675 680 685 Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val Thr 690 695 700 Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn Gly 705 710 715 720 Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr Gln 725 730 735 Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu Trp 740 745 750 Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys Lys Asn 755 760 765 Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn Phe Arg Tyr 770 775 780 Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp Ile Pro Glu Thr 785 790 795 800 Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val Ser His Met Pro Asn 805 810 815 Arg Lys Ile His Gly Pro Ala His Lys Glu Thr Ile Arg Ser Gly Arg 820 825 830 Leu Lys Glu Glu Gly Tyr Thr Ile Ser Lys Thr Ala Leu Ile Asp Leu 835 840 845 Lys Leu Thr Glu Asp Lys Glu Glu Ile Lys Gly Tyr Tyr Asn Lys Glu 850 855 860 Ser Asp Arg Leu Leu Tyr Glu Ala Leu Lys Lys Gln Leu Gln Arg Tyr 865 870 875 880 Gly Gly Lys Ala Lys Glu Ala Phe Lys Glu Pro Phe His Lys Pro Lys 885 890 895 Ala Asp Gly Thr Pro Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu 900 905 910 Lys Ser Thr Met Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser 915 920 925 Asn Gly Asn Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly 930 935 940 Lys Lys Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys 945 950 955 960 Glu Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala 965 970 975 Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro Asn 980 985 990 Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys Ala Ala 995 1000 1005 Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser Arg Phe 1010 1015 1020 Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser Ile Ser 1025 1030 1035 Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val Gly Ile 1040 1045 1050 Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val Leu Gly 1055 1060 1065 Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe Arg 1070 1075 1080 <210> 78 <211> 1348 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: nickase <220> <223> Description: nMG18-1 (D12A) nickase <400> 78 Met Asp Gln Ser Lys Glu Tyr Tyr Ile Gly Leu Ala Gly Gly Thr Asp 1 5 10 15 Ser Val Gly Trp Ala Val Leu Asn Pro Asp Tyr Thr Val Val Lys Lys 20 25 30 Arg Gly Lys Ser Leu Trp Gly Val Arg Leu Phe Glu Ser Gly Gln Thr 35 40 45 Ala Ala Glu Arg Arg Leu Ala Arg Ser Ala Arg Arg Arg Thr Asp Arg 50 55 60 Lys Lys Trp Arg Leu Lys Leu Leu Lys Glu Leu Phe Ala Glu Glu Val 65 70 75 80 Ala Ala Cys Asp Pro Ala Phe Phe Ala Arg Leu Ala Glu Ser Arg Tyr 85 90 95 Trp Glu Asp Asp Lys Lys Val Asp Gly Ala Asp Thr Leu Phe His Asp 100 105 110 Ala Asp Phe Thr Asp Lys Asp Tyr His Arg Gln Phe Pro Thr Ile Tyr 115 120 125 His Leu Arg Arg His Leu Met Cys Cys Thr Glu Lys Pro Asp Ile Arg 130 135 140 Leu Leu Tyr Leu Ala Val Ala His Met Ile Lys Asn Arg Gly His Phe 145 150 155 160 Leu Asn Glu Gly Gln Asp Leu Asn Gln Val Arg Arg Phe Asp Asp Val 165 170 175 Trp Gln Asn Leu Cys Ala Ala Val Ser Asp Val Leu Gly Ile Glu Leu 180 185 190 Ala Val Glu Asn Gly Ala Lys Ala Ala Glu Val Leu Thr Ser Ser Val 195 200 205 Lys Ile Lys Glu Lys Thr Lys Gln Leu Glu Ser Val Leu Gly Glu Gly 210 215 220 Glu Ser Glu Ala Asp Arg Ser Val Cys Lys Ala Leu Ala Gly Leu Leu 225 230 235 240 Ala Gly Ala Lys Val Ser Ala Val Asp Leu Phe Asn Gly Asp Glu Ala 245 250 255 Leu Lys Glu Cys Gly Lys Phe Ser Leu Ala Glu Lys Ser Ile Glu Glu 260 265 270 Leu Glu Pro Asp Leu Gly Asp Ala Leu Gly Glu Glu Arg Phe Ser Leu 275 280 285 Leu Gln Tyr Ala Tyr Ala Ala Tyr Asn Trp Ala Val Phe Ala Arg Leu 290 295 300 Leu Pro Glu Gly Lys Thr Ile Ser Glu Val Lys Thr Glu Glu Tyr Glu 305 310 315 320 Ala Tyr Lys Ala Asp Leu Arg Ala Leu Lys Gln Leu Val Lys Gln Tyr 325 330 335 Ala Ser Asp Gln Tyr Tyr Arg Val Phe Arg Ser Ala Lys Ile Lys Gly 340 345 350 Asn Tyr Ala Ser Tyr Val Gly Lys Thr Asn Cys Gly Asn Glu Lys Ser 355 360 365 Asn Pro Glu Ser Cys Lys Pro Glu Glu Phe Phe Ala Phe Leu Lys Lys 370 375 380 Glu Leu Lys Pro Leu Trp Ser Gln Asn Ile Pro Ala Ala Ala Ser Leu 385 390 395 400 Ala Ala Lys Leu Glu Ser Gly Thr Leu Leu Arg Arg Gln Arg Ser Gly 405 410 415 Glu Asn Ala Ala Ile Pro Tyr Gln Ala His Leu Gln Glu Leu Gln Ile 420 425 430 Ile Leu Lys Asn Met Gln Gln Phe Tyr Pro Phe Leu Gln Lys Ala Asp 435 440 445 Glu Asn Gly Phe Thr Pro Ala Tyr Lys Ile Glu Lys Leu Leu Thr Phe 450 455 460 Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Asp Ala His Lys Glu Lys 465 470 475 480 Gly Phe Cys Trp Ile Val Lys Lys Ala Asp Val Pro Val Leu Pro Trp 485 490 495 Asn Phe Asp Gln Val Val Asp Glu Asn Ala Cys Glu Asp Ala Phe Ile 500 505 510 Gly Arg Met Ser Ala Thr Cys Thr Tyr Leu Val Gly Glu Asn Val Leu 515 520 525 Pro Gln Asn Ser Pro Leu Tyr Cys Arg Phe Met Val Leu Asn Glu Leu 530 535 540 Asn Asn Leu Arg Ile Arg Ser Glu Lys Ile Thr Pro Ala Leu Lys Gln 545 550 555 560 Ala Ile Phe Thr Gln Leu Phe Cys Ala Gly Lys Gly Gly Lys Val Thr 565 570 575 Gln Lys Lys Leu Leu Asp Phe Leu His Ser Gln Gly Ile Asp Ala Asn 580 585 590 Lys Gln Asp Ile Ser Gly Ile Asp Gly Asp Phe Lys Ala Ser Met Ala 595 600 605 Pro Ala Val Lys Leu Gln Ser Ile Phe Thr Glu Pro Leu Pro Pro Glu 610 615 620 Ile Leu Glu Arg Leu Ala Phe Ala Leu Thr Val Ser Gly Glu Ser His 625 630 635 640 Lys Met Leu Gln Asn Arg Ile Arg Ala Ile Leu Pro Asn Ala Asp Asn 645 650 655 Ala Val Ile Arg Lys Val Cys Ala Leu Lys Phe Thr Gly Trp Gly Arg 660 665 670 Leu Ser Gln Lys Leu Leu Thr Glu Ile Tyr Asp Val Asp Gln Thr Thr 675 680 685 Gly Glu Cys Arg Ser Leu Met Asp Leu Leu Trp Ser Thr Asn Asn Asn 690 695 700 Leu Met Gln Leu Leu Ser Gly Asp Phe Thr Phe Ala Ala Gly Ile Asp 705 710 715 720 Ala Tyr Asn Ala Ala Gln Asn Gly Thr Glu Asn Ile Phe Asp Tyr Asp 725 730 735 His Leu Val Lys Asp Leu Tyr Val Ser Pro Ser Val Lys Arg Gly Leu 740 745 750 Trp Gln Thr Leu Leu Leu Val Lys Glu Val Arg Lys Ile Met Gly Cys 755 760 765 Asp Pro Ala Arg Val Phe Ile Glu Met Ala Arg Gly Val Ser Pro Glu 770 775 780 Gln Lys Asn Lys Arg Thr Val Ser Arg Lys Asp Gln Leu Leu Ala Leu 785 790 795 800 Tyr Lys Ala Cys Lys Glu Asp Ala Arg Asp Trp Cys Gly Glu Leu Glu 805 810 815 Ala Leu Pro Glu Asp Lys Leu Arg Ser Asp Lys Leu Tyr Leu Tyr Tyr 820 825 830 Thr Gln Met Gly Arg Cys Met Tyr Ser Gly Glu Pro Ile Arg Leu Asp 835 840 845 Asp Leu Met His Asp Thr Ala Asn Gln Leu Tyr Asp Ile Asp His Ile 850 855 860 Tyr Pro Gln Ser Lys Thr Lys Asp Asp Ser Leu Thr Asn Arg Val Leu 865 870 875 880 Val Lys Arg Gln Leu Asn Ala Ile Lys Ser Asn Asp Tyr Pro Leu Pro 885 890 895 Gln Thr Met Arg Gln Thr Ala Leu Trp Lys Ala Leu Leu Glu Lys Gly 900 905 910 Leu Ile Ser Lys Gln Lys Tyr Leu Arg Leu Thr Arg Thr Thr Pro Phe 915 920 925 Thr Glu Glu Glu Leu Ala Gly Phe Ile Asn Arg Gln Leu Val Glu Thr 930 935 940 Arg Gln Ser Thr Lys Ala Ala Ala His Leu Leu Glu Gln Leu Leu Pro 945 950 955 960 Asn Thr Glu Val Val Tyr Val Lys Ala Gly Leu Ala Ala Asp Phe Arg 965 970 975 Gln Glu Phe Gly Phe Val Lys Cys Arg Asp Ala Asn Asp Phe His His 980 985 990 Ala Lys Asp Ala Tyr Leu Asn Ala Val Val Gly Asn Val Tyr His Glu 995 1000 1005 Lys Phe Thr Lys Asn Pro Leu Arg Phe Val Arg Ser Gly Gln Glu 1010 1015 1020 Tyr Ser Leu Asn Leu Ser Ala Leu Phe Gln Asn Trp Asn Ile Tyr 1025 1030 1035 Lys Gly Gly Arg Val Ile Trp Gln Lys Gly Glu Asp Gly Ser Leu 1040 1045 1050 Glu Thr Val Arg Ala Arg Met Ala Lys Asn Asp Pro Met Val Thr 1055 1060 1065 Arg Tyr Cys Thr Glu Gly Arg Gly Ala Leu Tyr Asp Leu Gln Pro 1070 1075 1080 Met Lys Lys Ser Lys Gly Gln Leu Pro Leu Lys Ser Ser Asp Glu 1085 1090 1095 Arg Leu Gln His Ile Asp Arg Tyr Gly Gly Tyr Asn Lys Leu Ala 1100 1105 1110 Gly Ala Tyr Phe Thr Leu Ala Ala Tyr Tyr Lys Lys Gly Lys Arg 1115 1120 1125 Val Lys Ser Ile Glu Ser Val Pro Leu Tyr Leu Ala Ala Lys Leu 1130 1135 1140 Gln Arg Asp Pro Ala Ala Leu Gln Gln Tyr Leu Ala Asp Gln Leu 1145 1150 1155 Gly Thr Asp Arg Val Glu Ile Leu Val Pro Glu Ile Lys Leu Gly 1160 1165 1170 Thr Leu Phe Lys Trp Asn Gly Tyr Pro Met Thr Leu Ser Gly Arg 1175 1180 1185 Thr Gly Pro Gln Leu Leu Phe Arg Asn Ala Ala Glu Leu Arg Thr 1190 1195 1200 Asn Ala Glu Gln Glu Gln Tyr Ile Lys Lys Met Ser Arg Tyr Leu 1205 1210 1215 Glu Lys Cys Lys Gly Arg Lys Glu Pro Leu Pro Ile Arg Pro Ala 1220 1225 1230 Tyr Asp Lys Leu Thr Pro Glu Glu Asn Leu Gln Leu Tyr Asp Ala 1235 1240 1245 Phe Thr Gln Trp Leu Thr Ser Gly Ile Tyr Ala Lys Arg Leu Ser 1250 1255 1260 Leu Gln Gly Lys Phe Leu Leu Glu Lys Arg Asp Ala Phe Ala Ala 1265 1270 1275 Leu Ser Pro Glu Ala Gln Val Arg Gln Leu Met Glu Ile Leu His 1280 1285 1290 Leu Phe Gln Cys Asn Pro Val Ala Ala Asn Leu Ser Glu Leu Gly 1295 1300 1305 Gly Ala Ala His Ala Gly Ile Leu Leu Ala Ser Lys Asn Ile Asp 1310 1315 1320 Gly Lys Val Pro Val Ser Ile Val His Gln Ser Val Thr Gly Tyr 1325 1330 1335 Phe Thr Gln Glu Val Cys Leu Asn Asp Leu 1340 1345 <210> 79 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG1-4 (D9A) protospacer and PAM for in vitro nickase assay <400> 79 ccgtgagcca ccacgtcgca agcctcgacc aggaagg 37 <210> 80 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG1-6 (D13A) protospacer and PAM for in vitro nickase assay <400> 80 tccgtgagcc accacgtcgc aagcctcgac tagaacgg 38 <210> 81 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG3-6 (D13A) protospacer and PAM for in vitro nickase assay <400> 81 agccaccacg tcgcaagcct cgacgtgggt ta 32 <210> 82 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG3-7 (D12A) protospacer and PAM for in vitro nickase assay <400> 82 agccaccacg tcgcaagcct cgacgtgtta c 31 <210> 83 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG3-8 (D13A) protospacer and PAM for in vitro nickase assay <400> 83 agccaccacg tcgcaagcct cgacgtgggt ta 32 <210> 84 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG4-5 (D17A) protospacer and PAM for in vitro nickase assay <400> 84 agccaccacg tcgcaagcct cgacggcca 29 <210> 85 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG14-1 (D23A) protospacer and PAM for in vitro nickase assay <400> 85 tccgtgagcc accacgtcgc aagcctcgac ggcggggacg 40 <210> 86 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG15-1 (D8A) protospacer and PAM for in vitro nickase assay <400> 86 ccgtgagcca ccacgtcgca agcctcgact ggacctg 37 <210> 87 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: target sequence <220> <223> Description: nMG18-1 (D12A) protospacer and PAM for in vitro nickase assay <400> 87 agccaccacg tcgcaagcct cgaccgtaat tg 32 <210> 88 <211> 121 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG1-4 (D9A) single guide RNA for in vitro nickase assay <400> 88 ccaccacgtc gcaagcctcg acgttttgat ttactcgaaa gagtccaatc ataattgacc 60 ggagaataat tgattcctct acaatgtacg aataaattca ttctctaaac cttaaaaatt 120 t 121 <210> 89 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG1-6 (D13A) single guide RNA for in vitro nickase assay <400> 89 ccaccacgtc gcaagcctcg acgttttgac ttgaaaaagt cttaactgat tttgccgaat 60 ttcaagctct gcattgcacc ttggcattcg gcatatttt 99 <210> 90 <211> 110 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG3-6 (D13A) single guide RNA for in vitro nickase assay <400> 90 ccaccacgtc gcaagcctcg acgttgagaa tcgaaagatt cttaataagg catccttccg 60 atgctgactt ctcaccgtcc gttttccaat aggagcgggc ggtatgtttt 110 <210> 91 <211> 113 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG3-7 (D12A) single guide RNA for in vitro nickase assay <400> 91 ccaccacgtc gcaagcctcg acgttgggaa ccgaaaggtt cccaataagg cgcatcttgg 60 cgctgacttc tcaccgtcct cttgctgctt agcagagggc ggtatgtttt ttt 113 <210> 92 <211> 118 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG3-8 (D13A) single guide RNA for in vitro nickase assay <400> 92 ccaccacgtc gcaagcctcg acgttgagaa tctttcgaaa gaaagattct taataaggca 60 tccttccgat gctgacttct caccgtccgg ctcctcttag gaacgggcgg tatgtttt 118 <210> 93 <211> 124 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG4-5 (D17A) single guide RNA for in vitro nickase assay <400> 93 ccaccacgtc gcaagcctcg acgctgtggc ttgcggggga aaccccttgt cacagtaagg 60 gactttcgtt cgcgaaaggc aacctcgcca gcatcgctgg gcgaggacca gggcaaggcg 120 attt 124 <210> 94 <211> 118 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG14-1 (D23A) single guide RNA for in vitro nickase assay <400> 94 ccaccacgtc gcaagcctcg acgtcttgag cgaaagctcc agacaagggg agccacttaa 60 gtggcttacc cgtaaagtaa cccccgttca atcttcggat tgggcggggc gaactttt 118 <210> 95 <211> 118 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG15-1 (D8A) single guide RNA for in vitro nickase assay <400> 95 ccaccacgtc gcaagcctcg acgttgtaat tccctagaaa taggttatta caataaggtc 60 caacaggagt gttggtaccg taaagctcta acggcaccca cgggtgccgt tatctttt 118 <210> 96 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: single guide RNA <220> <223> Description: nMG18-1 (D12A) single guide RNA for in vitro nickase assay <400> 96 ccaccacgtc gcaagcctcg acgtttgaga gtagtgaaaa ctacgagttc aaatacaatt 60 ttttcaaatt gccctatagg gccctcacag tgtgagattt t 101 <210> 97 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA1-4 sgRNA spacer 1 (targeting E. coli lacZ) <400> 97 cgtttgccgt ctgaatttga cc 22 <210> 98 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA1-4 sgRNA spacer 2 (targeting E. coli lacZ) <400> 98 gaagatcagg atatgtggcg ga 22 <210> 99 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA1-4 sgRNA spacer 3 (targeting E. coli lacZ) <400> 99 acgggtaaca gtttctttat gg 22 <210> 100 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA1-6 sgRNA spacer 1 (targeting E. coli lacZ) <400> 100 cgttgctgca taaaccgact ac 22 <210> 101 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA1-6 sgRNA spacer 2 (targeting E. coli lacZ) <400> 101 aaaacccgaa actgtggagc gc 22 <210> 102 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA1-6 sgRNA spacer 3 (targeting E. coli lacZ) <400> 102 gattgaaaat ggtctgctgc tg 22 <210> 103 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-6 sgRNA spacer 1 (targeting E. coli lacZ) <400> 103 tacgggtaac agtttcttta tg 22 <210> 104 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-6 sgRNA spacer 2 (targeting E. coli lacZ) <400> 104 gcgttggcaa tttaaccgcc ag 22 <210> 105 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-6 sgRNA spacer 3 (targeting E. coli lacZ) <400> 105 ctgaatatcg acggtttcca ta 22 <210> 106 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-7 sgRNA spacer 1 (targeting E. coli lacZ) <400> 106 cacatttaat gttgatgaaa gc 22 <210> 107 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-7 sgRNA spacer 2 (targeting E. coli lacZ) <400> 107 acacaaatca gcgatttcca tg 22 <210> 108 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-7 sgRNA spacer 3 (targeting E. coli lacZ) <400> 108 atggatgagc agacgatggt gc 22 <210> 109 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-8 sgRNA spacer 1 (targeting E. coli lacZ) <400> 109 ttcatctgtg gtgcaacggg cg 22 <210> 110 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-8 sgRNA spacer 2 (targeting E. coli lacZ) <400> 110 acgagcatca tcctctgcat gg 22 <210> 111 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA3-8 sgRNA spacer 3 (targeting E. coli lacZ) <400> 111 cgacccgcat tgaccctaac gc 22 <210> 112 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA4-5 sgRNA spacer 1 (targeting E. coli lacZ) <400> 112 cacaaatcag cgatttccat gt 22 <210> 113 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA4-5 sgRNA spacer 2 (targeting E. coli lacZ) <400> 113 tgatgaagca gaacaacttt aa 22 <210> 114 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA4-5 sgRNA spacer 3 (targeting E. coli lacZ) <400> 114 aatattgaaa cccacggcat gg 22 <210> 115 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA14-1 sgRNA spacer 1 (targeting E. coli lacZ) <400> 115 tcaaaaaatg gctttcgcta cc 22 <210> 116 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA14-1 sgRNA spacer 2 (targeting E. coli lacZ) <400> 116 aagcagcgtt gttgcagtgc ac 22 <210> 117 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA14-1 sgRNA spacer 3 (targeting E. coli lacZ) <400> 117 tcagccggaa aacctaccgg at 22 <210> 118 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA15-1 sgRNA spacer 1 (targeting E. coli lacZ) <400> 118 gaagatcagg atatgtggcg ga 22 <210> 119 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA15-1 sgRNA spacer 2 (targeting E. coli lacZ) <400> 119 aacgtcgaaa acccgaaact gt 22 <210> 120 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA15-1 sgRNA spacer 3 (targeting E. coli lacZ) <400> 120 aaacccacgg catggtgcca at 22 <210> 121 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA18-1 sgRNA spacer 1 (targeting E. coli lacZ) <400> 121 aaaacccgaa actgtggagc gc 22 <210> 122 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA18-1 sgRNA spacer 2 (targeting E. coli lacZ) <400> 122 ggcaactctg gctcacagta cg 22 <210> 123 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGA18-1 sgRNA spacer 3 (targeting E. coli lacZ) <400> 123 ccggaaaacc taccggattg at 22 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: ABE8.17m sgRNA spacer 1 (targeting E. coli lacZ) <400> 124 tttctttcac agatgtggat 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: ABE8.17m sgRNA spacer 2 (targeting E. coli lacZ) <400> 125 caggatatgt ggcggatgag 20 <210> 126 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: ABE8.17m sgRNA spacer 3 (targeting E. coli lacZ) <400> 126 tgcgaatacg cccacgcgat 20 <210> 127 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC1-4 sgRNA spacer 1 (targeting E. coli lacZ) <400> 127 cggcgtttca tctgtggtgc aa 22 <210> 128 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC1-4 sgRNA spacer 2 (targeting E. coli lacZ) <400> 128 gccaggacag tcgtttgccg tc 22 <210> 129 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC1-4 sgRNA spacer 3 (targeting E. coli lacZ) <400> 129 tcagccgcgc tgtactggag gc 22 <210> 130 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC1-6 sgRNA spacer 1 (targeting E. coli lacZ) <400> 130 cccttcccaa cagttgcgca gc 22 <210> 131 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC1-6 sgRNA spacer 2 (targeting E. coli lacZ) <400> 131 ctgtcgtcgt cccctcaaac tg 22 <210> 132 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC1-6 sgRNA spacer 3 (targeting E. coli lacZ) <400> 132 ctacgtctga acgtcgaaaa cc 22 <210> 133 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-6 sgRNA spacer 1 (targeting E. coli lacZ) <400> 133 gtgacggcag ttatctggaa ga 22 <210> 134 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-6 sgRNA spacer 2 (targeting E. coli lacZ) <400> 134 atgatttcag ccgcgctgta ct 22 <210> 135 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-6 sgRNA spacer 3 (targeting E. coli lacZ) <400> 135 ttactgccgc ctgttttgac cg 22 <210> 136 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-7 sgRNA spacer 1 (targeting E. coli lacZ) <400> 136 cgaatggcgc tttgcctggt tt 22 <210> 137 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-7 sgRNA spacer 2 (targeting E. coli lacZ) <400> 137 tcccctcaaa ctggcagatg ca 22 <210> 138 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-7 sgRNA spacer 3 (targeting E. coli lacZ) <400> 138 atctacacca acgtgaccta tc 22 <210> 139 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-8 sgRNA spacer 1 (targeting E. coli lacZ) <400> 139 ttcatctgtg gtgcaacggg cg 22 <210> 140 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-8 sgRNA spacer 2 (targeting E. coli lacZ) <400> 140 acgagcatca tcctctgcat gg 22 <210> 141 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC3-8 sgRNA spacer 3 (targeting E. coli lacZ) <400> 141 cgacccgcat tgaccctaac gc 22 <210> 142 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC4-5 sgRNA spacer 1 (targeting E. coli lacZ) <400> 142 caacgggcgc tgggtcggtt ac 22 <210> 143 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC4-5 sgRNA spacer 2 (targeting E. coli lacZ) <400> 143 cacaaatcag cgatttccat gt 22 <210> 144 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC4-5 sgRNA spacer 3 (targeting E. coli lacZ) <400> 144 aaggcggcgg agccgacacc ac 22 <210> 145 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC14-1 sgRNA spacer 1 (targeting E. coli lacZ) <400> 145 cggtcaatcc gccgtttgtt cc 22 <210> 146 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC14-1 sgRNA spacer 2 (targeting E. coli lacZ) <400> 146 tcctttgcga atacgcccac gc 22 <210> 147 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC14-1 sgRNA spacer 3 (targeting E. coli lacZ) <400> 147 ggtcggctta cggcggtgat tt 22 <210> 148 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC15-1 sgRNA spacer 1 (targeting E. coli lacZ) <400> 148 gccgatcgcg tcacactacg tc 22 <210> 149 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC15-1 sgRNA spacer 2 (targeting E. coli lacZ) <400> 149 gatccgcgct ggctaccggc ga 22 <210> 150 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC15-1 sgRNA spacer 3 (targeting E. coli lacZ) <400> 150 ccttcccgcc cggtgcagta tg 22 <210> 151 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC18-1 sgRNA spacer 1 (targeting E. coli lacZ) <400> 151 tcagccgcgc tgtactggag gc 22 <210> 152 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC18-1 sgRNA spacer 2 (targeting E. coli lacZ) <400> 152 gaccagccct tcccggctgt gc 22 <210> 153 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: MGC18-1 sgRNA spacer 3 (targeting E. coli lacZ) <400> 153 tccgtttatc cgggcaaacc at 22 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: BE3 sgRNA spacer 1 (targeting E. coli lacZ) <400> 154 cctctggatg tcgctccaca 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: BE3 sgRNA spacer 2 (targeting E. coli lacZ) <400> 155 gggacgcgcg aattgaatta 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: BE3 sgRNA spacer 3 (targeting E. coli lacZ) <400> 156 cgttttacaa cgtcgtgact 20 <210> 157 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG1-4 (D9A) <400> 157 tgaaaaagaa agttttcgca tttgcgcttg gtaaagcaag 40 <210> 158 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG1-4 (D9A) <400> 158 tggtatatct ccttcttaaa gttaaac 27 <210> 159 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG1-6 (D13A) <400> 159 accatgtttg gggctttgcg attggcaaag ggtct 35 <210> 160 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG1-6 (D13A) <400> 160 tgttcttttc tttctccatg gtata 25 <210> 161 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG3-6 (D13A) <400> 161 attatcgcat tggcgtggcg gtcggggatc gcagc 35 <210> 162 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG3-6 (D13A) <400> 162 tcttcatatc ggttgacatg g 21 <210> 163 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG3-7 (D12A) <400> 163 agtaccgcat tggcatcgcg gtgggcgatc gctcg 35 <210> 164 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG3-7 (D12A) <400> 164 tagtatgttc gctcatggta ta 22 <210> 165 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG3-8 (D13A) <400> 165 attaccgcat tggcgtggcg gtaggtgatc gtagt 35 <210> 166 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG3-8 (D13A) <400> 166 tcttcatatc agtgctcatg g 21 <210> 167 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG4-5 (D17A) <400> 167 gctactgctt gggcctggcg gtaggtgtgc aagga 35 <210> 168 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG4-5 (D17A) <400> 168 tggtcgcctg cagggtct 18 <210> 169 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG14-1 (D23A) <400> 169 acctggttct gggtatggcg ccgggcatcg cctca 35 <210> 170 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG14-1 (D23A) <400> 170 ggcgaggcaa gcctaatt 18 <210> 171 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG15-1 (D8A) <400> 171 actatgtgct cggcctggcg gtcggtattg cttca 35 <210> 172 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG15-1 (D8A) <400> 172 tcatggtata tctccttctt aaagt 25 <210> 173 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG18-1 (D12A) <400> 173 taaagagtac tacattggtc tggcgggtgg tacggactcg 40 <210> 174 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of MG18-1 (D12A) <400> 174 ctctggtcca tggtatatct c 21 <210> 175 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of SpCas9 (D10A) <400> 175 gataagaaat actcaatagg actggcgatt ggcacaaata gc 42 <210> 176 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Site-directed mutagenesis of SpCas9 (D10A) <400> 176 catggtatat ctccttctta aagtt 25 <210> 177 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: For lacZ sequencing <400> 177 ccaggcttta cactttatgc t 21 <210> 178 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: For lacZ sequencing <400> 178 gtatgtggtg gatgaagcc 19 <210> 179 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify the fragment for nickase assay <400> 179 agcttccagg gggaaacg 18 <210> 180 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify the fragment for nickase assay <400> 180 attaacctat aaaaataggc gtatca 26 <210> 181 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify T7 promoter-His tag-adenine deaminase for MGA entry plasmid <400> 181 gatataccat gggcagcagt catcatcatc accatcactc cgaggttgaa tttagtcatg 60 <210> 182 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify T7 promoter-His tag-adenine deaminase for MGA entry plasmid <400> 182 agactttcct cttcttcttg ggagacccgc cagagcctcg aggacccacc agagctgcct 60 <210> 183 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify SV40 NLS-vector backbone for MGA entry plasmid <400> 183 tctggcgggt ctcccaagaa gaagaggaaa gtctaagatc cggctgctaa caaag 55 <210> 184 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify SV40 NLS-vector backbone for MGA entry plasmid <400> 184 ctccttgcat gctctagaat taattaaacc attccttgcg gcggc 45 <210> 185 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify vector backbone for MGA entry plasmid <400> 185 aggaatggtt taattaattc tagagcatgc aaggagatgg cgcccaac 48 <210> 186 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify vector backbone for MGA entry plasmid <400> 186 gtgatggtga tgatgatgac tgctgcccat ggtatatctc cttcttaaag ttaaac 56 <210> 187 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify T7 promoter-His-tag-cytosine deaminase for MGC entry plasmid <400> 187 aggagatata ccatgggcag cagtcatcat catcaccatc acatgtcgtc tgagaccggg 60 <210> 188 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify T7 promoter-His-tag-cytosine deaminase for MGC entry plasmid <400> 188 taatatctga aagattggta gaaccaccag acccgcggca gattcaggtg tcgcactttc 60 <210> 189 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify UGI-SV40 NLS for MGC entry plasmid <400> 189 cgacacctga atctgccgcg ggtctggtgg ttctaccaat cttt 44 <210> 190 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify UGI-SV40 NLS for MGC entry plasmid <400> 190 ttagactttc ctcttcttct tgggagaacc accagaaagc attttgatct tgttttcgcc 60 <210> 191 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify SV40 NLS-vector backbone for MGC entry plasmid <400> 191 ctggtggttc tcccaagaag aagaggaaag tctaagatcc ggctgctaac aaag 54 <210> 192 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify SV40 NLS-vector backbone for MGC entry plasmid <400> 192 ctccttgcat gctctagaat taattaacca ttccttgcgg cggcg 45 <210> 193 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify vector backbone for MGC entry plasmid <400> 193 aggaatggtt aattaattct agagcatgca aggagatggc gcccaaca 48 <210> 194 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify vector backbone for MGC entry plasmid <400> 194 gtgatgatga tgactgctgc ccatggtata tctccttctt aaagttaaac 50 <210> 195 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG1-4 (D9A) for pMGA expression plasmid <400> 195 aaagtagtgg aggcagctct ggtgggtcca tgaaaaagaa agttttcgca tttgc 55 <210> 196 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG1-4 (D9A) for pMGA expression plasmid <400> 196 ctcttcttct tgggagaccc gccagagcct ttgctttcga cttttttaaa ttcgg 55 <210> 197 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG1-6 (D13A) for pMGA expression plasmid <400> 197 gaaagtagtg gaggcagctc tggtgggtcc atggagaaag aaaagaacaa ccat 54 <210> 198 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG1-6 (D13A) for pMGA expression plasmid <400> 198 cctcttcttc ttgggagacc cgccagagcc cagttcactt aactcgacgc 50 <210> 199 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-6 (D13A) for pMGA expression plasmid <400> 199 gaaagtagtg gaggcagctc tggtgggtcc atgtcaaccg atatgaagaa ttatc 55 <210> 200 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-6 (D13A) for pMGA expression plasmid <400> 200 cctcttcttc ttgggagacc cgccagagcc cccctctact ccaagcgc 48 <210> 201 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-7 (D12A) for pMGA expression plasmid <400> 201 gaaagtagtg gaggcagctc tggtgggtcc atgagcgaac atactaagta cc 52 <210> 202 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-7 (D12A) for pMGA expression plasmid <400> 202 cctcttcttc ttgggagacc cgccagagcc ttcttgttca tcaagggctg 50 <210> 203 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-8 (D13A) for pMGA expression plasmid <400> 203 gaaagtagtg gaggcagctc tggtgggtcc atgagcactg atatgaagaa ttac 54 <210> 204 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-8 (D13A) for pMGA expression plasmid <400> 204 cctcttcttc ttgggagacc cgccagagcc accctcgacg cctaacgc 48 <210> 205 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG4-5 (D17A) for pMGA expression plasmid <400> 205 gaaagtagtg gaggcagctc tggtgggtcc atgggagatc agcagacc 48 <210> 206 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG4-5 (D17A) for pMGA expression plasmid <400> 206 cctcttcttc ttgggagacc cgccagagcc atcgttcgcg ggaaacac 48 <210> 207 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG14-1 (D23A) for pMGA expression plasmid <400> 207 gaaagtagtg gaggcagctc tggtgggtcc atggaaatta caattaaccg tgaga 55 <210> 208 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG14-1 (D23A) for pMGA expression plasmid <400> 208 cctcttcttc ttgggagacc cgccagagcc cttaatcggg ctctcacg 48 <210> 209 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG15-1 (D8A) for pMGA expression plasmid <400> 209 gaaagtagtg gaggcagctc tggtgggtcc atgaactatg tgctcggcc 49 <210> 210 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG15-1 (D8A) for pMGA expression plasmid <400> 210 cctcttcttc ttgggagacc cgccagagcc acggaacgtt tggcgctt 48 <210> 211 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG18-1 (D12A) for pMGA expression plasmid <400> 211 gaaagtagtg gaggcagctc tggtgggtcc atggaccaga gtaaagagta ct 52 <210> 212 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG18-1 (D12A) for pMGA expression plasmid <400> 212 cctcttcttc ttgggagacc cgccagagcc cagatcattt aaacacacct cttg 54 <210> 213 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify SpCas9 (D10A) for pMGA expression plasmid <400> 213 gaaagtagtg gaggcagctc tggtgggtcc atggataaga aatactcaat aggac 55 <210> 214 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify SpCas9 (D10A) for pMGA expression plasmid <400> 214 cctcttcttc ttgggagacc cgccagagcc gtcacctccc agctgact 48 <210> 215 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG1-4 (D9A) for pMGC expression plasmid <400> 215 acatccgaaa gtgcgacacc tgaatctgcc atgaaaaaga aagttttcgc atttgc 56 <210> 216 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG1-4 (D9A) for pMGC expression plasmid <400> 216 atctgaaaga ttggtagaac caccagaccc tttgctttcg acttttttaa attcgg 56 <210> 217 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG1-6 (D13A) for pMGC expression plasmid <400> 217 acatccgaaa gtgcgacacc tgaatctgcc atggagaaag aaaagaacaa ccat 54 <210> 218 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG1-6 (D13A) for pMGC expression plasmid <400> 218 atctgaaaga ttggtagaac caccagaccc cagttcactt aactcgacgc 50 <210> 219 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-6 (D13A) for pMGC expression plasmid <400> 219 catccgaaag tgcgacacct gaatctgcca tgtcaaccga tatgaagaat tatc 54 <210> 220 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-6 (D13A) for pMGC expression plasmid <400> 220 atctgaaaga ttggtagaac caccagaccc cccctctact ccaagcgc 48 <210> 221 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-7 (D12A) for pMGC expression plasmid <400> 221 acatccgaaa gtgcgacacc tgaatctgcc atgagcgaac atactaagta cc 52 <210> 222 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-7 (D12A) for pMGC expression plasmid <400> 222 atctgaaaga ttggtagaac caccagaccc ttcttgttca tcaagggctg 50 <210> 223 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-8 (D13A) for pMGC expression plasmid <400> 223 acatccgaaa gtgcgacacc tgaatctgcc atgagcactg atatgaagaa ttac 54 <210> 224 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG3-8 (D13A) for pMGC expression plasmid <400> 224 atctgaaaga ttggtagaac caccagaccc accctcgacg cctaacgc 48 <210> 225 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG4-5 (D17A) for pMGC expression plasmid <400> 225 acatccgaaa gtgcgacacc tgaatctgcc atgggagatc agcagacc 48 <210> 226 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG4-5 (D17A) for pMGC expression plasmid <400> 226 atctgaaaga ttggtagaac caccagaccc atcgttcgcg ggaaacac 48 <210> 227 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG14-1 (D23A) for pMGC expression plasmid <400> 227 acatccgaaa gtgcgacacc tgaatctgcc atggaaatta caattaaccg tgag 54 <210> 228 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG14-1 (D23A) for pMGC expression plasmid <400> 228 atctgaaaga ttggtagaac caccagaccc cttaatcggg ctctcacga 49 <210> 229 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG15-1 (D8A) for pMGC expression plasmid <400> 229 acatccgaaa gtgcgacacc tgaatctgcc atgaactatg tgctcggcc 49 <210> 230 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG15-1 (D8A) for pMGC expression plasmid <400> 230 atctgaaaga ttggtagaac caccagaccc acggaacgtt tggcgctt 48 <210> 231 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG18-1 (D12A) for pMGC expression plasmid <400> 231 atccgaaagt gcgacacctg aatctgccat ggaccagagt aaagagtac 49 <210> 232 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify nMG18-1 (D12A) for pMGC expression plasmid <400> 232 tatctgaaag attggtagaa ccaccagacc ccagatcatt taaacacacc tcttg 55 <210> 233 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify SpCas9 (D10A) for pMGC expression plasmid <400> 233 acatccgaaa gtgcgacacc tgaatctgcc atggataaga aatactcaat aggac 55 <210> 234 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify SpCas9 (D10A) for pMGC expression plasmid <400> 234 atctgaaaga ttggtagaac caccagaccc gtcacctccc agctgact 48 <210> 235 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-4_sgRNA spacer 1 <400> 235 ggtcaaattc agacggcaaa cgctatagtg agtcgtatta aggt 44 <210> 236 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-4_sgRNA spacer 1 <400> 236 tatagcgttt gccgtctgaa tttgaccgtt ttgatttact cgaaagagtc 50 <210> 237 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-4_sgRNA spacer 2 <400> 237 caaaactccg ccacatatcc tgatcttcct atagtgagtc gtattaaggt 50 <210> 238 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-4_sgRNA spacer 2 <400> 238 tataggaaga tcaggatatg tggcggagtt ttgatttact cgaaagagtc 50 <210> 239 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-4_sgRNA spacer 3 <400> 239 caaaacccat aaagaaactg ttacccgtct atagtgagtc gtattaaggt 50 <210> 240 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-4_sgRNA spacer 3 <400> 240 tatagacggg taacagtttc tttatgggtt ttgatttact cgaaagagtc 50 <210> 241 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-6_sgRNA spacer 1 <400> 241 caaaacgtag tcggtttatg cagcaacgct atagtgagtc gtattaaggt 50 <210> 242 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-6_sgRNA spacer 1 <400> 242 tagcgttgct gcataaaccg actacgtttt gacttgaaaa agtcttaact 50 <210> 243 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-6_sgRNA spacer 2 <400> 243 caaaacgcgc tccacagttt cgggttttct atagtgagtc gtattaaggt 50 <210> 244 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-6_sgRNA spacer 2 <400> 244 tagaaaaccc gaaactgtgg agcgcgtttt gacttgaaaa agtcttaact 50 <210> 245 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-6_sgRNA spacer 3 <400> 245 caaaaccagc agcagaccat tttcaatcct atagtgagtc gtattaaggt 50 <210> 246 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA1-6_sgRNA spacer 3 <400> 246 taggattgaa aatggtctgc tgctggtttt gacttgaaaa agtcttaact 50 <210> 247 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-6_sgRNA spacer 1 <400> 247 ctcaaccata aagaaactgt tacccgtact atagtgagtc gtattaaggt 50 <210> 248 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-6_sgRNA spacer 1 <400> 248 atagtacggg taacagtttc tttatggttg agaatcgaaa gattcttaat 50 <210> 249 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-6_sgRNA spacer 2 <400> 249 ctcaacctgg cggttaaatt gccaacgcct atagtgagtc gtattaaggt 50 <210> 250 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-6_sgRNA spacer 2 <400> 250 taggcgttgg caatttaacc gccaggttga gaatcgaaag attcttaata 50 <210> 251 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-6_sgRNA spacer 3 <400> 251 ctcaactatg gaaaccgtcg atattcagct atagtgagtc gtattaaggt 50 <210> 252 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-6_sgRNA spacer 3 <400> 252 tagctgaata tcgacggttt ccatagttga gaatcgaaag attcttaata 50 <210> 253 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-7_sgRNA spacer 1 <400> 253 cccaacgctt tcatcaacat taaatgtgct atagtgagtc gtattaaggt 50 <210> 254 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-7_sgRNA spacer 1 <400> 254 tcactatagc acatttaatg ttgatgaaag cgttgggaac cgaaaggttc 50 <210> 255 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-7_sgRNA spacer 2 <400> 255 cccaaccatg gaaatcgctg atttgtgtct atagtgagtc gtattaaggt 50 <210> 256 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-7_sgRNA spacer 2 <400> 256 tcactataga cacaaatcag cgatttccat ggttgggaac cgaaaggttc 50 <210> 257 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-7_sgRNA spacer 3 <400> 257 cccaacgcac catcgtctgc tcatccatct atagtgagtc gtattaaggt 50 <210> 258 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-7_sgRNA spacer 3 <400> 258 tcactataga tggatgagca gacgatggtg cgttgggaac cgaaaggttc 50 <210> 259 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA4-5_sgRNA spacer 1 <400> 259 cacagcacat ggaaatcgct gatttgtgct atagtgagtc gtattaaggt 50 <210> 260 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA4-5_sgRNA spacer 1 <400> 260 cactatagca caaatcagcg atttccatgt gctgtggctt gcggggga 48 <210> 261 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA4-5_sgRNA spacer 2 <400> 261 cacagcttaa agttgttctg cttcatcact atagtgagtc gtattaaggt 50 <210> 262 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA4-5_sgRNA spacer 2 <400> 262 cactatagtg atgaagcaga acaactttaa gctgtggctt gcggggga 48 <210> 263 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA4-5_sgRNA spacer 3 <400> 263 cacagcccat gccgtgggtt tcaatattct atagtgagtc gtattaaggt 50 <210> 264 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA4-5_sgRNA spacer 3 <400> 264 cactatagaa tattgaaacc cacggcatgg gctgtggctt gcggggga 48 <210> 265 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA14-1_sgRNA spacer 1 <400> 265 caagacggta gcgaaagcca ttttttgact atagtgagtc gtattaaggt 50 <210> 266 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA14-1_sgRNA spacer 1 <400> 266 cactatagtc aaaaaatggc tttcgctacc gtcttgagcg aaagctcc 48 <210> 267 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA14-1_sgRNA spacer 2 <400> 267 caagacgtgc actgcaacaa cgctgcttct atagtgagtc gtattaaggt 50 <210> 268 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA14-1_sgRNA spacer 2 <400> 268 cactatagaa gcagcgttgt tgcagtgcac gtcttgagcg aaagctcc 48 <210> 269 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA14-1_sgRNA spacer 3 <400> 269 caagacatcc ggtaggtttt ccggctgact atagtgagtc gtattaaggt 50 <210> 270 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA14-1_sgRNA spacer 3 <400> 270 cactatagtc agccggaaaa cctaccggat gtcttgagcg aaagctcc 48 <210> 271 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA15-1_sgRNA spacer 1 <400> 271 tacaactccg ccacatatcc tgatcttcct atagtgagtc gtattaaggt 50 <210> 272 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA15-1_sgRNA spacer 1 <400> 272 tataggaaga tcaggatatg tggcggagtt gtaattccct agaaataggt 50 <210> 273 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA15-1_sgRNA spacer 2 <400> 273 tacaacacag tttcgggttt tcgacgttct atagtgagtc gtattaaggt 50 <210> 274 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA15-1_sgRNA spacer 2 <400> 274 tatagaacgt cgaaaacccg aaactgtgtt gtaattccct agaaataggt 50 <210> 275 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA15-1_sgRNA spacer 3 <400> 275 tacaacattg gcaccatgcc gtgggtttct atagtgagtc gtattaaggt 50 <210> 276 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA15-1_sgRNA spacer 3 <400> 276 tatagaaacc cacggcatgg tgccaatgtt gtaattccct agaaataggt 50 <210> 277 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA18-1_sgRNA spacer 1 <400> 277 tcaaacgcgc tccacagttt cgggttttct atagtgagtc gtattaaggt 50 <210> 278 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA18-1_sgRNA spacer 1 <400> 278 tatagaaaac ccgaaactgt ggagcgcgtt tgagagtagt gaaaactacg 50 <210> 279 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA18-1_sgRNA spacer 2 <400> 279 tcaaaccgta ctgtgagcca gagttgccct atagtgagtc gtattaaggt 50 <210> 280 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA18-1_sgRNA spacer 2 <400> 280 tatagggcaa ctctggctca cagtacggtt tgagagtagt gaaaactacg 50 <210> 281 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA18-1_sgRNA spacer 3 <400> 281 tcaaacatca atccggtagg ttttccggct atagtgagtc gtattaaggt 50 <210> 282 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA18-1_sgRNA spacer 3 <400> 282 tatagccgga aaacctaccg gattgatgtt tgagagtagt gaaaactacg 50 <210> 283 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify ABE8.17m_sgRNA spacer 1 <400> 283 atccacatct gtgaaagaaa ctatagtgag tcgtattagg a 41 <210> 284 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify ABE8.17m_sgRNA spacer 1 <400> 284 tttctttcac agatgtggat gttttagagc tagaaatagc aagtt 45 <210> 285 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify ABE8.17m_sgRNA spacer 2 <400> 285 ctcatccgcc acatatcctg ctatagtgag tcgtattagg a 41 <210> 286 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify ABE8.17m_sgRNA spacer 2 <400> 286 caggatatgt ggcggatgag gttttagagc tagaaatagc aagtt 45 <210> 287 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify ABE8.17m_sgRNA spacer 3 <400> 287 atcgcgtggg cgtattcgca ctatagtgag tcgtattagg a 41 <210> 288 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify ABE8.17m_sgRNA spacer 3 <400> 288 tgcgaatacg cccacgcgat gttttagagc tagaaatagc aagtt 45 <210> 289 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-4_spacer 1 <400> 289 caaaacttgc accacagatg aaacgccgct atagtgagtc gtattaaggt 50 <210> 290 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-4_spacer 1 <400> 290 tatagcggcg tttcatctgt ggtgcaagtt ttgatttact cgaaagagtc 50 <210> 291 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-4_spacer 2 <400> 291 caaaacgacg gcaaacgact gtcctggcct atagtgagtc gtattaaggt 50 <210> 292 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-4_spacer 2 <400> 292 tataggccag gacagtcgtt tgccgtcgtt ttgatttact cgaaagagtc 50 <210> 293 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-4_spacer 3 <400> 293 caaaacgcct ccagtacagc gcggctgact atagtgagtc gtattaaggt 50 <210> 294 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-4_spacer 3 <400> 294 tatagtcagc cgcgctgtac tggaggcgtt ttgatttact cgaaagagtc 50 <210> 295 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-6_spacer 1 <400> 295 caaaacgctg cgcaactgtt gggaagggct atagtgagtc gtattaaggt 50 <210> 296 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-6_spacer 1 <400> 296 tagcccttcc caacagttgc gcagcgtttt gacttgaaaa agtcttaact 50 <210> 297 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-6_spacer 2 <400> 297 caaaaccagt ttgaggggac gacgacagct atagtgagtc gtattaaggt 50 <210> 298 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-6_spacer 2 <400> 298 tagctgtcgt cgtcccctca aactggtttt gacttgaaaa agtcttaact 50 <210> 299 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-6_spacer 3 <400> 299 caaaacggtt ttcgacgttc agacgtagct atagtgagtc gtattaaggt 50 <210> 300 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC1-6_spacer 3 <400> 300 tagctacgtc tgaacgtcga aaaccgtttt gacttgaaaa agtcttaact 50 <210> 301 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-6_spacer 1 <400> 301 ctcaactctt ccagataact gccgtcacct atagtgagtc gtattaaggt 50 <210> 302 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-6_spacer 1 <400> 302 aggtgacggc agttatctgg aagagttgag aatcgaaaga ttcttaataa 50 <210> 303 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-6_spacer 2 <400> 303 tcaacagtac agcgcggctg aaatcatcta tagtgagtcg tattaaggtc 50 <210> 304 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-6_spacer 2 <400> 304 agatgatttc agccgcgctg tactgttgag aatcgaaaga ttcttaataa 50 <210> 305 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-6_spacer 3 <400> 305 ctcaaccggt caaaacaggc ggcagtaact atagtgagtc gtattaaggt 50 <210> 306 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-6_spacer 3 <400> 306 tagttactgc cgcctgtttt gaccggttga gaatcgaaag attcttaata 50 <210> 307 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-7_spacer 1 <400> 307 cccaacaaac caggcaaagc gccattcgct atagtgagtc gtattaaggt 50 <210> 308 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-7_spacer 1 <400> 308 cactatagcg aatggcgctt tgcctggttt gttgggaacc gaaaggttc 49 <210> 309 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-7_spacer 2 <400> 309 cccaactgca tctgccagtt tgaggggact atagtgagtc gtattaaggt 50 <210> 310 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-7_spacer 2 <400> 310 cactatagtc ccctcaaact ggcagatgca gttgggaacc gaaaggttc 49 <210> 311 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-7_spacer 3 <400> 311 cccaacgata ggtcacgttg gtgtagatct atagtgagtc gtattaaggt 50 <210> 312 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-7_spacer 3 <400> 312 cactatagat ctacaccaac gtgacctatc gttgggaacc gaaaggttc 49 <210> 313 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC4-5_spacer 1 <400> 313 cacagcgtaa ccgacccagc gcccgttgct atagtgagtc gtattaaggt 50 <210> 314 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC4-5_spacer 1 <400> 314 cactatagca acgggcgctg ggtcggttac gctgtggctt gcggggga 48 <210> 315 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC4-5_spacer 2 <400> 315 cacagcacat ggaaatcgct gatttgtgct atagtgagtc gtattaaggt 50 <210> 316 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC4-5_spacer 2 <400> 316 cactatagca caaatcagcg atttccatgt gctgtggctt gcggggga 48 <210> 317 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC4-5_spacer 3 <400> 317 cacagcgtgg tgtcggctcc gccgccttct atagtgagtc gtattaaggt 50 <210> 318 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC4-5_spacer 3 <400> 318 cactatagaa ggcggcggag ccgacaccac gctgtggctt gcggggga 48 <210> 319 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC14-1_spacer 1 <400> 319 caagacggaa caaacggcgg attgaccgct atagtgagtc gtattaaggt 50 <210> 320 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC14-1_spacer 1 <400> 320 cactatagcg gtcaatccgc cgtttgttcc gtcttgagcg aaagctcc 48 <210> 321 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC14-1_spacer 2 <400> 321 caagacgcgt gggcgtattc gcaaaggact atagtgagtc gtattaaggt 50 <210> 322 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC14-1_spacer 2 <400> 322 cactatagtc ctttgcgaat acgcccacgc gtcttgagcg aaagctcc 48 <210> 323 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC14-1_spacer 3 <400> 323 caagacaaat caccgccgta agccgaccct atagtgagtc gtattaaggt 50 <210> 324 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC14-1_spacer 3 <400> 324 cactataggg tcggcttacg gcggtgattt gtcttgagcg aaagctcc 48 <210> 325 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC15-1_spacer 1 <400> 325 tacaacgacg tagtgtgacg cgatcggcct atagtgagtc gtattaaggt 50 <210> 326 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC15-1_spacer 1 <400> 326 ataggccgat cgcgtcacac tacgtcgttg taattcccta gaaataggtt 50 <210> 327 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC15-1_spacer 2 <400> 327 tacaactcgc cggtagccag cgcggatcct atagtgagtc gtattaaggt 50 <210> 328 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC15-1_spacer 2 <400> 328 ataggatccg cgctggctac cggcgagttg taattcccta gaaataggtt 50 <210> 329 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC15-1_spacer 3 <400> 329 tacaaccata ctgcaccggg cgggaaggct atagtgagtc gtattaaggt 50 <210> 330 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC15-1_spacer 3 <400> 330 atagccttcc cgcccggtgc agtatggttg taattcccta gaaataggtt 50 <210> 331 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC18-1_spacer 1 <400> 331 tcaaacgcct ccagtacagc gcggctgact atagtgagtc gtattaaggt 50 <210> 332 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC18-1_spacer 1 <400> 332 ctatagtcag ccgcgctgta ctggaggcgt ttgagagtag tgaaaactac 50 <210> 333 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC18-1_spacer 2 <400> 333 tcaaacgcac agccgggaag ggctggtcct atagtgagtc gtattaaggt 50 <210> 334 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC18-1_spacer 2 <400> 334 ctataggacc agcccttccc ggctgtgcgt ttgagagtag tgaaaactac 50 <210> 335 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC18-1_spacer 3 <400> 335 tcaaacatgg tttgcccgga taaacggact atagtgagtc gtattaaggt 50 <210> 336 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC18-1_spacer 3 <400> 336 ctatagtccg tttatccggg caaaccatgt ttgagagtag tgaaaactac 50 <210> 337 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify BE3_sgRNA spacer 1 <400> 337 tgtggagcga catccagagg ctatagtgag tcgtattagg a 41 <210> 338 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify BE3_sgRNA spacer 1 <400> 338 cctctggatg tcgctccaca gttttagagc tagaaatagc aagtt 45 <210> 339 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify BE3_sgRNA spacer 2 <400> 339 taattcaatt cgcgcgtccc ctatagtgag tcgtattagg a 41 <210> 340 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify BE3_sgRNA spacer 2 <400> 340 gggacgcgcg aattgaatta gttttagagc tagaaatagc aagtt 45 <210> 341 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify BE3_sgRNA spacer 3 <400> 341 agtcacgacg ttgtaaaacg ctatagtgag tcgtattagg a 41 <210> 342 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify BE3_sgRNA spacer 3 <400> 342 cgttttacaa cgtcgtgact gttttagagc tagaaatagc aagtt 45 <210> 343 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: For lacZ sequencing <400> 343 cgaacatcca aaagtttgtg ttttt 25 <210> 344 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: For lacZ sequencing <400> 344 tgagcgcatt tttacgcgc 19 <210> 345 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: For lacZ sequencing <400> 345 gaaaacggca acccgtgg 18 <210> 346 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify sgRNA expression cassette <400> 346 ccgccgccgc aaggaatggt ttaattaatt acggccagtc atgcataatc 50 <210> 347 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify sgRNA expression cassette <400> 347 gactgttggg cgccatctcc ttgcatgctc actgagcctc cacctagcct 50 <210> 348 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-8_sgRNA spacer 1 <400> 348 ctcaaccgcc cgttgcacca cagatgaact atagtgagtc gtattaaggt 50 <210> 349 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-8_sgRNA spacer 1 <400> 349 tatagttcat ctgtggtgca acgggcggtt gagaatcttt cgaaagaaag 50 <210> 350 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-8_sgRNA spacer 2 <400> 350 ctcaacccat gcagaggatg atgctcgtct atagtgagtc gtattaaggt 50 <210> 351 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-8_sgRNA spacer 2 <400> 351 atagacgagc atcatcctct gcatgggttg agaatctttc gaaagaaaga 50 <210> 352 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-8_sgRNA spacer 3 <400> 352 ctcaacgcgt tagggtcaat gcgggtcgct atagtgagtc gtattaaggt 50 <210> 353 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGA3-8_sgRNA spacer 3 <400> 353 tatagcgacc cgcattgacc ctaacgcgtt gagaatcttt cgaaagaaag 50 <210> 354 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-8_sgRNA spacer 1 <400> 354 ctcaaccgcc cgttgcacca cagatgaact atagtgagtc gtattaaggt 50 <210> 355 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-8_sgRNA spacer 1 <400> 355 tatagttcat ctgtggtgca acgggcggtt gagaatcttt cgaaagaaag 50 <210> 356 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-8_sgRNA spacer 2 <400> 356 ctcaacccat gcagaggatg atgctcgtct atagtgagtc gtattaaggt 50 <210> 357 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-8_sgRNA spacer 2 <400> 357 atagacgagc atcatcctct gcatgggttg agaatctttc gaaagaaaga 50 <210> 358 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-8_sgRNA spacer 3 <400> 358 ctcaacgcgt tagggtcaat gcgggtcgct atagtgagtc gtattaaggt 50 <210> 359 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Amplify MGC3-8_sgRNA spacer 3 <400> 359 tatagcgacc cgcattgacc ctaacgcgtt gagaatcttt cgaaagaaag 50 <210> 360 <211> 4 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG1-4 (D9A) nickase PAM <220> <221> modified_base <222> (1)..(1) <223> a, c, t, g, unknown or other <400> 360 nrrr 4 <210> 361 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG1-6 (D13A) nickase PAM <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <400> 361 nnrray 6 <210> 362 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG3-6 (D13A) nickase PAM <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (6)..(6) <223> a, c, t, g, unknown or other <400> 362 nnrggnt 7 <210> 363 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG3-7 (D12A) nickase PAM <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (4)..(4) <223> a, c, t, g, unknown or other <400> 363 nnrnyay 7 <210> 364 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG3-8 (D13A) nickase PAM <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <400> 364 nnrggty 7 <210> 365 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG4-5 (D17A) nickase PAM <220> <221> modified_base <222> (1)..(1) <223> a, c, t, g, unknown or other <400> 365 nrccv 5 <210> 366 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG14-1 (D23A) nickase PAM <220> <221> modified_base <222> (1)..(1) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (3)..(4) <223> a, c, t, g, unknown or other <400> 366 nrnngrka 8 <210> 367 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG15-1 (D8A) nickase PAM <220> <221> modified_base <222> (1)..(4) <223> a, c, t, g, unknown or other <400> 367 nnnnc 5 <210> 368 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: PAM <220> <223> Description: nMG18-1 (D12A) nickase PAM <220> <221> modified_base <222> (1)..(1) <223> a, c, t, g, unknown or other <400> 368 nrwart 6 <210> 369 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> Category: NLS <220> <223> Description: SV40 <400> 369 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 370 <211> 16 <212> PRT <213> Unknown <220> <223> Description of Unknown: nucleoplasmin bipartite NLS sequence <220> <223> Category: NLS <220> <223> Description: nucleoplasmin bipartite NLS <400> 370 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 371 <211> 9 <212> PRT <213> Unknown <220> <223> Description of Unknown: c-myc NLS sequence <220> <223> Category: NLS <220> <223> Description: c-myc NLS <400> 371 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 372 <211> 11 <212> PRT <213> Unknown <220> <223> Description of Unknown: c-myc NLS sequence <220> <223> Category: NLS <220> <223> Description: c-myc NLS <400> 372 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 373 <211> 38 <212> PRT <213> Homo sapiens <220> <223> Category: NLS <220> <223> Description: hRNPA1 M9 NLS <400> 373 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 374 <211> 42 <212> PRT <213> Unknown <220> <223> Description of Unknown: Importin-alpha IBB domain sequence <220> <223> Category: NLS <220> <223> Description: Importin-alpha IBB domain <400> 374 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 375 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: Myoma T protein sequence <220> <223> Category: NLS <220> <223> Description: Myoma T protein <400> 375 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 376 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: Myoma T protein sequence <220> <223> Category: NLS <220> <223> Description: Myoma T protein <400> 376 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 377 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: p53 sequence <220> <223> Category: NLS <220> <223> Description: p53 <400> 377 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 378 <211> 12 <212> PRT <213> Mus sp. <220> <223> Category: NLS <220> <223> Description: mouse c-abl IV <400> 378 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 379 <211> 5 <212> PRT <213> Influenza virus <220> <223> Category: NLS <220> <223> Description: influenza virus NS1 <400> 379 Asp Arg Leu Arg Arg 1 5 <210> 380 <211> 7 <212> PRT <213> Influenza virus <220> <223> Category: NLS <220> <223> Description: influenza virus NS1 <400> 380 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 381 <211> 10 <212> PRT <213> Hepatitis delta virus <220> <223> Category: NLS <220> <223> Description: Hepatitis virus delta antigen <400> 381 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 382 <211> 10 <212> PRT <213> Mus sp. <220> <223> Category: NLS <220> <223> Description: mouse Mx1 protein <400> 382 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 383 <211> 20 <212> PRT <213> Homo sapiens <220> <223> Category: NLS <220> <223> Description: human poly(ADP-ribose) polymerase <400> 383 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 384 <211> 17 <212> PRT <213> Homo sapiens <220> <223> Category: NLS <220> <223> Description: steroid hormone receptor (human) glucocorticoid <400> 384 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 385 <211> 170 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-3 deaminase <400> 385 Met Asn Glu Gln Thr Ser Thr Asp Glu Gln Phe Met Gln Gln Ala Leu 1 5 10 15 Ala Leu Ala Asp Glu Ala Glu Arg Gln Gly Glu Val Pro Val Gly Ala 20 25 30 Leu Leu Val His Gln Gly Thr Val Ile Gly Arg Gly Phe Asn Gln Val 35 40 45 Ile Thr Gln Leu Asp Pro Ser Ala His Ala Glu Met Leu Ala Ile Arg 50 55 60 Asp Ala Ala Arg Tyr Leu Gln Asn Tyr Arg Ile Leu Asp Thr Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Leu Val His 85 90 95 Ala Arg Val Lys Arg Leu Val Tyr Gly Ala Ser Asp Pro Arg Thr Gly 100 105 110 Ala Cys Gly Ser Val Phe Asn Val Val Ala Asp Thr Arg Leu Asn His 115 120 125 Gln Leu Glu Val Val Ala Gly Val Leu Gly Ser Gln Cys Gly Glu Arg 130 135 140 Leu Ser Ala Phe Phe Arg Gln Arg Arg Ala Ala Gln Lys Ala Leu Lys 145 150 155 160 Lys Ala Ala Gln Asn Phe Gln Ser Pro Ser 165 170 <210> 386 <211> 167 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4 deaminase <400> 386 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asp Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 387 <211> 173 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-5 deaminase <400> 387 Met Ser Thr Asp Phe Thr Ser Ala Ala Gln Gln Glu Leu Asp Ile Ala 1 5 10 15 Tyr Met Arg Lys Ala Ile Ala Leu Ala Ala Gln Ala Glu Ala Asp Gly 20 25 30 Glu Val Pro Val Gly Ala Val Leu Val His Asn Asn Glu Ile Ile Gly 35 40 45 Val Gly Arg Asn Arg Val Ile Gly Gly Cys Asp Pro Ser Leu His Ala 50 55 60 Glu Phe Glu Ala Ile Arg Gln Gly Ala Gln Glu Ile Gly Asn Tyr Arg 65 70 75 80 Leu Leu Glu Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys 85 90 95 Ala Gly Leu Leu Val His Ser Arg Ile Gly Arg Leu Val Tyr Gly Thr 100 105 110 Pro Asp Leu Lys Thr Gly Ala Ala Gly Ser Leu Met Asn Leu Leu Gln 115 120 125 His Pro Glu Leu Asn His Gln Ile Ala Ile Thr Ser Gly Val Leu Gln 130 135 140 Ala Asp Cys Ala Ala Gln Leu Ser Gly Phe Phe Ser Ala Gln Arg Glu 145 150 155 160 Arg Lys Lys Ala Leu Lys Lys Arg Leu Lys Pro Asn Leu 165 170 <210> 388 <211> 182 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-6 deaminase <400> 388 Met Ser Glu Ile Pro Gln Val Val Thr Glu Gln Gln Thr Asp Glu Arg 1 5 10 15 Trp Met His Tyr Ala Leu Ala Leu Ala Asp Lys Ala Glu Gln Ala Gly 20 25 30 Glu Ile Pro Val Gly Ala Val Leu Val Lys Asp Asn Gln Val Ile Gly 35 40 45 Glu Gly Trp Asn Met Ser Ile Cys Arg His Asp Pro Ser Ala His Ala 50 55 60 Glu Met Leu Ala Ile Arg Glu Ala Ala Val Arg Val Gln Asn Tyr Arg 65 70 75 80 Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys 85 90 95 Ala Gly Leu Leu Val His Ser Arg Val Lys Arg Leu Val Phe Gly Ala 100 105 110 Phe Asp Ala Lys Thr Gly Ala Ala Gly Ser Val Thr Asp Leu Val Arg 115 120 125 His Pro Val Leu Asn His Gln Leu Glu Val Thr Ser Gly Val Leu Ala 130 135 140 Glu Gln Cys Ala Asp Lys Leu Ser Ser Phe Phe Arg Arg Arg Arg Gln 145 150 155 160 Glu His Lys Ala Ala Lys Ala Leu Arg Gln Ala Gln Asp Pro Glu Asn 165 170 175 Gln Gly Asn Ser Glu Ser 180 <210> 389 <211> 151 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-7 deaminase <400> 389 Met Ser Asp Glu Ile Trp Ile Lys His Ala Leu Thr Leu Ala Asp Lys 1 5 10 15 Ala Tyr Gln Gln Gly Glu Val Pro Val Gly Ala Val Leu Val Lys Asn 20 25 30 Asn Gln Ile Ile Ala Glu Gly Trp Asn Gln Pro Ile Ala His His Asp 35 40 45 Pro Ser Ala His Ala Glu Ile Met Ala Leu Arg Leu Ala Gly Gln Ala 50 55 60 Glu Gln Asn Tyr Arg Leu Pro Glu Thr Thr Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ala Arg Ile Gly Arg 85 90 95 Leu Val Phe Gly Ala Tyr Asp Pro Lys Thr Gly Ala Ala Gly Ser Val 100 105 110 Phe Asp Ile Phe Ser Asp Ala Arg His Asn His Gln Ile Glu Val Val 115 120 125 Ser Gly Val Leu Ser Glu Leu Cys Gly Asp Lys Leu Arg Ala Phe Phe 130 135 140 Arg Glu Arg Arg Lys Lys Arg 145 150 <210> 390 <211> 166 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-8 deaminase <400> 390 Met Pro Gln Ser Glu Gln Asp Ile Tyr Trp Ile Arg Tyr Ala Met Gln 1 5 10 15 Leu Ala Glu Arg Ala Glu Gln Ala Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asp Asn Gln Ala Leu Gly Glu Gly Trp Asn Leu Ser Ile 35 40 45 Ser Arg His Asp Pro Cys Ala His Ala Glu Ile Met Ala Ile Arg Gln 50 55 60 Ala Gly Glu Arg Ile Gly Asn Tyr Arg Leu Leu Gly Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Val His Ser 85 90 95 Arg Ile Ala Arg Val Val Tyr Gly Ala Ser Asp Leu Lys Thr Gly Ala 100 105 110 Ala Gly Ser Val Phe Asp Val Leu Ser Asp Pro Arg His Asn His Val 115 120 125 Val Glu Ile Thr Gly Gly Val Glu Ser Glu Ala Cys Ser Gln Gln Leu 130 135 140 Ser Asp Phe Phe Arg Arg Arg Arg Ala Glu Gln Lys Ala Glu Lys Gln 145 150 155 160 Arg Leu Lys Asp Asn Gln 165 <210> 391 <211> 168 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-9 deaminase <400> 391 Met Asn Val Ala Ala Asp Glu Gln Trp Met Lys Glu Ala Leu Arg Gln 1 5 10 15 Ala Glu Arg Ala Leu Leu Ala Gly Glu Val Pro Val Gly Ala Val Val 20 25 30 Val Ser Gln Asn Asn Ile Val Gly Gln Gly Phe Asn Arg Asn Leu Leu 35 40 45 Asp Arg Asp Pro Thr Ala His Ala Glu Ile Ile Ala Leu Arg Glu Ala 50 55 60 Ala Ala Asn Ile Gly Asn His Arg Leu Leu Asp Cys Glu Leu Tyr Ala 65 70 75 80 Thr Ile Glu Pro Cys Ala Met Cys Ala Gly Ala Ile Thr His Ala Arg 85 90 95 Val Arg Arg Leu Val Tyr Gly Ala Glu Asp Leu Lys Ala Gly Ala Val 100 105 110 His Ser Val Met Gln Val Val Asn His Pro Ala Leu Asn His Arg Val 115 120 125 Glu Val Lys Gly Gly Val Leu Ala Glu Arg Cys Gly Glu Leu Leu Gln 130 135 140 Gln Phe Phe Trp Ala Arg Arg Ala Glu Gln Ser Gly Ile Ser Gly Ala 145 150 155 160 Asn Glu Asp Gln Leu Arg Arg Gly 165 <210> 392 <211> 143 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-10 deaminase <400> 392 Met Leu Leu Ala Met Glu Gln Ala Arg Ala Ala Glu Glu Ala Gly Glu 1 5 10 15 Val Pro Val Gly Ala Val Ile Leu Ser Pro Glu Gly Glu Val Val Ala 20 25 30 Arg Gly Glu Asn Arg Val Leu Arg Asp Ser Asp Pro Thr Ala His Ala 35 40 45 Glu Met Val Ala Leu Arg Ala Ala Gly Arg Val Leu Gly Asn Tyr Arg 50 55 60 Leu Pro Gly Cys Thr Leu Tyr Ser Thr Leu Glu Pro Cys Ser Met Cys 65 70 75 80 Ser Gly Ala Ile Leu His Ala Arg Val Ala Arg Leu Val Phe Ala Ala 85 90 95 Ser Asp Pro Lys Ala Gly Ala Cys Gly Ser Val Leu Glu Val Met Asn 100 105 110 His Pro Arg Leu Asn His Gln Val Glu Leu Val Gly Gly Val Leu Ala 115 120 125 Leu Glu Cys Gly Gln Met Leu Thr Glu Phe Phe Arg Ala Arg Arg 130 135 140 <210> 393 <211> 210 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-11 deaminase <400> 393 Met Ser Ala Glu Ile Asp Leu Thr Asp Lys Ala Phe Met Arg Gln Ala 1 5 10 15 Leu Asp Gln Ala Gln Asn Ala Trp Leu Leu Gly Glu Val Pro Val Gly 20 25 30 Ala Val Ile Val Arg Glu Gly Arg Val Ile Ala Thr Gly Tyr Asn Arg 35 40 45 Pro Ile Gly Asp Asn Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu 50 55 60 Arg Gln Ala Ala Ser Leu Leu Gly Asn Tyr Arg Leu Pro Gly Cys Thr 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Met Ala Leu Met 85 90 95 His Ala Arg Leu Asp Arg Val Val Phe Gly Ala Pro Asp Pro Lys Thr 100 105 110 Gly Ala Ala Gly Ser Val Ile Asn Leu Phe Asp Glu Pro Arg Leu Asn 115 120 125 His His Cys Ala Leu Arg Gly Gly Val Glu Ala Gln Asp Cys Ala Arg 130 135 140 Leu Leu Gln Asp Phe Phe Arg Glu Arg Arg Arg Gln Ile Gln Ala Leu 145 150 155 160 Gln Gln Lys Pro Ala Ile Pro Ala Asp Arg Ala Asp Pro Asp Glu Gln 165 170 175 His Ala Ser Leu His Ala Glu Gly Pro Ala Pro Leu Ala Gly Ile Asp 180 185 190 Val Arg His Leu Asp Glu Pro Asp Ala Ala Ala Thr Ser Asn Pro Glu 195 200 205 Ser Pro 210 <210> 394 <211> 159 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-12 deaminase <400> 394 Met Glu Ile Lys Ala Arg Met Arg Asp Ile Met Thr Asp Asp Glu Arg 1 5 10 15 Trp Met Ala Lys Ala Leu Arg Leu Ala Lys Glu Gly Ala Gln Ala Gly 20 25 30 Glu Val Pro Val Gly Ala Ile Leu Val Phe Ser Gly Glu Gln Leu Ala 35 40 45 Ala Ala Tyr Asn Ser Pro Ile Arg Leu Arg Asp Ala Thr Ala His Ala 50 55 60 Glu Ile Leu Ala Leu Arg Leu Gly Gly Glu Arg Leu Gln Asn Tyr Arg 65 70 75 80 Leu Thr Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys 85 90 95 Ala Gly Ala Leu Val Gln Ala Arg Ile Ala Arg Leu Val Phe Gly Ala 100 105 110 Arg Asp Ser Arg Val Gly Ala Ala Gly Ser Ala Leu Asp Leu Ala Arg 115 120 125 Glu Pro Arg Phe Asn His Gln Val Thr Val Val Gly Gly Val Leu Ala 130 135 140 Ser Glu Cys Glu Gln Val Leu Arg Glu Phe Phe Arg Ala Arg Arg 145 150 155 <210> 395 <211> 205 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-13 deaminase <400> 395 Met Pro Glu Pro Phe Gln Gly Gly Asp Pro Ala Asp Pro Ala Arg Ala 1 5 10 15 Ala Ala Glu Ala Gln Asp Leu Ala Asp Arg Ala Phe Met Arg Leu Ala 20 25 30 Leu Asp Gln Ala His Asn Ala Trp Leu Leu Gly Glu Val Pro Val Gly 35 40 45 Ala Val Ile Val His Glu Gly Arg Val Leu Ala Thr Gly Tyr Asn Arg 50 55 60 Pro Ile Gly Asp Ser Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu 65 70 75 80 Arg Gln Ala Ala Ser Leu Leu Gly Asn Tyr Arg Leu Pro Gly Cys Thr 85 90 95 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Met Ala Leu Leu 100 105 110 His Ala Arg Ile Glu Arg Val Val Phe Gly Ala Ser Asp Pro Lys Thr 115 120 125 Gly Ala Ala Gly Ser Val Leu Asp Leu Phe Ala Gln Pro Leu Leu Asn 130 135 140 His His Ala Ser Leu Arg Ala Gly Val Glu Ala Gln Ala Cys Gly Ala 145 150 155 160 Leu Leu Gln Glu Phe Phe Arg Glu Arg Arg Ala Arg Ala Arg Ala Gln 165 170 175 Gln Gln Leu Pro Ala His Gly Gly Gly Ile Asp Val Arg His Leu Asp 180 185 190 Ala Pro Glu Pro Gly Asp Glu Ser Asp Pro Phe Asp Glu 195 200 205 <210> 396 <211> 159 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-14 deaminase <400> 396 Met Gly Ser Asp Gln Asp Phe Met Arg Leu Ala Leu Leu Glu Ala Glu 1 5 10 15 Lys Ala Gly Ala Ile Gly Glu Val Pro Val Gly Ala Val Ile Val Lys 20 25 30 Asp Gly Lys Val Val Ala Arg Gly His Asn Gln Pro Val Ser Gly His 35 40 45 Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Glu Ala Gly Gln 50 55 60 Val Leu Gly Asn Tyr Arg Leu Pro Ala Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Ala Met Cys Ile Gly Ala Met Ile His Ala Arg Ile Arg 85 90 95 Arg Val Ile Phe Gly Ala His Asp Pro Lys Thr Gly Ala Ala Gly Ser 100 105 110 Val Ile Asn Leu Phe Glu Glu Lys Thr Leu Asn His His Ala Thr Val 115 120 125 Thr Gly Gly Ile Leu Ala Ser Asp Cys Ala Gln Leu Leu Lys Ala Phe 130 135 140 Phe Ala Met Arg Arg Lys Glu Ala Lys Thr Pro Ser Leu Ser Gly 145 150 155 <210> 397 <211> 168 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-15 deaminase <400> 397 Met Glu Pro Met Glu Glu His Arg His Phe Met Gly Leu Ala Ile Glu 1 5 10 15 Glu Ala Ala Arg Ala Tyr Glu Leu Asn Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Gly Ser Ala Gly Glu Ile Leu Ser Arg Ala Ser Asn Ala Pro 35 40 45 Ile Arg Ser Ala Asp Pro Ser Ala His Ala Glu Met Ile Ala Leu Arg 50 55 60 Gln Ala Ala Arg Ala Ser Gly Asn Tyr Arg Leu Pro Gly Ser Val Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Val Gly Ala Met Leu His 85 90 95 Ala Arg Ile Ala Thr Leu Val Phe Gly Ala Arg Asp Pro Arg Thr Gly 100 105 110 Ala Ala Gly Ser Val Val Asp Leu Thr Ser Val Pro Ala Phe Asn His 115 120 125 Tyr Val Arg Val Ile Ala Gly Val Arg Ala Glu Glu Cys Ser Glu Leu 130 135 140 Leu Arg Arg Phe Phe Arg Glu Arg Arg Arg Glu Gly Lys Ser Gly Tyr 145 150 155 160 Gly Gly Glu Val Pro Lys Arg Pro 165 <210> 398 <211> 153 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-16 deaminase <400> 398 Met Ala Asp Glu Asp Ile Lys Phe Met Arg Leu Ala Leu Glu Leu Ala 1 5 10 15 Lys Lys Ala Glu Phe Ile Asp Glu Val Pro Val Gly Ala Leu Ile Ile 20 25 30 Lys Asp Gly Glu Ile Ile Gly Thr Gly Met Asn Ser Cys Ile Ser Asp 35 40 45 His Asp Pro Thr Ser His Ala Glu Ile Lys Ala Ile Arg Asp Ala Ala 50 55 60 Asn Thr Ile Lys Asn Tyr Arg Leu Asn Gly Cys Ser Ile Tyr Val Thr 65 70 75 80 Leu Glu Pro Cys Ala Met Cys Val Gly Ala Ile Gln His Ala Arg Ile 85 90 95 Glu Lys Ile Ile Tyr Gly Ala Asn Asp Pro Lys Thr Gly Ala Cys Gly 100 105 110 Ser Val Ile Asp Leu Met Ser Ile Lys Glu Ile Asn His His Thr Glu 115 120 125 Ala Ile Gly Gly Val Leu Gln Lys Glu Cys Gly Gln Ile Leu Lys Asp 130 135 140 Phe Phe Leu Ser Lys Arg Lys Lys Pro 145 150 <210> 399 <211> 148 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-17 deaminase <400> 399 Met Gln Arg Ala Leu Gly Arg Ala Gly Asp Ala Arg Ala Gln Gly Glu 1 5 10 15 Val Pro Val Gly Ala Val Val Val Cys Ala Gly Glu Val Val Gly Glu 20 25 30 Gly Cys Asn Arg Asn Ile Ser Leu Asp Asp Pro Ser Ala His Ala Glu 35 40 45 Ile Leu Ala Leu Arg Ala Ala Gly Gln Arg Leu Gly Asn Tyr Arg Leu 50 55 60 Pro Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Val 65 70 75 80 Gly Ala Ala Ile His Ser Arg Leu Asp Gly Val Val Phe Gly Ala Thr 85 90 95 Asp Pro Lys Thr Gly Ala Leu Gly Gly Ala Phe Asp Leu Pro Ala Ser 100 105 110 His Ala His Asn His Val Leu Ser Val Arg Gly Gly Leu Leu Ala Asp 115 120 125 Glu Cys Gly Ala Leu Leu Lys Ala Phe Phe Arg Asp Arg Arg Lys Ala 130 135 140 Pro Arg Ala Pro 145 <210> 400 <211> 191 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-18 deaminase <400> 400 Met Gln Lys Lys Val Asp Asp Phe Leu Lys Ile Val Glu Pro Pro Asp 1 5 10 15 Ala Glu Arg Arg Thr Lys Gly Lys Leu Leu Gln Gln Arg Ala Val Asp 20 25 30 Glu Gln Trp Met Gly Leu Ala Leu Gln Arg Gly Glu Glu Ala Gly Arg 35 40 45 Gln Gly Glu Val Pro Val Gly Ala Val Val Val Gly Lys Asp Gly Phe 50 55 60 Leu Thr Ala Ala Gly Asn Ser Pro Ile Gly Leu Ala Asp Pro Ser Ala 65 70 75 80 His Ala Glu Met Leu Ala Ile Arg Ala Ala Ala Lys Leu Leu Gly Asn 85 90 95 Tyr Arg Leu Pro Glu Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Ile 100 105 110 Met Cys Met Gly Ala Leu Ile Gln Ala Arg Ile Ser Arg Leu Val Phe 115 120 125 Gly Ala Ala Asp Pro Lys Thr Gly Ala Ala Ile Ser Val Tyr Ala Ile 130 135 140 Gly Thr Asp Gln Arg Leu Asn His Thr Val Ala Val Thr Gly Gly Ile 145 150 155 160 Leu Ala Glu Ala Cys Ala Gln Leu Leu Lys Asn Phe Phe Lys Lys Arg 165 170 175 Arg Gly His Ser Pro Val Ile Asn Ser Pro Phe Leu Lys Thr Pro 180 185 190 <210> 401 <211> 144 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-19 deaminase <400> 401 Met Arg Glu Ala Tyr Ala Leu Ala Leu Ile Ala Tyr Glu Gln Gly Glu 1 5 10 15 Val Pro Val Gly Ala Val Leu Val Gly Glu Asp Asp Glu Ile Leu Gly 20 25 30 Arg Gly Trp Asn Gln Val Ile Gln Arg His Asp Pro Met Ala His Ala 35 40 45 Glu Cys Val Ala Ile Gln Glu Ala Ala Ala Gln Leu Arg Asn Tyr Arg 50 55 60 Leu Asn Gly Ser Thr Leu Tyr Val Thr Leu Glu Pro Cys Cys Met Cys 65 70 75 80 Ala Gly Ala Met Val His Ala Arg Ile Ala Arg Leu Val Phe Gly Ala 85 90 95 Arg Asp Val Arg Ser Gly Ala Ala Gly Ser Ala Tyr Asn Leu Leu Ala 100 105 110 Gly Asp Leu Leu Asn His Arg Val Lys Ile Asp Glu Gly Ile Leu Gln 115 120 125 Gln Glu Cys Ser His Leu Leu Arg Asn Phe Phe Lys Gln Arg Arg Asp 130 135 140 <210> 402 <211> 195 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-20 deaminase <400> 402 Met Thr Ser Gln Val Ser Arg Gln Gln Pro Leu Ser Gly Asn Asn Leu 1 5 10 15 Val His Asn Asp Leu Ile Ala Ser Val Cys Pro Pro Gly Leu Val Pro 20 25 30 Ala Gln Gln Asp Glu Phe Trp Met Gln Gln Ala Leu Val Leu Ala Arg 35 40 45 Gln Ala Glu Met Met Gly Glu Val Pro Val Gly Ala Val Val Val Lys 50 55 60 Asn Gln Gln Leu Ile Gly Tyr Gly Tyr Asn Gln Ser Ile Thr Leu Asn 65 70 75 80 Asp Pro Ser Ala His Ala Glu Val Leu Ala Leu Arg Met Ala Gly Gln 85 90 95 Thr Leu Thr Asn Tyr Arg Leu Pro Asp Thr Thr Leu Tyr Val Thr Leu 100 105 110 Glu Pro Cys Ala Met Cys Ala Thr Thr Met Val His Ala Arg Val Ala 115 120 125 Arg Leu Val Tyr Gly Ala Ala Asp Leu Lys Thr Gly Ala Ala Gly Ser 130 135 140 Val Leu Asn Leu Thr Asn Tyr Thr Ala Phe Asn His Gln Leu Ser Cys 145 150 155 160 Val Ser Gly Val Leu Gln Arg Asp Cys Ser Tyr Leu Leu Ser Asn Phe 165 170 175 Phe Lys Leu Arg Arg Thr Gln His Lys Ala Lys Lys Val Ser Gly Thr 180 185 190 Phe Ile Arg 195 <210> 403 <211> 162 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-21 deaminase <400> 403 Met Asp His Glu Arg Tyr Met Arg Arg Ala Ile Glu Leu Ala Gln Gln 1 5 10 15 Ala Glu Ser Leu Gly Glu Val Pro Val Gly Ala Val Ile Val His Asp 20 25 30 His Gln Ile Ile Gly Glu Gly Phe Asn Glu Val Ile Arg Arg Asn Asp 35 40 45 Pro Ser Ala His Ala Glu Ala Gln Ala Ile Arg Ala Ala Gly Gln His 50 55 60 Leu Ala Asn Tyr Arg Leu Val Asn Thr Thr Leu Tyr Val Ser Leu Glu 65 70 75 80 Pro Cys Ala Met Cys Ala Gly Leu Ile Val His Ala Arg Val Lys Thr 85 90 95 Val Val Phe Ala Thr Pro Asp Pro Arg Thr Gly Ala Thr Gly Thr Ala 100 105 110 Ile Gln Val Leu Asn His Pro Ser Met Asn His His Val Glu Val Val 115 120 125 Ser Gly Val Leu Gln Glu Gln Ser Ala Thr Ile Leu Gln Asn Phe Phe 130 135 140 Arg Lys Lys Arg Glu Leu Ala Lys Met Lys Lys Phe His Glu Lys Arg 145 150 155 160 Val Asn <210> 404 <211> 166 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-22 deaminase <400> 404 Met Ser Asp Glu His Phe Met Arg Leu Ala Leu Ala Gln Ala Ala Leu 1 5 10 15 Ala Glu Ala Glu Gly Glu Ile Pro Val Gly Ala Val Val Val Leu Asn 20 25 30 Gly Glu Val Val Gly Ser Gly Tyr Asn Ser Pro Ile Gly Arg His Asp 35 40 45 Pro Thr Ala His Ala Glu Ile Arg Ala Leu Arg Ala Ala Ala Ala Thr 50 55 60 Leu Gly Asn Tyr Arg Leu Val Gly Cys Glu Leu Phe Val Thr Leu Glu 65 70 75 80 Pro Cys Leu Met Cys Ala Gly Ala Ile Gln His Ala Arg Ile Ala Arg 85 90 95 Leu Val Tyr Gly Ala Ala Asp Tyr Lys Thr Gly Val Cys Gly Ser Thr 100 105 110 Leu Asp Val Phe Gly Glu Leu Pro Gly Ser Pro Val Pro Arg Leu Asn 115 120 125 His His Thr Gln Val Thr Gly Gly Val Leu Gly Asp Glu Cys Ser Arg 130 135 140 Gln Leu Ser Ala Phe Phe Ala Arg Arg Arg Ala Glu Lys Asn Ala Ala 145 150 155 160 Lys Asn His Val Phe Gln 165 <210> 405 <211> 161 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-23 deaminase <400> 405 Met Asp Ser Leu Val Glu Arg His Glu His Tyr Met Met Leu Ala Leu 1 5 10 15 Arg Leu Ala Glu Lys Gly Ala Asp Arg Gly Glu Val Pro Val Gly Ala 20 25 30 Val Val Val Ser Pro Lys Gly Gln Ile Leu Ser Leu Ala His Asn Glu 35 40 45 Pro Ile Asp Leu His Asp Pro Thr Gly His Ala Glu Ile Ile Ala Ile 50 55 60 Arg Lys Ala Ala Gln Arg Ile Gly Asn Tyr Arg Leu Val Gly Cys Ser 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Tyr Gly Ala Ile Ile 85 90 95 His Ala Arg Ile Lys Arg Leu Phe Phe Gly Ala Tyr Asp Pro Lys Ala 100 105 110 Gly Ala Gly Thr Val Phe Gly Leu Phe Ser Ser Pro Phe Phe Asn His 115 120 125 Gln Pro Glu Val Arg Gly Gly Ile Leu Ala Glu Leu Cys Glu Lys Val 130 135 140 Leu Lys Glu Phe Phe Glu Lys Leu Arg Ser Ser Lys Cys Cys Ser Ser 145 150 155 160 Gly <210> 406 <211> 152 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-24 deaminase <400> 406 Met Thr Glu Asp Glu Arg Trp Met Glu Glu Ala Leu Ala Leu Ala Arg 1 5 10 15 Glu Ala Ser Asn Asp Gly Glu Ala Pro Val Gly Ala Val Val Val His 20 25 30 Ala Gly Glu Ile Ile Gly Arg Gly Arg Asn Arg Ile Glu Gly Leu Ala 35 40 45 Asp Pro Thr Ala His Ala Glu Leu Leu Ala Leu Arg Gln Ala Ser Met 50 55 60 Asn Leu Gly Arg Trp Arg Leu Thr Gly Cys Ala Leu Phe Val Thr Leu 65 70 75 80 Glu Pro Cys Ala Met Cys Leu Gly Ala Cys Tyr Ala Ala Arg Val Asp 85 90 95 Arg Leu Val Tyr Gly Ala Thr Ser Pro Lys Phe Gly Ala Ala Gly Ser 100 105 110 Ser Val Thr Leu Ala Gly Val Glu Arg Leu Asn His Arg Leu Glu Val 115 120 125 Val Ser Gly Val Leu Glu Lys Glu Cys Ala Arg Leu Leu Ala Lys Phe 130 135 140 Phe Arg Gly Leu Arg Gly Lys Gly 145 150 <210> 407 <211> 168 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-25 deaminase <400> 407 Met Asp Asp Gln His Trp Met Gly Arg Ala Leu Ala Leu Ala Glu Arg 1 5 10 15 Ala Ala Glu Gln Gly Glu Val Pro Gly Gly Ala Val Leu Val Ile Glu 20 25 30 Asn Glu Ile Val Gly Glu Gly Trp Ser Arg Pro Ile Ala Thr Gln Asp 35 40 45 Pro Ser Ala His Ala Glu Ile Leu Ala Leu Arg Asp Ala Gly Leu Arg 50 55 60 Arg Gly Asn Tyr Arg Leu Ser Gly Ser Val Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Val Met Cys Ala Gly Ala Ile Val His Ala Arg Val Asp Thr 85 90 95 Leu Val Phe Gly Ala Ala Asp Pro Lys Ala Gly Ala Cys Gly Ser Val 100 105 110 Phe Asp Leu Leu Pro Ser Asp Gly Arg Phe Asn His His Thr Gln Cys 115 120 125 Arg Gly Pro Ile Leu Ala Asp Ala Cys Gly Thr Ile Leu Arg Ala Phe 130 135 140 Phe Ala Asn Lys Arg Ala Ser Pro Arg Ala Arg Ala Asn Ala Ser Ala 145 150 155 160 Ala His Glu Arg Pro Glu Asn Asp 165 <210> 408 <211> 173 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-26 deaminase <400> 408 Met Ser Glu Ser Gln Phe Asp Glu Thr Gln Tyr Arg Trp Met Asp Arg 1 5 10 15 Ala Leu Glu Leu Ala Gly Gln Ala Ala Asn Leu Gly Glu Val Pro Val 20 25 30 Gly Ala Val Ile Val Ser Ala Glu Gly Glu Leu Leu Gly Glu Gly Phe 35 40 45 Asn Gln Pro Ile Lys Val Gln Asp Pro Thr Ala His Ala Glu Ile Met 50 55 60 Ala Ile Arg Gln Ala Cys Arg Lys Thr Gly Asn Tyr Arg Leu Pro Gly 65 70 75 80 Ala Val Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala 85 90 95 Ile Val His Ala Arg Leu Ala Arg Val Val Phe Ala Thr Cys Glu Pro 100 105 110 Lys Ala Gly Ala Val Glu Ser Thr Leu Arg Phe Phe Asp Leu Pro Gln 115 120 125 Leu Asn His Arg Val Glu Tyr Thr Gly Gly Leu Arg Arg Ser Glu Ala 130 135 140 Ser Ser Leu Leu Ser His Phe Phe Gln Ser Arg Arg Glu Glu Lys Ala 145 150 155 160 Leu Leu Lys Lys Asn Ser Arg Gln Gln Gln Ser Asp Cys 165 170 <210> 409 <211> 164 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-27 deaminase <400> 409 Met Arg Glu Glu Lys Asp Leu Ile Phe Met Lys Lys Ala Leu His Leu 1 5 10 15 Ala Glu Glu Ala Trp Arg Gln Gly Glu Val Pro Val Gly Ala Val Val 20 25 30 Val Asp Gly Glu Gly Gln Ile Ile Gly Gln Gly Tyr Asn Gln Ser Ile 35 40 45 Ala Leu Leu Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu Arg Gln 50 55 60 Ala Ala Lys Lys Lys Lys Asn Tyr Arg Leu Ser Gly Ser Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Pro Met Cys Leu Gly Ala Met Val Gln Ala 85 90 95 Arg Ile Asp Arg Leu Val Phe Gly Ala Tyr Asp Pro Lys Asn Gly Ala 100 105 110 Val Ser Ser Ile Met Asn Phe Pro Leu Asp Lys Met Asn His Arg Phe 115 120 125 Glu Ile Glu Gly Gly Leu Leu Ser Gln Glu Cys Ala Thr Ile Leu Lys 130 135 140 Glu Phe Phe Gln Ser Arg Arg Gly Glu Thr Asn Asn Lys Lys Glu Thr 145 150 155 160 Ala Lys Glu Glu <210> 410 <211> 153 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-28 deaminase <400> 410 Met Asp Thr Asp Glu Gln Phe Met Gln His Ala Ile Gln Leu Ala His 1 5 10 15 Lys Ala Gln Ser Gln Gly Glu Val Pro Val Gly Ala Ile Leu Val Lys 20 25 30 Asp Asn Lys Ile Ile Gly Lys Gly Trp Asn Gln Pro Ile Thr Arg His 35 40 45 Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile Arg His Ala Gly Gln 50 55 60 Ala Leu Lys Asn Tyr Arg Leu Pro Asp Thr Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Asn Met Cys Ala Gly Met Ile Ile His Ala Arg Ile Lys 85 90 95 Arg Leu Val Phe Ala Ala Tyr Asp Pro Lys Thr Gly Ala Ala Gly Ser 100 105 110 Val Phe Asp Thr Leu Thr Asp Pro Arg Asn Asn His Thr Val Glu Ile 115 120 125 Glu Gly Gly Val Leu Glu Glu Pro Cys Ala Glu Met Leu Arg His Phe 130 135 140 Phe Arg Gln Arg Arg Lys Lys Thr Pro 145 150 <210> 411 <211> 158 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-29 deaminase <400> 411 Met Ser Glu Leu Glu Asn Asn Asn Pro Gln His Ile Lys Trp Met Arg 1 5 10 15 Glu Ala Ile Lys Leu Ala Gln Lys Ala Gln Glu Cys Gly Glu Val Pro 20 25 30 Val Gly Ala Leu Ile Thr Lys Asn Asp Thr Leu Ile Ser Ser Ala Tyr 35 40 45 Asn Gln Pro Ile Thr Lys His Asp Pro Thr Ala His Ala Glu Ile Gln 50 55 60 Ala Leu Gln Gln Ala Gly Lys Ile Leu Gln Asn Tyr Arg Leu Asn Asp 65 70 75 80 Thr Val Leu Tyr Ile Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala 85 90 95 Ile Val His Ala Arg Ile Gly Thr Val Val Phe Gly Ala Tyr Asp His 100 105 110 Lys Thr Gly Val Ala Gly Ser Ala Gly Asn Ile Phe Thr Ala Glu Phe 115 120 125 Ser Asn His Lys Pro Lys Ile Ile Gly Gly Thr Leu Glu Lys Glu Cys 130 135 140 Ser Leu Ile Ile Arg Asn Phe Phe Gln Ala Arg Arg Gln Lys 145 150 155 <210> 412 <211> 182 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-30 deaminase <400> 412 Met Pro Asn Phe Leu Lys Gln Leu Gln Gln Ile Ile Ala Phe Glu Thr 1 5 10 15 Ser Cys Ala Ala Asp Trp Ser Glu Gln Gln Lys His Val Phe Trp Met 20 25 30 Gln Gln Ala Leu Lys Val Ala Ala Tyr Gly Glu Gln Leu Gly Glu Val 35 40 45 Pro Val Gly Ala Val Ala Val Val Glu Asn Gln Leu Ile Ala Val Gly 50 55 60 Trp Asn Ala Ser Ile Ser Lys His Asp Pro Thr Ala His Ala Glu Val 65 70 75 80 Met Ala Leu Arg Ala Ala Gly Thr Val Leu Lys Asn Tyr Arg Gln Leu 85 90 95 Gln Leu Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly 100 105 110 Ala Met Val His Ala Arg Ile Ala Gln Leu Val Tyr Gly Ala Ser Asp 115 120 125 Pro Lys Thr Gly Ala Val Asp Ser Val Phe Asn Leu Leu Arg His Pro 130 135 140 Asn Leu Asn His Gln Ala Pro Val Leu Gly Gly Val Leu Ala Thr Glu 145 150 155 160 Cys Arg Thr Gln Leu Gln Asp Phe Phe Arg Arg Arg Arg Gln Glu Lys 165 170 175 Lys Gln Ala Gln Gln Lys 180 <210> 413 <211> 167 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-31 deaminase <400> 413 Met Glu Ser Val Asp Glu Gln Trp Met Arg Tyr Ala Ile Arg Leu Ala 1 5 10 15 Gln Arg Ala Glu Glu Gln Gly Glu Val Pro Val Gly Ala Val Leu Val 20 25 30 Lys Gly Asp Arg Cys Leu Ala Glu Gly Trp Asn Val Pro Val Gln Arg 35 40 45 His Asp Pro Thr Ala His Ala Glu Met Val Ala Ile Arg Asp Ala Gly 50 55 60 Ile Ala Leu Glu Asn Tyr Arg Leu Ile Asp Ser Thr Leu Tyr Val Thr 65 70 75 80 Leu Glu Pro Cys Val Met Cys Met Gly Ala Ile Ala His Ala Arg Ile 85 90 95 Lys Arg Leu Val Phe Gly Ala Phe Asp Pro Lys Arg Gly Ala Val Cys 100 105 110 Asn Ala Leu Ser Leu Thr Asp Ala Ser Phe Leu Asn His Lys Val Val 115 120 125 Trp Asp Gly Gly Val Phe Glu Gln Glu Cys Ser Glu Leu Leu Ile Asp 130 135 140 Phe Phe Lys Ala Arg Arg Lys Val Thr Lys Pro Glu Val Val Val Thr 145 150 155 160 Asn Pro Gln Arg His Gly Met 165 <210> 414 <211> 160 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-32 deaminase <400> 414 Met Tyr Asn Gln Gln Ala Ile Asp Lys His Phe Met Asn Cys Ala Leu 1 5 10 15 Glu Leu Ala Thr Phe Ala Ala Asp Ser Gly Glu Val Pro Val Gly Ala 20 25 30 Val Ile Val Arg Lys Asn Thr Ile Val Ala Lys Gly Ser Asn Ser Pro 35 40 45 Ile Ala Asp His Asp Pro Thr Ala His Ala Glu Ile Ile Ala Ile Arg 50 55 60 Lys Ala Thr Ala Gln Cys Ala Asn Tyr Arg Thr Pro Asp Thr Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Ile Met Cys Met Gly Ala Ile Ile Gln 85 90 95 Ala Arg Ile Gly Arg Leu Val Phe Gly Ala Tyr Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Cys Tyr Ser Ile Gly Gln Asp Asn Leu Leu Asn His 115 120 125 Ser Leu Glu Ile Ala Gly Gly Ile Asn Glu Gln Gln Cys Ala Ile Leu 130 135 140 Leu Lys Lys Phe Phe Lys Ile Arg Arg Lys Lys Gly Ser Lys Asn Asn 145 150 155 160 <210> 415 <211> 150 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-33 deaminase <400> 415 Met Ser Asp Leu Glu Trp Met Arg Arg Ala Ile Thr Leu Ala Gln Lys 1 5 10 15 Ala Glu Gln Gln Gly Glu Val Pro Val Gly Ala Leu Leu Val Arg Glu 20 25 30 Gly Val Cys Val Gly Glu Gly Trp Asn Gln Pro Ile Leu Arg His Asp 35 40 45 Pro Ser Ala His Ala Glu Ile Asn Ala Leu Arg Asp Ala Gly Gln Ala 50 55 60 Thr Glu Asn Tyr Arg Leu Ile Asp Thr Val Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Val Met Cys Met Gly Ala Ile Ala Asn Ala Arg Val Arg Arg 85 90 95 Leu Val Phe Gly Ala Ser Asp Pro Ala Arg Gly Ala Ala Gly Ser Ile 100 105 110 Leu Ser Leu Ser Asn Ala Ser Phe Leu Asn His His Ile Glu Thr Glu 115 120 125 Gly Gly Leu Leu Ala Glu Glu Cys Ser Glu Leu Leu Arg Ser Phe Phe 130 135 140 Ala Arg Arg Arg Arg Lys 145 150 <210> 416 <211> 155 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-34 deaminase <400> 416 Met Ser Pro Val Val Ala Glu Ser Asp Arg Ala Trp Met Arg His Ala 1 5 10 15 Leu Glu Leu Ala Asn Arg Ala Gly Glu Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Val Met Val Lys Asp Gly Gln Leu Val Gly Glu Gly Trp Asn Arg 35 40 45 Val Ile Gly Leu Asn Asp Pro Ser Ala His Ala Glu Ile Leu Ala Leu 50 55 60 Arg Glu Ala Gly Gln Arg Leu Gly Asn Tyr Arg Leu Pro Gly Cys Ser 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Met Leu 85 90 95 His Ala Arg Leu Glu Arg Val Tyr Phe Gly Thr Gly Asp Pro Lys Thr 100 105 110 Gly Ala Leu Gly Gly Thr Phe Asp Leu Phe Ala Asp Tyr Pro His Asn 115 120 125 His Arg Ile Glu Thr Gln Gly Gly Leu Leu Glu Ile Glu Cys Ser Ser 130 135 140 Leu Leu Lys Glu Phe Phe Arg Ala Arg Arg Leu 145 150 155 <210> 417 <211> 194 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-35 deaminase <400> 417 Met Gly Leu Asn Gly Leu Thr His His Ser Pro Phe Ile Pro Ile Ser 1 5 10 15 Glu Asn Ile Asp Thr Ser Asp Lys Leu Ala Leu Gln Ile Met Ser Leu 20 25 30 Lys Leu Ser Asn Pro Asp Glu Lys Trp Met Arg His Ala Gln Ser Leu 35 40 45 Ala Glu His Ala Ala Ala Gln Gly Glu Ile Pro Val Gly Ala Val Ile 50 55 60 Val Gln Ala Gly Glu Cys Ile Ala Glu Gly Trp Asn Gln Pro Ile Ala 65 70 75 80 Asn Asn Asp Pro Thr Ala His Ala Glu Ile Ile Ala Leu Arg Lys Ala 85 90 95 Ala Gln Tyr Leu Asn Asn Tyr Arg Leu Val Asn Thr Leu Leu Tyr Val 100 105 110 Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Ile Ile Gln Ala Arg 115 120 125 Val Lys Arg Val Ile Phe Gly Ala Tyr Asp Pro Lys Ala Gly Ala Ala 130 135 140 Gly Ser Arg Phe Asp Ile Leu Arg Asp Thr Arg His Asn Tyr Gln Val 145 150 155 160 Glu Cys Ile Ser Gly Val Leu Ala Lys Glu Cys Ser Asp Tyr Leu Ser 165 170 175 Arg Phe Phe Lys Asn Arg Arg Thr Arg Ala Lys Pro Ser Arg Phe Pro 180 185 190 Lys Pro <210> 418 <211> 174 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-36 deaminase <400> 418 Met Gln Asp Asp Thr Val Pro Glu Glu Ile Asp His Glu Arg Trp Met 1 5 10 15 Arg Gln Ala Leu Asn Glu Ala Met Asp Ala Ala Glu Glu Gly Glu Val 20 25 30 Pro Val Gly Ala Val Val Val Tyr Glu Asn Arg Ile Ile Gly Arg Gly 35 40 45 His Asn Arg Thr Val Ala Thr His Asp Pro Ser Ala His Ala Glu Ile 50 55 60 Leu Ala Leu Gly Ala Ala Gly Ala Ala Val Gly Asp Trp Arg Leu Thr 65 70 75 80 Gly Val Asp Ile Tyr Val Ser Leu Glu Pro Cys Ala Met Cys Ala Gly 85 90 95 Ala Ile Gln Leu Gly Arg Leu Arg Arg Ala Val Phe Gly Pro Arg Asp 100 105 110 Pro Lys Phe Gly Gly Cys Gly Ser Val Leu Asp Val Leu Arg Glu Pro 115 120 125 Arg Leu Asn His Gln Val Glu Val Ile Glu Gly Val Met Ala Ala Glu 130 135 140 Ser Gln His Leu Leu Lys Glu Phe Phe Arg Arg Leu Arg Ala Lys Asp 145 150 155 160 Arg Val Pro Ala Thr Pro Asp Pro Phe Pro Asn Ala Gly Glu 165 170 <210> 419 <211> 149 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-37 deaminase <400> 419 Met Glu Glu Glu Tyr Phe Met Arg Glu Ala Leu Lys Glu Ala Glu Lys 1 5 10 15 Ala Ala Gln Glu Gly Glu Val Pro Ile Gly Ala Val Val Val Gly Pro 20 25 30 Ser Arg Glu Ile Ile Gly Arg Gly Tyr Asn Arg Pro Ile Gly Leu Cys 35 40 45 Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Glu Ala Ala Lys 50 55 60 Arg Leu Gly Asn Tyr Arg Leu Leu Asp Cys Glu Ile Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Leu Val Tyr Ala Arg Leu Lys 85 90 95 Arg Leu Val Phe Gly Ala His Asp Pro Lys Ala Gly Ala Cys Gly Ser 100 105 110 Val Tyr Asn Ile Val Gln Asp Lys Arg Leu Asn His Gln Leu Glu Val 115 120 125 Ala Gly Gly Leu Leu Ala Glu Glu Cys Arg Ala Leu Leu Gln Ala Phe 130 135 140 Phe Lys Ser Arg Arg 145 <210> 420 <211> 160 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-38 deaminase <400> 420 Met Phe Glu Phe Ser Asp Asn Lys Ala Glu Phe Phe Met Lys Gln Ala 1 5 10 15 Ile Leu Gln Ala Ile Arg Ala Trp Lys Lys Gly Glu Val Pro Val Gly 20 25 30 Ala Val Val Val Ser Gly Ala Gly Gln Ile Leu Ala Ser Ala His Asn 35 40 45 Cys Pro Ile Ser Leu Asp Asp Pro Thr Ala His Ala Glu Ile Leu Ala 50 55 60 Leu Arg Leu Ala Ala Gly Lys Val Gly Asn Tyr Arg Leu Thr Asp Ser 65 70 75 80 Trp Leu Ile Ser Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met 85 90 95 Val Trp Ala Arg Val Lys Gly Val Val Phe Gly Ala Arg Asp Pro Val 100 105 110 Ser Gly Ala Phe Gly Ser Val Met Asp Ile Asn Glu Val Pro Gly Leu 115 120 125 Asn His Arg Ile Glu Val Thr Glu Gly Val Leu Ala Ala Glu Cys Ser 130 135 140 Gln Leu Leu Lys Asp Phe Phe Lys Arg Arg Arg Gln Ser Ser Ala Gly 145 150 155 160 <210> 421 <211> 148 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-39 deaminase <400> 421 Met Thr Asp Glu Asn Trp Met Gln Arg Ala Leu Gln Leu Ala Ala Gln 1 5 10 15 Ala Glu Ala Val Gly Glu Val Pro Val Gly Ala Val Ile Val Lys Asn 20 25 30 Asp Thr Leu Val Ala Glu Gly Phe Asn Gln Pro Ile Gly Ala His Asp 35 40 45 Ala Thr Ala His Ala Glu Ile Val Ala Leu Arg Arg Ala Gly Glu Ala 50 55 60 Leu Gly Asn Tyr Arg Leu Val Asp Thr Thr Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Ser Met Cys Val Gly Ala Met Ile His Ala Arg Val Ala Lys 85 90 95 Val Val Phe Gly Ala Ser Asp Pro Arg Thr Gly Ala Leu Gly Gly Ala 100 105 110 Phe Asp Leu Gln Gln Ala Gly Arg His Asn His Arg Phe Asp Val Val 115 120 125 Ser Gly Val Met Ala Asp Ser Ser Arg Gln Leu Leu Gln Asn Phe Phe 130 135 140 Arg Val Arg Arg 145 <210> 422 <211> 149 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-40 deaminase <400> 422 Met Thr Glu Asp Glu Lys Trp Met Asn Leu Ala Ile Glu Gln Ala Ile 1 5 10 15 Lys Ala Gln Asp Glu Asp Glu Val Pro Val Gly Ala Val Leu Val Lys 20 25 30 Asn Gly Leu Leu Leu Ser Gln Ala His Asn Gln Pro Ile Ser Thr Asn 35 40 45 Asp Ala Thr Ala His Ala Glu Ile Gln Ala Leu Arg Lys Ala Gly Ile 50 55 60 Lys Leu Gln Asn Tyr Arg Leu Thr Asp Ser Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Ala Met Cys Leu Gly Ala Met Met His Ala Arg Ile Ala 85 90 95 Arg Ile Val Tyr Gly Ala Asn Asp Leu Lys Thr Gly Ala Cys Gly Ser 100 105 110 Ser Glu Asn Leu Leu Asn Ala Asn Cys Phe Asn His Lys Ile His Leu 115 120 125 Ile Ser Gly Val Leu Glu Asn Glu Cys Lys Gln Leu Leu Lys Lys Phe 130 135 140 Phe Asn Ser Arg Arg 145 <210> 423 <211> 185 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-41 deaminase <400> 423 Met Asn Gln Val Asn Cys Gly Arg Ile Gly Ser Arg Leu Ile Arg Thr 1 5 10 15 Gly Gly Val Asn Ile Ser Arg Ala Pro Ile Glu Glu Asp Pro Val Asn 20 25 30 Asp Leu Gln Tyr Ala Gln Asp Thr Lys Trp Met Arg Cys Ala Leu Asp 35 40 45 Cys Ala Arg Arg Ala Tyr Ser Thr Glu Glu Val Pro Ile Gly Ala Val 50 55 60 Leu Val Arg Asn Glu Gln Ile Ile Gly Glu Gly Phe Asn Gln Thr Ile 65 70 75 80 Arg Asn Leu Asp Pro Thr Ser His Ala Glu Ile Met Ala Ile Arg Ser 85 90 95 Ala Ala Glu Asn Ile Gly Asn Tyr Arg Leu Ser Asp Thr Thr Leu Tyr 100 105 110 Val Thr Ile Glu Pro Cys Met Met Cys Leu Gly Ala Ile Ile His Ala 115 120 125 Arg Val Glu Arg Leu Val Phe Gly Ala Gln Glu Pro Lys Ala Gly Val 130 135 140 Leu Lys Ser His Pro Val Phe Asp Gly Asp Phe Leu Asn His Gln Val 145 150 155 160 Lys Trp Ser Ser Gly Ile Leu Glu Ser Glu Cys Ser Arg Leu Met Arg 165 170 175 Asp Phe Phe Ile His Lys Arg Thr Leu 180 185 <210> 424 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-42 deaminase <400> 424 Met Ala Pro Val Pro Leu Lys Gln Pro Leu Ala Gly Glu Ser Phe Asp 1 5 10 15 Ala His Asp His Ala Met Met Arg Leu Ala Ile Asp Gln Ala Leu Asn 20 25 30 Ala Gln Leu His Gly Glu Val Pro Val Gly Ala Val Leu Val Lys Gly 35 40 45 Gly Gln Val Ile Ala Thr Gly Tyr Asn His Pro Ile Gly Ser His Asp 50 55 60 Pro Thr Ala His Ala Glu Ile Arg Thr Leu Arg Met Ala Ala Glu Gln 65 70 75 80 Leu Gly Asn Tyr Arg Leu Gly Glu Ser Thr Leu Tyr Val Thr Leu Glu 85 90 95 Pro Cys Met Met Cys Leu Gly Ala Met Leu His Ala Arg Ile Thr Arg 100 105 110 Val Val Phe Gly Ala Ser Asp Pro Lys Thr Gly Val Cys Gly Gly Val 115 120 125 Leu Asp Leu Pro Ala Glu Gly Arg Leu Asn His Gln Thr Thr Val Gln 130 135 140 Gly Gly Leu Leu Ala Glu Glu Cys Gly Glu Leu Leu Gln Arg Phe Phe 145 150 155 160 Ala Glu Arg Arg Ala Gln Arg Arg Ala Asp Arg Glu Ala Leu Arg Ala 165 170 175 Gln Gln Asp Glu Leu Leu Arg Trp Ala Ala Thr Leu Pro Ala Glu Glu 180 185 190 Glu Val Gly Thr Leu Arg Leu Asp Glu Glu Thr 195 200 <210> 425 <211> 150 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-43 deaminase <400> 425 Met Ala Met Ala Leu Ala Glu Ala Glu Lys Ala Met Gln Ile Gly Glu 1 5 10 15 Val Pro Ile Gly Ala Val Val Val Gly Pro Asp Gln Gln Leu Leu Gly 20 25 30 Thr Gly Tyr Asn Gln Ser Ile Cys Leu Asn Asp Pro Ser Ala His Ala 35 40 45 Glu Met Leu Ala Ile Arg Ala Ala Ala Ala Gln Leu Gly Asn Tyr Arg 50 55 60 Leu Arg Asp Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys 65 70 75 80 Met Gly Ala Ile Leu His Ser Arg Ile Gln Arg Val Val Phe Ala Ala 85 90 95 Ala Asp Pro Lys Thr Gly Ala Cys Gly Ser Val Leu Ser Leu Gln Ser 100 105 110 Glu Pro Arg Leu Asn His His Cys Ser Val Thr Gln Gly Val Leu Ala 115 120 125 Glu Arg Ala Ala Ser Leu Ile Lys Gly Phe Phe Lys Ala Arg Arg Gln 130 135 140 Val Lys Lys Cys Arg Cys 145 150 <210> 426 <211> 164 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-44 deaminase <400> 426 Met Leu His Met Val Tyr Tyr Glu Ile Asn Glu Thr Asn Ser Gln Asp 1 5 10 15 Val Phe Phe Met Arg Arg Ala Leu Thr Leu Ala Gln Lys Ala Ala Ser 20 25 30 Ala Asp Glu Val Pro Val Gly Ala Val Ala Ile Ala Asn Asn Glu Ile 35 40 45 Ile Gly Glu Gly Phe Asn Cys Pro Ile Gly Thr His Asp Pro Thr Ala 50 55 60 His Ala Glu Ile Met Ala Leu Arg Gln Ala Ala Gln Lys Ser Asn Asn 65 70 75 80 Tyr Arg Leu Pro Glu Val Thr Leu Tyr Val Thr Leu Glu Pro Cys Val 85 90 95 Met Cys Val Gly Ala Met Leu His Ala Arg Ile Lys Arg Leu Val Phe 100 105 110 Gly Ala Ile Asp Gln Lys Thr Gly Ala Val Val Ser Val Phe Lys Ile 115 120 125 Leu Asp Glu Lys Asn Leu Asn His Arg Ile Gln Tyr Gln Ser Gly Val 130 135 140 Leu Ala Val Pro Cys Gly Lys Ile Leu Ser Asp Phe Phe Lys Asp Arg 145 150 155 160 Arg Gly Val Ile <210> 427 <211> 180 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-45 deaminase <400> 427 Met Thr Ala Leu Ile Thr Thr Ser Asn Ile His Asp Lys Met Met Ser 1 5 10 15 Leu Ala Leu Lys Glu Ala Phe Lys Ala Tyr Lys Leu Gly Glu Ile Pro 20 25 30 Val Gly Cys Val Ile Thr Asp Glu Asn Asn Glu Leu Val Ala Thr Gly 35 40 45 Phe Asn Arg Thr Ile Ile Asp Asn Asp Pro Ser Ala His Ala Glu Ile 50 55 60 Val Ala Leu Arg Lys Ala Gly Glu Lys Leu Gln Asn Tyr Arg Leu Val 65 70 75 80 Asn Leu Asn Leu Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Ser Gly 85 90 95 Ala Ile Ile His Ala Arg Ile Lys Arg Val Phe Phe Gly Ala Tyr Asp 100 105 110 Leu Lys Thr Gly Ala Cys Gly Ser Val Phe Asn Val Leu Asn Asp Asp 115 120 125 Arg His Asn His Lys Val Glu Ile Tyr Gly Gly Ile Leu Lys Glu Glu 130 135 140 Cys Ser Ser Met Leu Ser Asp Phe Phe Lys Ala Arg Arg Lys Met Gln 145 150 155 160 Lys Glu Gly Arg Asp Trp Ile Val Glu Ser Gly Lys Asp Arg Thr Trp 165 170 175 Leu Asn Lys Asp 180 <210> 428 <211> 153 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-46 deaminase <400> 428 Met Ile Ser Asp Thr Glu Phe Met Gly Ala Ala Leu Glu Leu Ala Leu 1 5 10 15 Ala Ala Ser Lys Leu Gly Glu Val Pro Val Gly Ala Val Val Val Lys 20 25 30 Gly Gly Arg Ile Ile Gly Thr Gly Ser Asn Ala Pro Ile Ser Arg His 35 40 45 Asp Pro Thr Ala His Ala Glu Ile Leu Ala Leu Arg Ala Ala Ala Ser 50 55 60 Ala Leu Glu Asn Tyr Arg Leu Thr Glu Cys Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Ala Met Cys Ala Gly Ala Ile Gln His Ala Arg Ile Ala 85 90 95 Arg Leu Val Phe Gly Ala Ser Asp Ser Lys Thr Gly Ala Cys Gly Ser 100 105 110 Val Val Asn Leu Phe Gly Glu Pro Met Leu Asn His His Thr Gln Val 115 120 125 Gln Gly Gly Met Leu Ala Arg Asp Cys Gly Glu Leu Leu Ser Asp Phe 130 135 140 Phe Arg Gln Arg Arg Ala Ala Val Gln 145 150 <210> 429 <211> 160 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-47 deaminase <400> 429 Met Ser Gly Ser Asp Ala Ala Ala Ser Arg Ala Cys Met Glu Gln Ala 1 5 10 15 Leu Ala Cys Ala Arg Asp Ala Glu Ala Ala Gly Glu Val Pro Val Gly 20 25 30 Ala Val Ile Val Asp Ala Ala Gly Ala Val Val Ala Arg Ala Ala Asn 35 40 45 Ala Pro Ile Ala Arg Asn Asp Pro Thr Ala His Ala Glu Leu Leu Val 50 55 60 Leu Arg Ala Ala Gly Arg Val Leu Gly Asn Tyr Arg Leu Pro Gly Cys 65 70 75 80 Val Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Val Gly Ala Leu 85 90 95 Val His Ala Arg Ile Ala Arg Ile Val Tyr Gly Ala Pro Asp Pro Lys 100 105 110 Thr Gly Ala Cys Gly Ser Val Phe Asp Leu Ala Ala Asn Ser Lys Met 115 120 125 Asn His Arg Ile Glu Val Ala Gly Gly Val Leu Ala Glu Glu Cys Gly 130 135 140 Ala Leu Leu Lys Gln Phe Phe Ala Ala Arg Arg Gly Arg Asp Ala Pro 145 150 155 160 <210> 430 <211> 151 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-48 deaminase <400> 430 Met Phe Ser Arg Ala Asp Gln Val Phe Met Arg Gln Ala Leu Glu Leu 1 5 10 15 Ala Lys Gln Ala Lys Gly Glu Gly Glu Val Pro Val Gly Ala Val Leu 20 25 30 Thr Leu Asn Asp Leu Pro Ile Ala Thr Ala Tyr Asn Gln Ser Ile Thr 35 40 45 His Gln Asp Pro Thr Ala His Ala Glu Ile Ile Val Leu Arg Glu Ala 50 55 60 Ala Lys Ile Leu Lys Asn Tyr Arg Leu Val Asn Thr Val Leu Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Ile His Ala Arg 85 90 95 Val Lys Arg Leu Ile Tyr Ala Thr Ala Asp Pro Arg Thr Gly Ala Cys 100 105 110 Gly Ser Ile Phe Asn Leu Ile Asn His Gln Ala Leu Asn His Gln Ile 115 120 125 Gln Tyr Glu Ser Gly Leu Leu Ala Glu Glu Ser Lys Leu Leu Leu Gln 130 135 140 Gln Phe Phe Gln Lys Arg Arg 145 150 <210> 431 <211> 148 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-49 deaminase <400> 431 Met Asn Asp Glu His Tyr Ile Gln Tyr Ala Leu Asn Leu Ala Gln Lys 1 5 10 15 Ala Glu Ser Glu Asn Glu Val Pro Val Gly Ala Leu Ile Val Cys Asn 20 25 30 Asn Gln Ile Ile Ala Glu Gly Trp Asn Gln Pro Ile Gln Leu His Asp 35 40 45 Ser Ser Ala His Ala Glu Met Leu Ala Leu Arg Lys Ala Ser His His 50 55 60 Ile Glu Asn Tyr Arg Leu Lys Asn Thr Thr Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Ala Met Cys Val Gly Ala Met Ile His Ala Arg Ile Gln Lys 85 90 95 Leu Val Phe Gly Ala Trp Asp Gln Lys Ala Gly Ala Val His Ser Val 100 105 110 Phe Gln Leu Ile Asp Asp Thr Arg His Asn His Ala Ile Glu Trp Arg 115 120 125 Gly Gly Val Met Ala Asp Ala Cys Ser Arg Val Leu Lys Asn Phe Phe 130 135 140 Lys Gln Arg Arg 145 <210> 432 <211> 153 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-50 deaminase <400> 432 Met Thr Ser His Asp Asp Thr Tyr Trp Ile Ile His Ala Leu Thr Leu 1 5 10 15 Ala Lys Lys Ala Glu Gln Gln Gly Glu Val Pro Val Gly Ala Val Ile 20 25 30 Val His Asp His Gln Ile Val Gly Glu Gly Trp Asn Gln Pro Ile Gly 35 40 45 Ala Gly Asp Pro Thr Ala His Ala Glu Ile Ile Ala Met Arg Asn Ala 50 55 60 Ala Gln His Leu Lys Asn Tyr Arg Leu Ile Asn Cys Thr Leu Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Ala Met Cys Val Gly Ala Met Val His Ala Arg 85 90 95 Ile Ser Arg Leu Val Phe Gly Ala Phe Asp Pro Lys Ala Gly Ala Val 100 105 110 Thr Ser Val Met Gln Leu Leu Asp Ala Pro His Phe Asn His Ile Val 115 120 125 Thr His Gln Gly Gly Ile Cys Ala Glu Lys Cys Ser Glu Ile Leu Lys 130 135 140 Ser Phe Phe Ala Met Lys Arg Lys Thr 145 150 <210> 433 <211> 155 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-51 deaminase <400> 433 Met Thr Asp Asp Arg Asp Leu Tyr Trp Met Gln Gln Ala Leu Leu Leu 1 5 10 15 Ala Val Asp Ala Gly Arg Arg Gly Glu Val Pro Val Gly Ala Leu Leu 20 25 30 Val Leu Asp Glu Val Ser Ile Gly Val Gly Tyr Asn Arg Pro Ile Gly 35 40 45 Asp Arg Asp Pro Thr Ala His Ala Glu Ile Ile Ala Leu Arg Asp Ala 50 55 60 Ala Lys Lys Ile Asn Asn Tyr Arg Leu Leu Asp Thr Thr Leu Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Met Met Cys Ala Ala Ala Met Val His Ala Arg 85 90 95 Ile Lys Arg Leu Val Tyr Gly Ala Pro Asp Pro Lys Ala Gly Ala Ile 100 105 110 Val Ser Gln Ala Gln Ile Leu Asp Ala Pro Phe Phe Asn His Arg Val 115 120 125 Ala Tyr Tyr Gly Asn Leu Leu Ala Met Pro Cys Gly Glu Leu Leu Arg 130 135 140 Thr Phe Phe Lys Ala Lys Arg Leu Ser Ser Thr 145 150 155 <210> 434 <211> 153 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-52 deaminase <400> 434 Met Arg Leu Ala Met Asp Met Ala Lys Glu Ala Tyr Ser Ile Gly Glu 1 5 10 15 Val Pro Val Gly Cys Val Ile Ala Asp Ala Asp Gly Asn Val Ile Ser 20 25 30 Thr Gly Tyr Asn Arg Ser Ile Thr Asp Asn Asp Pro Ser Ala His Ala 35 40 45 Glu Met Val Ala Ile Arg Asn Ala Gly Ser Leu Leu Lys Asn Tyr Arg 50 55 60 Met Pro Gly Leu Ser Leu Tyr Val Thr Leu Glu Pro Cys Cys Met Cys 65 70 75 80 Ser Gly Ala Ile Ile His Ala Arg Ile Ala Arg Val Tyr Tyr Gly Ala 85 90 95 Ser Asp Leu Lys Thr Gly Ala Cys Gly Ser Val Phe Asn Val Met Ser 100 105 110 Asp Pro Arg His Asn His Ser Val Glu Cys Ile Gly Gly Ile Leu Ala 115 120 125 Asp Glu Cys Ser Lys Met Leu Ser Asp Phe Phe Lys Glu Arg Arg Gln 130 135 140 Gln Lys Lys Ala Glu Ala Thr Lys Leu 145 150 <210> 435 <211> 174 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-53 deaminase <400> 435 Met Thr Val Asn His Glu Tyr Phe Met Arg Leu Ala Ile Glu Gln Ala 1 5 10 15 Leu Leu Ala Tyr Gln Ala Gly Glu Ile Pro Val Gly Ala Val Ile Val 20 25 30 Asp Thr Asp Gly Asn Val Ile Gly Arg Gly Phe Asn Arg Thr Ile Leu 35 40 45 Asp Asn Asp Pro Ser Ala His Ala Glu Ile Val Ala Leu Arg Asp Ala 50 55 60 Gly Glu Arg Val Lys Asn Tyr Arg Leu Ile Asn Leu Asp Met Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Thr Met Cys Ser Gly Ala Leu Ile His Ser Arg 85 90 95 Leu Asn Asn Leu Tyr Phe Gly Ala Tyr Asp Leu Lys Thr Gly Ala Cys 100 105 110 Gly Ser Arg Phe Asn Ile Leu Gly Ser Ser Glu Tyr Asn His Ile Val 115 120 125 Asn Val Thr Gly Gly Ile Leu Lys Glu Glu Cys Gln Asn Ile Ile Ser 130 135 140 Asp Phe Phe Lys Ala Arg Arg Lys Met Gln Lys Asp Gly Arg Asp Trp 145 150 155 160 Ile Val Glu Ser Gly Lys Val Arg Ser Trp Gln Lys Asn Val 165 170 <210> 436 <211> 172 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-54 deaminase <400> 436 Met Thr Ser Pro Thr Ala Gly Leu Gly Glu Thr Asp Glu Tyr Trp Met 1 5 10 15 Asn Arg Ala Leu Ala Leu Ala Ala Glu Ala Gly Glu Ser Gly Glu Val 20 25 30 Pro Val Gly Ala Val Val Val Leu Asp Gly Arg Glu Val Gly Ala Gly 35 40 45 Tyr Asn Gly Pro Ile Gly Ser Cys Asp Pro Thr Ala His Ala Glu Ile 50 55 60 Arg Ala Leu Arg Asp Ala Gly Ala Arg Ala Gly Asn Tyr Arg Leu Pro 65 70 75 80 Gly Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Val Gly 85 90 95 Ala Ile Val His Ala Arg Ile Asn Arg Leu Val Tyr Gly Thr Thr Glu 100 105 110 Pro Lys Ala Gly Ala Val Glu Ser Ile Arg Gln Thr Leu Arg Asp Asp 115 120 125 His Phe Asn Trp Gln Val Glu Ala Thr Gly Gly Val Leu Ala Ser Gln 130 135 140 Cys Arg Glu Ile Ile Gln Arg Phe Phe Ala Gly Arg Arg Glu Tyr His 145 150 155 160 Arg Leu Arg Lys Gln Thr Leu Ser Val Lys Glu Gln 165 170 <210> 437 <211> 158 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-55 deaminase <400> 437 Met Pro Asp Leu Asp Asp Gly Tyr Trp Met Gln Gln Ala Leu Lys Leu 1 5 10 15 Ala Ala Gln Ala Lys Asp Gln Gly Glu Val Pro Val Gly Ala Leu Val 20 25 30 Val Gly Glu Gln Lys Leu Leu Gly Gln Gly Tyr Asn Gln Val Ile Ser 35 40 45 Leu Gln Asp Pro Ser Ala His Ala Glu Val Met Ala Leu Arg Gly Ala 50 55 60 Gly Ile Thr Gln Gln Asn Tyr Arg Leu Val Asn Thr Thr Leu Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Met Met Cys Ala Gly Val Leu Val His Ala Arg 85 90 95 Ile Lys Arg Leu Val Phe Gly Ala Tyr Asp Pro Lys Ala Gly Ala Ile 100 105 110 Ser Ser Cys Ala Gln Leu Leu Thr Leu Pro His Leu Asn His Gln Ile 115 120 125 Leu Val Gln Gly Gly Ile Leu Ala Lys Glu Cys Gly Gln Gln Leu Thr 130 135 140 Asp Phe Phe Lys Ala Lys Arg Gln Ala Lys His Asp Lys Gly 145 150 155 <210> 438 <211> 157 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-56 deaminase <400> 438 Met Thr Ala Ala Ala Glu Phe Asp Glu His Asp Leu Arg Trp Met Arg 1 5 10 15 Gln Ala Leu Glu Leu Ala Arg Arg Ala Glu Arg Asp His Ala Glu Val 20 25 30 Pro Val Gly Ala Val Leu Val Ile Asp Asn Glu Val Ile Gly Ser Gly 35 40 45 Met Asn Arg Asn Ile Ile Asp His Asp Ala Ser Ala His Ala Glu Ile 50 55 60 Val Cys Leu Arg Asp Ala Gly Gln Arg Val Ala Asn His Arg Phe Pro 65 70 75 80 Gly Ser Thr Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly 85 90 95 Ala Ile Val His Ala Arg Val Gly Arg Val Val Tyr Ala Ala Ser Asp 100 105 110 Pro Lys Thr Gly Ala Ala Gly Ser Val Phe Asp Ile Leu Thr Ser Glu 115 120 125 Arg His Asn His Arg Val Ala Val Arg Gly Gly Leu Leu Ala Glu Glu 130 135 140 Ser Ala Arg Leu Leu Gln Leu Phe Phe Arg Ser Arg Arg 145 150 155 <210> 439 <211> 176 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-57 deaminase <400> 439 Met Ser Glu Ser Ser Ala Val Tyr Ser Asp Glu Tyr Trp Leu Arg Tyr 1 5 10 15 Ala Leu Gln Leu Ala Glu Arg Ala Tyr Gln Gln Gly Glu Val Pro Val 20 25 30 Gly Ala Val Leu Val Arg Asp Asn Gln Ile Leu Gly Glu Gly Trp Asn 35 40 45 Gln Ser Ile Ser Gln His Asp Ala Thr Ala His Ala Glu Ile Met Ala 50 55 60 Leu Arg Ala Ala Gly Leu Val Ala Gly Asn Tyr Arg Leu Pro Asn Thr 65 70 75 80 Ser Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Leu 85 90 95 Leu His Ala Arg Val Glu Arg Val Val Phe Gly Ala Tyr Asp Pro Lys 100 105 110 Thr Gly Ala Val Gly Ser Met Phe Asp Val Leu Leu Asp Ala Arg His 115 120 125 Asn His Gln Val Gln Leu Thr Gly Gly Val Leu Gln Ala Asp Cys Val 130 135 140 Ala Gln Leu Gln Ala Phe Phe Lys Glu Arg Arg Leu Ala Gln Lys Leu 145 150 155 160 Ala Lys Phe Asn Ser Val Thr Ile Ser Ser Pro Thr Ser Thr Glu Asn 165 170 175 <210> 440 <211> 158 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-58 deaminase <400> 440 Met Ser Leu Ala Asp Arg His Glu Met Phe Met Gln Met Ala Leu Gln 1 5 10 15 Gln Ala Gln Leu Ala Tyr Asp Cys Ala Glu Val Pro Val Gly Ala Val 20 25 30 Val Val Asn Ser Ala Gly Glu Val Ile Gly Lys Gly Tyr Asn Arg Thr 35 40 45 Ile Ile Asp Ser Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu Arg 50 55 60 Gln Ala Ala Ala His Glu Gln Asn Tyr Arg Leu Pro Asp Leu Thr Val 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ile Gly Ala Leu Thr His 85 90 95 Ala Arg Ile Ala His Val Val Tyr Gly Ala Ser Asp Pro Lys Thr Gly 100 105 110 Ala Cys Gly Ser Val Leu Cys Ile Gln Ala Asn Lys Lys Ile Asn His 115 120 125 His Thr Arg Ile Thr Ser Gly Val Leu Glu Gln Ala Cys Ala Glu Lys 130 135 140 Leu Arg His Phe Phe Arg Glu Arg Arg Lys Gly Ser Lys Leu 145 150 155 <210> 441 <211> 154 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-59 deaminase <400> 441 Met Ala Asp Asp Asp Phe Met Ala Leu Ala Ile Glu Gln Ala Leu Leu 1 5 10 15 Ala Gln Ala Gln Gly Glu Val Pro Val Gly Ala Val Leu Val Asp Gly 20 25 30 Ser Gly His Val Ile Gly Arg Gly Ala Asn Ala Val Ile Gly Leu Ser 35 40 45 Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu Arg Ser Ala Ala Lys 50 55 60 Leu Leu Gly Asn Tyr Arg Leu Pro Gln Thr Thr Leu Phe Val Thr Leu 65 70 75 80 Glu Pro Cys Ala Met Cys Leu Gly Ala Leu Phe His Ala Arg Val Ser 85 90 95 Arg Ile Val Phe Gly Ala Pro Asp Pro Lys Thr Gly Ala Cys Gly Ser 100 105 110 Arg Leu Asp Leu Thr Ala Pro Asp Leu Ile Asn Phe His Ala Ser Val 115 120 125 Arg Gly Gly Val Met Gln Glu Ala Cys Gly His Leu Leu Thr Asp Phe 130 135 140 Phe Lys Arg Lys Arg Ser Glu Lys Leu Ser 145 150 <210> 442 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-60 deaminase <400> 442 Met Arg Val Ala Leu Gly Ala Ala Arg Glu Ala Gln Ala Ala Gly Glu 1 5 10 15 Val Pro Val Gly Ala Val Ile Val Arg Asp Gly Val Leu Ile Ala Thr 20 25 30 Gly Arg Asn Ala Pro Arg Gln Gln His Asp Pro Thr Ala His Ala Glu 35 40 45 Ile Ala Ala Leu Arg Ala Ala Ala Arg Arg Leu Gly Asn Tyr Arg Leu 50 55 60 Asp Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Leu Met Cys Val 65 70 75 80 Gly Ala Met Leu His Ala Arg Leu Glu Arg Val Val Phe Gly Ala Pro 85 90 95 Asp Pro Lys Thr Gly Ala Ala Gly Ser Val Phe Asn Ala Leu Ala Glu 100 105 110 Pro Lys Leu Asn His Gln Thr Thr Val Glu Gly Gly Val Leu Ala Thr 115 120 125 Glu Cys Ala Ala Leu Leu Gln Val Phe Phe Gly Gln Arg Arg Leu Leu 130 135 140 Gln Arg Ile Ser Ala Gln Pro Leu Arg Asp Asp Ala Leu Arg Thr Ser 145 150 155 160 Glu Ala Arg Met Ala Ala Phe Ala Ser Pro Leu Ser Arg Trp Val Cys 165 170 175 Asp Leu Pro Ala Leu Gln Gly Leu Arg Leu His Tyr Leu Asp Met Gly 180 185 190 Pro Ser Thr Glu Gly Arg Ala Trp Leu Leu Leu His 195 200 <210> 443 <211> 168 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-61 deaminase <400> 443 Met Asn Thr Glu Gln Ser Lys Pro Leu Leu Gly Asp Ala His Phe Met 1 5 10 15 Gln Gln Ala Leu Gln Leu Ala Asp Ala Ala Phe Ala Leu Gln Glu Val 20 25 30 Pro Val Gly Ala Val Val Val Gln Asp Gly Ile Ile Ile Gly Arg Gly 35 40 45 Phe Asn Ala Pro Ile Thr Gln His Asp Pro Cys Ala His Ala Glu Ile 50 55 60 Leu Ala Leu Arg Asp Ala Ala Lys Asn Ile Gly Asn Tyr Arg Leu Val 65 70 75 80 Gly Cys Glu Leu Phe Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly 85 90 95 Ala Met Met His Ala Arg Ile Ala Arg Val Val Tyr Gly Ala Tyr Asp 100 105 110 Leu Lys Thr Gly Ala Cys Gly Ser Val Gln Asn Val Phe Asn Glu Pro 115 120 125 Arg Trp Asn His His Thr Ile Cys Thr Gly Gly Val Leu Ala Glu Gln 130 135 140 Cys Gly Thr Lys Leu Ser Gln Phe Phe Ala Leu Arg Arg Ala Gln Lys 145 150 155 160 Lys Ser Leu Thr Ala Thr Trp Thr 165 <210> 444 <211> 283 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG121 deaminase <220> <223> Description: MG121-1 deaminase <400> 444 Met Lys Val Thr Leu Gly Gly Gln Thr Ile Asp Val Glu Glu Val Leu 1 5 10 15 Lys Arg Ile Ser Ser Thr Thr Val Ala Ala Ala Leu Ile Lys Asp Gly 20 25 30 Glu Val Val Ala Val Glu Glu Thr Gly Gly Glu His Ala Glu Lys Lys 35 40 45 Leu Val Arg Lys His Asp Val Glu Gly Ala Val Ile Phe Val Thr Ala 50 55 60 Arg Pro Cys Arg Tyr Cys Ala Glu Ala Met Ala Glu Ala Gly Val Ala 65 70 75 80 Gly Val Val Tyr Leu Gly Lys Gly Arg Gly Tyr Gly Pro Tyr Leu Leu 85 90 95 Glu Arg Leu Gly Val Pro Cys Val Glu Val His Pro Ser Glu Pro Pro 100 105 110 Ala Trp Arg Pro Val Pro Arg Leu Asp Val Leu Ile Thr Phe Gly Gly 115 120 125 Asn Pro Tyr Leu Thr Glu Glu Asp Val Ala Ala Arg Thr Tyr Ala Leu 130 135 140 Leu Thr Gly Ile Gly Val Glu Ala Glu Val Val Pro Ala Pro Asn Asn 145 150 155 160 Met Ala Gly Arg Val Glu Val Met Val Lys Arg Gly Asp Pro Asp Arg 165 170 175 Ala His Gly Arg Leu Lys Glu Thr Phe Gly Pro Val Phe Lys Val Arg 180 185 190 Arg Phe Gln Leu Ser Gly Asp Tyr Glu Asp Arg Glu Ser Leu Ala Glu 195 200 205 Asp Val Leu Glu Val Val Glu Pro Leu Ile Glu Asp Pro Phe Ala Val 210 215 220 Arg Ala Asn Val Ala Ser Pro Gly Pro Thr Phe Ser Gly Ser Lys Glu 225 230 235 240 Ala Glu Val Phe Ile Gly Asp Val Leu Thr Ser Ala Gly His Glu Val 245 250 255 Asp Leu Glu Asp Pro Arg Thr Leu Val His Val Asp Val Leu Gly Arg 260 265 270 Arg Val Ser Val Gly Val Glu Arg Arg Asp Gly 275 280 <210> 445 <211> 279 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG121 deaminase <220> <223> Description: MG121-2 deaminase <400> 445 Val Lys Ile Thr Leu Ala Gly Glu Thr Ile Asp Val Glu Lys Val Leu 1 5 10 15 Arg Glu Ile Pro Thr Arg Thr Val Thr Ala Ala Leu Ile Lys Asp Gly 20 25 30 Glu Val Lys Ala Tyr Glu Glu Ala Asp Gly Glu His Ala Glu Lys Lys 35 40 45 Leu Ile Arg Asn His Asp Val Ser Asp Gly Val Val Phe Val Thr Ile 50 55 60 Arg Pro Cys Leu Tyr Cys Ala Arg Glu Leu Ala Lys Ala Gly Val Ala 65 70 75 80 Gly Val Val Tyr Ile Gly Arg Gly Arg Gly Leu Gly Pro Tyr Tyr Leu 85 90 95 Ala Arg Lys Gly Ile Glu Val Val Glu Val Asn Pro Ser Arg Pro Leu 100 105 110 His Tyr Asp Pro Val Glu Arg Leu Asp Val Leu Val Thr Phe Gly Gly 115 120 125 Asn Pro Tyr Leu Thr Glu Glu Asp Val Ala Ala Arg Val Tyr Cys Leu 130 135 140 Leu Thr Gly Lys Gly Ile Lys Ala Glu Ile Ala Pro Ala Pro Glu Asn 145 150 155 160 Leu Ala Gly Arg Val Glu Val Met Ile Thr Asp Gly Asp Ser Glu Arg 165 170 175 Ala Ala Arg Val Ile Glu Arg Glu Leu Pro Thr Phe Asn Val Arg His 180 185 190 Phe Leu Leu Ser Asp Arg Phe Asp Asp Arg Glu Glu Leu Ser Lys Arg 195 200 205 Val Leu Glu Glu Ile Glu Pro Arg Val Glu Asp Pro Phe Ala Val Arg 210 215 220 Ala Arg Ile Ala Arg Ala Gly Leu Phe Ser Ser Ser Arg Asp Ala Glu 225 230 235 240 Val Phe Leu Gly Asp Val Leu Thr Ser Ala Gly His Glu Val Asp Leu 245 250 255 Asp Glu Pro Arg Thr Val Val His Val Asp Val Leu Gly Asp Arg Val 260 265 270 Ser Val Gly Val Glu Lys Arg 275 <210> 446 <211> 283 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG121 deaminase <220> <223> Description: MG121-3 deaminase <400> 446 Met Lys Val Thr Leu Gly Gly Gln Thr Ile Asp Val Glu Glu Val Leu 1 5 10 15 Lys Arg Ile Ser Ser Thr Thr Val Ala Ala Ala Leu Ile Lys Asp Gly 20 25 30 Glu Val Val Ala Val Glu Glu Thr Gly Gly Glu His Ala Glu Lys Lys 35 40 45 Leu Val Arg Lys His Asp Val Glu Gly Ala Val Ile Phe Val Thr Ala 50 55 60 Arg Pro Cys Arg Tyr Cys Ala Glu Ala Met Ala Glu Ala Gly Val Ala 65 70 75 80 Gly Val Val Tyr Leu Gly Lys Gly Arg Gly Tyr Gly Pro Tyr Leu Leu 85 90 95 Glu Arg Leu Gly Val Pro Cys Val Glu Val His Pro Ser Glu Pro Pro 100 105 110 Ala Trp Arg Pro Val Pro Arg Leu Asp Val Leu Ile Thr Phe Gly Gly 115 120 125 Asn Pro Tyr Leu Thr Glu Glu Asp Val Ala Ala Arg Thr Tyr Ala Leu 130 135 140 Leu Thr Gly Ile Gly Ile Glu Ala Glu Val Val Pro Ala Pro Asn Asn 145 150 155 160 Met Ala Gly Arg Val Glu Val Met Val Lys Arg Gly Asp Pro Asp Arg 165 170 175 Ala His Gly Arg Leu Lys Glu Thr Phe Gly Ser Val Phe Lys Val Arg 180 185 190 Arg Phe Gln Leu Ser Gly Asp Tyr Glu Asp Arg Glu Ser Leu Ala Glu 195 200 205 Asp Val Leu Glu Val Val Glu Pro Leu Ile Glu Asp Pro Phe Ala Val 210 215 220 Arg Ala Asn Val Ala Ser Pro Gly Pro Thr Phe Ser Gly Ser Lys Glu 225 230 235 240 Ala Glu Val Phe Ile Gly Asp Val Leu Thr Ser Ala Gly His Glu Val 245 250 255 Asp Leu Glu Asp Pro Arg Thr Leu Val His Val Asp Val Leu Gly Arg 260 265 270 Arg Val Ser Val Gly Val Glu Arg Arg Asp Gly 275 280 <210> 447 <211> 280 <212> PRT <213> Unknown <220> <223> Description of Unknown: uncultivated organism <220> <223> Category: MG121 deaminase <220> <223> Description: MG121-4 deaminase <400> 447 Met Arg Ser Ala Glu Tyr Leu Ala Tyr Leu Arg Arg Arg Tyr Gly Leu 1 5 10 15 Arg Pro Asn Arg Arg Leu Gly Gln His Phe Met Val Asp Asp Arg Leu 20 25 30 Leu Arg Phe Met Val Glu Ala Ala Gly Val Gly Pro Glu Asp Thr Val 35 40 45 Leu Glu Ile Gly Pro Gly Pro Gly Leu Leu Thr Arg Tyr Leu Ile Glu 50 55 60 Arg Ala Gly Arg Val Val Ala Val Glu Leu Asp Glu Arg Leu Val Glu 65 70 75 80 Val Leu Glu Arg Glu Leu Gly Asp Ala Glu Asn Leu Glu Ile Val His 85 90 95 Ala Asp Phe Leu Glu Tyr Gly Val Pro Glu Glu Val Asn Lys Val Val 100 105 110 Ser Asn Leu Pro Tyr Gln Ile Ser Ser Glu Ala Thr Phe Glu Ile Leu 115 120 125 Arg Ser Asp Val Glu Arg Ala Val Leu Thr Tyr Gln Arg Glu Phe Ala 130 135 140 Glu Arg Met Thr Ala Glu Pro Gly Thr Arg Gly Tyr Gly Arg Leu Thr 145 150 155 160 Val Met Val Asn Leu Leu Ala Arg Val Glu Val Leu Arg Ala Val Pro 165 170 175 Arg Arg Ala Phe Val Pro Pro Pro Arg Val Ser Ser Ala Ile Val Arg 180 185 190 Leu Glu Pro Arg Pro Glu Ser Glu Leu Pro Asp Val Asp Pro Glu Thr 195 200 205 Leu Glu Ala Val Cys Arg Gly Leu Phe Gln His Arg Arg Lys Thr Val 210 215 220 Arg Asn Ala Leu Arg Leu Ser Ala His Glu Trp Gly Gly Asp Glu Glu 225 230 235 240 Val Val Glu Glu Val Leu Arg Arg Leu Pro Glu Glu Leu Leu Asp Lys 245 250 255 Arg Pro Leu His Leu Thr Pro Glu Glu Val Val Arg Val Ala Arg Cys 260 265 270 Val Glu Arg Ala Arg Gly Ser Ser 275 280 <210> 448 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V1 <400> 448 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 449 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V2 <400> 449 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 450 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V3 <400> 450 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 451 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V4 <400> 451 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 452 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V5 <400> 452 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 453 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V6 <400> 453 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 454 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V7 <400> 454 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Cys Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 455 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V8 <400> 455 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 456 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V9 <400> 456 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 457 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V10 <400> 457 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Ser Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 458 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V11 <400> 458 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Arg 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 459 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V12 <400> 459 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Arg Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 460 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V13 <400> 460 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Pro Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 461 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V14 <400> 461 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 462 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V15 <400> 462 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 463 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V16 <400> 463 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 464 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V17 <400> 464 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 465 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V18 <400> 465 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Cys Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 466 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V19 <400> 466 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 467 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V20 <400> 467 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Cys Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 468 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V21 <400> 468 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Cys Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 469 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V22 <400> 469 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Cys Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 470 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V23 <400> 470 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Cys Tyr Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 471 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V24 <400> 471 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Cys Tyr Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 472 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V25 <400> 472 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Cys Tyr Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 473 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V26 <400> 473 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Cys Arg Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 474 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V27 <400> 474 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Arg 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Cys Arg Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 475 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: MG68 putative adenosine deaminase (TadA-like) <220> <223> Description: MG68-4_V28 <400> 475 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Arg 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg 130 135 140 Leu Leu Cys Asp Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn 165 <210> 476 <211> 962 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: adenine base editor <220> <223> Description: MG68-4_V1-nMG34-1 (D10A) <400> 476 Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala 1 5 10 15 Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly 20 25 30 Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg 35 40 45 Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile 50 55 60 Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val 85 90 95 His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr 100 105 110 Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn 115 120 125 His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg 130 135 140 Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala 145 150 155 160 Arg Asp Asn Ser Ser Gly Asn Gly Thr Ser Gly Gly Ser Ser Gly Gly 165 170 175 Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu 180 185 190 Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Glu Arg Glu Leu Val Leu 195 200 205 Gly Ile Ala Tyr Gly Gly Lys Tyr Thr Gly Leu Ala Val Val Asp Arg 210 215 220 Arg His Asn Gln Val Leu Tyr Ala Asn Arg Leu Lys Met Arg Asp Asp 225 230 235 240 Val Ala Gly Ile Leu Lys Asp Arg Arg Lys Gln Arg Gly Ile Arg Arg 245 250 255 Thr Ala Gln Thr Lys Lys Lys Arg Leu Arg Glu Leu Lys Asn Tyr Leu 260 265 270 Lys Ser Ile Gly Tyr Asn Glu Ser Thr Ala Thr Phe Glu Thr Val Tyr 275 280 285 Ser Leu Ala His Lys Arg Gly Tyr Asp Tyr Ala Asp Met Pro Glu Glu 290 295 300 Lys Thr Ser Glu Glu Ile Glu Ala Met Asp Val Glu Glu Arg Lys Gln 305 310 315 320 Trp Glu Lys Glu Lys Gln Glu Trp Glu Glu Thr Lys Arg Asn Ser Arg 325 330 335 His Arg Lys Glu Val Val Lys Asp Val His Lys Ala Met Ile Glu Gly 340 345 350 Arg Ala Thr Glu Glu Gln Ile Lys Arg Val Glu Arg Ile Phe Asn Lys 355 360 365 Gln Tyr Arg Pro Lys Arg Phe Asn Asn Arg Ile Leu Thr Lys Cys Lys 370 375 380 Val Glu Asp Cys Gly Val Asn Thr Pro Leu Arg Lys Asn Val Arg Asp 385 390 395 400 Leu Leu Ile Glu Asn Ile Val Arg Phe Phe Pro Ile Glu Gln Ser Glu 405 410 415 Lys Asp Asn Leu Lys Asp Ala Val Leu Asp Lys Asn Arg Arg Glu Glu 420 425 430 Val Lys Ser Phe Phe Arg Lys His Lys Thr Asp Glu His Ile Arg Lys 435 440 445 Gln Val Tyr Asp Ile Ala Asp Asn Lys Leu Ser Gly Arg Thr Val Phe 450 455 460 Cys Lys Glu His Ile Leu Glu His Thr Glu His Ser Lys Glu Glu Arg 465 470 475 480 Lys Val Phe Arg Leu Ala Pro Ser Leu Lys Thr Lys Ile Glu Asn Val 485 490 495 Leu Ala Val Ile Lys Asp Glu Ile Leu Pro Lys Phe Thr Val Asn Lys 500 505 510 Val Val Met Glu Ser Asn Asn Phe Asp Ile Ala Ala Lys Thr Gln Gly 515 520 525 Lys Lys Arg Leu Ala Lys Glu Glu Tyr Gly Lys Gly Pro Arg Glu Gly 530 535 540 Lys Glu Thr Arg Lys Glu Ala Leu Leu Arg Glu Thr Asp Gly Arg Cys 545 550 555 560 Ile Tyr Cys Gly Lys Ser Ile Asp Ile Ser Asn Ala His Asp Asp His 565 570 575 Ile Phe Pro Arg Lys Ala Gly Gly Leu Asn Ile Phe Ala Asn Leu Val 580 585 590 Ala Cys Cys Ala Val Cys Asn Glu Asn Lys Lys Gly Arg Thr Pro Leu 595 600 605 Glu Ser Gly Ile Ser Pro Lys Pro Glu Ile Ile Ala Phe Met Lys Asn 610 615 620 Asp Leu Lys Lys Lys Ile Leu Glu Asp Ala Arg Asn Ile Asn Thr Val 625 630 635 640 Asp Phe Asn Lys Tyr Met Ser His Ala Ser Ile Gly Trp Arg Tyr Met 645 650 655 Arg Asp Arg Leu Arg Glu Ser Ala Gly Asn Lys Lys Leu Pro Ile Glu 660 665 670 Arg Gln Ser Gly Ile Tyr Thr Ala Tyr Phe Arg Arg Trp Trp Gly Phe 675 680 685 Lys Lys Glu Arg Gly Asn Thr Leu His His Ala Leu Asp Ala Val Ile 690 695 700 Leu Ala Ser Arg Lys Gly Tyr Ser Asp Asp Gly Leu Val Asp Met Thr 705 710 715 720 Leu Lys Pro Lys Tyr Asn Lys Gly Gly Glu Phe Asp Pro Glu Lys His 725 730 735 Leu Pro Glu Pro Ile Glu Phe Lys Met Asp Lys Gly Ser Arg Gly Ser 740 745 750 Ala Leu His Asp Arg Asn Pro Leu Ser Tyr Lys Lys Gly Ile Ile Thr 755 760 765 Arg Arg Phe Met Val Thr Glu Ile Glu Cys Gly Lys Glu Asp Asp Val 770 775 780 Ile Ser Glu Thr Tyr Arg Glu Lys Leu Lys Glu Ala Phe Lys Arg Phe 785 790 795 800 Asp Thr Lys Lys Gly Lys Cys Leu Thr Asp Lys Glu Ala Lys Glu Ala 805 810 815 Gly Phe Cys Ile Lys Lys Asn Glu Leu Val Met Ser Leu Lys Cys Ser 820 825 830 Ile Lys Gly Thr Gly Pro Gly Gln Met Ile Arg Ile Asn Asn Asn Val 835 840 845 Phe Lys Thr Asn Val His Asn Val Gly Val Asp Val Tyr Leu Asp Glu 850 855 860 Lys Gly Lys Lys Lys Ala Tyr Glu Arg Lys Asn Pro Arg Leu Ser Lys 865 870 875 880 His Phe Ile Glu Pro Pro Pro Gln Pro Asn Gly Arg Val Ser Phe Thr 885 890 895 Leu Lys Arg Arg Asp Met Val Thr Val Glu Gly Glu Asp Ala Ile Tyr 900 905 910 Arg Ile Lys Lys Leu Gly Thr Ser Pro Thr Ile Glu Ala Val Val Gly 915 920 925 Ser Asp Gly Lys Thr Arg Thr Val Ser Ala Thr Lys Leu Thr Lys Ala 930 935 940 Asn Ser Ala Glu Leu Glu Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg 945 950 955 960 Lys Val <210> 477 <211> 1589 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: adenine base editor <220> <223> Description: MG68-4_V1-nSpCas9 (D10A) <400> 477 Met Gly Ser Ser His His His His His His Met Thr Asp Ser Gln Asn 1 5 10 15 Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala Leu Lys Leu Ala Gln Lys 20 25 30 Ala Trp Asp Glu Gly Glu Val Pro Val Gly Ala Ile Leu Val Arg Lys 35 40 45 Gly Glu Val Ile Gly His Gly Trp Asn Arg Ser Ile Gly Ser His Asp 50 55 60 Pro Ser Ala His Ala Glu Ile Met Ala Ile Arg Glu Ala Gly Val Arg 65 70 75 80 Ile Gly Asn Tyr Arg Met Leu Asp Thr Val Leu Tyr Val Thr Leu Glu 85 90 95 Pro Cys Ala Met Cys Ala Gly Ala Leu Val His Gly Arg Ile Ser Arg 100 105 110 Leu Val Phe Gly Ala Glu Asn Pro Lys Thr Gly Ala Cys Gly Ser Val 115 120 125 Met Asp Ile Ala Arg His Pro Ala Leu Asn His Gln Leu Gln Val Asp 130 135 140 Gly Gly Val Met Ala Ala Pro Cys Ala Arg Leu Leu Ser Asp Phe Phe 145 150 155 160 Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala Arg Asp Asn Ser Ser Gly 165 170 175 Asn Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly 180 185 190 Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly 195 200 205 Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser 210 215 220 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 225 230 235 240 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 245 250 255 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 260 265 270 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 275 280 285 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 290 295 300 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 305 310 315 320 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 325 330 335 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 340 345 350 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 355 360 365 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 370 375 380 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 385 390 395 400 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 405 410 415 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 420 425 430 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 435 440 445 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 450 455 460 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 465 470 475 480 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 485 490 495 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 500 505 510 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 515 520 525 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 530 535 540 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 545 550 555 560 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 565 570 575 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 580 585 590 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 595 600 605 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 610 615 620 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 625 630 635 640 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 645 650 655 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 660 665 670 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 675 680 685 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 690 695 700 Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 705 710 715 720 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 725 730 735 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 740 745 750 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 755 760 765 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 770 775 780 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 785 790 795 800 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 805 810 815 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 820 825 830 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 835 840 845 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 850 855 860 Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 865 870 875 880 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 885 890 895 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr 900 905 910 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 915 920 925 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 930 935 940 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 945 950 955 960 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 965 970 975 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 980 985 990 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 995 1000 1005 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr 1010 1015 1020 Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp 1025 1030 1035 Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln 1040 1045 1050 Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg 1055 1060 1065 Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu 1070 1075 1080 Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala 1085 1090 1095 Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu 1100 1105 1110 Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg 1115 1120 1125 Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile 1130 1135 1140 Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu 1145 1150 1155 Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser 1160 1165 1170 Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn 1175 1180 1185 Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly 1190 1195 1200 Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 1205 1210 1215 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1220 1225 1230 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1235 1240 1245 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1250 1255 1260 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1265 1270 1275 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1280 1285 1290 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1295 1300 1305 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1310 1315 1320 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1325 1330 1335 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1340 1345 1350 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1355 1360 1365 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1370 1375 1380 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1385 1390 1395 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1400 1405 1410 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1415 1420 1425 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1430 1435 1440 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1445 1450 1455 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1460 1465 1470 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1475 1480 1485 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1490 1495 1500 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1505 1510 1515 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1520 1525 1530 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1535 1540 1545 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1550 1555 1560 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly 1565 1570 1575 Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1580 1585 <210> 478 <211> 1361 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: cytosine base editor <220> <223> Description: rAPOBEC1-nMG15-1 (D8A) <400> 478 Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr 1 5 10 15 Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His 20 25 30 Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys 35 40 45 Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His 50 55 60 Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys 65 70 75 80 Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr 85 90 95 Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr 100 105 110 Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala 115 120 125 Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp 130 135 140 Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser 145 150 155 160 Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala 165 170 175 His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu 180 185 190 Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg 195 200 205 Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys 210 215 220 His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys 225 230 235 240 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 245 250 255 Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly 260 265 270 Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu 275 280 285 Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly 290 295 300 Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val 305 310 315 320 Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys 325 330 335 Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val 340 345 350 Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu 355 360 365 Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys 370 375 380 His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp 385 390 395 400 Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys 405 410 415 Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg 420 425 430 Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg 435 440 445 Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn 450 455 460 Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile 465 470 475 480 Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser 485 490 495 Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu 500 505 510 Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met 515 520 525 Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg 530 535 540 Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp 545 550 555 560 Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val 565 570 575 Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu 580 585 590 Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu 595 600 605 Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala 610 615 620 Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln 625 630 635 640 Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr 645 650 655 Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu 660 665 670 Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser 675 680 685 Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val 690 695 700 Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser 705 710 715 720 Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile 725 730 735 Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn 740 745 750 Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe 755 760 765 Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys 770 775 780 Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg 785 790 795 800 Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn 805 810 815 Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu 820 825 830 Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg 835 840 845 Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu 850 855 860 Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala 865 870 875 880 Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg 885 890 895 Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr 900 905 910 Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile 915 920 925 Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys 930 935 940 Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val 945 950 955 960 Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn 965 970 975 Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr 980 985 990 Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu 995 1000 1005 Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys 1010 1015 1020 Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn 1025 1030 1035 Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp 1040 1045 1050 Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val 1055 1060 1065 Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu 1070 1075 1080 Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser 1085 1090 1095 Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu 1100 1105 1110 Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu 1115 1120 1125 Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu 1130 1135 1140 Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro 1145 1150 1155 Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met 1160 1165 1170 Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn 1175 1180 1185 Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys 1190 1195 1200 Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu 1205 1210 1215 Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala 1220 1225 1230 Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro 1235 1240 1245 Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys 1250 1255 1260 Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser 1265 1270 1275 Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser 1280 1285 1290 Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val 1295 1300 1305 Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val 1310 1315 1320 Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe 1325 1330 1335 Arg Ser Gly Gly Ser Ser Ser Gly Gly Gly Ala Ser Ser Gly Gly 1340 1345 1350 Ser Pro Lys Lys Lys Arg Lys Val 1355 1360 <210> 479 <211> 1441 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: cytosine base editor <220> <223> Description: rAPOBEC1-nMG15-1 (D8A)-UGI (PBS1) <400> 479 Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr 1 5 10 15 Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His 20 25 30 Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys 35 40 45 Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His 50 55 60 Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys 65 70 75 80 Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr 85 90 95 Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr 100 105 110 Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala 115 120 125 Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp 130 135 140 Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser 145 150 155 160 Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala 165 170 175 His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu 180 185 190 Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg 195 200 205 Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys 210 215 220 His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys 225 230 235 240 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 245 250 255 Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly 260 265 270 Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu 275 280 285 Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly 290 295 300 Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val 305 310 315 320 Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys 325 330 335 Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val 340 345 350 Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu 355 360 365 Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys 370 375 380 His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp 385 390 395 400 Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys 405 410 415 Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg 420 425 430 Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg 435 440 445 Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn 450 455 460 Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile 465 470 475 480 Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser 485 490 495 Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu 500 505 510 Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met 515 520 525 Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg 530 535 540 Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp 545 550 555 560 Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val 565 570 575 Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu 580 585 590 Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu 595 600 605 Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala 610 615 620 Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln 625 630 635 640 Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr 645 650 655 Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu 660 665 670 Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser 675 680 685 Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val 690 695 700 Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser 705 710 715 720 Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile 725 730 735 Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn 740 745 750 Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe 755 760 765 Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys 770 775 780 Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg 785 790 795 800 Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn 805 810 815 Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu 820 825 830 Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg 835 840 845 Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu 850 855 860 Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala 865 870 875 880 Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg 885 890 895 Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr 900 905 910 Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile 915 920 925 Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys 930 935 940 Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val 945 950 955 960 Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn 965 970 975 Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr 980 985 990 Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu 995 1000 1005 Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys 1010 1015 1020 Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn 1025 1030 1035 Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp 1040 1045 1050 Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val 1055 1060 1065 Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu 1070 1075 1080 Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser 1085 1090 1095 Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu 1100 1105 1110 Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu 1115 1120 1125 Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu 1130 1135 1140 Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro 1145 1150 1155 Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met 1160 1165 1170 Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn 1175 1180 1185 Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys 1190 1195 1200 Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu 1205 1210 1215 Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala 1220 1225 1230 Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro 1235 1240 1245 Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys 1250 1255 1260 Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser 1265 1270 1275 Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser 1280 1285 1290 Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val 1295 1300 1305 Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val 1310 1315 1320 Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe 1325 1330 1335 Arg Ser Gly Gly Ser Ser Arg Thr Asn Leu Ser Asp Ile Ile Glu 1340 1345 1350 Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met 1355 1360 1365 Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser 1370 1375 1380 Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn 1385 1390 1395 Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala 1400 1405 1410 Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu 1415 1420 1425 Ala Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1430 1435 1440 <210> 480 <211> 1442 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: cytosine base editor <220> <223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-1 <400> 480 Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr 1 5 10 15 Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His 20 25 30 Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys 35 40 45 Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His 50 55 60 Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys 65 70 75 80 Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr 85 90 95 Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr 100 105 110 Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala 115 120 125 Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp 130 135 140 Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser 145 150 155 160 Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala 165 170 175 His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu 180 185 190 Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg 195 200 205 Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys 210 215 220 His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys 225 230 235 240 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 245 250 255 Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly 260 265 270 Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu 275 280 285 Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly 290 295 300 Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val 305 310 315 320 Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys 325 330 335 Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val 340 345 350 Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu 355 360 365 Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys 370 375 380 His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp 385 390 395 400 Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys 405 410 415 Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg 420 425 430 Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg 435 440 445 Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn 450 455 460 Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile 465 470 475 480 Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser 485 490 495 Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu 500 505 510 Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met 515 520 525 Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg 530 535 540 Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp 545 550 555 560 Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val 565 570 575 Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu 580 585 590 Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu 595 600 605 Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala 610 615 620 Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln 625 630 635 640 Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr 645 650 655 Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu 660 665 670 Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser 675 680 685 Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val 690 695 700 Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser 705 710 715 720 Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile 725 730 735 Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn 740 745 750 Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe 755 760 765 Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys 770 775 780 Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg 785 790 795 800 Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn 805 810 815 Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu 820 825 830 Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg 835 840 845 Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu 850 855 860 Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala 865 870 875 880 Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg 885 890 895 Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr 900 905 910 Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile 915 920 925 Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys 930 935 940 Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val 945 950 955 960 Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn 965 970 975 Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr 980 985 990 Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu 995 1000 1005 Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys 1010 1015 1020 Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn 1025 1030 1035 Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp 1040 1045 1050 Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val 1055 1060 1065 Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu 1070 1075 1080 Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser 1085 1090 1095 Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu 1100 1105 1110 Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu 1115 1120 1125 Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu 1130 1135 1140 Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro 1145 1150 1155 Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met 1160 1165 1170 Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn 1175 1180 1185 Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys 1190 1195 1200 Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu 1205 1210 1215 Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala 1220 1225 1230 Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro 1235 1240 1245 Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys 1250 1255 1260 Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser 1265 1270 1275 Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser 1280 1285 1290 Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val 1295 1300 1305 Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val 1310 1315 1320 Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe 1325 1330 1335 Arg Ser Gly Gly Ser Ser Ser Lys Thr Ile Lys Asp Leu Glu Glu 1340 1345 1350 Phe Ala Ala Glu Lys Leu Gly Tyr Asp Ile Val Phe Gln Glu Ser 1355 1360 1365 Ile Ser Met Glu Pro Gln Glu Val Glu His Leu Ile Thr Thr Asp 1370 1375 1380 Glu Lys Ser Val Leu Val Asn Ser Thr Tyr Asp Asp Asn Lys Glu 1385 1390 1395 Ile Thr Ile Ser Met Ile Ser Thr Pro His Pro Glu Tyr Arg Pro 1400 1405 1410 Ile Ala Leu Ile Ile Gln Asp Met Glu Gly Glu Val Gln Arg Lys 1415 1420 1425 Glu Leu Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1430 1435 1440 <210> 481 <211> 1443 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: cytosine base editor <220> <223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-2 <400> 481 Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr 1 5 10 15 Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His 20 25 30 Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys 35 40 45 Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His 50 55 60 Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys 65 70 75 80 Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr 85 90 95 Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr 100 105 110 Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala 115 120 125 Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp 130 135 140 Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser 145 150 155 160 Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala 165 170 175 His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu 180 185 190 Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg 195 200 205 Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys 210 215 220 His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys 225 230 235 240 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 245 250 255 Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly 260 265 270 Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu 275 280 285 Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly 290 295 300 Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val 305 310 315 320 Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys 325 330 335 Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val 340 345 350 Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu 355 360 365 Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys 370 375 380 His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp 385 390 395 400 Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys 405 410 415 Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg 420 425 430 Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg 435 440 445 Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn 450 455 460 Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile 465 470 475 480 Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser 485 490 495 Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu 500 505 510 Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met 515 520 525 Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg 530 535 540 Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp 545 550 555 560 Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val 565 570 575 Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu 580 585 590 Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu 595 600 605 Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala 610 615 620 Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln 625 630 635 640 Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr 645 650 655 Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu 660 665 670 Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser 675 680 685 Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val 690 695 700 Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser 705 710 715 720 Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile 725 730 735 Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn 740 745 750 Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe 755 760 765 Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys 770 775 780 Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg 785 790 795 800 Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn 805 810 815 Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu 820 825 830 Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg 835 840 845 Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu 850 855 860 Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala 865 870 875 880 Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg 885 890 895 Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr 900 905 910 Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile 915 920 925 Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys 930 935 940 Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val 945 950 955 960 Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn 965 970 975 Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr 980 985 990 Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu 995 1000 1005 Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys 1010 1015 1020 Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn 1025 1030 1035 Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp 1040 1045 1050 Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val 1055 1060 1065 Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu 1070 1075 1080 Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser 1085 1090 1095 Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu 1100 1105 1110 Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu 1115 1120 1125 Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu 1130 1135 1140 Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro 1145 1150 1155 Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met 1160 1165 1170 Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn 1175 1180 1185 Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys 1190 1195 1200 Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu 1205 1210 1215 Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala 1220 1225 1230 Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro 1235 1240 1245 Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys 1250 1255 1260 Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser 1265 1270 1275 Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser 1280 1285 1290 Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val 1295 1300 1305 Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val 1310 1315 1320 Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe 1325 1330 1335 Arg Ser Gly Gly Ser Ser Ser Lys Thr Ile Lys Asp Leu Glu Glu 1340 1345 1350 Phe Ala Ala Glu Lys Leu Gly Tyr Asp Ile Val Phe Gln Glu Ser 1355 1360 1365 Ile Ser Met Glu Pro Gln Glu Val Glu His Leu Ile Thr Thr Asp 1370 1375 1380 Glu Lys Ser Val Leu Val Asn Ser Thr Tyr Asp Asp Asp Lys Glu 1385 1390 1395 Ile Thr Ile Ser Val Ile Ser Thr Pro His Pro Glu Tyr Arg Pro 1400 1405 1410 Ile Ala Leu Val Ile Gln Asp Met Glu Gly Glu Val Gln Arg Lys 1415 1420 1425 Glu Leu Tyr Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1430 1435 1440 <210> 482 <211> 1422 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: cytosine base editor <220> <223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69- <400> 482 Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr 1 5 10 15 Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His 20 25 30 Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys 35 40 45 Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His 50 55 60 Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys 65 70 75 80 Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr 85 90 95 Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr 100 105 110 Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala 115 120 125 Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp 130 135 140 Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser 145 150 155 160 Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala 165 170 175 His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu 180 185 190 Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg 195 200 205 Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys 210 215 220 His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys 225 230 235 240 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 245 250 255 Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly 260 265 270 Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu 275 280 285 Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly 290 295 300 Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val 305 310 315 320 Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys 325 330 335 Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val 340 345 350 Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu 355 360 365 Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys 370 375 380 His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp 385 390 395 400 Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys 405 410 415 Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg 420 425 430 Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg 435 440 445 Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn 450 455 460 Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile 465 470 475 480 Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser 485 490 495 Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu 500 505 510 Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met 515 520 525 Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg 530 535 540 Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp 545 550 555 560 Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val 565 570 575 Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu 580 585 590 Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu 595 600 605 Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala 610 615 620 Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln 625 630 635 640 Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr 645 650 655 Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu 660 665 670 Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser 675 680 685 Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val 690 695 700 Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser 705 710 715 720 Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile 725 730 735 Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn 740 745 750 Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe 755 760 765 Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys 770 775 780 Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg 785 790 795 800 Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn 805 810 815 Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu 820 825 830 Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg 835 840 845 Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu 850 855 860 Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala 865 870 875 880 Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg 885 890 895 Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr 900 905 910 Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile 915 920 925 Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys 930 935 940 Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val 945 950 955 960 Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn 965 970 975 Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr 980 985 990 Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu 995 1000 1005 Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys 1010 1015 1020 Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn 1025 1030 1035 Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp 1040 1045 1050 Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val 1055 1060 1065 Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu 1070 1075 1080 Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser 1085 1090 1095 Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu 1100 1105 1110 Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu 1115 1120 1125 Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu 1130 1135 1140 Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro 1145 1150 1155 Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met 1160 1165 1170 Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn 1175 1180 1185 Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys 1190 1195 1200 Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu 1205 1210 1215 Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala 1220 1225 1230 Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro 1235 1240 1245 Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys 1250 1255 1260 Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser 1265 1270 1275 Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser 1280 1285 1290 Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val 1295 1300 1305 Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val 1310 1315 1320 Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe 1325 1330 1335 Arg Ser Gly Gly Ser Ser Ile Val Arg Val Thr Tyr Asn Val Glu 1340 1345 1350 Gln Glu Val Glu Ile Ser Asn Lys Phe Asn Lys Asp Val Asp Ile 1355 1360 1365 Met Lys Pro Glu Glu Tyr Asp Asp Tyr Ile Asp Asp Leu Met Phe 1370 1375 1380 Ala Leu Asn Glu Lys Leu Pro Glu Tyr Ala Glu Ile Ser Cys Val 1385 1390 1395 Ile Asn Asp Asn Thr Gly Glu Val Leu Phe Glu Gly Gly Ser Gly 1400 1405 1410 Gly Ser Pro Lys Lys Lys Arg Lys Val 1415 1420 <210> 483 <211> 10943 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: Plasmid <220> <223> Description: pET21-CAT (H193Y)-sgRNA-TadA-nSpCas9 (D10A) <400> 483 gaaataattt tgtttaactt taagaaggag atataccatg ggcagcagtc atcatcatca 60 ccatcacatg tctgaagtcg aatttagcca cgaatactgg atgcgtcacg cgctgacgct 120 ggcgaaacgt gcctgggatg agcgggaagt gccggtcggc gcggtattag tgcataacaa 180 tcgggtaatc ggcgaaggct ggaaccgccc gattggtcgc catgatccca ccgcacatgc 240 agaaatcatg gccctgcggc agggtggtct ggtgatgcaa aattatcgtc tgatcgacgc 300 cacgttgtat gtcacgcttg aaccatgtgt aatgtgtgcc ggagcgatga tccacagtcg 360 cattggtcgc gtggtctttg gtgcgcgtga cgcgaaaact ggcgctgcgg gatctttaat 420 ggatgtgctg catcatccgg gtatgaatca ccgagtggaa attacggaag gaatactggc 480 ggatgagtgc gcggcgttgc tcagtgactt ctttcgcatg cgccgccagg aaattaaagc 540 gcagaaaaaa gcgcaatcct cgacggattc aggcgggtcg tcgggaggaa gcagtggcag 600 cgagactccc ggaacttcgg agagcgctac accagaaagt agtggaggca gctctggtgg 660 gtccatggat aagaaatact caataggact ggcgattggc acaaatagcg tcggatgggc 720 tgtgatcact gatgaatata aggttccttc taaaaagttc aaggttctgg gaaatacaga 780 ccgccacagt atcaaaaaaa atcttatagg ggctcttctg tttgacagtg gagagacagc 840 cgaagctact agactcaaac ggacagctag gagaaggtat acaagacgga agaataggat 900 ttgttatctc caggagattt tttcaaatga gatggccaaa gtggatgata gtttctttca 960 tagacttgaa gagtcttttt tggtggaaga agacaagaag catgaaagac atcctatttt 1020 tggaaatata gtggatgaag ttgcttatca cgagaaatat ccaactatct atcatctgag 1080 aaaaaaattg gtggattcta ctgataaagc cgatttgcgc ctgatctatt tggccctggc 1140 ccacatgatt aagtttagag gtcatttttt gattgagggc gatctgaatc ctgataatag 1200 tgatgtggac aaactgttta tccagttggt gcaaacctac aatcaactgt ttgaagaaaa 1260 ccctattaac gcaagtggag tggatgctaa agccattctt tctgcaagat tgagtaaatc 1320 aagaagactg gaaaatctca ttgctcagct ccccggtgag aagaaaaatg gcctgtttgg 1380 gaatctcatt gctttgtcat tgggtttgac ccctaatttt aaatcaaatt ttgatttggc 1440 agaagatgct aaactccagc tttcaaaaga tacttacgat gatgatctgg ataatctgtt 1500 ggctcaaatt ggagatcaat atgctgattt gtttttggca gctaagaatc tgtcagatgc 1560 tattctgctt tcagacatcc tgagagtgaa tactgaaata actaaggctc ccctgtcagc 1620 ttcaatgatt aaacgctacg atgaacatca tcaagacttg actcttctga aagccctggt 1680 tagacaacaa cttccagaaa agtataaaga aatctttttt gatcaatcaa aaaacggata 1740 tgcaggttat attgatggcg gcgcaagcca agaagaattt tataaattta tcaaaccaat 1800 tctggaaaaa atggatggta ctgaggaact gttggtgaaa ctgaatagag aagatttgct 1860 gcgcaagcaa cggacctttg acaacggctc tattccccat caaattcact tgggtgagct 1920 gcatgctatt ttgagaagac aagaagactt ttatccattt ctgaaagaca atagagagaa 1980 gattgaaaaa atcttgactt ttaggattcc ttattatgtt ggtccattgg ccagaggcaa 2040 tagtaggttt gcatggatga ctcggaagtc tgaagaaaca attaccccat ggaattttga 2100 agaagttgtc gataaaggtg cttcagctca atcatttatt gaacgcatga caaactttga 2160 taaaaatctt ccaaatgaaa aagtgctgcc aaaacatagt ttgctttatg agtattttac 2220 cgtttataac gaattgacaa aggtcaaata tgttactgaa ggaatgagaa aaccagcatt 2280 tctttcaggt gaacagaaga aagccattgt tgatctgctc ttcaaaacaa ataggaaagt 2340 gaccgttaag caactgaaag aagattattt caaaaaaata gaatgttttg atagtgttga 2400 aatttcagga gttgaagata gatttaatgc ttcactgggt acataccatg atttgctgaa 2460 aattattaaa gataaagatt ttttggataa tgaagaaaat gaagacatcc tggaggatat 2520 tgttctgaca ttgaccctgt ttgaagatag ggagatgatt gaggaaagac ttaaaacata 2580 cgctcacctc tttgatgata aggtgatgaa acagcttaaa agacgcagat atactggttg 2640 gggaaggttg tccagaaaat tgattaatgg tattagggat aagcaatctg gcaaaacaat 2700 actggatttt ttgaaatcag atggttttgc caatcgcaat tttatgcagc tcatccatga 2760 tgatagtttg acatttaaag aagacatcca aaaagcacaa gtgtctggac aaggcgatag 2820 tctgcatgaa catattgcaa atctggctgg tagccctgct attaaaaaag gtattctcca 2880 gactgtgaaa gttgttgatg aattggtcaa agtgatgggg cggcataagc cagaaaatat 2940 cgttattgaa atggcaagag aaaatcagac aactcaaaag ggccagaaaa attccagaga 3000 gaggatgaaa agaatcgaag aaggtatcaa agaactggga agtcagattc ttaaagagca 3060 tcctgttgaa aatactcaat tgcaaaatga aaagctctat ctctattatc tccaaaatgg 3120 aagagatatg tatgtggacc aagaactgga tattaatagg ctgagtgatt atgatgtcga 3180 tcacattgtt ccacaaagtt tccttaaaga cgattcaata gacaataagg tcctgaccag 3240 gtctgataaa aatagaggta aatccgataa cgttccaagt gaagaagtgg tcaaaaagat 3300 gaaaaactat tggagacaac ttctgaacgc caagctgatc actcaaagga agtttgataa 3360 tctgaccaaa gctgaaagag gaggtttgag tgaacttgat aaagctggtt ttatcaaacg 3420 ccaattggtt gaaactcgcc aaatcactaa gcatgtggca caaattttgg atagtcgcat 3480 gaatactaaa tacgatgaaa atgataaact tattagagag gttaaagtga ttaccctgaa 3540 atctaaactg gtttctgact tcagaaaaga tttccaattc tataaagtga gagagattaa 3600 caattaccat catgcccatg atgcctatct gaatgccgtc gttggaactg ctttgattaa 3660 gaaatatcca aaacttgaaa gcgagtttgt ctatggtgat tataaagttt atgatgttag 3720 gaaaatgatt gctaagtctg agcaagaaat aggcaaagca accgcaaagt atttctttta 3780 ctctaatatc atgaacttct tcaaaacaga aattacactt gcaaatggag agattcgcaa 3840 acgccctctg atcgaaacta atggggaaac tggagaaatt gtctgggata aagggagaga 3900 ttttgccaca gtgcgcaaag tgttgtccat gccccaagtc aatatcgtca agaaaacaga 3960 agtgcagaca ggcggattct ctaaggagtc aattctgcca aaaagaaatt ccgacaagct 4020 gattgctagg aaaaaagact gggacccaaa aaaatatggt ggttttgata gtccaaccgt 4080 ggcttattca gtcctggtgg ttgctaaggt ggaaaaaggg aaatccaaga agctgaaatc 4140 cgttaaagag ctgctgggga tcacaattat ggaaagaagt tcctttgaaa aaaatcccat 4200 tgactttctg gaagctaaag gatataagga agttaaaaaa gacctgatca ttaaactgcc 4260 taaatatagt ctttttgagc tggaaaacgg taggaaacgg atgctggcta gtgccggaga 4320 actgcaaaaa ggaaatgagc tggctctgcc aagcaaatat gtgaattttc tgtatctggc 4380 tagtcattat gaaaagttga agggtagtcc agaagataac gaacaaaaac aattgtttgt 4440 ggagcagcat aagcattatc tggatgagat tattgagcaa atcagtgaat tttctaagag 4500 agttattctg gcagatgcca atctggataa agttcttagt gcatataaca aacatagaga 4560 caaaccaata agagaacaag cagaaaatat cattcatctg tttaccttga ccaatcttgg 4620 agcacccgct gcttttaaat actttgatac aacaattgat aggaaaagat atacctctac 4680 aaaagaagtt ctggatgcca ctcttatcca tcaatccatc actggtcttt atgaaacacg 4740 cattgatttg agtcagctgg gaggtgacgg ctctggcggg tctcccaaga agaagaggaa 4800 agtctaagat ccggctgcta acaaagcccg aaaggaagct gagttggctg ctgccaccgc 4860 tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg gttttttgct 4920 gaaaggagga actatatccg gattggcgaa tgggacgcgc cctgtagcgg cgcattaagc 4980 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 5040 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 5100 ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 5160 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 5220 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 5280 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 5340 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 5400 cttacaattt aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 5460 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 5520 aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 5580 ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 5640 ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 5700 tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 5760 tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 5820 actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 5880 gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 5940 acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 6000 gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 6060 acgagcgtga caccacgatg cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg 6120 gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 6180 ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 6240 gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 6300 cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 6360 agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 6420 catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 6480 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 6540 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 6600 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 6660 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 6720 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 6780 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 6840 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 6900 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6960 agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 7020 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 7080 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 7140 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 7200 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 7260 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 7320 cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg 7380 gtatttcaca ccgcaatggt gcactctcag tacaatctgc tctgatgccg catagttaag 7440 ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 7500 acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 7560 gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 7620 aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat gtctgcctgt 7680 tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct tctgataaag 7740 cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt gtaaggggga 7800 tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac gatacgggtt 7860 actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact ggcggtatgg 7920 atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt taatacagat 7980 gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa cataatggtg 8040 cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa gaccattcat 8100 gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg ctcgcgtatc 8160 ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt cctcaacgac 8220 aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc ctgcttctcg 8280 ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg 8340 aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa 8400 atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata 8460 agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct 8520 ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg 8580 ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 8640 ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac 8700 cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa 8760 gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg 8820 gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac 8880 gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac 8940 cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga 9000 catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata 9060 tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag 9120 cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc 9180 atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg 9240 aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat 9300 gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac 9360 gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt 9420 aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat 9480 cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc 9540 cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac 9600 cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac 9660 tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg 9720 aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct 9780 gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg 9840 gtttaattaa tttgatcggc acgtaagagg ttccaacttt caccataatg aaataagatc 9900 actaccgggc gtattttttg agttatcgag attttcagga gctaaggaag ctaaaatgga 9960 gaaaaaaatc actggatata ccaccgttga tatatcccaa tggcatcgta aagaacattt 10020 tgaggcattt cagtcagttg ctcaatgtac ctataaccag accgttcagc tggatattac 10080 ggccttttta aagaccgtaa agaaaaataa gcacaagttt tatccggcct ttattcacat 10140 tcttgcccgc ctgatgaatg ctcatccgga attccgtatg gcaatgaaag acggtgagct 10200 ggtgatatgg gatagtgttc acccttgtta caccgttttc catgagcaaa ctgaaacgtt 10260 ttcatcgctc tggagtgaat accacgacga tttccggcag tttctacaca tatattcgca 10320 agatgtggcg tgttacggtg aaaacctggc ctatttccct aaagggttta ttgagaatat 10380 gttttttgtc tcagccaatc cctgggtgag tttcaccagt tttgatttaa acgtggccaa 10440 tatggacaac ttcttcgccc ccgttttcac catgggcaaa tattatacgc aaggcgacaa 10500 ggtgctgatg ccgctggcga ttcaggttca ttatgccgtc tgtgatggct tccatgtcgg 10560 cagaatgctt aatgaattac aacagtactg cgatgagtgg cagggcgggg cgtaattttt 10620 ttaaggcagt tattggtgcc cttaaacgcc tggtgctacg cctgaataag tgaagcatgc 10680 aaggagatgg cgcccaacag tcccccggcc acggggcctg ccaccatacc cacgccgaaa 10740 caagcgctca tgagcccgaa gtggcgagcc cgatcttccc catcggtgat gtcggcgata 10800 taggcgccag caaccgcacc tgtggcgccg gtgatgccgg ccacgatgcg tccggcgtag 10860 aggatcgaga tctcgatccc gcgaaattaa tacgactcac tataggggaa ttgtgagcgg 10920 ataacaattc ccctctagga tcc 10943 <210> 484 <211> 8520 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: Plasmid <220> <223> Description: pET21-sgRNA-TadA (ABE8.17m)-nMG34-1 (D10A) <400> 484 gaaataattt tgtttaactt taagaaggag atataccatg ggcagcagtc atcatcatca 60 ccatcactcc gaggttgaat ttagtcatga atattggatg cgccacgcgc tgacgttagc 120 caaacgtgct cgtgatgagc gcgaagttcc agtcggggcc gtcttggtcc ttaacaatcg 180 tgtcattggc gaggggtgga accgcgctat tgggctgcac gatccaacag cgcatgctga 240 gattatggcc ttgcgtcaag gagggttagt aatgcaaaac taccgtctta ttgatgctac 300 gttatactct acattcgaac cctgtgtaat gtgtgcagga gcgatgatcc acagtcgtat 360 tggccgcgta gtatttggtg tacgcaatgc taaaactgga gccgccggat cgttgatgga 420 tgtcttgcat taccctggaa tgaaccatcg tgtagagatc actgaaggca tccttgccga 480 tgagtgtgcg gctttgcttt gctatttctt ccgtatgcca cgtcgtgttt ttaacgccca 540 aaaaaaggct caatccagta ccgattcagg cgggtcgtcg ggaggaagca gtggcagcga 600 gactcccgga acttcggaga gcgctacacc agaaagtagt ggaggcagct ctggtgggtc 660 catggagcgc gagctggtgc tggggatcgc gtatggtggt aagtacacgg gcttggcggt 720 ggtggatcgc cgccacaacc aagtgctgta cgcgaatcgt cttaaaatgc gtgatgacgt 780 ggcaggcatc ttgaaggacc gtcgcaaaca gcgcgggatt cgtcgcacgg cccagacgaa 840 gaagaaacgc cttcgcgagc tgaagaatta cctgaagagc atcgggtaca atgagtcgac 900 ggccaccttc gagaccgtgt attcactggc gcacaagcgt ggttacgact acgcagacat 960 gccagaggag aaaaccagtg aggagattga agcgatggac gttgaggaac gtaagcaatg 1020 ggagaaggaa aagcaagagt gggaagaaac taagcgcaac tctcgccatc gcaaagaggt 1080 agttaaggac gtacacaagg cgatgatcga gggccgtgcc acggaagaac aaattaagcg 1140 tgtggagcgc atcttcaaca agcaatatcg cccgaagcgt tttaacaacc gcatcttgac 1200 caagtgcaaa gtggaagact gtggtgtgaa cactcctttg cgtaagaacg tacgcgacct 1260 gctgattgag aacattgttc gtttctttcc gattgagcag agcgagaaag acaacctgaa 1320 ggacgccgta ttagacaaga atcgtcgcga agaggtgaag tccttctttc gcaagcacaa 1380 aaccgacgag cacatccgta aacaagtgta cgacattgcc gacaataaac tgagcgggcg 1440 tactgtattc tgcaaggagc acattctgga gcacacggaa cactccaagg aagagcgtaa 1500 agtctttcgc ctggcaccga gtctgaagac gaagattgaa aacgtgctgg cagtaatcaa 1560 ggatgaaatt ctccctaagt tcacggtgaa caaagtagtg atggaatcaa ataacttcga 1620 catcgccgcg aagacccaag gtaagaagcg tctcgccaag gaagagtacg gcaagggccc 1680 gcgtgagggt aaggaaacgc gcaaagaggc gctgctgcgc gagaccgacg ggcgctgcat 1740 ttattgcggc aagagcatcg atatttcgaa cgcacacgac gatcacatct tccctcgtaa 1800 agcgggcgga ttgaacattt tcgcgaacct cgtggcctgc tgtgcggtgt gcaacgaaaa 1860 caagaagggc cgcacgcctc tggagtcggg catttcacca aagccagaga ttattgcatt 1920 tatgaagaac gacctgaaga agaaaatctt ggaagatgct cgcaacatta acaccgtcga 1980 cttcaacaag tatatgagcc acgcttcgat tgggtggcgt tacatgcgcg atcgccttcg 2040 cgaatcggca ggtaacaaga aactgccgat cgaacgccaa agtggtattt atacggccta 2100 ctttcgtcgc tggtggggtt tcaagaaaga gcgcggtaat actttgcacc acgctctgga 2160 cgcggtgatt ttggcctcgc gtaagggcta ctcagacgac ggcttagtag acatgacttt 2220 aaaacccaag tacaataagg gcggcgaatt cgatccggag aagcacttac cggagcctat 2280 cgagttcaag atggacaagg ggtcacgcgg tagcgccctg cacgaccgta atccgttgag 2340 ttacaagaag ggtatcatca ctcgtcgctt catggtcact gaaatcgaat gtggcaagga 2400 agatgacgtg atctctgaaa cctaccgcga gaagttgaag gaagcgttca agcgcttcga 2460 caccaagaag ggcaagtgcc tgaccgataa agaagccaaa gaggcggggt tctgtatcaa 2520 gaagaacgag ctggtgatgt cgctgaagtg ttcaatcaag gggactggcc cgggccaaat 2580 gattcgcatt aacaacaacg tgttcaaaac caacgtacac aacgtaggag ttgacgtcta 2640 cctggacgag aagggcaaga agaaggcgta cgaacgcaag aacccacgct tatcgaagca 2700 ttttattgag ccgccgccac aaccgaacgg ccgcgtctct ttcacactga agcgtcgcga 2760 catggtgact gtagagggag aggatgccat ttaccgcatt aagaagttgg gtacttcccc 2820 gaccatcgag gcggtggtgg ggagcgacgg taagacgcgc acagtatcgg caacgaaatt 2880 gaccaaggcc aatagcgccg agctcgaggg ctctggcggg tctcccaaga agaagaggaa 2940 agtctaagat ccggctgcta acaaagcccg aaaggaagct gagttggctg ctgccaccgc 3000 tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg gttttttgct 3060 gaaaggagga actatatccg gattggcgaa tgggacgcgc cctgtagcgg cgcattaagc 3120 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 3180 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 3240 ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 3300 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 3360 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 3420 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 3480 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 3540 cttacaattt aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 3600 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 3660 aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 3720 ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 3780 ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 3840 tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 3900 tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 3960 actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 4020 gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 4080 acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 4140 gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 4200 acgagcgtga caccacgatg cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg 4260 gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 4320 ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 4380 gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 4440 cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 4500 agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 4560 catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 4620 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 4680 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 4740 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 4800 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 4860 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 4920 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 4980 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5040 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 5100 agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 5160 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 5220 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 5280 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 5340 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 5400 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 5460 cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg 5520 gtatttcaca ccgcaatggt gcactctcag tacaatctgc tctgatgccg catagttaag 5580 ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 5640 acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 5700 gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 5760 aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat gtctgcctgt 5820 tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct tctgataaag 5880 cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt gtaaggggga 5940 tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac gatacgggtt 6000 actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact ggcggtatgg 6060 atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt taatacagat 6120 gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa cataatggtg 6180 cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa gaccattcat 6240 gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg ctcgcgtatc 6300 ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt cctcaacgac 6360 aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc ctgcttctcg 6420 ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg 6480 aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa 6540 atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata 6600 agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct 6660 ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg 6720 ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6780 ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac 6840 cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa 6900 gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg 6960 gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac 7020 gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac 7080 cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga 7140 catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata 7200 tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag 7260 cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc 7320 atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg 7380 aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat 7440 gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac 7500 gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt 7560 aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat 7620 cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc 7680 cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac 7740 cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac 7800 tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg 7860 aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct 7920 gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg 7980 gtttaattaa ttacggccag tcatgcataa tccgcacgca tctggaataa ggaagtgcca 8040 ttccgcctga ccttaatacg actcactata gtctttatgg cagggtgaaa cgcgttacag 8100 ttaagaaatt aattgtaaaa cgcctataca gtgaagggat atacgcttgg gtttgtccag 8160 cctgagcctc tatgccagaa atggcgcctt catcgtgggt taggacattt aattttaaaa 8220 aaaaaccccg cttcggcggg gttttttttt agcatgcaag gagatggcgc ccaacagtcc 8280 cccggccacg gggcctgcca ccatacccac gccgaaacaa gcgctcatga gcccgaagtg 8340 gcgagcccga tcttccccat cggtgatgtc ggcgatatag gcgccagcaa ccgcacctgt 8400 ggcgccggtg atgccggcca cgatgcgtcc ggcgtagagg atcgagatct cgatcccgcg 8460 aaattaatac gactcactat aggggaattg tgagcggata acaattcccc tctaggatcc 8520 <210> 485 <211> 8925 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: Plasmid <220> <223> Description: pET21-sgRNA-rAPOBEC1-nMG34-1 (D10A)-UGI (PBS1) <400> 485 atgggcagca gtcatcatca tcaccatcac atgtcgtctg agaccgggcc tgttgccgtg 60 gaccctaccc ttcgccgccg tatcgaacca cacgagtttg aagtgttttt tgacccacgc 120 gaactgcgca aagagacttg tttgctttac gagattaact ggggaggccg tcactccatc 180 tggcgtcaca cttcacaaaa tactaataag cacgttgagg ttaatttcat tgagaaattt 240 actacagagc gctacttctg tccgaataca cgttgcagca tcacctggtt tctttcctgg 300 tccccgtgcg gtgaatgttc acgtgccatc accgaattct tatcgcgcta ccctcacgta 360 actttgttta tctatattgc ccgtttatat caccatgcag accctcgcaa tcgtcagggc 420 ctgcgcgacc ttatctcgag tggagtcacc atccaaatta tgactgaaca ggaatcgggg 480 tattgttggc gcaactttgt caattattct ccgagcaacg aggcacattg gccgcgttac 540 ccacacttat gggtgcgcct ttacgtgctg gaattgtatt gcatcattct tggtcttccc 600 ccatgtttga atatccttcg ccgcaaacag cctcagttga cgttttttac gattgctctt 660 cagtcctgtc actaccaacg tcttcccccg cacatcctgt gggcgaccgg tttgaaatcg 720 gggagtgaaa cacccggcac atccgaaagt gcgacacctg aatctgccat ggagcgcgag 780 ctggtgctgg ggatcgcgta tggtggtaag tacacgggct tggcggtggt ggatcgccgc 840 cacaaccaag tgctgtacgc gaatcgtctt aaaatgcgtg atgacgtggc aggcatcttg 900 aaggaccgtc gcaaacagcg cgggattcgt cgcacggccc agacgaagaa gaaacgcctt 960 cgcgagctga agaattacct gaagagcatc gggtacaatg agtcgacggc caccttcgag 1020 accgtgtatt cactggcgca caagcgtggt tacgactacg cagacatgcc agaggagaaa 1080 accagtgagg agattgaagc gatggacgtt gaggaacgta agcaatggga gaaggaaaag 1140 caagagtggg aagaaactaa gcgcaactct cgccatcgca aagaggtagt taaggacgta 1200 cacaaggcga tgatcgaggg ccgtgccacg gaagaacaaa ttaagcgtgt ggagcgcatc 1260 ttcaacaagc aatatcgccc gaagcgtttt aacaaccgca tcttgaccaa gtgcaaagtg 1320 gaagactgtg gtgtgaacac tcctttgcgt aagaacgtac gcgacctgct gattgagaac 1380 attgttcgtt tctttccgat tgagcagagc gagaaagaca acctgaagga cgccgtatta 1440 gacaagaatc gtcgcgaaga ggtgaagtcc ttctttcgca agcacaaaac cgacgagcac 1500 atccgtaaac aagtgtacga cattgccgac aataaactga gcgggcgtac tgtattctgc 1560 aaggagcaca ttctggagca cacggaacac tccaaggaag agcgtaaagt ctttcgcctg 1620 gcaccgagtc tgaagacgaa gattgaaaac gtgctggcag taatcaagga tgaaattctc 1680 cctaagttca cggtgaacaa agtagtgatg gaatcaaata acttcgacat cgccgcgaag 1740 acccaaggta agaagcgtct cgccaaggaa gagtacggca agggcccgcg tgagggtaag 1800 gaaacgcgca aagaggcgct gctgcgcgag accgacgggc gctgcattta ttgcggcaag 1860 agcatcgata tttcgaacgc acacgacgat cacatcttcc ctcgtaaagc gggcggattg 1920 aacattttcg cgaacctcgt ggcctgctgt gcggtgtgca acgaaaacaa gaagggccgc 1980 acgcctctgg agtcgggcat ttcaccaaag ccagagatta ttgcatttat gaagaacgac 2040 ctgaagaaga aaatcttgga agatgctcgc aacattaaca ccgtcgactt caacaagtat 2100 atgagccacg cttcgattgg gtggcgttac atgcgcgatc gccttcgcga atcggcaggt 2160 aacaagaaac tgccgatcga acgccaaagt ggtatttata cggcctactt tcgtcgctgg 2220 tggggtttca agaaagagcg cggtaatact ttgcaccacg ctctggacgc ggtgattttg 2280 gcctcgcgta agggctactc agacgacggc ttagtagaca tgactttaaa acccaagtac 2340 aataagggcg gcgaattcga tccggagaag cacttaccgg agcctatcga gttcaagatg 2400 gacaaggggt cacgcggtag cgccctgcac gaccgtaatc cgttgagtta caagaagggt 2460 atcatcactc gtcgcttcat ggtcactgaa atcgaatgtg gcaaggaaga tgacgtgatc 2520 tctgaaacct accgcgagaa gttgaaggaa gcgttcaagc gcttcgacac caagaagggc 2580 aagtgcctga ccgataaaga agccaaagag gcggggttct gtatcaagaa gaacgagctg 2640 gtgatgtcgc tgaagtgttc aatcaagggg actggcccgg gccaaatgat tcgcattaac 2700 aacaacgtgt tcaaaaccaa cgtacacaac gtaggagttg acgtctacct ggacgagaag 2760 ggcaagaaga aggcgtacga acgcaagaac ccacgcttat cgaagcattt tattgagccg 2820 ccgccacaac cgaacggccg cgtctctttc acactgaagc gtcgcgacat ggtgactgta 2880 gagggagagg atgccattta ccgcattaag aagttgggta cttccccgac catcgaggcg 2940 gtggtgggga gcgacggtaa gacgcgcaca gtatcggcaa cgaaattgac caaggccaat 3000 agcgccgagc tcgaggggtc tggtggttct accaatcttt cagatattat tgaaaaagag 3060 acaggaaagc agttggtcat tcaagagagt atcctgatgt taccggagga agttgaggag 3120 gtaatcggaa ataaacccga gagcgacatt ttagtccaca ctgcttatga cgagagtacg 3180 gatgagaatg tgatgctgct tacgtcagat gcgcccgagt ataagccgtg ggccctggtc 3240 attcaggaca gtaacggcga aaacaagatc aaaatgcttt ctggtggttc tcccaagaag 3300 aagaggaaag tctaagatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 3360 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt 3420 tttttgctga aaggaggaac tatatccgga ttggcgaatg ggacgcgccc tgtagcggcg 3480 cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc 3540 tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc 3600 gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg 3660 accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg 3720 tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg 3780 gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt 3840 cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa 3900 tattaacgct tacaatttag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 3960 tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 4020 gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 4080 tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 4140 aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 4200 cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 4260 agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 4320 ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 4380 tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 4440 tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 4500 caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 4560 accaaacgac gagcgtgaca ccacgatgcc tgcagcaatg gcaacaacgt tgcgcaaact 4620 attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 4680 ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 4740 taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 4800 taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 4860 aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 4920 agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 4980 ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 5040 ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 5100 cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 5160 tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 5220 tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 5280 tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 5340 tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 5400 ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 5460 acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 5520 ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 5580 gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 5640 ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 5700 ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 5760 taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 5820 cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca 5880 tctgtgcggt atttcacacc gcaatggtgc actctcagta caatctgctc tgatgccgca 5940 tagttaagcc agtatacact ccgctatcgc tacgtgactg ggtcatggct gcgccccgac 6000 acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca 6060 gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga 6120 aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc gtgaagcgat tcacagatgt 6180 ctgcctgttc atccgcgtcc agctcgttga gtttctccag aagcgttaat gtctggcttc 6240 tgataaagcg ggccatgtta agggcggttt tttcctgttt ggtcactgat gcctccgtgt 6300 aagggggatt tctgttcatg ggggtaatga taccgatgaa acgagagagg atgctcacga 6360 tacgggttac tgatgatgaa catgcccggt tactggaacg ttgtgagggt aaacaactgg 6420 cggtatggat gcggcgggac cagagaaaaa tcactcaggg tcaatgccag cgcttcgtta 6480 atacagatgt aggtgttcca cagggtagcc agcagcatcc tgcgatgcag atccggaaca 6540 taatggtgca gggcgctgac ttccgcgttt ccagacttta cgaaacacgg aaaccgaaga 6600 ccattcatgt tgttgctcag gtcgcagacg ttttgcagca gcagtcgctt cacgttcgct 6660 cgcgtatcgg tgattcattc tgctaaccag taaggcaacc ccgccagcct agccgggtcc 6720 tcaacgacag gagcacgatc atgcgcaccc gtggggccgc catgccggcg ataatggcct 6780 gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa ggcttgagcg agggcgtgca 6840 agattccgaa taccgcaagc gacaggccga tcatcgtcgc gctccagcga aagcggtcct 6900 cgccgaaaat gacccagagc gctgccggca cctgtcctac gagttgcatg ataaagaaga 6960 cagtcataag tgcggcgacg atagtcatgc cccgcgccca ccggaaggag ctgactgggt 7020 tgaaggctct caagggcatc ggtcgagatc ccggtgccta atgagtgagc taacttacat 7080 taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt 7140 aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgccag ggtggttttt 7200 cttttcacca gtgagacggg caacagctga ttgcccttca ccgcctggcc ctgagagagt 7260 tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa aatcctgttt gatggtggtt 7320 aacggcggga tataacatga gctgtcttcg gtatcgtcgt atcccactac cgagatatcc 7380 gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg cgcccagcgc catctgatcg 7440 ttggcaacca gcatcgcagt gggaacgatg ccctcattca gcatttgcat ggtttgttga 7500 aaaccggaca tggcactcca gtcgccttcc cgttccgcta tcggctgaat ttgattgcga 7560 gtgagatatt tatgccagcc agccagacgc agacgcgccg agacagaact taatgggccc 7620 gctaacagcg cgatttgctg gtgacccaat gcgaccagat gctccacgcc cagtcgcgta 7680 ccgtcttcat gggagaaaat aatactgttg atgggtgtct ggtcagagac atcaagaaat 7740 aacgccggaa cattagtgca ggcagcttcc acagcaatgg catcctggtc atccagcgga 7800 tagttaatga tcagcccact gacgcgttgc gcgagaagat tgtgcaccgc cgctttacag 7860 gcttcgacgc cgcttcgttc taccatcgac accaccacgc tggcacccag ttgatcggcg 7920 cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca gggccagact ggaggtggca 7980 acgccaatca gcaacgactg tttgcccgcc agttgttgtg ccacgcggtt gggaatgtaa 8040 ttcagctccg ccatcgccgc ttccactttt tcccgcgttt tcgcagaaac gtggctggcc 8100 tggttcacca cgcgggaaac ggtctgataa gagacaccgg catactctgc gacatcgtat 8160 aacgttactg gtttcacatt caccaccctg aattgactct cttccgggcg ctatcatgcc 8220 ataccgcgaa aggttttgcg ccattcgatg gtgtccggga tctcgacgct ctcccttatg 8280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 8340 aaggaatggt ttaattaatt acggccagtc atgcataatc cgcacgcatc tggaataagg 8400 aagtgccatt ccgcctgacc ttaatacgac tcactatagc gcgccggaga aaaccgcctc 8460 ggttacagtt aagaaattaa ttgtaaaacg cctatacagt gaagggatat acgcttgggt 8520 ttgtccagcc tgagcctcta tgccagaaat ggcgccttca tcgtgggtta ggacatttaa 8580 ttttaaaaaa aaaccccgct tcggcggggt ttttttttag catgcaagga gatggcgccc 8640 aacagtcccc cggccacggg gcctgccacc atacccacgc cgaaacaagc gctcatgagc 8700 ccgaagtggc gagcccgatc ttccccatcg gtgatgtcgg cgatataggc gccagcaacc 8760 gcacctgtgg cgccggtgat gccggccacg atgcgtccgg cgtagaggat cgagatctcg 8820 atcccgcgaa attaatacga ctcactatag gggaattgtg agcggataac aattcccctc 8880 taggatccga aataattttg tttaacttta agaaggagat atacc 8925 <210> 486 <211> 9519 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: Plasmid <220> <223> Description: pET21-CAT (H193Y)-sgRNA-MG68-4 (D109N)-nMG34-1 (D10A) <400> 486 ttaattaatt tgatcggcac gtaagaggtt ccaactttca ccataatgaa ataagatcac 60 taccgggcgt attttttgag ttatcgagat tttcaggagc taaggaagct aaaatggaga 120 aaaaaatcac tggatatacc accgttgata tatcccaatg gcatcgtaaa gaacattttg 180 aggcatttca gtcagttgct caatgtacct ataaccagac cgttcagctg gatattacgg 240 cctttttaaa gaccgtaaag aaaaataagc acaagtttta tccggccttt attcacattc 300 ttgcccgcct gatgaatgct catccggaat tccgtatggc aatgaaagac ggtgagctgg 360 tgatatggga tagtgttcac ccttgttaca ccgttttcca tgagcaaact gaaacgtttt 420 catcgctctg gagtgaatac cacgacgatt tccggcagtt tctacacata tattcgcaag 480 atgtggcgtg ttacggtgaa aacctggcct atttccctaa agggtttatt gagaatatgt 540 tttttgtctc agccaatccc tgggtgagtt tcaccagttt tgatttaaac gtggccaata 600 tggacaactt cttcgccccc gttttcacca tgggcaaata ttatacgcaa ggcgacaagg 660 tgctgatgcc gctggcgatt caggttcatt atgccgtctg tgatggcttc catgtcggca 720 gaatgcttaa tgaattacaa cagtactgcg atgagtggca gggcggggcg taattttttt 780 aaggcagtta ttggtgccct taaacgcctg gtgctacgcc tgaataagtg aagcatgcaa 840 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 900 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 960 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 1020 gatcgactcg agtgcggccg caagcttgtc gacggagctc gaattcggat cctaatacga 1080 ctcactatag taatgaacct gaatcgccag gttacagtta agaaattaat tgtaaaacgc 1140 ctatacagtg aagggatata cgcttgggtt tgtccagcct gagcctctat gccagaaatg 1200 gcgccttcat cgtgggttag gacatttaat tttaaaaaaa aaccccgctt cggcggggtt 1260 tttttttagc atgcaaggag atggcgccca acagtccccc ggccacgggg cctgccacca 1320 tacccacgcc gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg 1380 tgatgtcggc gatataggcg ccagcaaccg cacctgtggc gccggtgatg ccggccacga 1440 tgcgtccggc gtagaggatc gagatctcga tcccgcgaaa ttaatacgac tcactatagg 1500 ggaattgtga gcggataaca attcccctct aggatccgaa ataattttgt ttaactttaa 1560 gaaggagata taccccgcgg atgactgatt ctcaaaatga tacagatgaa tactggatgg 1620 gagaggccct gaagttggca caaaaggcat gggacgaagg agaggtgccc gtaggagcca 1680 tcttggttcg taagggcgaa gttatcggtc atggctggaa ccgtagcatc gggtcccatg 1740 acccctcggc gcatgctgaa attatggcta ttcgtgaagc cggggtgcgt atcggtaatt 1800 atcgcatgtt ggataccgta ttatacgtta cgctggagcc gtgtgcaatg tgcgcagggg 1860 cacttgttca cgggcgtatt tcacgcttgg tctttggtgc cgaaaacccc aagacagggg 1920 cgtgcgggtc agtcatggac attgctcgcc accctgcttt gaaccaccaa ttacaagttg 1980 atggtggggt aatggcggct ccttgtgcgc gtcttttatc tgacttcttt cgctggcgtc 2040 gcgctcagaa aaaggcggcc cgtgataata gttcggggaa cggtacctca ggcgggtcgt 2100 cgggaggaag cagtggcagc gagactcccg gaacttcgga gagcgctaca ccagaaagta 2160 gtggaggcag ctctggtggg tccatggagc gcgagctggt gctggggatc gcgtatggtg 2220 gtaagtacac gggcttggcg gtggtggatc gccgccacaa ccaagtgctg tacgcgaatc 2280 gtcttaaaat gcgtgatgac gtggcaggca tcttgaagga ccgtcgcaaa cagcgcggga 2340 ttcgtcgcac ggcccagacg aagaagaaac gccttcgcga gctgaagaat tacctgaaga 2400 gcatcgggta caatgagtcg acggccacct tcgagaccgt gtattcactg gcgcacaagc 2460 gtggttacga ctacgcagac atgccagagg agaaaaccag tgaggagatt gaagcgatgg 2520 acgttgagga acgtaagcaa tgggagaagg aaaagcaaga gtgggaagaa actaagcgca 2580 actctcgcca tcgcaaagag gtagttaagg acgtacacaa ggcgatgatc gagggccgtg 2640 ccacggaaga acaaattaag cgtgtggagc gcatcttcaa caagcaatat cgcccgaagc 2700 gttttaacaa ccgcatcttg accaagtgca aagtggaaga ctgtggtgtg aacactcctt 2760 tgcgtaagaa cgtacgcgac ctgctgattg agaacattgt tcgtttcttt ccgattgagc 2820 agagcgagaa agacaacctg aaggacgccg tattagacaa gaatcgtcgc gaagaggtga 2880 agtccttctt tcgcaagcac aaaaccgacg agcacatccg taaacaagtg tacgacattg 2940 ccgacaataa actgagcggg cgtactgtat tctgcaagga gcacattctg gagcacacgg 3000 aacactccaa ggaagagcgt aaagtctttc gcctggcacc gagtctgaag acgaagattg 3060 aaaacgtgct ggcagtaatc aaggatgaaa ttctccctaa gttcacggtg aacaaagtag 3120 tgatggaatc aaataacttc gacatcgccg cgaagaccca aggtaagaag cgtctcgcca 3180 aggaagagta cggcaagggc ccgcgtgagg gtaaggaaac gcgcaaagag gcgctgctgc 3240 gcgagaccga cgggcgctgc atttattgcg gcaagagcat cgatatttcg aacgcacacg 3300 acgatcacat cttccctcgt aaagcgggcg gattgaacat tttcgcgaac ctcgtggcct 3360 gctgtgcggt gtgcaacgaa aacaagaagg gccgcacgcc tctggagtcg ggcatttcac 3420 caaagccaga gattattgca tttatgaaga acgacctgaa gaagaaaatc ttggaagatg 3480 ctcgcaacat taacaccgtc gacttcaaca agtatatgag ccacgcttcg attgggtggc 3540 gttacatgcg cgatcgcctt cgcgaatcgg caggtaacaa gaaactgccg atcgaacgcc 3600 aaagtggtat ttatacggcc tactttcgtc gctggtgggg tttcaagaaa gagcgcggta 3660 atactttgca ccacgctctg gacgcggtga ttttggcctc gcgtaagggc tactcagacg 3720 acggcttagt agacatgact ttaaaaccca agtacaataa gggcggcgaa ttcgatccgg 3780 agaagcactt accggagcct atcgagttca agatggacaa ggggtcacgc ggtagcgccc 3840 tgcacgaccg taatccgttg agttacaaga agggtatcat cactcgtcgc ttcatggtca 3900 ctgaaatcga atgtggcaag gaagatgacg tgatctctga aacctaccgc gagaagttga 3960 aggaagcgtt caagcgcttc gacaccaaga agggcaagtg cctgaccgat aaagaagcca 4020 aagaggcggg gttctgtatc aagaagaacg agctggtgat gtcgctgaag tgttcaatca 4080 aggggactgg cccgggccaa atgattcgca ttaacaacaa cgtgttcaaa accaacgtac 4140 acaacgtagg agttgacgtc tacctggacg agaagggcaa gaagaaggcg tacgaacgca 4200 agaacccacg cttatcgaag cattttattg agccgccgcc acaaccgaac ggccgcgtct 4260 ctttcacact gaagcgtcgc gacatggtga ctgtagaggg agaggatgcc atttaccgca 4320 ttaagaagtt gggtacttcc ccgaccatcg aggcggtggt ggggagcgac ggtaagacgc 4380 gcacagtatc ggcaacgaaa ttgaccaagg ccaatagcgc cgagctcgag ggctctggcg 4440 ggtctcccaa gaagaagagg aaagtctaag atccggctgc taacaaagcc cgaaaggaag 4500 ctgagttggc tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac 4560 gggtcttgag gggttttttg ctgaaaggag gaactatatc cggattggcg aatgggacgc 4620 gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 4680 acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 4740 cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 4800 tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 4860 gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 4920 cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 4980 gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 5040 gaattttaac aaaatattaa cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc 5100 ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 5160 taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 5220 cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 5280 acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 5340 ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 5400 atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 5460 gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 5520 acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 5580 atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 5640 accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 5700 ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgcagc aatggcaaca 5760 acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 5820 gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 5880 tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 5940 ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 6000 actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 6060 taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 6120 tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 6180 gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 6240 cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 6300 gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 6360 gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 6420 tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 6480 ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 6540 cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 6600 gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 6660 gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 6720 gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 6780 cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 6840 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 6900 cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 6960 cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat 7020 tttctcctta cgcatctgtg cggtatttca caccgcaatg gtgcactctc agtacaatct 7080 gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat 7140 ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 7200 ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 7260 accgtcatca ccgaaacgcg cgaggcagct gcggtaaagc tcatcagcgt ggtcgtgaag 7320 cgattcacag atgtctgcct gttcatccgc gtccagctcg ttgagtttct ccagaagcgt 7380 taatgtctgg cttctgataa agcgggccat gttaagggcg gttttttcct gtttggtcac 7440 tgatgcctcc gtgtaagggg gatttctgtt catgggggta atgataccga tgaaacgaga 7500 gaggatgctc acgatacggg ttactgatga tgaacatgcc cggttactgg aacgttgtga 7560 gggtaaacaa ctggcggtat ggatgcggcg ggaccagaga aaaatcactc agggtcaatg 7620 ccagcgcttc gttaatacag atgtaggtgt tccacagggt agccagcagc atcctgcgat 7680 gcagatccgg aacataatgg tgcagggcgc tgacttccgc gtttccagac tttacgaaac 7740 acggaaaccg aagaccattc atgttgttgc tcaggtcgca gacgttttgc agcagcagtc 7800 gcttcacgtt cgctcgcgta tcggtgattc attctgctaa ccagtaaggc aaccccgcca 7860 gcctagccgg gtcctcaacg acaggagcac gatcatgcgc acccgtgggg ccgccatgcc 7920 ggcgataatg gcctgcttct cgccgaaacg tttggtggcg ggaccagtga cgaaggcttg 7980 agcgagggcg tgcaagattc cgaataccgc aagcgacagg ccgatcatcg tcgcgctcca 8040 gcgaaagcgg tcctcgccga aaatgaccca gagcgctgcc ggcacctgtc ctacgagttg 8100 catgataaag aagacagtca taagtgcggc gacgatagtc atgccccgcg cccaccggaa 8160 ggagctgact gggttgaagg ctctcaaggg catcggtcga gatcccggtg cctaatgagt 8220 gagctaactt acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 8280 gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 8340 ccagggtggt ttttcttttc accagtgaga cgggcaacag ctgattgccc ttcaccgcct 8400 ggccctgaga gagttgcagc aagcggtcca cgctggtttg ccccagcagg cgaaaatcct 8460 gtttgatggt ggttaacggc gggatataac atgagctgtc ttcggtatcg tcgtatccca 8520 ctaccgagat atccgcacca acgcgcagcc cggactcggt aatggcgcgc attgcgccca 8580 gcgccatctg atcgttggca accagcatcg cagtgggaac gatgccctca ttcagcattt 8640 gcatggtttg ttgaaaaccg gacatggcac tccagtcgcc ttcccgttcc gctatcggct 8700 gaatttgatt gcgagtgaga tatttatgcc agccagccag acgcagacgc gccgagacag 8760 aacttaatgg gcccgctaac agcgcgattt gctggtgacc caatgcgacc agatgctcca 8820 cgcccagtcg cgtaccgtct tcatgggaga aaataatact gttgatgggt gtctggtcag 8880 agacatcaag aaataacgcc ggaacattag tgcaggcagc ttccacagca atggcatcct 8940 ggtcatccag cggatagtta atgatcagcc cactgacgcg ttgcgcgaga agattgtgca 9000 ccgccgcttt acaggcttcg acgccgcttc gttctaccat cgacaccacc acgctggcac 9060 ccagttgatc ggcgcgagat ttaatcgccg cgacaatttg cgacggcgcg tgcagggcca 9120 gactggaggt ggcaacgcca atcagcaacg actgtttgcc cgccagttgt tgtgccacgc 9180 ggttgggaat gtaattcagc tccgccatcg ccgcttccac tttttcccgc gttttcgcag 9240 aaacgtggct ggcctggttc accacgcggg aaacggtctg ataagagaca ccggcatact 9300 ctgcgacatc gtataacgtt actggtttca cattcaccac cctgaattga ctctcttccg 9360 ggcgctatca tgccataccg cgaaaggttt tgcgccattc gatggtgtcc gggatctcga 9420 cgctctccct tatgcgactc ctgcattagg aagcagccca gtagtaggtt gaggccgttg 9480 agcaccgccg ccgcaaggaa tggtttaatt aattctaga 9519 <210> 487 <211> 11211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: Plasmid <220> <223> Description: pET21-CAT (H193Y)-sgRNA-MG68-4 (D109N)-nSpCas9 (D10A) <400> 487 gaaataattt tgtttaactt taagaaggag atataccatg ggcagcagtc atcatcatca 60 ccatcacatg actgattctc aaaatgatac agatgaatac tggatgggag aggccctgaa 120 gttggcacaa aaggcatggg acgaaggaga ggtgcccgta ggagccatct tggttcgtaa 180 gggcgaagtt atcggtcatg gctggaaccg tagcatcggg tcccatgacc cctcggcgca 240 tgctgaaatt atggctattc gtgaagccgg ggtgcgtatc ggtaattatc gcatgttgga 300 taccgtatta tacgttacgc tggagccgtg tgcaatgtgc gcaggggcac ttgttcacgg 360 gcgtatttca cgcttggtct ttggtgccga aaaccccaag acaggggcgt gcgggtcagt 420 catggacatt gctcgccacc ctgctttgaa ccaccaatta caagttgatg gtggggtaat 480 ggcggctcct tgtgcgcgtc ttttatctga cttctttcgc tggcgtcgcg ctcagaaaaa 540 ggcggcccgt gataatagtt cggggaactc aggcgggtcg tcgggaggaa gcagtggcag 600 cgagactccc ggaacttcgg agagcgctac accagaaagt agtggaggca gctctggtgg 660 gtccatggat aagaaatact caataggact ggcgattggc acaaatagcg tcggatgggc 720 tgtgatcact gatgaatata aggttccttc taaaaagttc aaggttctgg gaaatacaga 780 ccgccacagt atcaaaaaaa atcttatagg ggctcttctg tttgacagtg gagagacagc 840 cgaagctact agactcaaac ggacagctag gagaaggtat acaagacgga agaataggat 900 ttgttatctc caggagattt tttcaaatga gatggccaaa gtggatgata gtttctttca 960 tagacttgaa gagtcttttt tggtggaaga agacaagaag catgaaagac atcctatttt 1020 tggaaatata gtggatgaag ttgcttatca cgagaaatat ccaactatct atcatctgag 1080 aaaaaaattg gtggattcta ctgataaagc cgatttgcgc ctgatctatt tggccctggc 1140 ccacatgatt aagtttagag gtcatttttt gattgagggc gatctgaatc ctgataatag 1200 tgatgtggac aaactgttta tccagttggt gcaaacctac aatcaactgt ttgaagaaaa 1260 ccctattaac gcaagtggag tggatgctaa agccattctt tctgcaagat tgagtaaatc 1320 aagaagactg gaaaatctca ttgctcagct ccccggtgag aagaaaaatg gcctgtttgg 1380 gaatctcatt gctttgtcat tgggtttgac ccctaatttt aaatcaaatt ttgatttggc 1440 agaagatgct aaactccagc tttcaaaaga tacttacgat gatgatctgg ataatctgtt 1500 ggctcaaatt ggagatcaat atgctgattt gtttttggca gctaagaatc tgtcagatgc 1560 tattctgctt tcagacatcc tgagagtgaa tactgaaata actaaggctc ccctgtcagc 1620 ttcaatgatt aaacgctacg atgaacatca tcaagacttg actcttctga aagccctggt 1680 tagacaacaa cttccagaaa agtataaaga aatctttttt gatcaatcaa aaaacggata 1740 tgcaggttat attgatggcg gcgcaagcca agaagaattt tataaattta tcaaaccaat 1800 tctggaaaaa atggatggta ctgaggaact gttggtgaaa ctgaatagag aagatttgct 1860 gcgcaagcaa cggacctttg acaacggctc tattccccat caaattcact tgggtgagct 1920 gcatgctatt ttgagaagac aagaagactt ttatccattt ctgaaagaca atagagagaa 1980 gattgaaaaa atcttgactt ttaggattcc ttattatgtt ggtccattgg ccagaggcaa 2040 tagtaggttt gcatggatga ctcggaagtc tgaagaaaca attaccccat ggaattttga 2100 agaagttgtc gataaaggtg cttcagctca atcatttatt gaacgcatga caaactttga 2160 taaaaatctt ccaaatgaaa aagtgctgcc aaaacatagt ttgctttatg agtattttac 2220 cgtttataac gaattgacaa aggtcaaata tgttactgaa ggaatgagaa aaccagcatt 2280 tctttcaggt gaacagaaga aagccattgt tgatctgctc ttcaaaacaa ataggaaagt 2340 gaccgttaag caactgaaag aagattattt caaaaaaata gaatgttttg atagtgttga 2400 aatttcagga gttgaagata gatttaatgc ttcactgggt acataccatg atttgctgaa 2460 aattattaaa gataaagatt ttttggataa tgaagaaaat gaagacatcc tggaggatat 2520 tgttctgaca ttgaccctgt ttgaagatag ggagatgatt gaggaaagac ttaaaacata 2580 cgctcacctc tttgatgata aggtgatgaa acagcttaaa agacgcagat atactggttg 2640 gggaaggttg tccagaaaat tgattaatgg tattagggat aagcaatctg gcaaaacaat 2700 actggatttt ttgaaatcag atggttttgc caatcgcaat tttatgcagc tcatccatga 2760 tgatagtttg acatttaaag aagacatcca aaaagcacaa gtgtctggac aaggcgatag 2820 tctgcatgaa catattgcaa atctggctgg tagccctgct attaaaaaag gtattctcca 2880 gactgtgaaa gttgttgatg aattggtcaa agtgatgggg cggcataagc cagaaaatat 2940 cgttattgaa atggcaagag aaaatcagac aactcaaaag ggccagaaaa attccagaga 3000 gaggatgaaa agaatcgaag aaggtatcaa agaactggga agtcagattc ttaaagagca 3060 tcctgttgaa aatactcaat tgcaaaatga aaagctctat ctctattatc tccaaaatgg 3120 aagagatatg tatgtggacc aagaactgga tattaatagg ctgagtgatt atgatgtcga 3180 tcacattgtt ccacaaagtt tccttaaaga cgattcaata gacaataagg tcctgaccag 3240 gtctgataaa aatagaggta aatccgataa cgttccaagt gaagaagtgg tcaaaaagat 3300 gaaaaactat tggagacaac ttctgaacgc caagctgatc actcaaagga agtttgataa 3360 tctgaccaaa gctgaaagag gaggtttgag tgaacttgat aaagctggtt ttatcaaacg 3420 ccaattggtt gaaactcgcc aaatcactaa gcatgtggca caaattttgg atagtcgcat 3480 gaatactaaa tacgatgaaa atgataaact tattagagag gttaaagtga ttaccctgaa 3540 atctaaactg gtttctgact tcagaaaaga tttccaattc tataaagtga gagagattaa 3600 caattaccat catgcccatg atgcctatct gaatgccgtc gttggaactg ctttgattaa 3660 gaaatatcca aaacttgaaa gcgagtttgt ctatggtgat tataaagttt atgatgttag 3720 gaaaatgatt gctaagtctg agcaagaaat aggcaaagca accgcaaagt atttctttta 3780 ctctaatatc atgaacttct tcaaaacaga aattacactt gcaaatggag agattcgcaa 3840 acgccctctg atcgaaacta atggggaaac tggagaaatt gtctgggata aagggagaga 3900 ttttgccaca gtgcgcaaag tgttgtccat gccccaagtc aatatcgtca agaaaacaga 3960 agtgcagaca ggcggattct ctaaggagtc aattctgcca aaaagaaatt ccgacaagct 4020 gattgctagg aaaaaagact gggacccaaa aaaatatggt ggttttgata gtccaaccgt 4080 ggcttattca gtcctggtgg ttgctaaggt ggaaaaaggg aaatccaaga agctgaaatc 4140 cgttaaagag ctgctgggga tcacaattat ggaaagaagt tcctttgaaa aaaatcccat 4200 tgactttctg gaagctaaag gatataagga agttaaaaaa gacctgatca ttaaactgcc 4260 taaatatagt ctttttgagc tggaaaacgg taggaaacgg atgctggcta gtgccggaga 4320 actgcaaaaa ggaaatgagc tggctctgcc aagcaaatat gtgaattttc tgtatctggc 4380 tagtcattat gaaaagttga agggtagtcc agaagataac gaacaaaaac aattgtttgt 4440 ggagcagcat aagcattatc tggatgagat tattgagcaa atcagtgaat tttctaagag 4500 agttattctg gcagatgcca atctggataa agttcttagt gcatataaca aacatagaga 4560 caaaccaata agagaacaag cagaaaatat cattcatctg tttaccttga ccaatcttgg 4620 agcacccgct gcttttaaat actttgatac aacaattgat aggaaaagat atacctctac 4680 aaaagaagtt ctggatgcca ctcttatcca tcaatccatc actggtcttt atgaaacacg 4740 cattgatttg agtcagctgg gaggtgacgg ctctggcggg tctcccaaga agaagaggaa 4800 agtctaagat ccggctgcta acaaagcccg aaaggaagct gagttggctg ctgccaccgc 4860 tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg gttttttgct 4920 gaaaggagga actatatccg gattggcgaa tgggacgcgc cctgtagcgg cgcattaagc 4980 gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 5040 gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 5100 ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 5160 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 5220 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 5280 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 5340 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 5400 cttacaattt aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 5460 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 5520 aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 5580 ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 5640 ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 5700 tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 5760 tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 5820 actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 5880 gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 5940 acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 6000 gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 6060 acgagcgtga caccacgatg cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg 6120 gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 6180 ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 6240 gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 6300 cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 6360 agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 6420 catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 6480 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 6540 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 6600 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 6660 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 6720 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 6780 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 6840 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 6900 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6960 agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 7020 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 7080 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 7140 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 7200 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 7260 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 7320 cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg 7380 gtatttcaca ccgcaatggt gcactctcag tacaatctgc tctgatgccg catagttaag 7440 ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 7500 acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 7560 gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 7620 aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat gtctgcctgt 7680 tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct tctgataaag 7740 cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt gtaaggggga 7800 tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac gatacgggtt 7860 actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact ggcggtatgg 7920 atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt taatacagat 7980 gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa cataatggtg 8040 cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa gaccattcat 8100 gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg ctcgcgtatc 8160 ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt cctcaacgac 8220 aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc ctgcttctcg 8280 ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg 8340 aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa 8400 atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata 8460 agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct 8520 ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg 8580 ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 8640 ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac 8700 cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa 8760 gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg 8820 gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac 8880 gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac 8940 cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga 9000 catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata 9060 tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag 9120 cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc 9180 atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg 9240 aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat 9300 gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac 9360 gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt 9420 aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat 9480 cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc 9540 cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac 9600 cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac 9660 tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg 9720 aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct 9780 gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg 9840 gtttaattaa tttgatcggc acgtaagagg ttccaacttt caccataatg aaataagatc 9900 actaccgggc gtattttttg agttatcgag attttcagga gctaaggaag ctaaaatgga 9960 gaaaaaaatc actggatata ccaccgttga tatatcccaa tggcatcgta aagaacattt 10020 tgaggcattt cagtcagttg ctcaatgtac ctataaccag accgttcagc tggatattac 10080 ggccttttta aagaccgtaa agaaaaataa gcacaagttt tatccggcct ttattcacat 10140 tcttgcccgc ctgatgaatg ctcatccgga attccgtatg gcaatgaaag acggtgagct 10200 ggtgatatgg gatagtgttc acccttgtta caccgttttc catgagcaaa ctgaaacgtt 10260 ttcatcgctc tggagtgaat accacgacga tttccggcag tttctacaca tatattcgca 10320 agatgtggcg tgttacggtg aaaacctggc ctatttccct aaagggttta ttgagaatat 10380 gttttttgtc tcagccaatc cctgggtgag tttcaccagt tttgatttaa acgtggccaa 10440 tatggacaac ttcttcgccc ccgttttcac catgggcaaa tattatacgc aaggcgacaa 10500 ggtgctgatg ccgctggcga ttcaggttca ttatgccgtc tgtgatggct tccatgtcgg 10560 cagaatgctt aatgaattac aacagtactg cgatgagtgg cagggcgggg cgtaattttt 10620 ttaaggcagt tattggtgcc cttaaacgcc tggtgctacg cctgaataag tgaagcatgc 10680 aaggagatgg cgcccaacag tcccccggcc acggggcctg ccaccatacc cacgccgaaa 10740 caagcgctca tgagcccgaa gtggcgagcc cgatcttccc catcggtgat gtcggcgata 10800 taggcgccag caaccgcacc tgtggcgccg gtgatgccgg ccacgatgcg tccggcgtag 10860 aggatcgact cgagtgcggc cgcaagcttg tcgacggagc tcgaattcgg atcctaatac 10920 gactcactat agtaatgaac ctgaatcgcc aggttttaga gctagaaata gcaagttaaa 10980 ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt ttttgtgaac 11040 ctgcaggagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 11100 ctgttgtttg tcggtgaacg ctctcctgag taggacaaat tcgatcccgc gaaattaata 11160 cgactcacta taggggaatt gtgagcggat aacaattccc ctctaggatc c 11211 <210> 488 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: sgRNA scaffold sequence <220> <223> Description: MG15-1 <400> 488 gttgtaattc cctagaaata ggttattaca ataaggtcca acaggagtgt tggtaccgta 60 aagctctaac ggcacccacg ggtgccgtta tctttt 96 <210> 489 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Category: sgRNA scaffold sequence <220> <223> Description: MG34-1 <400> 489 gttacagtta agaaattaat tgtaaaacgc ctatacagtg aagggatata cgcttgggtt 60 tgtccagcct gagcctctat gccagaaatg gcgccttcat cgtgggttag gacatttaat 120 ttt 123 <210> 490 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nMG15-1 (D8A) in E. coli <400> 490 gatccgcgct ggctaccggc ga 22 <210> 491 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nMG15-1 (D8A)-UGI (PBS1) in E. coli <400> 491 gatccgcgct ggctaccggc ga 22 <210> 492 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-1 in E. coli <400> 492 gatccgcgct ggctaccggc ga 22 <210> 493 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-2 in E. coli <400> 493 gatccgcgct ggctaccggc ga 22 <210> 494 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-3 in E. coli <400> 494 gatccgcgct ggctaccggc ga 22 <210> 495 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nSpCas9 (D10A)-UGI (PBS1) in HEK293T <400> 495 ggcccagact gagcacgtga 20 <210> 496 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nSpCas9 (D10A) in HEK293T <400> 496 ggcccagact gagcacgtga 20 <210> 497 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nSpCas9 (D10A)-MG69-1 in HEK293T <400> 497 ggcccagact gagcacgtga 20 <210> 498 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: rAPOBEC1-nSpCas9 (D10A)-MG69-2 in HEK293T <400> 498 ggcccagact gagcacgtga 20 <210> 499 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 1 in HEK293T <400> 499 gattcccacc tctcaatacg tt 22 <210> 500 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 2 in HEK293T <400> 500 cccaggcagg caggctctcc ga 22 <210> 501 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 3 in HEK293T <400> 501 caccccctct ccctccatca gt 22 <210> 502 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 4 in HEK293T <400> 502 tgtacacagt ttcccaagct ac 22 <210> 503 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 1 in HEK293T <400> 503 ctggactctg gccactccct gg 22 <210> 504 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 2 in HEK293T <400> 504 catccagctc cagccccaga gc 22 <210> 505 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 3 in HEK293T <400> 505 gattccggct ctgagggcca gt 22 <210> 506 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 4 in HEK293T <400> 506 gcccttctgt ttgtcccact tg 22 <210> 507 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 5 in HEK293T <400> 507 ttggccaagc caggcctaga at 22 <210> 508 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 6 in HEK293T <400> 508 ctcagctggt acacggcagg gt 22 <210> 509 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 7 in HEK293T <400> 509 tcgcctatgg gaactctgga gg 22 <210> 510 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 1 in HEK293T <400> 510 cctaacatgg ataagtccag at 22 <210> 511 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 2 in HEK293T <400> 511 ggccctcaga gccggaatct ac 22 <210> 512 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 3 in HEK293T <400> 512 tgtcctccct caagatacag ga 22 <210> 513 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 4 in HEK293T <400> 513 tgtgttcacc tgcccttctg tt 22 <210> 514 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 1 in HEK293T <400> 514 cagtgtcccc cttccctatg gg 22 <210> 515 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 2 in HEK293T <400> 515 cccccttccc tatgggaata at 22 <210> 516 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 3 in HEK293T <400> 516 cagctccagc cccagagcct gg 22 <210> 517 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 4 in HEK293T <400> 517 gtgcctctcc ctgcagacgg ta 22 <210> 518 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 1 in HEK293T <400> 518 ttgccacgaa gcaggccaat 20 <210> 519 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 2 in HEK293T <400> 519 cccggggccg ccattgacag 20 <210> 520 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 3 in HEK293T <400> 520 tccggctctg agggccagtg 20 <210> 521 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 4 in HEK293T <400> 521 caaccagtcc ccagtgactc 20 <210> 522 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> Category: spacer <220> <223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 5 in HEK293T <400> 522 gagtccgagc agaagaagaa 20 <210> 523 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify lacZ of E. coli and Sanger sequencing <400> 523 ccaggcttta cactttatgc t 21 <210> 524 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify lacZ of E. coli and Sanger sequencing <400> 524 cgaacatcca aaagtttgtg ttttt 25 <210> 525 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Sanger sequencing of base edit of lacZ of E. coli <400> 525 ccgaaaggcg cggtgccg 18 <210> 526 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Sanger sequencing of base edit of lacZ of E. coli <400> 526 gtatgtggtg gatgaagcc 19 <210> 527 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Sanger sequencing of base edit of lacZ of E. coli <400> 527 ttgtggagcg acatccag 18 <210> 528 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Sanger sequencing of base edit of lacZ of E. coli <400> 528 tgagcgcatt tttacgcgc 19 <210> 529 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Sanger sequencing of base edit of lacZ of E. coli <400> 529 gaaaacggca acccgtgg 18 <210> 530 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Sanger sequencing of base edit of lacZ of E. coli <400> 530 ggattgaaaa tggtctgctg 20 <210> 531 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Sanger sequencing of base edit of lacZ of E. coli <400> 531 actgctgacg ccgctgcg 18 <210> 532 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify CAT (H193Y) of CAT (H193Y)-sgRNA- MG68-4 variant-nSpCas9 (D10A) <400> 532 ccgccgccgc aaggaatggt ttaattaatt tgatcggcac gtaagagg 48 <210> 533 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify CAT (H193Y) of CAT (H193Y)-sgRNA-MG68-4 variant-nSpCas9 <400> 533 ggactgttgg gcgccatctc cttgcatgct tcacttattc aggcgtagca 50 <210> 534 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify CAT (H193Y) of CAT (H193Y)-sgRNA-MG68-4 variant-nMG34-1 (D10A) <400> 534 aaggaatggt ttaattaatt ctagattaat taatttgatc ggcacgtaag 50 <210> 535 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Sanger sequencing primer of CAT (H193Y) <400> 535 ggactgttgg gcgccatctc cttgcatgct tcacttattc aggcgtagca 50 <210> 536 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify BE3 target site in HEK293T cells and Sanger sequencing <400> 536 gaggctggag aggcccgt 18 <210> 537 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify BE3 target site in HEK293T cells for Sanger sequencing <400> 537 gattttcatg caggtgctga aa 22 <210> 538 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 538 gctcttccga tctnnnnnag gaggaagggc ctgagt 36 <210> 539 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 539 gctcttccga tctnnnnntc tgccctcgtg ggtttg 36 <210> 540 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 540 gctcttccga tctnnnnnct ctggccactc cctggc 36 <210> 541 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 541 gctcttccga tctnnnnngg caggctctcc gaggag 36 <210> 542 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 542 gctcttccga tctnnnnngg gaataataaa agtctctctc ttaa 44 <210> 543 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 543 gctcttccga tctnnnnncc ccctccacca gtaccc 36 <210> 544 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 544 gctcttccga tctnnnnncc tgtccttgga gaaccg 36 <210> 545 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 545 gctcttccga tctnnnnngc aggtgaacac aagagct 37 <210> 546 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 5 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 546 gctcttccga tctnnnnnga aggtgtggtt ccagaac 37 <210> 547 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 5 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 547 gctcttccga tctnnnnntc gatgtcctcc ccattg 36 <210> 548 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 548 gctcttccga tctnnnnnaa acaggctaga cataggga 38 <210> 549 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 549 gctcttccga tctnnnnnga agccaccaga gtctcta 37 <210> 550 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 550 gctcttccga tctnnnnngc cgccattgac agaggg 36 <210> 551 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 551 gctcttccga tctnnnnngc atcaaaacaa aagggagatt g 41 <210> 552 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 552 gctcttccga tctnnnnncc tctgcccacc tcactt 36 <210> 553 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 553 gctcttccga tctnnnnngc catgtgggtt aatctgg 37 <210> 554 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 554 gctcttccga tctnnnnncc ggacgcacct acccat 36 <210> 555 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 555 gctcttccga tctnnnnnct agatgggaat ggatggg 37 <210> 556 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 556 gctcttccga tctnnnnnaa ccacaaaccc acgagg 36 <210> 557 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 557 gctcttccga tctnnnnntc aatggcggcc ccgggc 36 <210> 558 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 558 gctcttccga tctnnnnnag tgatccccag tgtccc 36 <210> 559 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 559 gctcttccga tctnnnnngc cctgaacgcg tttgct 36 <210> 560 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 560 gctcttccga tctnnnnntg ggaataataa aagtctctct ct 42 <210> 561 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 561 gctcttccga tctnnnnncc cctccaccag tacccc 36 <210> 562 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 562 gctcttccga tctnnnnnca gggcctcctc agccca 36 <210> 563 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 563 gctcttccga tctnnnnngt ctggatgtcg taagggaa 38 <210> 564 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 5 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 564 gctcttccga tctnnnnngg ggtgtaactc agaatgtttt 40 <210> 565 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 5 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 565 gctcttccga tctnnnnngg gagtgagact cagaga 36 <210> 566 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 6 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 566 gctcttccga tctnnnnngc aaagagggaa atgagatca 39 <210> 567 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 6 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 567 gctcttccga tctnnnnngt gacacatttg tttgagaatc a 41 <210> 568 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 7 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 568 gctcttccga tctnnnnnct ttatccccgc acagag 36 <210> 569 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 7 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 569 gctcttccga tctnnnnnct tggcccatgg gaaatc 36 <210> 570 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 570 gctcttccga tctnnnnngt cccatcccaa cacccc 36 <210> 571 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 571 gctcttccga tctnnnnntg ggcatgtgtg ctccca 36 <210> 572 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 572 gctcttccga tctnnnnnct atgggaataa taaaagtctc tc 42 <210> 573 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 573 gctcttccga tctnnnnnct ccaccagtac cccacc 36 <210> 574 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 574 gctcttccga tctnnnnngg accctggtct ctacct 36 <210> 575 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 575 gctcttccga tctnnnnncc tctcccattg aactacc 37 <210> 576 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 576 gctcttccga tctnnnnncc ccagtgactc agggcc 36 <210> 577 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 577 gctcttccga tctnnnnntc gtaagggaaa gacttaggaa 40 <210> 578 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 578 gctcttccga tctnnnnntc tcccttttgt tttgatgcat tt 42 <210> 579 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 1 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 579 gctcttccga tctnnnnncc accccaggct ctgggg 36 <210> 580 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 580 gctcttccga tctnnnnncc ttttgttttg atgcatttct gttt 44 <210> 581 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 2 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 581 gctcttccga tctnnnnnaa tctaccaccc caggct 36 <210> 582 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 582 gctcttccga tctnnnnnat ccccagtgtc cccctt 36 <210> 583 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 3 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 583 gctcttccga tctnnnnncc aggccctgaa cgcgtt 36 <210> 584 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Forward primer used to amplify A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 584 gctcttccga tctnnnnnag gccaggcctg cggggg 36 <210> 585 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <223> Category: primer <220> <223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 4 in HEK293T cells <220> <221> modified_base <222> (14)..(18) <223> a, c, t, g, unknown or other <400> 585 gctcttccga tctnnnnncc aaaaactccc aaattagcaa a 41 <210> 586 <211> 969 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: adenine base editor <220> <223> Description: TadA (ABE8.17m)-nMG34-1 (D10A) <400> 586 Met Gly Ser Ser His His His His His His Ser Glu Val Glu Phe Ser 1 5 10 15 His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg 20 25 30 Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg 35 40 45 Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr 50 55 60 Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln 65 70 75 80 Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Ser Thr Phe Glu Pro Cys 85 90 95 Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val 100 105 110 Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp 115 120 125 Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly 130 135 140 Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met 145 150 155 160 Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp 165 170 175 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 180 185 190 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 195 200 205 Met Glu Arg Glu Leu Val Leu Gly Ile Ala Tyr Gly Gly Lys Tyr Thr 210 215 220 Gly Leu Ala Val Val Asp Arg Arg His Asn Gln Val Leu Tyr Ala Asn 225 230 235 240 Arg Leu Lys Met Arg Asp Asp Val Ala Gly Ile Leu Lys Asp Arg Arg 245 250 255 Lys Gln Arg Gly Ile Arg Arg Thr Ala Gln Thr Lys Lys Lys Arg Leu 260 265 270 Arg Glu Leu Lys Asn Tyr Leu Lys Ser Ile Gly Tyr Asn Glu Ser Thr 275 280 285 Ala Thr Phe Glu Thr Val Tyr Ser Leu Ala His Lys Arg Gly Tyr Asp 290 295 300 Tyr Ala Asp Met Pro Glu Glu Lys Thr Ser Glu Glu Ile Glu Ala Met 305 310 315 320 Asp Val Glu Glu Arg Lys Gln Trp Glu Lys Glu Lys Gln Glu Trp Glu 325 330 335 Glu Thr Lys Arg Asn Ser Arg His Arg Lys Glu Val Val Lys Asp Val 340 345 350 His Lys Ala Met Ile Glu Gly Arg Ala Thr Glu Glu Gln Ile Lys Arg 355 360 365 Val Glu Arg Ile Phe Asn Lys Gln Tyr Arg Pro Lys Arg Phe Asn Asn 370 375 380 Arg Ile Leu Thr Lys Cys Lys Val Glu Asp Cys Gly Val Asn Thr Pro 385 390 395 400 Leu Arg Lys Asn Val Arg Asp Leu Leu Ile Glu Asn Ile Val Arg Phe 405 410 415 Phe Pro Ile Glu Gln Ser Glu Lys Asp Asn Leu Lys Asp Ala Val Leu 420 425 430 Asp Lys Asn Arg Arg Glu Glu Val Lys Ser Phe Phe Arg Lys His Lys 435 440 445 Thr Asp Glu His Ile Arg Lys Gln Val Tyr Asp Ile Ala Asp Asn Lys 450 455 460 Leu Ser Gly Arg Thr Val Phe Cys Lys Glu His Ile Leu Glu His Thr 465 470 475 480 Glu His Ser Lys Glu Glu Arg Lys Val Phe Arg Leu Ala Pro Ser Leu 485 490 495 Lys Thr Lys Ile Glu Asn Val Leu Ala Val Ile Lys Asp Glu Ile Leu 500 505 510 Pro Lys Phe Thr Val Asn Lys Val Val Met Glu Ser Asn Asn Phe Asp 515 520 525 Ile Ala Ala Lys Thr Gln Gly Lys Lys Arg Leu Ala Lys Glu Glu Tyr 530 535 540 Gly Lys Gly Pro Arg Glu Gly Lys Glu Thr Arg Lys Glu Ala Leu Leu 545 550 555 560 Arg Glu Thr Asp Gly Arg Cys Ile Tyr Cys Gly Lys Ser Ile Asp Ile 565 570 575 Ser Asn Ala His Asp Asp His Ile Phe Pro Arg Lys Ala Gly Gly Leu 580 585 590 Asn Ile Phe Ala Asn Leu Val Ala Cys Cys Ala Val Cys Asn Glu Asn 595 600 605 Lys Lys Gly Arg Thr Pro Leu Glu Ser Gly Ile Ser Pro Lys Pro Glu 610 615 620 Ile Ile Ala Phe Met Lys Asn Asp Leu Lys Lys Lys Ile Leu Glu Asp 625 630 635 640 Ala Arg Asn Ile Asn Thr Val Asp Phe Asn Lys Tyr Met Ser His Ala 645 650 655 Ser Ile Gly Trp Arg Tyr Met Arg Asp Arg Leu Arg Glu Ser Ala Gly 660 665 670 Asn Lys Lys Leu Pro Ile Glu Arg Gln Ser Gly Ile Tyr Thr Ala Tyr 675 680 685 Phe Arg Arg Trp Trp Gly Phe Lys Lys Glu Arg Gly Asn Thr Leu His 690 695 700 His Ala Leu Asp Ala Val Ile Leu Ala Ser Arg Lys Gly Tyr Ser Asp 705 710 715 720 Asp Gly Leu Val Asp Met Thr Leu Lys Pro Lys Tyr Asn Lys Gly Gly 725 730 735 Glu Phe Asp Pro Glu Lys His Leu Pro Glu Pro Ile Glu Phe Lys Met 740 745 750 Asp Lys Gly Ser Arg Gly Ser Ala Leu His Asp Arg Asn Pro Leu Ser 755 760 765 Tyr Lys Lys Gly Ile Ile Thr Arg Arg Phe Met Val Thr Glu Ile Glu 770 775 780 Cys Gly Lys Glu Asp Asp Val Ile Ser Glu Thr Tyr Arg Glu Lys Leu 785 790 795 800 Lys Glu Ala Phe Lys Arg Phe Asp Thr Lys Lys Gly Lys Cys Leu Thr 805 810 815 Asp Lys Glu Ala Lys Glu Ala Gly Phe Cys Ile Lys Lys Asn Glu Leu 820 825 830 Val Met Ser Leu Lys Cys Ser Ile Lys Gly Thr Gly Pro Gly Gln Met 835 840 845 Ile Arg Ile Asn Asn Asn Val Phe Lys Thr Asn Val His Asn Val Gly 850 855 860 Val Asp Val Tyr Leu Asp Glu Lys Gly Lys Lys Lys Ala Tyr Glu Arg 865 870 875 880 Lys Asn Pro Arg Leu Ser Lys His Phe Ile Glu Pro Pro Pro Gln Pro 885 890 895 Asn Gly Arg Val Ser Phe Thr Leu Lys Arg Arg Asp Met Val Thr Val 900 905 910 Glu Gly Glu Asp Ala Ile Tyr Arg Ile Lys Lys Leu Gly Thr Ser Pro 915 920 925 Thr Ile Glu Ala Val Val Gly Ser Asp Gly Lys Thr Arg Thr Val Ser 930 935 940 Ala Thr Lys Leu Thr Lys Ala Asn Ser Ala Glu Leu Glu Gly Ser Gly 945 950 955 960 Gly Ser Pro Lys Lys Lys Arg Lys Val 965 <210> 587 <211> 1104 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: cytosine base editor <220> <223> Description: rAPOBEC1-nMG34-1 (D10A)-UGI (PBS1) <400> 587 Met Gly Ser Ser His His His His His His Met Ser Ser Glu Thr Gly 1 5 10 15 Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu 20 25 30 Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu 35 40 45 Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr 50 55 60 Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe 65 70 75 80 Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp 85 90 95 Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu 100 105 110 Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg 115 120 125 Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu 130 135 140 Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly 145 150 155 160 Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His 165 170 175 Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu 180 185 190 Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg 195 200 205 Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His 210 215 220 Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser 225 230 235 240 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ala 245 250 255 Met Glu Arg Glu Leu Val Leu Gly Ile Ala Tyr Gly Gly Lys Tyr Thr 260 265 270 Gly Leu Ala Val Val Asp Arg Arg His Asn Gln Val Leu Tyr Ala Asn 275 280 285 Arg Leu Lys Met Arg Asp Asp Val Ala Gly Ile Leu Lys Asp Arg Arg 290 295 300 Lys Gln Arg Gly Ile Arg Arg Thr Ala Gln Thr Lys Lys Lys Arg Leu 305 310 315 320 Arg Glu Leu Lys Asn Tyr Leu Lys Ser Ile Gly Tyr Asn Glu Ser Thr 325 330 335 Ala Thr Phe Glu Thr Val Tyr Ser Leu Ala His Lys Arg Gly Tyr Asp 340 345 350 Tyr Ala Asp Met Pro Glu Glu Lys Thr Ser Glu Glu Ile Glu Ala Met 355 360 365 Asp Val Glu Glu Arg Lys Gln Trp Glu Lys Glu Lys Gln Glu Trp Glu 370 375 380 Glu Thr Lys Arg Asn Ser Arg His Arg Lys Glu Val Val Lys Asp Val 385 390 395 400 His Lys Ala Met Ile Glu Gly Arg Ala Thr Glu Glu Gln Ile Lys Arg 405 410 415 Val Glu Arg Ile Phe Asn Lys Gln Tyr Arg Pro Lys Arg Phe Asn Asn 420 425 430 Arg Ile Leu Thr Lys Cys Lys Val Glu Asp Cys Gly Val Asn Thr Pro 435 440 445 Leu Arg Lys Asn Val Arg Asp Leu Leu Ile Glu Asn Ile Val Arg Phe 450 455 460 Phe Pro Ile Glu Gln Ser Glu Lys Asp Asn Leu Lys Asp Ala Val Leu 465 470 475 480 Asp Lys Asn Arg Arg Glu Glu Val Lys Ser Phe Phe Arg Lys His Lys 485 490 495 Thr Asp Glu His Ile Arg Lys Gln Val Tyr Asp Ile Ala Asp Asn Lys 500 505 510 Leu Ser Gly Arg Thr Val Phe Cys Lys Glu His Ile Leu Glu His Thr 515 520 525 Glu His Ser Lys Glu Glu Arg Lys Val Phe Arg Leu Ala Pro Ser Leu 530 535 540 Lys Thr Lys Ile Glu Asn Val Leu Ala Val Ile Lys Asp Glu Ile Leu 545 550 555 560 Pro Lys Phe Thr Val Asn Lys Val Val Met Glu Ser Asn Asn Phe Asp 565 570 575 Ile Ala Ala Lys Thr Gln Gly Lys Lys Arg Leu Ala Lys Glu Glu Tyr 580 585 590 Gly Lys Gly Pro Arg Glu Gly Lys Glu Thr Arg Lys Glu Ala Leu Leu 595 600 605 Arg Glu Thr Asp Gly Arg Cys Ile Tyr Cys Gly Lys Ser Ile Asp Ile 610 615 620 Ser Asn Ala His Asp Asp His Ile Phe Pro Arg Lys Ala Gly Gly Leu 625 630 635 640 Asn Ile Phe Ala Asn Leu Val Ala Cys Cys Ala Val Cys Asn Glu Asn 645 650 655 Lys Lys Gly Arg Thr Pro Leu Glu Ser Gly Ile Ser Pro Lys Pro Glu 660 665 670 Ile Ile Ala Phe Met Lys Asn Asp Leu Lys Lys Lys Ile Leu Glu Asp 675 680 685 Ala Arg Asn Ile Asn Thr Val Asp Phe Asn Lys Tyr Met Ser His Ala 690 695 700 Ser Ile Gly Trp Arg Tyr Met Arg Asp Arg Leu Arg Glu Ser Ala Gly 705 710 715 720 Asn Lys Lys Leu Pro Ile Glu Arg Gln Ser Gly Ile Tyr Thr Ala Tyr 725 730 735 Phe Arg Arg Trp Trp Gly Phe Lys Lys Glu Arg Gly Asn Thr Leu His 740 745 750 His Ala Leu Asp Ala Val Ile Leu Ala Ser Arg Lys Gly Tyr Ser Asp 755 760 765 Asp Gly Leu Val Asp Met Thr Leu Lys Pro Lys Tyr Asn Lys Gly Gly 770 775 780 Glu Phe Asp Pro Glu Lys His Leu Pro Glu Pro Ile Glu Phe Lys Met 785 790 795 800 Asp Lys Gly Ser Arg Gly Ser Ala Leu His Asp Arg Asn Pro Leu Ser 805 810 815 Tyr Lys Lys Gly Ile Ile Thr Arg Arg Phe Met Val Thr Glu Ile Glu 820 825 830 Cys Gly Lys Glu Asp Asp Val Ile Ser Glu Thr Tyr Arg Glu Lys Leu 835 840 845 Lys Glu Ala Phe Lys Arg Phe Asp Thr Lys Lys Gly Lys Cys Leu Thr 850 855 860 Asp Lys Glu Ala Lys Glu Ala Gly Phe Cys Ile Lys Lys Asn Glu Leu 865 870 875 880 Val Met Ser Leu Lys Cys Ser Ile Lys Gly Thr Gly Pro Gly Gln Met 885 890 895 Ile Arg Ile Asn Asn Asn Val Phe Lys Thr Asn Val His Asn Val Gly 900 905 910 Val Asp Val Tyr Leu Asp Glu Lys Gly Lys Lys Lys Ala Tyr Glu Arg 915 920 925 Lys Asn Pro Arg Leu Ser Lys His Phe Ile Glu Pro Pro Pro Gln Pro 930 935 940 Asn Gly Arg Val Ser Phe Thr Leu Lys Arg Arg Asp Met Val Thr Val 945 950 955 960 Glu Gly Glu Asp Ala Ile Tyr Arg Ile Lys Lys Leu Gly Thr Ser Pro 965 970 975 Thr Ile Glu Ala Val Val Gly Ser Asp Gly Lys Thr Arg Thr Val Ser 980 985 990 Ala Thr Lys Leu Thr Lys Ala Asn Ser Ala Glu Leu Glu Gly Ser Gly 995 1000 1005 Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys 1010 1015 1020 Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val 1025 1030 1035 Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His 1040 1045 1050 Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr 1055 1060 1065 Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp 1070 1075 1080 Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro 1085 1090 1095 Lys Lys Lys Arg Lys Val 1100 <210> 588 <211> 1592 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: adenine base editor <220> <223> Description: MG68-3-nSpCas9 (D10A) <400> 588 Met Gly Ser Ser His His His His His His Met Asn Glu Gln Thr Ser 1 5 10 15 Thr Asp Glu Gln Phe Met Gln Gln Ala Leu Ala Leu Ala Asp Glu Ala 20 25 30 Glu Arg Gln Gly Glu Val Pro Val Gly Ala Leu Leu Val His Gln Gly 35 40 45 Thr Val Ile Gly Arg Gly Phe Asn Gln Val Ile Thr Gln Leu Asp Pro 50 55 60 Ser Ala His Ala Glu Met Leu Ala Ile Arg Asp Ala Ala Arg Tyr Leu 65 70 75 80 Gln Asn Tyr Arg Ile Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro 85 90 95 Cys Pro Met Cys Ala Gly Ala Leu Val His Ala Arg Val Lys Arg Leu 100 105 110 Val Tyr Gly Ala Ser Asp Pro Arg Thr Gly Ala Cys Gly Ser Val Phe 115 120 125 Asn Val Val Ala Asp Thr Arg Leu Asn His Gln Leu Glu Val Val Ala 130 135 140 Gly Val Leu Gly Ser Gln Cys Gly Glu Arg Leu Ser Ala Phe Phe Arg 145 150 155 160 Gln Arg Arg Ala Ala Gln Lys Ala Leu Lys Lys Ala Ala Gln Asn Phe 165 170 175 Gln Ser Pro Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu 180 185 190 Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser 195 200 205 Ser Gly Gly Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 210 215 220 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 225 230 235 240 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 245 250 255 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 260 265 270 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 275 280 285 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 290 295 300 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 305 310 315 320 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 325 330 335 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 340 345 350 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 355 360 365 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 370 375 380 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 385 390 395 400 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 405 410 415 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 420 425 430 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 435 440 445 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 450 455 460 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 465 470 475 480 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 485 490 495 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 500 505 510 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 515 520 525 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 530 535 540 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 545 550 555 560 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 565 570 575 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 580 585 590 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 595 600 605 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 610 615 620 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 625 630 635 640 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 645 650 655 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 660 665 670 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 675 680 685 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 690 695 700 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 705 710 715 720 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 725 730 735 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 740 745 750 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 755 760 765 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 770 775 780 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 785 790 795 800 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 805 810 815 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 820 825 830 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu 835 840 845 Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys 850 855 860 Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn 865 870 875 880 Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys 885 890 895 Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp 900 905 910 Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln 915 920 925 Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 930 935 940 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val 945 950 955 960 Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala 965 970 975 Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg 980 985 990 Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu 995 1000 1005 Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu 1010 1015 1020 Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 1025 1030 1035 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1040 1045 1050 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1055 1060 1065 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1070 1075 1080 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1085 1090 1095 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1100 1105 1110 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1115 1120 1125 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1130 1135 1140 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1145 1150 1155 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1160 1165 1170 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1175 1180 1185 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1190 1195 1200 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1205 1210 1215 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1220 1225 1230 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1235 1240 1245 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1250 1255 1260 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1265 1270 1275 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1280 1285 1290 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1295 1300 1305 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1310 1315 1320 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1325 1330 1335 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1340 1345 1350 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1355 1360 1365 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1370 1375 1380 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1385 1390 1395 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1400 1405 1410 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1415 1420 1425 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1430 1435 1440 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1445 1450 1455 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1460 1465 1470 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1475 1480 1485 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1490 1495 1500 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1505 1510 1515 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1520 1525 1530 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1535 1540 1545 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1550 1555 1560 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1565 1570 1575 Gly Asp Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1580 1585 1590 <210> 589 <211> 1588 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <223> Category: adenine base editor <220> <223> Description: MG68-8-nSpCas9 (D10A) <400> 589 Met Gly Ser Ser His His His His His His Met Pro Gln Ser Glu Gln 1 5 10 15 Asp Ile Tyr Trp Ile Arg Tyr Ala Met Gln Leu Ala Glu Arg Ala Glu 20 25 30 Gln Ala Gly Glu Val Pro Val Gly Ala Val Leu Val Leu Asp Asn Gln 35 40 45 Ala Leu Gly Glu Gly Trp Asn Leu Ser Ile Ser Arg His Asp Pro Cys 50 55 60 Ala His Ala Glu Ile Met Ala Ile Arg Gln Ala Gly Glu Arg Ile Gly 65 70 75 80 Asn Tyr Arg Leu Leu Gly Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys 85 90 95 Val Met Cys Ala Gly Ala Met Val His Ser Arg Ile Ala Arg Val Val 100 105 110 Tyr Gly Ala Ser Asp Leu Lys Thr Gly Ala Ala Gly Ser Val Phe Asp 115 120 125 Val Leu Ser Asp Pro Arg His Asn His Val Val Glu Ile Thr Gly Gly 130 135 140 Val Glu Ser Glu Ala Cys Ser Gln Gln Leu Ser Asp Phe Phe Arg Arg 145 150 155 160 Arg Arg Ala Glu Gln Lys Ala Glu Lys Gln Arg Leu Lys Asp Asn Gln 165 170 175 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 180 185 190 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 195 200 205 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 210 215 220 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 225 230 235 240 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 245 250 255 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 260 265 270 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 275 280 285 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 290 295 300 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 305 310 315 320 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 325 330 335 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 340 345 350 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 355 360 365 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 370 375 380 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 385 390 395 400 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 405 410 415 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 420 425 430 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 435 440 445 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 450 455 460 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 465 470 475 480 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 485 490 495 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 500 505 510 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 515 520 525 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 530 535 540 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 545 550 555 560 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 565 570 575 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 580 585 590 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 595 600 605 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 610 615 620 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 625 630 635 640 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 645 650 655 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 660 665 670 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 675 680 685 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 690 695 700 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 705 710 715 720 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 725 730 735 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 740 745 750 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 755 760 765 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 770 775 780 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 785 790 795 800 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 805 810 815 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 820 825 830 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 835 840 845 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 850 855 860 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 865 870 875 880 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 885 890 895 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 900 905 910 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 915 920 925 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 930 935 940 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 945 950 955 960 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 965 970 975 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 980 985 990 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 995 1000 1005 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1010 1015 1020 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1025 1030 1035 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1040 1045 1050 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1055 1060 1065 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1070 1075 1080 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1085 1090 1095 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1100 1105 1110 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1115 1120 1125 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1130 1135 1140 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1145 1150 1155 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1160 1165 1170 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1175 1180 1185 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1190 1195 1200 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1205 1210 1215 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1220 1225 1230 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1235 1240 1245 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1250 1255 1260 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1265 1270 1275 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1280 1285 1290 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1295 1300 1305 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1310 1315 1320 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1325 1330 1335 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1340 1345 1350 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1355 1360 1365 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1370 1375 1380 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1385 1390 1395 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1400 1405 1410 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1415 1420 1425 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1430 1435 1440 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1445 1450 1455 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1460 1465 1470 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1475 1480 1485 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1490 1495 1500 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1505 1510 1515 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1520 1525 1530 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1535 1540 1545 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1550 1555 1560 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly Ser 1565 1570 1575 Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1580 1585 <210> 590 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> Category: Linker <400> 590 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 591 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> Category: Linker <400> 591 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Ala <210> 592 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> Category: Linker <400> 592 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 <210> 593 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> Category: Linker <400> 593 Gly Thr Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro 1 5 10 15 Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly 20 25 30 Gly Ser

Claims (133)

  1. 조작된 핵산 편집 시스템으로서,
    (a) RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제;
    (b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및
    (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
    i. 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
    ii. 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
    을 포함하는 조작된 가이드 리보핵산 구조체
    를 포함하는 조작된 핵산 편집 시스템.
  2. 제1항에 있어서, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 조작된 핵산 편집 시스템.
  3. 제1항에 있어서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성되는 것인 조작된 핵산 편집 시스템.
  4. 제1항 또는 제2항에 있어서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 닉카제(nickase) 돌연변이를 포함하는 것인 조작된 핵산 편집 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 클래스 2, 타입 II cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 조작된 핵산 편집 시스템.
  7. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 72에 비해 잔기 13에, 또는 서열번호 75에 비해 잔기 17에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 조작된 뉴클레아제 시스템.
  8. 조작된 핵산 편집 시스템으로서,
    (a) 서열번호 70-78, 596, 또는 597-598 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제;
    (b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및
    (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
    i. 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
    ii. 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
    을 포함하는 조작된 가이드 리보핵산 구조체
    를 포함하는 조작된 핵산 편집 시스템.
  9. 조작된 핵산 편집 시스템으로서,
    (a) 서열번호 360-368 또는 598 중 어느 하나 또는 이의 변이체를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서,
    상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제;
    (b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및
    (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
    i. 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
    ii. 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
    을 포함하는 조작된 가이드 리보핵산 구조체
    를 포함하는 조작된 핵산 편집 시스템.
  10. 제9항에 있어서, 상기 엔도뉴클레아제는 닉카제 돌연변이를 포함하는 것인 조작된 핵산 편집 시스템.
  11. 제9항에 있어서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성되는 것인 조작된 핵산 편집 시스템.
  12. 제9항에 있어서, 상기 클래스 2, 타입 II cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 조작된 핵산 편집 시스템.
  13. 제9항에 있어서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  14. 제9항에 있어서, 상기 염기 편집기는 서열번호 50-51 또는 385-390 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  15. 제8항 내지 제14항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 조작된 핵산 편집 시스템.
  16. 제8항 내지 제15항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 조작된 핵산 편집 시스템.
  17. 제8항 내지 제16항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는 것인 조작된 핵산 편집 시스템.
  18. 제8항 내지 제17항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 조작된 핵산 편집 시스템.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 조작된 가이드 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성(non-degenerate) 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  20. 조작된 핵산 편집 시스템으로서,
    (a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
    (ii) 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
    을 포함하는 조작된 가이드 리보핵산 구조체로서,
    상기 조작된 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 구조체;
    (b) 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, 타입 II Cas 엔도뉴클레아제; 및
    (c) 상기 엔도뉴클레아제에 커플링된 염기 편집기
    를 포함하는 조작된 핵산 편집 시스템.
  21. 제20항에 있어서, 상기 엔도뉴클레아제는 서열번호 360-368 또는 598로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성되는 것인 조작된 핵산 편집 시스템.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 염기 편집기는 서열번호 50-51 또는 385-390 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  24. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 염기 편집기는 아데닌 데아미나제인 조작된 핵산 편집 시스템.
  25. 제23항에 있어서, 상기 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  26. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 염기 편집기는 시토신 데아미나제인 조작된 핵산 편집 시스템.
  27. 제26항에 있어서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제(UGI)를 포함하는 조작된 핵산 편집 시스템.
  29. 제28항에 있어서, 상기 우라실 DNA 글리코실라제 억제제(UGI)는 서열번호 52-56 또는 서열번호 67 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 조작된 가이드 리보핵산 구조체는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함하는 것인 조작된 핵산 편집 시스템.
  31. 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 조작된 가이드 리보핵산 구조체는 상기 가이드 리보핵산 서열 및 엔도뉴클레아제에 결합하도록 구성된 상기 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함하는 것인 조작된 핵산 편집 시스템.
  32. 제1항 내지 제31항 중 어느 한 항에 있어서, 상기 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물 또는 인간 게놈 서열에 상보적인 것인 조작된 핵산 편집 시스템.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 가이드 리보핵산 서열은 길이가 15 내지 24 개의 뉴클레오티드인 조작된 핵산 편집 시스템.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 추가로 포함하는 조작된 핵산 편집 시스템.
  35. 제34항에 있어서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합되는 것인 조작된 핵산 편집 시스템.
  37. 제36항에 있어서, 폴리펩티드는 상기 엔도뉴클레아제 및 상기 염기 편집기를 포함하는 것인 조작된 핵산 편집 시스템.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성되는 것인 조작된 핵산 편집 시스템.
  39. 제1항 내지 제38항 중 어느 한 항에 있어서, 상기 시스템은 Mg2+ 공급원을 추가로 포함하는 것인 조작된 핵산 편집 시스템.
  40. 제1항 내지 제39항 중 어느 한 항에 있어서,
    (a) 상기 엔도뉴클레아제는 서열번호 70, 71, 73, 74, 76, 78, 77 또는 78 중 어느 하나 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나;
    (b) 상기 가이드 RNA 구조체는 서열번호 88, 89, 91, 92, 94, 96, 95 또는 488 중 어느 하나의 비축퇴성 뉴클레오티드와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나;
    (c) 상기 엔도뉴클레아제는 서열번호 360, 361, 363, 365, 367, 또는 368 중 어느 하나를 포함하는 PAM에 결합하도록 구성되거나; 또는
    (d) 상기 염기 편집기는 서열번호 58 또는 595 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  41. 제1항 내지 제39항 중 어느 한 항에 있어서,
    (a) 상기 엔도뉴클레아제는 서열번호 70, 71 또는 78 중 어느 하나 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나;
    (b) 상기 가이드 RNA 구조체는 서열번호 88, 89, 또는 96 중 적어도 하나의 비축퇴성 뉴클레오티드와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나;
    (c) 상기 엔도뉴클레아제는 서열번호 360, 362 또는 368 중 어느 하나를 포함하는 PAM에 결합하도록 구성되거나; 또는
    (d) 상기 염기 편집기는 서열번호 594 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하는 것인 조작된 핵산 편집 시스템.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT 또는 스미스-워터맨(Smith-Waterman) 상동성 검색 알고리즘에 의해 결정되는 것인 조작된 핵산 편집 시스템.
  43. 제42항에 있어서, 상기 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고, 조건부 조성 점수 매트릭스 조정을 사용하여, 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는 것인 조작된 핵산 편집 시스템.
  44. 제1항 내지 제43항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 촉매적으로 사멸되도록 구성되는 것인 조작된 핵산 편집 시스템.
  45. 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 핵산.
  46. 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된, 서열번호 70-78 중 어느 하나에 대해 적어도 70% 서열 동일성을 갖는 엔도뉴클레아제를 코딩하는 것인 핵산.
  47. 제44항 내지 제46항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함하는 것인 핵산.
  48. 제47항에 있어서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 핵산.
  49. 제44항 내지 제48항 중 어느 한 항에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간인 핵산.
  50. 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 벡터로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 벡터.
  51. 제44항 내지 제49항 중 어느 한 항의 핵산을 포함하는 벡터.
  52. 제50항 또는 제51항에 있어서,
    상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
    (a) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
    (b) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
    을 포함하는 조작된 가이드 리보핵산 구조체를 코딩하는 핵산을 추가로 포함하는 벡터.
  53. 제50항 내지 제52항 중 어느 한 항에 있어서, 상기 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래 비리온 또는 렌티바이러스인 벡터.
  54. 제50항 내지 제53항 중 어느 한 항의 벡터를 포함하는 세포.
  55. 제54항의 세포를 배양하는 단계를 포함하는, 엔도뉴클레아제의 제조 방법.
  56. 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를,
    a. RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제;
    b. 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및
    c. 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체
    를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하는 것인, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법.
  57. 제56항에 있어서, RuvC 도메인 및 HNH 도메인을 포함하는 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합되는 것인 방법.
  58. 제56항 또는 제57항에 있어서, RuvC 도메인 및 HNH 도메인을 포함하는 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 방법.
  59. 제56항 또는 제57항에 있어서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73 또는 78에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 서열번호 77에 비해 잔기 8에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 방법.
  60. 제56항 또는 제57항에 있어서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 72에 비해 잔기 13에, 또는 서열번호 75에 비해 잔기 17에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 방법.
  61. 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를,
    클래스 2, 타입 II Cas 엔도뉴클레아제,
    상기 엔도뉴클레아제에 커플링된 염기 편집기, 및
    상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체
    를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하며; 상기 PAM은 서열번호 70-78 또는 597로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법.
  62. 제61항에 있어서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 상기 염기 편집기에 공유 결합되거나, 링커를 통해 상기 염기 편집기에 커플링되는 것인 방법.
  63. 제61항 또는 제62항에 있어서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 또는 이의 변이체로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함하는 것인 방법.
  64. 제61항 내지 제63항 중 어느 한 항에 있어서,
    상기 염기 편집기는 아데닌 데아미나제를 포함하고;
    상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 아데닌을 포함하며;
    상기 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 상기 아데닌을 구아닌으로 전환시키는 것을 포함하는 것인 방법.
  65. 제64항에 있어서, 상기 아데닌 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 방법.
  66. 제61항 내지 제63항 중 어느 한 항에 있어서,
    상기 염기 편집기는 시토신 데아미나제를 포함하고;
    상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 시토신을 포함하며;
    상기 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 상기 시토신을 우라실로 전환시키는 것을 포함하는 것인 방법.
  67. 제66항에 있어서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 방법.
  68. 제61항 내지 제67항 중 어느 한 항에 있어서, 상기 복합체는 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제를 추가로 포함하는 것인 방법.
  69. 제68항에 있어서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 방법.
  70. 제61항 내지 제69항 중 어느 한 항에 있어서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는, 상기 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함하는 것인 방법.
  71. 제70항에 있어서, 상기 PAM은 상기 조작된 가이드 리보핵산 구조체의 상기 서열에 상보적인 상기 서열의 3' 말단에 바로 인접한 것인 방법.
  72. 제61항 내지 제71항 중 어느 한 항에 있어서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제 또는 Cas 13d 엔도뉴클레아제가 아닌 것인 방법.
  73. 제61항 내지 제72항 중 어느 한 항에 있어서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 방법.
  74. 제61항 내지 제73항 중 어느 한 항에 있어서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드인 방법.
  75. 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 제1항 내지 제44항 중 어느 한 항의 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것을 포함하고, 상기 엔도뉴클레아제는 상기 조작된 가이드 리보핵산 구조체와 복합체를 형성하도록 구성되며, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법.
  76. 제75항에 있어서, 상기 조작된 핵산 편집 시스템은 아데닌 데아미나제를 포함하고, 상기 뉴클레오티드는 아데닌이며, 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 아데닌을 구아닌으로 전환시키는 것을 포함하는 것인 방법.
  77. 제75항에 있어서, 상기 조작된 핵산 편집 시스템은 시티딘 데아미나제 및 우라실 DNA 글리코실라제 억제제를 포함하고, 상기 뉴클레오티드는 시토신이며, 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 아데닌을 우라실로 전환시키는 것을 포함하는 것인 방법.
  78. 제75항 내지 제77항 중 어느 한 항에 있어서, 상기 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA 또는 박테리아 DNA를 포함하는 것인 방법.
  79. 제75항 내지 제78항 중 어느 한 항에 있어서, 상기 표적 핵산 유전자좌는 시험관 내에 있는 것인 방법.
  80. 제75항 내지 제78항 중 어느 한 항에 있어서, 상기 표적 핵산 유전자좌는 세포 내에 있는 것인 방법.
  81. 제80항에 있어서, 상기 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포 또는 인간 세포인 방법.
  82. 제80항 또는 제81항에 있어서, 상기 세포는 동물 내에 있는 것인 방법.
  83. 제82항에 있어서, 상기 세포는 달팽이관 내에 있는 것인 방법.
  84. 제80항 또는 제81항에 있어서, 상기 세포는 배아 내에 있는 것인 방법.
  85. 제84항에 있어서, 상기 배아는 2세포 배아인 방법.
  86. 제84항에 있어서, 상기 배아는 마우스 배아인 방법.
  87. 제75항 내지 제86항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은, 제46항 내지 제49항 중 어느 한 항의 핵산 또는 제50항 내지 제53항 중 어느 한 항의 벡터를 전달하는 것을 포함하는 것인 방법.
  88. 제75항 내지 제87항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은, 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함하는 것인 방법.
  89. 제88항에 있어서, 상기 핵산은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임이 작동 가능하게 연결된 프로모터를 포함하는 것인 방법.
  90. 제75항 내지 제89항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은, 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 포함하는 캡핑된 mRNA를 전달하는 것을 포함하는 것인 방법.
  91. 제75항 내지 제86항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 폴리펩티드를 전달하는 것을 포함하는 것인 방법.
  92. 제75항 내지 제86항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은, 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 상기 조작된 가이드 리보핵산 구조체를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함하는 것인 방법.
  93. 조작된 핵산 편집 폴리펩티로서,
    RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; 및
    상기 엔도뉴클레아제에 커플링된 염기 편집기
    를 포함하는 조작된 핵산 편집 폴리펩티드.
  94. 제93항에 있어서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  95. 조작된 핵산 편집 폴리펩티드로서,
    서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및
    상기 엔도뉴클레아제에 커플링된 염기 편집기
    를 포함하는 조작된 핵산 편집 폴리펩티드.
  96. 조작된 핵산 편집 폴리펩티드로서,
    서열번호 360-368 또는 598 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및
    상기 엔도뉴클레아제에 커플링된 염기 편집기
    를 포함하는 조작된 핵산 편집 폴리펩티드.
  97. 제95항 또는 제96항에 있어서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 조작된 핵산 편집 폴리펩티드.
  98. 제93항 내지 제97항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는 것인 조작된 핵산 편집 폴리펩티드.
  99. 제95항 내지 제98항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  100. 제95항 내지 제99항 중 어느 한 항에 있어서, 상기 tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  101. 제93항 내지 제100항 중 어느 한 항에 있어서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  102. 제93항 내지 제101항 중 어느 한 항에 있어서, 상기 염기 편집기는 아데닌 데아미나제인 조작된 핵산 편집 폴리펩티드.
  103. 제102항에 있어서, 상기 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  104. 제93항 내지 제101항 중 어느 한 항에 있어서, 상기 염기 편집기는 시토신 데아미나제인 조작된 핵산 편집 폴리펩티드.
  105. 제104항에 있어서, 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  106. 조작된 핵산 편집 폴리펩티드로서,
    엔도뉴클레아제로서, 상기 엔도뉴클레아제는 엔도뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및
    상기 엔도뉴클레아제에 커플링된 염기 편집기로서, 상기 염기 편집기는 서열번호 1-51, 385-386, 387-443, 444-447, 488-475 또는 595 중 어느 하나, 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 염기 편집기
    를 포함하는 조작된 핵산 편집 폴리펩티드.
  107. 제106항에 있어서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성되는 것인 조작된 핵산 편집 폴리펩티드.
  108. 제106항에 있어서, 상기 엔도뉴클레아제는 촉매적으로 사멸되도록 구성되는 것인 조작된 핵산 편집 폴리펩티드.
  109. 제106항 내지 제108항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 Cas 엔도뉴클레아제인 조작된 핵산 편집 폴리펩티드.
  110. 제109항에 있어서, 상기 Cas 엔도뉴클레아제는 클래스 II, 타입 II Cas 엔도뉴클레아제 또는 클래스 II, 타입 V Cas 엔도뉴클레아제인 조작된 핵산 편집 폴리펩티드.
  111. 제106항에 있어서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  112. 제109항 내지 제111항 중 어느 한 항에 있어서, 상기 Cas 엔도뉴클레아제는 닉카제 돌연변이를 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  113. 제112항에 있어서, 상기 Cas 엔도뉴클레아제는 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  114. 제109항 내지 제113항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 서열번호 360-368 또는 598로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성되는 것인 조작된 핵산 편집 폴리펩티드.
  115. 제106항 내지 제114항 중 어느 한 항에 있어서, 상기 염기 편집기는 아데닌 데아미나제인 조작된 핵산 편집 폴리펩티드.
  116. 제115항에 있어서, 상기 아데노신 데아미나제는 서열번호 50-51, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  117. 제116항에 있어서, 상기 아데노신 데아미나제는 서열번호 50-51, 385-390, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  118. 제106항 내지 제114항 중 어느 한 항에 있어서, 상기 염기 편집기는 시토신 데아미나제인 조작된 핵산 편집 폴리펩티드.
  119. 제118항에 있어서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  120. 제106항 내지 제119항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제(UGI)를 추가로 포함하는 조작된 핵산 편집 폴리펩티드.
  121. 제120항에 있어서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  122. 제106항 내지 제121항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제를 포함하는 폴리펩티드는, 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  123. 제122항에 있어서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
  124. 제106항 내지 제123항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합되는 것인 조작된 핵산 편집 폴리펩티드.
  125. 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 서열번호 1-51, 385-386, 387-443, 444-447, 488-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 코딩하는 것인 핵산.
  126. 제125항에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간인 핵산.
  127. 제125항 또는 제126항의 핵산을 포함하는 벡터.
  128. 제127항에 있어서, 상기 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래의 비리온 또는 렌티바이러스인 벡터.
  129. 제127항 또는 제128항의 벡터를 포함하는 세포.
  130. 제129항의 상기 세포를 배양하는 단계를 포함하는, 염기 편집기의 제조 방법.
  131. 시스템으로서,
    (a) 제106항 내지 제124항 중 어느 한 항의 핵산 편집 폴리펩티드; 및
    (b) 상기 핵산 편집 폴리펩티드와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
    i. 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
    ii. 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
    을 포함하는 조작된 가이드 리보핵산 구조체
    를 포함하는 시스템.
  132. 제131항에 있어서, 상기 조작된 가이드 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나의 비축퇴성 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 시스템.
  133. 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 제106항 내지 제124항 중 어느 한 항의 상기 조작된 핵산 편집 폴리펩티드 또는 제131항 또는 제132항의 상기 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인, 표적 핵산 유전자좌를 변형시키는 방법.
KR1020237012244A 2020-09-11 2021-09-10 염기 편집 효소 KR20230062873A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063077057P 2020-09-11 2020-09-11
US63/077,057 2020-09-11
US202163222351P 2021-07-15 2021-07-15
US63/222,351 2021-07-15
PCT/US2021/049962 WO2022056324A1 (en) 2020-09-11 2021-09-10 Base editing enzymes

Publications (1)

Publication Number Publication Date
KR20230062873A true KR20230062873A (ko) 2023-05-09

Family

ID=80629930

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237012244A KR20230062873A (ko) 2020-09-11 2021-09-10 염기 편집 효소

Country Status (9)

Country Link
US (3) US20220364067A1 (ko)
EP (1) EP4211234A1 (ko)
JP (1) JP2023540797A (ko)
KR (1) KR20230062873A (ko)
AU (1) AU2021339819A1 (ko)
CA (1) CA3192224A1 (ko)
GB (1) GB2605340A (ko)
MX (1) MX2023002913A (ko)
WO (1) WO2022056324A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4114932A4 (en) 2020-03-06 2024-03-13 Metagenomi, Inc. CLASS II, TYPE V CRISPR SYSTEMS
MX2022012110A (es) * 2020-03-31 2022-10-18 Metagenomi Inc Sistemas crispr clase ii tipo ii.
KR20230134543A (ko) * 2021-01-22 2023-09-21 메타지노미, 인크. 신규한 조작된 뉴클레아제 및 키메라 뉴클레아제
AU2022380842A1 (en) * 2021-11-05 2024-05-23 Metagenomi, Inc. Base editing enzymes

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190134673A (ko) * 2017-03-30 2019-12-04 고쿠리츠 다이가쿠 호진 교토 다이가쿠 게놈 편집에 의한 엑손 스키핑 유도 방법
US9982279B1 (en) * 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases

Also Published As

Publication number Publication date
MX2023002913A (es) 2023-06-01
GB2605340A8 (en) 2024-02-21
CA3192224A1 (en) 2022-03-17
US20230374482A1 (en) 2023-11-23
GB202209534D0 (en) 2022-08-10
US20220364067A1 (en) 2022-11-17
EP4211234A1 (en) 2023-07-19
WO2022056324A1 (en) 2022-03-17
US20230348876A1 (en) 2023-11-02
AU2021339819A1 (en) 2023-05-25
GB2605340A (en) 2022-09-28
JP2023540797A (ja) 2023-09-26

Similar Documents

Publication Publication Date Title
KR102654180B1 (ko) 프롤린 및 알라닌 잔기가 풍부한 반복적인 아미노산 서열을 암호화하고 낮은 반복적인 뉴클레오티드 서열을 갖는 핵산
KR20230062873A (ko) 염기 편집 효소
KR102622910B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
JP2023082141A (ja) CasZ組成物及び使用方法
CN108753824B (zh) 用于治疗视网膜营养不良的病毒载体
KR102604096B1 (ko) 윌슨병을 치료하기 위한 유전자 치료
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
CN107580503B (zh) 用于治疗细菌感染的杀菌剂与亲溶酶体碱化剂的组合
DK2768848T3 (en) METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS
KR101449587B1 (ko) 장기 지속형 약물 제형
CN112218882A (zh) Foxp3在经编辑的cd34+细胞中的表达
KR20210005146A (ko) 유전자 편집된 t 세포에서의 인간 foxp3의 발현
CN108289933A (zh) 作为认知和行为障碍药物的哺乳动物Klotho的分泌型剪接变体
KR20210151916A (ko) 뒤시엔느 근육 이영양증의 치료를 위한 aav 벡터-매개된 큰 돌연변이 핫스팟의 결실
CN112912112A (zh) 肝特异性核酸调节元件以及其方法及用途
CN110785179A (zh) Wiskott-Aldrich综合征和X连锁血小板减少症中的治疗性基因组编辑
CN116083398B (zh) 分离的Cas13蛋白及其应用
KR101970428B1 (ko) 재조합 볼거리 바이러스 제릴린2계 백신
CN113164560A (zh) 改善基因疗法的新工具及其用途
KR20220142502A (ko) 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도
CN107988259B (zh) SmartBac杆状病毒表达系统及其应用
CN112342234B (zh) 一种调控n-乙酰神经氨酸产量提高的重组枯草芽孢杆菌
CN112312931A (zh) X连锁高IgM综合征的治疗性基因组编辑
CN112203697A (zh) 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途
CN114990157B (zh) 用于构建lmna基因突变的扩张型心肌病模型猪核移植供体细胞的基因编辑系统及其应用