KR20230062873A - 염기 편집 효소 - Google Patents
염기 편집 효소 Download PDFInfo
- Publication number
- KR20230062873A KR20230062873A KR1020237012244A KR20237012244A KR20230062873A KR 20230062873 A KR20230062873 A KR 20230062873A KR 1020237012244 A KR1020237012244 A KR 1020237012244A KR 20237012244 A KR20237012244 A KR 20237012244A KR 20230062873 A KR20230062873 A KR 20230062873A
- Authority
- KR
- South Korea
- Prior art keywords
- endonuclease
- nucleic acid
- seq
- glu
- ala
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2497—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/02—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
- C12Y302/02027—Uracil-DNA glycosylase (3.2.2.27)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Virology (AREA)
- Cell Biology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Dental Preparations (AREA)
- Paints Or Removers (AREA)
- Graft Or Block Polymers (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 개시내용은 독특한 도메인 특징을 갖는 엔도뉴클레아제 효소뿐만 아니라 이러한 효소 또는 이의 변이체를 사용하는 방법을 제공한다.
Description
상호 참조
본 출원은 2020년 9월 11일에 출원된 "염기 편집 효소(BASE EDITING ENZYMES)"라는 제목의 미국 가출원 제63/077,057호 및 2021년 7월 15일에 출원된 "염기 편집 효소(BASE EDITING ENZYMES)"라는 제목의 미국 가출원 제63/222,351호를 우선권으로 주장하며, 이들 각각은 그 전체가 본원에 포함된다.
Cas 효소는 이와 연관된 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(Clustered Regularly Interspaced Short Palindromic Repeat; CRISPR) 가이드 리보핵산(RNA)과 함께 원핵생물 면역계의 만연한(박테리아의 약 45%, 고세균의 약 84%) 성분으로 보이며, CRISPR-RNA 가이드 핵산 절단에 의해 감염성 바이러스 및 플라스미드와 같은 비-자기 핵산으로부터 상기 미생물을 보호하는 역할을 한다. CRISPR RNA 요소를 코딩하는 데옥시리보핵산(DNA) 요소는 구조 및 길이가 상대적으로 보존될 수 있지만, 이의 CRISPR 연관(Cas) 단백질은 매우 다양하며, 광범위하게 다양한 핵산-상호작용 도메인을 포함한다. CRISPR DNA 요소는 1987년도에 일찍 관찰되었지만, CRISPR/Cas 복합체의 프로그래밍 가능한 엔도뉴클레아제 절단 능력은 비교적 최근에야 인식되어, 다양한 DNA 조작 및 유전자 편집 응용 분야에서 재조합 CRISPR/Cas 시스템을 사용하게 되었다.
서열 목록
본 출원은 ASCII 형식으로 전자 제출되고 그 전체가 본원에 참조로 포함되는 서열 목록을 포함한다. 2021년 9월 9일에 생성된 상기 ASCII 사본은 명칭이 55921-715_601_SL.txt이고, 크기가 705,305 바이트이다.
일부 양상에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기(base editor); 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 실시양태에서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 닉카제(nickase) 돌연변이를 포함한다. 일부 실시양태에서, 상기 클래스 2, 타입 II cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 72에 비해 잔기 13에, 또는 서열번호 75에 비해 잔기 17에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다. 일부 양상에서, 본 개시내용은 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 양상에서, 본 개시내용은 서열번호 360-368 또는 598 중 어느 하나 또는 이의 변이체를 포함하는 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 상기 클래스 2, 타입 II cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에서 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 50-51 또는 385-390 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 실시양태에서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, 상기 조작된 가이드 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성(non-degenerate) 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 양상에서, 본 개시내용은 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체로서, 상기 조작된 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 구조체; 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, 타입 II Cas 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 50-51 또는 385-390 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 360-368 또는 598로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 상기 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 시토신 데아미나제이다. 일부 실시양태에서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시스템은 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 리보핵산 구조체는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 리보핵산 구조체는 상기 가이드 리보핵산 서열 및 상기 tracr 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 상기 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물, 또는 인간 게놈 서열에 상보적이다. 일부 실시양태에서, 상기 가이드 리보핵산 서열은 길이가 15 내지 24 개의 뉴클레오티드이다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시양태에서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73 또는 78에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 서열번호 77에 비해 잔기 8에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 72에 비해 잔기 13에, 또는 서열번호 75에 비해 잔기 17에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 폴리펩티드는 상기 엔도뉴클레아제 및 상기 염기 편집기를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 상기 시스템은 Mg2+ 공급원을 추가로 포함한다. 일부 실시양태에서: (a) 상기 엔도뉴클레아제는 서열번호 70, 71, 73, 74, 76, 78, 77 또는 78 중 어느 하나 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나; (b) 상기 가이드 RNA 구조체는 서열번호 88, 89, 91, 92, 94, 96, 95 또는 488 중 어느 하나의 비축퇴성 뉴클레오티드와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나; (c) 상기 엔도뉴클레아제는 서열번호 360, 361, 363, 365, 367, 또는 368 중 어느 하나를 포함하는 PAM에 결합하도록 구성되거나; (d) 상기 염기 편집기는 서열번호 58 또는 595 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함한다. 일부 실시양태에서: (a) 상기 엔도뉴클레아제는 서열번호 70, 71, 또는 78 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나; (b) 상기 가이드 RNA 구조체는 서열번호 88, 89, 또는 96 중 적어도 하나의 비축퇴성 뉴클레오티드와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나; (c) 상기 엔도뉴클레아제는 서열번호 360, 362 또는 368 중 어느 하나를 포함하는 PAM에 결합하도록 구성되거나; (d) 상기 염기 편집기는 서열번호 594 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함한다. 일부 실시양태에서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT 또는 스미스-워터맨(Smith-Waterman) 상동성 검색 알고리즘에 의해 결정된다. 일부 실시양태에서, 상기 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 존재(existence) 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고 조건부 조성 점수 매트릭스 조정을 사용하여 상기 BLASTP 상동성 검색 알고리즘에 의해 결정된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 촉매적으로 사멸되도록 구성된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다.
일부 양태에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 핵산을 제공한다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된, 서열번호 70-78 중 어느 하나에 대해 적어도 70% 서열 동일성을 갖는 엔도뉴클레아제를 코딩하는 것인 핵산을 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시양태에서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간이다.
일부 양상에서, 본 개시내용은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 벡터로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 벡터를 제공한다.
일부 양상에서, 본 개시내용은 본원에 기재된 임의의 양상 또는 실시양태의 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 코딩하는 핵산을 추가로 포함한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래 비리온 또는 렌티바이러스이다.
일부 양상에서, 본 개시내용은 본원에 기재된 임의의 양상 또는 실시양태의 벡터를 포함하는 세포를 제공한다.
일부 양상에서, 본 개시내용은 본원에 기재된 임의의 양상 또는 실시양태의 세포를 배양하는 단계를 포함하는, 엔도뉴클레아제의 제조 방법을 제공한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 여기서 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하는 것인 방법을 제공한다. 일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합된다. 일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, 클래스 2, 타입 II Cas 엔도뉴클레아제, 상기 엔도뉴클레아제에 커플링된 염기 편집기, 및 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고; 상기 PAM은 서열번호 70-78 또는 597로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법을 제공한다. 일부 실시양태에서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 상기 염기 편집기에 공유 결합되거나, 링커를 통해 상기 염기 편집기에 커플링된다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 또는 이의 변이체로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 아데닌 데아미나제를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 아데닌을 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 상기 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 상기 아데닌 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 시토신 데아미나제를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 시토신을 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 상기 시토신을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 복합체는 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 상기 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시양태에서, 상기 PAM은 상기 조작된 가이드 리보핵산 구조체의 상기 서열에 상보적인 상기 서열의 3' 말단에 바로 인접한다. 일부 실시양태에서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시양태에서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 양상에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 본원에 기재된 임의의 양상 또는 실시양태의 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것을 포함하고, 상기 엔도뉴클레아제는 상기 조작된 가이드 리보핵산 구조체와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법을 제공한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템은 아데닌 데아미나제를 포함하고, 상기 뉴클레오티드는 아데닌이고, 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템은 시티딘 데아미나제 및 우라실 DNA 글리코실라제 억제제를 포함하고, 상기 뉴클레오티드는 시토신이고 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 아데닌을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 상기 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA 또는 박테리아 DNA를 포함한다. 일부 실시양태에서, 상기 표적 핵산 유전자좌는 시험관내에 있다. 일부 실시양태에서, 상기 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시양태에서, 상기 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포 또는 인간 세포이다. 일부 실시양태에서, 상기 세포는 동물 내에 있다. 일부 실시양태에서, 상기 세포는 달팽이관 내에 있다. 일부 실시양태에서, 상기 세포는 배아 내에 있다. 일부 실시양태에서, 상기 배아는 2세포 배아이다. 일부 실시양태에서, 상기 배아는 마우스 배아이다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 본원에 기재된 임의의 양상 또는 실시양태의 핵산 또는 본원에 기재된 임의의 양상 또는 실시양태의 벡터를 전달하는 것을 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함한다. 일부 실시양태에서, 상기 핵산은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임이 작동 가능하게 연결된 프로모터를 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA를 전달하는 것을 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 번역된 폴리펩티드를 전달하는 것을 포함한다. 일부 실시양태에서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 상기 조작된 가이드 리보핵산 구조체를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함한다.
일부 양상에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 양상에서, 본 개시내용은 서열번호 360-368 또는 598 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, 상기 tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 상기 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 시토신 데아미나제이다. 일부 실시양태에서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 엔도뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기로서, 상기 염기 편집기는 서열번호 1-51, 385-386, 387-443, 444-447, 488-475 또는 595 중 어느 하나, 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 촉매적으로 사멸되도록 구성된다. 일부 실시양태에서, 상기 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 실시양태에서, 상기 Cas 엔도뉴클레아제는 클래스 II, 타입 II Cas 엔도뉴클레아제 또는 클래스 II, 타입 V Cas 엔도뉴클레아제이다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 Cas 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 실시양태에서, 상기 Cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열번호 360-368 또는 598로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 상기 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 상기 아데노신 데아미나제는 서열번호 50-51, 385-443, 또는 448-475 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 아데노신 데아미나제는 서열번호 50-51, 385-390, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 염기 편집기는 시토신 데아미나제이다. 일부 실시양태에서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 폴리펩티드는 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시양태에서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합된다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 서열번호 1-51, 385-386, 387-443, 444-447 또는 488-475 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 코딩하는 것인 핵산을 제공한다. 일부 실시양태에서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간이다.
일부 양상에서, 본 개시내용은 본원에 기재된 임의의 양상 또는 실시양태의 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래의 비리온 또는 렌티바이러스이다.
일부 양상에서, 본 개시내용은 본원에 기재된 양상 또는 실시양태 중 어느 하나의 벡터를 포함하는 세포를 제공한다.
일부 양상에서, 본 개시내용은 본원에 기재된 양상 또는 실시양태 중 어느 하나의 상기 세포를 배양하는 단계를 포함하는, 염기 편집기의 제조 방법을 제공한다.
일부 양상에서, 본 개시내용은 (a) 본원에 기재된 임의의 양상 또는 실시양태의 핵산 편집 폴리펩티드; 및 (b) 상기 핵산 편집 폴리펩티드와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 조작된 가이드 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나의 비축퇴성 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 본원에 기재된 임의의 양상 또는 실시양태의 상기 조작된 핵산 편집 폴리펩티드 또는 본원에 기재된 임의의 양상 또는 실시양태의 상기 시스템을 상기 표적 핵산 유전자좌에 전달하는 것을 포함하고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법을 제공한다.
일부 양상에서, 본 개시내용은 (a) RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; (b) 엔도뉴클레아제에 커플링된 염기 편집기; 및 (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열울 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 (a) 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다.
일부 양상에서, 본 개시내용은 (a) 서열번호 360-368을 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및 (b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 (a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체로서, 상기 tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 구조체; 및 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, 타입 II Cas 엔도뉴클레아제를 포함하는 조작된 핵산 편집 시스템을 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 360-368로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51 및 385-475 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 서열번호 57에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제이다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 59-66 중 어느 하나에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 조작된 핵산 편집 시스템은 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 조작된 가이드 리보핵산 구조체는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 조작된 가이드 리보핵산 구조체는 가이드 리보핵산 서열 및 tracr 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물 또는 인간 게놈 서열에 상보적이다. 일부 실시양태에서, 가이드 리보핵산 서열은 길이가 15 내지 24 개의 뉴클레오티드이다. 일부 실시양태에서, 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 염기 편집기에 직접 공유 결합되거나, 링커를 통해 염기 편집기에 공유 결합된다. 일부 실시양태에서, 폴리펩티드는 엔도뉴클레아제 및 염기 편집기를 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 370을 포함한다. 일부 실시양태에서, 시스템은 Mg2+ 공급원을 추가로 포함한다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 70과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 88과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 360을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 71과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 89와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 361을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 73과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 91과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 363을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 75와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 93과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 365를 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 76과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 94와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 366을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 77과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 95와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 367을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 78과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 96과 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 368을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 염기 편집기는 아데닌 데아미나제를 포함한다. 일부 실시양태에서, 데아미나제는 서열번호 57을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제를 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58을 포함한다. 일부 실시양태에서, 본원에 기재된 조작된 핵산 편집 시스템은 우라실 DNA 글리코실화 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실화 억제제는 서열번호 67을 포함한다.
일부 실시양태에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 스미스-워터맨(Smith-Waterman) 상동성 검색 알고리즘에 의해 결정된다. 일부 실시양태에서, 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고, 조건부 조성 점수 매트릭스 조정을 사용하여 BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 핵산을 제공한다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된, 서열번호 70-78 중 어느 하나에 대해 적어도 70% 서열 동일성을 갖는 엔도뉴클레아제를 코딩하는 것인 핵산을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시양태에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간이다.
일부 양상에서, 본 개시내용은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하는 핵산을 포함하는 벡터로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 벡터를 제공한다. 일부 실시양태에서, 벡터는 본원에 기재된 핵산을 포함한다. 일부 실시양태에서, 벡터는 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 코딩하는 핵산을 추가로 포함한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래의 비리온 또는 렌티바이러스이다. 일부 양상에서, 본 개시내용은 본원에 기재된 벡터를 포함하는 세포를 제공한다. 일부 양상에서, 본 개시내용은 본원에 기재된 세포를 배양하는 단계를 포함하는, 엔도뉴클레아제의 제조 방법을 제공한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하는 것인 방법을 제공한다.
일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제는 염기 편집기에 직접 공유 결합되거나, 링커를 통해 염기 편집기에 공유 결합된다. 일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제는 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, 클래스 2, 타입 II Cas 엔도뉴클레아제, 상기 엔도뉴클레아제에 커플링된 염기 편집기, 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고; 상기 PAM은 서열번호 360-368로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법을 제공한다.
일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 염기 편집기에 공유 결합되거나, 링커를 통해 염기 편집기에 커플링된다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51 및 385-475로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제를 포함하고; 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 아데닌을 포함하고; 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 아데닌 데아미나제는 서열번호 57에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 염기 편집기는 시토신 데아미나제를 포함하고; 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 시토신을 포함하고; 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 시토신을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 59-66 중 어느 하나에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 복합체는 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시양태에서, PAM은 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열의 3' 말단에 바로 인접한다.
일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 양상에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 본원에 기재된 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것을 포함하는 방법을 제공하고, 여기서 엔도뉴클레아제는 조작된 가이드 리보핵산 구조체와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법을 제공한다.
일부 실시양태에서, 조작된 핵산 편집 시스템은 아데닌 데아미나제를 포함하고, 뉴클레오티드는 아데닌이고, 표적 핵산 유전자좌를 변형시키는 것은 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템은 시티딘 데아미나제 및 우라실 DNA 글리코실라제 억제제를 포함하고, 뉴클레오티드는 시토신이고 표적 핵산 유전자좌를 변형시키는 것은 아데닌을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA 또는 박테리아 DNA를 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 시험관내에 있다. 일부 실시양태에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시양태에서, 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포 또는 인간 세포이다. 일부 실시양태에서, 세포는 동물 내에 있다.
일부 실시양태에서, 세포는 달팽이관 내에 있다. 일부 실시양태에서, 세포는 배아 내에 있다. 일부 실시양태에서, 배아는 2세포 배아이다. 일부 실시양태에서, 배아는 마우스 배아이다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 본원에 기재된 핵산 또는 본원에 기재된 벡터를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함한다.
일부 실시양태에서, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동 가능하게 연결된 프로모터를 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 캡핑된 mRNA를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 번역된 폴리펩타이드를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 리보핵산 구조체를 코딩하는 데옥시리보핵산(DNA)를 전달하는 것을 포함한다.
일부 양상에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 서열번호 70-78 중 어느 하나에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다.
일부 양상에서, 본 개시내용은 서열번호 360-368을 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51 및 385-475 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 서열번호 57에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제이다.일부 실시양태에서, 시토신 데아미나제는 서열번호 58에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 아데노신 시토신 데아미나제는 서열번호 59-66 중 어느 하나에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
본 개시내용의 추가적인 양상 및 이점은 본 개시내용의 예시적인 실시양태만이 제시되고 설명되는 하기 상세한 설명으로부터 당업자에게 용이하게 명백해질 것이다. 알 수 있는 바와 같이, 본 개시내용은 다른 및 상이한 실시양태가 가능하고, 이의 여러 세부사항은 모두 본 개시내용에서 벗어나지 않으면서 다양한 명백한 측면에서 변형될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되지 않아야 한다.
참조에 의한 인용
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 마치 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함된다고 구체적이고 개별적으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다.
본 발명의 신규한 특징은 특히 첨부된 청구범위에서 제시된다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 실시양태를 제시하는 하기 상세한 설명, 및 첨부 도면(또한 본원에서 "도면" 및 "도")을 참조하여 얻어질 것이며, 첨부 도면에서,
도 1은 상이한 클래스 및 타입의 CRISPR/Cas 유전자좌의 전형적인 구성을 도시한다.
도 2는 본원에 기재된 시스템의 발현을 구동하는 T7 프로모터를 함유하는 염기 편집기 플라스미드의 구조를 도시한다.
도 3은 본원에 기재된 시스템에 대한 플라스미드 지도를 도시한다. MGA는 TadA*(ABE8.17m으로부터)-SV40 NLS를 포함하고 MGC는 우라실 글리코실라제 억제제에 연결된 APOBEC1(BE3으로부터) 및 SV40 NLS를 포함한다.
도 4는 닉카제 효소를 생성하는 뉴클레아제 활성을 파괴하도록 돌연변이된 본원에 기재된 선택된 엔도뉴클레아제의 RuvCI 도메인 내의 예측된 촉매 잔기를 도시한다.
도 5는 단일 가이드 RNA 발현 카세트를 본원에 기재된 시스템으로 클로닝하기 위한 예시적인 방법을 도시한다. 하나의 단편은 T7 프로모터와 스페이서를 포함한다. 다른 단편은 스페이서와 단일 가이드 스캐폴드 서열 및 양방향 터미네이터를 포함한다. 단편을 발현 플라스미드로 조립하여, sgRNA와 염기 편집기를 동시에 발현할 수 있는 기능적 작제물을 생성한다.
도 6a 및 6b는 이. 콜라이(E. coli)에서의 lacZ 표적화를 위한 sgRNA 설계를 도시한다. 본원에 기재된 시스템에 사용된 스페이서 길이는 22 개의 뉴클레오티드였다. 본원에 기재된 선택된 시스템의 경우, 이. 콜라이에서 lacZ를 표적화하는 3개의 sgRNA가 편집 윈도우(editing window)를 결정하도록 설계하였다.
도 7은 선택된 돌연변이된 효과기의 닉카제 활성을 도시한다. 양쪽 5' 말단에 형광단(6-FAM)으로 표지된 600bp 이중 가닥 DNA 단편을 동족 sgRNA가 보충된 정제된 효소와 함께 인큐베이션하였다. 반응 산물을 10% TBE-우레아 변성 겔에서 분해시켰다. 이중 가닥 절단은 400개 및 200개 염기의 밴드를 생성한다. 닉카제 활성은 600개 및 200개 염기의 밴드를 생성한다.
도 8a, 8b 및 8c는 본원에 기재된 선택된 시스템에 의한 염기 편집을 입증하는 생어(Sanger) 시퀀싱 결과를 도시한다.
도 9는 본원에 기재된 시스템이 본원에 기재된 엔도뉴클레아제 및 염기 편집기를 사용하여 염기-편집 능력을 어떻게 확장하는가를 도시한다.
도 10a 및 10b는 TadA(ABE8.17m) 및 MG 닉카제를 포함하는 아데닌 염기 편집기(ABE)의 염기 편집 효율을 도시한다. TadA는 tRNA 아데닌 데아미나제이고 TadA(ABE8.17m)는 이. 콜라이 TadA의 조작된 변이체이다. TadA(ABE8.17m)와 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 Edit R에 의해 정량화된 A에서 G로의 전환의 백분율을 나타낸다. ABE8.17m은 실험의 양성 대조군으로서 사용하였다.
도 11a 및 11b는 래트 APOBEC1, MG 닉카제 및 바실러스 서브틸리스(Bacillus subtilis) 박테리오파지(UGI(PBS1))의 우라실 글리코실라제 억제제를 포함하는 시토신 염기 편집기(CBE)의 염기 편집 효율을 도시한다. APOBEC1은 시토신 데아미나제이다. N-말단에서 rAPOBEC1에 융합되고 C-말단에서 UGI에 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 Edit R에 의해 정량화된 C에서 T로의 전환의 백분율을 나타낸다. BE3는 실험에서 양성 대조군으로서 사용하였다.
도 12는 CBE의 염기 편집 활성에 미치는 MG 우라실 글리코실라제 억제제(UGI)의 효과를 도시한다. 패널 (a)는 N-말단 APOBEC1, MG15-1 닉카제 및 C-말단 UGI를 포함하는 MGC15-1 및 변이체의 염기 편집 활성을 보여주는 그래프를 도시한다. 3가지 MG UGI를 이. 콜라이에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. 패널 (b)는 N-말단 rAPOBEC1, SpCas9 닉카제 및 C-말단 UGI를 포함하는 BE3의 염기 편집 활성을 보여주는 그래프이다. 2가지 MG UGI를 HEK293T 세포에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. 편집 효율은 Edit R에 의해 정량화하였다.
도 13a 및 13b는 A0A2K5RDN7, MG 닉카제 및 MG UGI를 포함하는 시토신 염기 편집기의 편집 효율을 보여주는 편집된 부위의 지도를 도시한다. 작제물은 N-말단 A0A2K5RDN7, MG 닉카제 및 C-말단 MG69-1을 포함한다. 단순화를 위해, 도면에는 MG 닉카제의 정체만이 도시된다. BE3은 염기 편집에 대한 양성 대조군으로서 사용하였다. 음성 대조군으로는 공 벡터(empty vector)를 사용하였다. 상이한 날에 3회의 독립적인 실험을 수행하였다. 약어: R, 반복; NEG, 음성 대조군.
도 14는 이. 콜라이에서의 TadA 특성규명을 위한 양성 선택 방법을 도시한다. 패널 (a)는 TadA 선택에 사용된 하나의 플라스미드 시스템의 지도를 도시한다. 벡터는 CAT(H193Y), CAT를 표적화는 sgRNA 발현 카세트 및 ABE 발현 카세트를 포함한다. 본 도면에는, 이. 콜라이로부터의 N-말단 TadA 및 스트렙토코커스 피오게네스(Streptococcus pyogenes)로부터의 C-말단 SpCas9(D10A)가 도시되어 있다. 패널 (b)는 이. 콜라이 세포 내로 도입/형질전환될 때 CAT(H193Y)의 주형 가닥의 A2 위치가 편집되어 H193Y 돌연변이를 야생형으로 되돌리고 이의 활성을 복원시킴을 입증하는 시퀀싱 추적을 도시한다. 약어: CAT, 클로람페니콜 아세틸트랜스퍼라제.
도 15는 TadA에 의해 유발된 돌연변이가 클로람페니콜(Cm)의 높은 내용성(tolerance)을 가능하게 함을 도시한다. 패널 (a)는 이. 콜라이의 항생제 내성을 선택하기 위해 상이한 농도의 클로람페니콜이 사용된 성장 플레이트의 사진을 도시한다. 이 예에서, 이. 콜라이(EcTadA)로부터의 TadA의 야생형 및 변이체 2가지를 테스트하였다. 패널 (b)는 돌연변이된 TadA를 보유하는 ABE가 야생형보다 더 높은 편집 효율을 나타낸다는 것을 입증하는 결과 요약 표를 도시한다. 이들 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다. 단순화를 위해, 표에는 데아미나제의 정체만이 도시된다.
도 16a는 양성 선택에서 MG TadA 활성을 조사하기 위한 성장 플레이트의 사진을 도시한다. 8개의 MG68 TadA 후보를 0 내지 2 ㎍/mL의 클로람페니콜(ABE는 N-말단 TadA 변이체 및 C-말단 SpCas9(D10A) 닉카제를 포함함)에 대해 테스트하였다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 이 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 16b는 MG TadA 후보의 편집 효율을 요약하고, MG68-3 및 MG68-4가 아데닌의 염기 편집을 구동하였음을 입증한다.
도 17은 MG68-4 상의 D109N 돌연변이를 통한 MG68-4_nSpCas9의 염기 편집 효율의 개선을 도시한다. 패널 (a)는 야생형 MG68-4 및 이의 변이체가 0 내지 4 ㎍/mL의 클로람페니콜에 대해 테스트된 성장 플레이트의 사진을 도시한다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 이 실험에서 아데닌 염기 편집기는 N-말단 TadA 변이체 및 C-말단 SpCas9(D10A) 닉카제를 포함한다. 패널 (b)는 MG TadA 후보의 편집 효율을 나타내는 요약 표를 도시한다. 패널 (b)는 MG68-4 및 MG68-4(D109N)가 아데닌의 염기 편집을 나타냈고, D109N 돌연변이가 증가된 활성을 나타냈음을 입증한다. 이 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 18은 MG68-4(D109N)_nMG34-1의 염기 편집을 도시한다. 패널 (a)는 N-말단 MG68-4(D109N) 및 C-말단 SpCas9(D10A) 닉카제를 포함하는 ABE가 0 내지 2 ㎍/mL의 클로람페니콜에 대해 테스트된 실험의 성장 플레이트의 사진을 도시한다. 패널 (b)는 sgRNA의 존재 및 부재 하의 편집 효율을 나타내는 요약 표를 도시한다. 이 실험에서 콜로니는 1 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 19는 MG68-4-nMG34-1 염기 편집 활성의 개선을 위해 설계된 28가지의 MG68-4 변이체(서열번호 448-475)를 도시한다. 효소의 편집을 개선하기 위한 표적화 돌연변이유발을 위해 12개의 잔기를 선택하였다.
서열 목록의 간략한 설명
본 출원과 함께 제출된 서열 목록은 본 개시내용에 따른 방법, 조성물 및 시스템에서 사용하기 위한 예시적인 폴리뉴클레오티드 및 폴리펩티드 서열을 제공한다. 하기는 이 중의 서열의 예시적인 설명이다.
서열번호 1-47은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG66 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 48-49는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG67 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 50-51은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 52-56은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 우라실 DNA 글리코실라제 억제제의 서열을 나타낸다.
서열번호 57-66은 참조 데아미나제의 서열을 나타낸다.
서열번호 67은 참조 우라실 DNA 글리코실라제 억제제의 서열을 나타낸다.
서열번호 68은 아데닌 염기 편집기의 서열을 나타낸다.
서열번호 69는 시토신 염기 편집기의 서열을 나타낸다.
서열번호 70-78은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG 닉카제의 전장 펩티드 서열을 나타낸다.
서열번호 79-87은 본원에 기재된 시험관내 닉카제 분석에서 사용된 프로토스페이서 및 PAM을 나타낸다.
서열번호 88-96은 본원에 기재된 시험관내 닉카제 분석에서 사용된 단일 가이드 RNA의 펩티드 서열을 나타낸다.
서열번호 97-156은 이. 콜라이 lacZ를 표적화할 때의 스페이서의 서열을 나타낸다.
서열번호 157-176은 부위 지정 돌연변이유발을 수행할 때의 프라이머의 서열을 나타낸다.
서열번호 177-178은 lacZ 시퀀싱을 위한 프라이머의 서열을 나타낸다.
서열번호 179-342는 증폭 동안 사용된 프라이머의 서열을 나타낸다.
서열번호 343-345는 lacZ 시퀀싱을 위한 프라이머의 서열을 나타낸다.
서열번호 346-359는 증폭 동안 사용된 프라이머의 서열을 나타낸다.
서열번호 360-368은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 프로토스페이서 인접 모티프를 나타낸다.
서열번호 369-384는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 핵 국소화 서열(NLS)을 나타낸다.
서열번호 385-443은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 444-447은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG121 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 448-475는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 476 및 477은 아데닌 염기 편집기의 서열을 나타낸다.
서열번호 478-482는 시토신 염기 편집기의 서열을 나타낸다.
서열번호 483-487은 본원에 기재된 조작된 핵산 편집 시스템을 코딩하기에 적합한 플라스미드의 서열을 나타낸다.
서열번호 488 및 489는 MG15-1 및 MG34-1에 대한 sgRNA 스캐폴드 서열을 나타낸다.
서열번호 490-522는 이. 콜라이 및 HEK293T 세포에서 게놈 유전자좌를 표적화하기 위해 사용된 스페이서의 서열을 나타낸다.
서열번호 523-585는 증폭 및 생어 시퀀싱 동안 사용된 프라이머의 서열을 나타낸다.
도 1은 상이한 클래스 및 타입의 CRISPR/Cas 유전자좌의 전형적인 구성을 도시한다.
도 2는 본원에 기재된 시스템의 발현을 구동하는 T7 프로모터를 함유하는 염기 편집기 플라스미드의 구조를 도시한다.
도 3은 본원에 기재된 시스템에 대한 플라스미드 지도를 도시한다. MGA는 TadA*(ABE8.17m으로부터)-SV40 NLS를 포함하고 MGC는 우라실 글리코실라제 억제제에 연결된 APOBEC1(BE3으로부터) 및 SV40 NLS를 포함한다.
도 4는 닉카제 효소를 생성하는 뉴클레아제 활성을 파괴하도록 돌연변이된 본원에 기재된 선택된 엔도뉴클레아제의 RuvCI 도메인 내의 예측된 촉매 잔기를 도시한다.
도 5는 단일 가이드 RNA 발현 카세트를 본원에 기재된 시스템으로 클로닝하기 위한 예시적인 방법을 도시한다. 하나의 단편은 T7 프로모터와 스페이서를 포함한다. 다른 단편은 스페이서와 단일 가이드 스캐폴드 서열 및 양방향 터미네이터를 포함한다. 단편을 발현 플라스미드로 조립하여, sgRNA와 염기 편집기를 동시에 발현할 수 있는 기능적 작제물을 생성한다.
도 6a 및 6b는 이. 콜라이(E. coli)에서의 lacZ 표적화를 위한 sgRNA 설계를 도시한다. 본원에 기재된 시스템에 사용된 스페이서 길이는 22 개의 뉴클레오티드였다. 본원에 기재된 선택된 시스템의 경우, 이. 콜라이에서 lacZ를 표적화하는 3개의 sgRNA가 편집 윈도우(editing window)를 결정하도록 설계하였다.
도 7은 선택된 돌연변이된 효과기의 닉카제 활성을 도시한다. 양쪽 5' 말단에 형광단(6-FAM)으로 표지된 600bp 이중 가닥 DNA 단편을 동족 sgRNA가 보충된 정제된 효소와 함께 인큐베이션하였다. 반응 산물을 10% TBE-우레아 변성 겔에서 분해시켰다. 이중 가닥 절단은 400개 및 200개 염기의 밴드를 생성한다. 닉카제 활성은 600개 및 200개 염기의 밴드를 생성한다.
도 8a, 8b 및 8c는 본원에 기재된 선택된 시스템에 의한 염기 편집을 입증하는 생어(Sanger) 시퀀싱 결과를 도시한다.
도 9는 본원에 기재된 시스템이 본원에 기재된 엔도뉴클레아제 및 염기 편집기를 사용하여 염기-편집 능력을 어떻게 확장하는가를 도시한다.
도 10a 및 10b는 TadA(ABE8.17m) 및 MG 닉카제를 포함하는 아데닌 염기 편집기(ABE)의 염기 편집 효율을 도시한다. TadA는 tRNA 아데닌 데아미나제이고 TadA(ABE8.17m)는 이. 콜라이 TadA의 조작된 변이체이다. TadA(ABE8.17m)와 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 Edit R에 의해 정량화된 A에서 G로의 전환의 백분율을 나타낸다. ABE8.17m은 실험의 양성 대조군으로서 사용하였다.
도 11a 및 11b는 래트 APOBEC1, MG 닉카제 및 바실러스 서브틸리스(Bacillus subtilis) 박테리오파지(UGI(PBS1))의 우라실 글리코실라제 억제제를 포함하는 시토신 염기 편집기(CBE)의 염기 편집 효율을 도시한다. APOBEC1은 시토신 데아미나제이다. N-말단에서 rAPOBEC1에 융합되고 C-말단에서 UGI에 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 Edit R에 의해 정량화된 C에서 T로의 전환의 백분율을 나타낸다. BE3는 실험에서 양성 대조군으로서 사용하였다.
도 12는 CBE의 염기 편집 활성에 미치는 MG 우라실 글리코실라제 억제제(UGI)의 효과를 도시한다. 패널 (a)는 N-말단 APOBEC1, MG15-1 닉카제 및 C-말단 UGI를 포함하는 MGC15-1 및 변이체의 염기 편집 활성을 보여주는 그래프를 도시한다. 3가지 MG UGI를 이. 콜라이에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. 패널 (b)는 N-말단 rAPOBEC1, SpCas9 닉카제 및 C-말단 UGI를 포함하는 BE3의 염기 편집 활성을 보여주는 그래프이다. 2가지 MG UGI를 HEK293T 세포에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. 편집 효율은 Edit R에 의해 정량화하였다.
도 13a 및 13b는 A0A2K5RDN7, MG 닉카제 및 MG UGI를 포함하는 시토신 염기 편집기의 편집 효율을 보여주는 편집된 부위의 지도를 도시한다. 작제물은 N-말단 A0A2K5RDN7, MG 닉카제 및 C-말단 MG69-1을 포함한다. 단순화를 위해, 도면에는 MG 닉카제의 정체만이 도시된다. BE3은 염기 편집에 대한 양성 대조군으로서 사용하였다. 음성 대조군으로는 공 벡터(empty vector)를 사용하였다. 상이한 날에 3회의 독립적인 실험을 수행하였다. 약어: R, 반복; NEG, 음성 대조군.
도 14는 이. 콜라이에서의 TadA 특성규명을 위한 양성 선택 방법을 도시한다. 패널 (a)는 TadA 선택에 사용된 하나의 플라스미드 시스템의 지도를 도시한다. 벡터는 CAT(H193Y), CAT를 표적화는 sgRNA 발현 카세트 및 ABE 발현 카세트를 포함한다. 본 도면에는, 이. 콜라이로부터의 N-말단 TadA 및 스트렙토코커스 피오게네스(Streptococcus pyogenes)로부터의 C-말단 SpCas9(D10A)가 도시되어 있다. 패널 (b)는 이. 콜라이 세포 내로 도입/형질전환될 때 CAT(H193Y)의 주형 가닥의 A2 위치가 편집되어 H193Y 돌연변이를 야생형으로 되돌리고 이의 활성을 복원시킴을 입증하는 시퀀싱 추적을 도시한다. 약어: CAT, 클로람페니콜 아세틸트랜스퍼라제.
도 15는 TadA에 의해 유발된 돌연변이가 클로람페니콜(Cm)의 높은 내용성(tolerance)을 가능하게 함을 도시한다. 패널 (a)는 이. 콜라이의 항생제 내성을 선택하기 위해 상이한 농도의 클로람페니콜이 사용된 성장 플레이트의 사진을 도시한다. 이 예에서, 이. 콜라이(EcTadA)로부터의 TadA의 야생형 및 변이체 2가지를 테스트하였다. 패널 (b)는 돌연변이된 TadA를 보유하는 ABE가 야생형보다 더 높은 편집 효율을 나타낸다는 것을 입증하는 결과 요약 표를 도시한다. 이들 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다. 단순화를 위해, 표에는 데아미나제의 정체만이 도시된다.
도 16a는 양성 선택에서 MG TadA 활성을 조사하기 위한 성장 플레이트의 사진을 도시한다. 8개의 MG68 TadA 후보를 0 내지 2 ㎍/mL의 클로람페니콜(ABE는 N-말단 TadA 변이체 및 C-말단 SpCas9(D10A) 닉카제를 포함함)에 대해 테스트하였다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 이 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 16b는 MG TadA 후보의 편집 효율을 요약하고, MG68-3 및 MG68-4가 아데닌의 염기 편집을 구동하였음을 입증한다.
도 17은 MG68-4 상의 D109N 돌연변이를 통한 MG68-4_nSpCas9의 염기 편집 효율의 개선을 도시한다. 패널 (a)는 야생형 MG68-4 및 이의 변이체가 0 내지 4 ㎍/mL의 클로람페니콜에 대해 테스트된 성장 플레이트의 사진을 도시한다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 이 실험에서 아데닌 염기 편집기는 N-말단 TadA 변이체 및 C-말단 SpCas9(D10A) 닉카제를 포함한다. 패널 (b)는 MG TadA 후보의 편집 효율을 나타내는 요약 표를 도시한다. 패널 (b)는 MG68-4 및 MG68-4(D109N)가 아데닌의 염기 편집을 나타냈고, D109N 돌연변이가 증가된 활성을 나타냈음을 입증한다. 이 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 18은 MG68-4(D109N)_nMG34-1의 염기 편집을 도시한다. 패널 (a)는 N-말단 MG68-4(D109N) 및 C-말단 SpCas9(D10A) 닉카제를 포함하는 ABE가 0 내지 2 ㎍/mL의 클로람페니콜에 대해 테스트된 실험의 성장 플레이트의 사진을 도시한다. 패널 (b)는 sgRNA의 존재 및 부재 하의 편집 효율을 나타내는 요약 표를 도시한다. 이 실험에서 콜로니는 1 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 19는 MG68-4-nMG34-1 염기 편집 활성의 개선을 위해 설계된 28가지의 MG68-4 변이체(서열번호 448-475)를 도시한다. 효소의 편집을 개선하기 위한 표적화 돌연변이유발을 위해 12개의 잔기를 선택하였다.
서열 목록의 간략한 설명
본 출원과 함께 제출된 서열 목록은 본 개시내용에 따른 방법, 조성물 및 시스템에서 사용하기 위한 예시적인 폴리뉴클레오티드 및 폴리펩티드 서열을 제공한다. 하기는 이 중의 서열의 예시적인 설명이다.
서열번호 1-47은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG66 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 48-49는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG67 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 50-51은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 52-56은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 우라실 DNA 글리코실라제 억제제의 서열을 나타낸다.
서열번호 57-66은 참조 데아미나제의 서열을 나타낸다.
서열번호 67은 참조 우라실 DNA 글리코실라제 억제제의 서열을 나타낸다.
서열번호 68은 아데닌 염기 편집기의 서열을 나타낸다.
서열번호 69는 시토신 염기 편집기의 서열을 나타낸다.
서열번호 70-78은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG 닉카제의 전장 펩티드 서열을 나타낸다.
서열번호 79-87은 본원에 기재된 시험관내 닉카제 분석에서 사용된 프로토스페이서 및 PAM을 나타낸다.
서열번호 88-96은 본원에 기재된 시험관내 닉카제 분석에서 사용된 단일 가이드 RNA의 펩티드 서열을 나타낸다.
서열번호 97-156은 이. 콜라이 lacZ를 표적화할 때의 스페이서의 서열을 나타낸다.
서열번호 157-176은 부위 지정 돌연변이유발을 수행할 때의 프라이머의 서열을 나타낸다.
서열번호 177-178은 lacZ 시퀀싱을 위한 프라이머의 서열을 나타낸다.
서열번호 179-342는 증폭 동안 사용된 프라이머의 서열을 나타낸다.
서열번호 343-345는 lacZ 시퀀싱을 위한 프라이머의 서열을 나타낸다.
서열번호 346-359는 증폭 동안 사용된 프라이머의 서열을 나타낸다.
서열번호 360-368은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 프로토스페이서 인접 모티프를 나타낸다.
서열번호 369-384는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 핵 국소화 서열(NLS)을 나타낸다.
서열번호 385-443은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 444-447은 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG121 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 448-475는 본원에 기재된 조작된 핵산 편집 시스템에 적합한 MG68 데아미나제의 전장 펩티드 서열을 나타낸다.
서열번호 476 및 477은 아데닌 염기 편집기의 서열을 나타낸다.
서열번호 478-482는 시토신 염기 편집기의 서열을 나타낸다.
서열번호 483-487은 본원에 기재된 조작된 핵산 편집 시스템을 코딩하기에 적합한 플라스미드의 서열을 나타낸다.
서열번호 488 및 489는 MG15-1 및 MG34-1에 대한 sgRNA 스캐폴드 서열을 나타낸다.
서열번호 490-522는 이. 콜라이 및 HEK293T 세포에서 게놈 유전자좌를 표적화하기 위해 사용된 스페이서의 서열을 나타낸다.
서열번호 523-585는 증폭 및 생어 시퀀싱 동안 사용된 프라이머의 서열을 나타낸다.
본 발명의 다양한 실시양태가 본원에서 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 수많은 변경, 변화 및 치환이 본 개시내용에서 벗어나지 않고 당업자에게 일어날 수 있다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
본원에 개시된 일부 방법의 실행은 달리 명시되지 않는 한, 면역학, 생화학, 화학, 분자생물학, 미생물학, 세포생물학, 유전체학 및 재조합 DNA의 기술을 사용한다. 예를 들어, 문헌[Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))] (그 전체가 본원에 참조로 포함됨)을 참조한다.
본 명세서에 사용되는 바와 같이, 단수형인 부정관사 및 정관사는 문맥이 명백하게 달리 나타내지 않는 한 복수형도 포함하도록 의도된다. 또한, "포함되는", "포함되다", "갖는", "갖다", "~와 함께" 또는 이들의 어미변화가 상세한 설명 및/또는 청구범위에서 사용되는 한, 이러한 용어들은 용어 "포함하는"와 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 당업자에 의해 결정된 특정 값에 대해 허용 가능한 오차 범위 내를 의미하며, 이는 값이 어떻게 측정 또는 결정되는지, 즉 측정 시스템의 한계에 부분적으로 의존할 것이다. 예를 들어, "약"은 당업계의 관행에 따라 1 또는 1 초과의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 20% 이하, 15% 이하, 10% 이하, 5% 이하, 또는 1% 이하의 범위를 의미할 수 있다.
본원에 사용된 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본적인 구조적, 기능적 및/또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 유기체로부터 유래할 수 있다. 일부 비제한적인 예는 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵 유기체의 세포, 원생동물 세포, 식물 세포(예를 들어, 식물 작물, 과일, 채소, 곡물, 대두, 옥수수, 메이즈, 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 면, 대마, 담배, 현화 식물, 침엽수, 겉씨 식물, 양치류, 석송, 붕어마름(hornwort), 우산이끼, 이끼로부터의 세포), 조류 세포(예를 들어, 보트리코쿠스 브라우니이(Botryococcus braunii), 클라미도모나스 레인하르드티이(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐아 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스 씨. 아가르드(Sargassum patens C. Agardh) 등), 해조류(예를 들어, 다시마), 진균 세포(예를 들어, 효모 세포, 버섯으로부터의 세포), 동물 세포, 무척추 동물(예를 들어, 초파리, 자포동물, 극피동물, 선충류 등)로부터의 세포, 척추동물(예를 들어, 어류, 양서류, 파충류, 조류, 포유동물)로부터의 세포, 포유동물(예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 인간이 아닌 영장류, 인간 등)의 세포 등을 포함한다. 때때로, 세포는 천연 유기체로부터 유래하지 않는다(예를 들어, 세포는 합성으로 제조될 수 있고, 때로는 인공 세포로 명명됨).
본원에 사용된 바와 같이, 용어 "뉴클레오티드"는 일반적으로 염기-당-포스페이트 조합물을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열의 단량체 단위(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))일 수 있다. 용어 뉴클레오티드는 리보뉴클레오시드 트리포스페이트 아데노신 트리포스페이트(ATP), 우리딘 트리포스페이트(UTP), 시토신 트리포스페이트(CTP), 구아노신 트리포스페이트(GTP) 및 데옥시리보뉴클레오시드 트리포스페이트, 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어 [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이들을 함유하는 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에 사용된 바와 같이, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 트리포스페이트(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 트리포스페이트의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP 및 ddTTP를 포함할 수 있지만, 이에 제한되지 않는다. 뉴클레오티드는 표지되지 않거나, 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)을 포함하는 모이어티를 사용하는 것과 같이 검출 가능하게 표지될 수 있다. 표지화는 양자점으로 수행될 수도 있다. 검출 가능한 표지는 예를 들어 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조)벤조산(DABCYL), 캐스케이드 블루, 오레곤 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있지만, 이에 제한되지 않는다. 형광 표지된 뉴클레오티드의 구체적인 예는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP(미국 캘리포니아주 포스터 시티 소재의 Perkin Elmer로부터 입수 가능); 플루오로링크(FluoroLink) 데옥시뉴클레오티드, 플루오로링크 Cy3-dCTP, 플루오로링크 Cy5-dCTP, 플루오로링크 플루오르(Fluor) X-dCTP, 플루오로링크 Cy3-dUTP, 및 플루오로링크 Cy5-dUTP(미국 일리노이주 알링턴 하이츠 Ill 소재의 Amersham으로부터 입수 가능); 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP(미국 인디애나주 인디애나폴리스 소재의 Boehringer Mannheim으로부터 입수 가능); 및 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP 및 텍사스 레드-12-dUTP(미국 오레곤주 유진 소재의 Molecular Probes로부터 입수 가능)를 포함할 수 있다. 뉴클레오티드는 또한 화학 변형에 의해 표지되거나 표시될 수 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오틴화된 dNTP의 일부 비제한적 예는 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP)를 포함할 수 있다.
용어 "폴리뉴클레오티드", "올리고뉴클레오티드" 및 "핵산"은 일반적으로 단일 가닥, 이중 가닥 또는 다중 가닥 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 이들의 유사체인 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭하기 위해 상호교환 가능하게 사용된다. 폴리뉴클레오티드는 세포에 대해 외인성 또는 내인성일 수 있다. 폴리뉴클레오티드는 세포-유리(cell-free) 환경에 존재할 수 있다. 폴리뉴클레오티드는 유전자 또는 이의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있고, 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예를 들어, 변경된 백본, 당 또는 핵염기)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적 예는 5-브로모우라실, 펩티드 핵산, 제노 핵산, 모르폴리노, 잠금 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코르디세핀, 7-데아자-GTP, 형광단(예를 들어, 당에 연결된 로다민 또는 플루오레세인), 티올-함유 뉴클레오티드, 비오틴-연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우리딘, 디히드로우리딘, 쿠에오신 및 와이오신을 포함한다. 폴리뉴클레오티드의 비제한적인 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연관 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로 RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 세포-유리 DNA(cfDNA) 및 세포-유리 RNA(cfRNA)를 포함하는 세포-유리 폴리뉴클레오티드, 핵산 프로브 및 프라이머를 포함한다. 뉴클레오티드의 서열은 비뉴클레오티드 성분에 의해 중단될 수 있다.
용어 "형질감염" 또는 "형질감염된"은 일반적으로 비바이러스 또는 바이러스 기반 방법에 의해 핵산이 세포 내로 도입되는 것을 지칭한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 코딩하는 유전자 서열일 수 있다. 예를 들어, 문헌 [Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88]을 참조한다.
용어 "펩티드", "폴리펩티드" 및 "단백질"은 일반적으로 펩티드 결합(들)에 의해 연결된 적어도 2개의 아미노산 잔기의 중합체를 지칭하기 위해 본원에서 상호교환 가능하게 사용된다. 상기 용어는 특정 길이의 중합체를 의미하지 않으며, 펩티드가 재조합 기술, 화학적 또는 효소적 합성을 사용하여 생산되는지 또는 자연적으로 발생하지를 암시하거나 구별하려는 의도도 아니다. 상기 용어는 자연 발생 아미노산 중합체뿐만 아니라, 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 경우에, 중합체는 비아미노산에 의해 중단될 수 있다. 상기 용어는 전장 단백질, 및 2차 및/또는 3차 구조(예를 들어, 도메인)를 갖거나 갖지 않는 단백질을 포함하는 임의의 길이의 아미노산 사슬을 포함한다. 상기 용어는 또한 예를 들어 디설파이드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 산화 및 표지 성분과의 접합과 같은 임의의 기타 조작에 의해 변형된 아미노산 중합체를 포함한다. 본원에 사용된 바와 같이, 용어 "아미노산" 및 "아미노산들"은 일반적으로 변형된 아미노산 및 아미노산 유사체를 포함하지만 이에 제한되지 않는 천연 및 비천연 아미노산을 지칭한다. 변형된 아미노산은 천연 아미노산 및 비천연 아미노산을 포함할 수 있으며, 이는 아미노산 상에 자연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 것이다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산과 L-아미노산 둘 모두를 포함한다.
본원에 사용된 바와 같이, "비-고유(non-native)"는 일반적으로 고유 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유는 친화도 태그를 지칭할 수 있다. 비-고유는 융합을 지칭할 수 있다. 비-고유는 돌연변이, 삽입 및/또는 결실을 포함하는 자연 발생 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유 서열은 비-고유 서열이 융합되는 핵산 및/또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타내고/내거나 이를 코딩할 수 있다. 비-고유 핵산 또는 폴리뉴클레오티드 서열은 키메라 핵산 및/또는 폴리펩티드를 코딩하는 키메라 핵산 및/또는 폴리펩티드 서열을 생성하기 위해 유전적 조작에 의해 자연 발생 핵산 또는 폴리펩티드 서열(또는 이의 변이체)에 연결될 수 있다.
본원에 사용된 바와 같이, 용어 "프로모터"는 일반적으로 유전자의 전사 또는 발현을 제어하고 RNA 전사가 개시되는 뉴클레오티드 또는 뉴클레오티드의 영역에 인접하거나 중첩하여 위치될 수 있는 조절 DNA 영역을 지칭한다. 프로모터는 종종 전사 인자라고 지칭되는 단백질 인자에 결합하는 특정 DNA 서열을 함유할 수 있으며, 이는 RNA 폴리머라제가 DNA에 결합하여 유전자 전사로 이어지는 것을 용이하게 한다. '코어 프로모터'로도 지칭되는 '기본 프로모터'는 일반적으로 작동 가능하게 연결된 폴리뉴클레오티드의 전사 발현을 촉진하기 위해 필요한 모든 기본 요소를 함유하는 프로모터를 지칭할 수 있다. 일반적으로 진핵생물의 기본 프로모터는 반드시 그런 것은 아니지만, TATA 박스 및/또는 CAAT 박스를 함유한다.
본원에 사용된 바와 같이, 용어 "발현"은 일반적으로 핵산 서열 또는 폴리뉴클레오티드가 DNA 주형으로부터 전사되는 과정(예컨대, mRNA 또는 다른 RNA 전사체로) 및/또는 전사된 mRNA가 이후에 펩티드, 폴리펩티드 또는 단백질로 번역되는 과정을 지칭한다. 전사체 및 코딩된 폴리펩티드는 집합적으로 "유전자 산물"로 지칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에 사용된 바와 같이, "작동 가능하게 연결된", "작동 가능한 연결", "작동적으로 연결된" 또는 이의 문법적 등가물은 일반적으로 유전 요소, 예를 들어 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 지칭하며, 여기서 요소들은 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소는 조절 요소가 코딩 서열의 전사 개시를 돕는 경우 코딩 영역에 작동 가능하게 연결된 것이다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 중간 잔기가 있을 수 있다.
본원에 사용된 바와 같이, "벡터"는 일반적으로 폴리뉴클레오티드를 포함하거나 이와 회합하고 폴리뉴클레오티드를 세포로 전달하는 것을 매개하는 데 사용될 수 있는 거대분자 또는 거대분자의 회합체를 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포솜 및 기타 유전자 전달 비히클을 포함한다. 벡터는 일반적으로 표적에서 유전자의 발현을 촉진하기 위해 유전자에 작동 가능하게 연결된 유전 요소, 예를 들어 조절 요소를 포함한다.
본원에 사용된 바와 같이, "발현 카세트" 및 "핵산 카세트"는 일반적으로 함께 발현되거나 발현을 위해 작동 가능하게 연결된 핵산 서열 또는 요소의 조합물을 지칭하기 위해 상호교환 가능하게 사용된다. 일부 경우에, 발현 카세트는 조절 요소 및 발현을 위해 작동 가능하게 연결된 유전자 또는 유전자들의 조합물을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 일반적으로 전장 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적 활성(기능적 또는 구조적)을 보유하는 단편을 지칭한다. DNA 서열의 생물학적 활성은 전장 서열에 기인하는 것으로 알려진 방식으로 발현에 영향을 미치는 능력일 수 있다.
본원에 사용된 바와 같이, "조작된" 대상은 일반적으로 대상이 인간의 개입에 의해 변형되었음을 나타낸다. 비제한적 예에 따르면, 핵산은 자연에서 발생하지 않는 서열로 이의 서열을 변경함으로써 변형될 수 있으며; 핵산은 라이게이션된 산물이 원래 핵산에 존재하지 않는 기능을 갖도록 자연에서는 회합되지 않는 핵산에 핵산을 라이게이션시킴으로써 변형될 수 있고; 조작된 핵산은 자연에 존재하지 않는 서열로 시험관 내에서 합성될 수 있고; 단백질은 이의 아미노산 서열을 자연에 존재하지 않는 서열로 변경함으로써 변형될 수 있고; 조작된 단백질은 새로운 기능 또는 특성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에 사용된 바와 같이, "합성" 및 "인공"은 자연 발생 인간 단백질에 대한 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 이의 도메인을 지칭하기 위해 상호교환 가능하게 사용될 수 있다. 예를 들어, VPR 및 VP64 도메인은 합성 전이활성화(transactivation) 도메인이다.
본원에 사용된 용어 "tracrRNA" 또는 "tracr 서열"은 일반적으로 예시적인 야생형 tracrRNA 서열(예를 들어, 에스. 피오게네스(S. pyogenes) 에스. 아우레우스(S. aureus) 등으로부터의 tracrRNA)에 대해 적어도 약 5%, 10%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 핵산을 지칭할 수 있다. tracrRNA는 예시적인 야생형 tracrRNA 서열(예를 들어, 에스. 피오게네스 에스. 아우레우스 등으로부터의 tracrRNA)에 대해 최대 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 핵산을 지칭할 수 있다. tracrRNA는 결실, 삽입, 또는 치환, 변이체, 돌연변이 또는 키메라와 같은 뉴클레오티드 변화를 포함할 수 있는 tracrRNA의 변형된 형태를 지칭할 수 있다. tracrRNA는 적어도 6개의 인접한 뉴클레오티드의 스트레치에 걸쳐 예시적인 야생형 tracrRNA(예를 들어, 에스. 피오게네스 에스. 아우레우스 등으로부터의 tracrRNA) 서열과 적어도 약 60% 동일할 수 있는 핵산을 지칭할 수 있다. 예를 들어, tracrRNA 서열은 적어도 6개의 인접한 뉴클레오티드의 스트레치에 걸쳐 적어도 약 60% 동일하거나, 적어도 약 65% 동일하거나, 적어도 약 70% 동일하거나, 적어도 약 75% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 85% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 100% 동일할 수 있다. 타입 II tracrRNA 서열은 인접한 CRISPR 어레이에서 반복 서열의 일부에 상보성을 갖는 영역을 식별함으로써 게놈 서열 상에서 예측될 수 있다.
본원에 사용된 바와 같이, "가이드 핵산"은 일반적으로 또 다른 핵산에 혼성화할 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 핵산 서열에 부위-특이적으로 결합하도록 프로그래밍될 수 있다. 표적화될 핵산, 또는 표적 핵산은 뉴클레오티드를 포함할 수 있다. 가이드 핵산은 뉴클레오티드를 포함할 수 있다. 표적 핵산의 일부는 가이드 핵산의 일부에 상보적일 수 있다. 가이드 핵산에 상보적이고 이와 혼성화하는 이중 가닥 표적 폴리뉴클레오티드의 가닥은 상보적 가닥이라 불릴 수 있다. 상보적 가닥에 상보적이고 따라서 가이드 핵산에 상보적이지 않을 수 있는 이중 가닥 표적 폴리뉴클레오티드의 가닥은 비상보적 가닥이라 불릴 수 있다. 가이드 핵산은 폴리뉴클레오티드 사슬을 포함할 수 있으며, "단일 가이드 핵산"이라 불릴 수 있다. 가이드 핵산은 2개의 폴리뉴클레오티드 사슬을 포함할 수 있으며, "이중 가이드 핵산"으로 불릴 수 있다. 달리 명시되지 않은 경우, 용어 "가이드 핵산"은 단일 가이드 핵산과 이중 가이드 핵산 둘 모두를 지칭하는 포괄적인 의미일 수 있다. 가이드 핵산은 "핵산 표적화 세그먼트" 또는 "핵산 표적화 서열 서열"로 지칭될 수 있는 세그먼트를 포함할 수 있다. 핵산 표적화 세그먼트는 "단백질 결합 세그먼트" 또는 "단백질 결합 서열" 또는 "Cas 단백질 결합 세그먼트"로 지칭될 수 있는 하위 세그먼트를 포함할 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "서열 동일성" 또는 "동일성 퍼센트"는 일반적으로 서열 비교 알고리즘을 사용하여 측정할 때 국소적 또는 전체적 비교 윈도우에 걸쳐 최대 일치를 위해 비교되고 정렬될 때 동일한, 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 지정된 백분율을 갖는 2개(예를 들어, 쌍별 정렬) 이상(예를 들어, 다중 서열 정렬)의 서열을 지칭한다. 폴리펩티드 서열에 적합한 서열 비교 알고리즘은 예를 들어 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고 30개 잔기보다 긴 폴리펩티드 서열에 대한 조건부 조성 점수 매트릭스 조정을 사용하는 BLASTP; 단어 길이(W) 2, 기대값(E) 1000000, 및 30개 미만의 잔기의 서열에 대한 오픈 갭 9 및 연장 갭 1의 PAM30 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하는 BLASTP(이들은 https://blast.ncbi.nlm.nih.gov에서 이용 가능한 BLAST 스위트의 BLASTP에 대한 디폴트 매개변수임); 의 매개변수를 갖는 CLUSTALW; 일치 2, 불일치 -1 및 갭 -1의 매개변수를 갖는 스미스-워터맨 상동성 검색 알고리즘; 디폴트 매개변수를 갖는 MUSCLE; retree가 2이고 최대 반복이 1000인 매개변수를 갖는 MAFFT; 디폴트 매개변수를 갖는 Novafold; 디폴트 매개변수를 갖는 HMMER hmmalign을 포함한다.
본원에 사용된 바와 같이, 용어 "RuvC_III 도메인"은 일반적으로 RuvC 엔도뉴클레아제 도메인(RuvC 뉴클레아제 도메인은 3개의 불연속적인 세그먼트, 즉 RuvC_I, RuvC_II, 및 RuvC_III로 이루어짐)의 불연속적인 3번째 세그먼트를 지칭한다. RuvC 도메인 또는 이의 세그먼트는 일반적으로 알려진 도메인 서열에 대한 정렬, 주석이 달린 도메인을 갖는 단백질에 대한 구조적 정렬에 의해, 또는 알려진 도메인 서열(예를 들어, RuvC_III에 대한 Pfam HMM PF18541)에 기초하여 구축된 히든 마르코프 모델(HMM)과 비교함으로써 식별될 수 있다.
본원에 사용된 바와 같이, 용어 "HNH 도메인"은 일반적으로 특징적인 히스티딘 및 아스파라긴 잔기를 갖는 엔도뉴클레아제 도메인을 지칭한다. HNH 도메인은 일반적으로 알려진 도메인 서열에 대한 정렬, 주석이 달린 도메인을 갖는 단백질에 대한 구조적 정렬에 의해, 또는 알려진 도메인 서열(예를 들어, 도메인 HNH에 대한 Pfam HMM PF01844)에 기초하여 구축된 히든 마르코프 모델(HMM)과 비교함으로써 식별될 수 있다.
본원에 사용된 바와 같이, 용어 "염기 편집기"는 일반적으로 이중 가닥 파손(double-strand break)의 생성 및 복구를 필요로 하지 않으면서 하나의 표적 염기 또는 염기쌍의 다른 것으로의 전환(예를 들어, A:T에서 G:C로, C:G에서 T:A로)을 촉매하는 효소를 지칭한다. 일부 실시양태에서, 염기 편집기는 데아미나제이다.
본원에 사용된 바와 같이, 용어 "데아미나제"는 일반적으로 탈아미노화 반응을 촉매하는 단백질 또는 효소를 지칭한다. 일부 실시양태에서, 데아미나제는 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매하는 아데노신 데아미나제(예를 들어, DNA에서 아데노신을 탈아미노화하는 조작된 아데노신 데아미나제)이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 각각 시티딘(또는 시토신) 또는 데옥시시티딘의 우리딘(또는 우라실) 또는 데옥시우리딘으로의 가수분해성 탈아미노화를 촉매하는 시티딘(또는 시토신) 데아미나제이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 시토신(또는 시토신)의 우라실(또는 우리딘)로의 가수분해성 탈아미노화를 촉매하는 시티딘(또는 시토신) 데아미나제 도메인이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 인간, 침팬지, 고릴라, 원숭이, 소, 개, 래트, 마우스 또는 박테리아(예를 들어, 이. 콜라이)와 같은 유기체로부터의 자연 발생 데아미나제이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 자연에서 발생하지 않는 유기체로부터의 자연 발생 데아미나제의 변이체이다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "최적으로 정렬된"은 일반적으로, 예를 들어, 가장 높은 또는 "최적화된" 동일성 퍼센트 점수를 생성하는 정렬에 의해 결정하는 경우 아미노산 잔기 또는 뉴클레오티드의 최대 일치성으로 정렬된 2개(예를 들어, 쌍별 정렬) 이상(예를 들어, 다중 서열 정렬)의 서열을 지칭한다.
본 개시내용에는 하나 이상의 보존적 아미노산 치환을 갖는 본원에 기재된 임의의 효소의 변이체가 포함된다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 방해하지 않으면서 폴리펩티드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 서로에 대해 유사한 소수성, 극성, 및 R 사슬 길이를 갖는 아미노산을 치환함으로써 달성될 수 있다. 추가로 또는 대안적으로, 상이한 종으로부터의 상동성 단백질의 정렬된 서열을 비교함으로써, 코딩된 단백질의 기본 기능을 변경하지 않으면서 종 사이에서 돌연변이된 아미노산 잔기(예를 들어, 비-보존된 잔기)를 위치시킴으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기재된 엔도뉴클레아제 단백질 서열 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%의 동일성을 갖는 변이체를 포함할 수 있다. 일부 실시양태에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 엔도뉴클레아제의 하나 이상의 중요한 활성 부위 잔기 또는 가이드 RNA 결합 잔기의 활성이 파괴되지 않도록 치환을 갖는 서열을 포함할 수 있다.
또한, 본 개시내용에는 효소의 활성을 감소시키거나 제거하기 위한 하나 이상의 촉매 잔기의 치환을 갖는 본원에 기재된 임의의 효소의 변이체(예를 들어, 감소된-활성 변이체)가 포함된다. 일부 실시양태에서, 본원에 기재된 단백질과 같은 감소된 활성 변이체는 적어도 1개, 적어도 2개, 또는 3개 모두의 촉매 잔기의 파괴성 치환을 포함한다. 일부 실시양태에서, 본원에 기재된 임의의 엔도뉴클레아제는 닉카제 돌연변이를 포함할 수 있다. 일부 실시양태에서, 본원에 기재된 임의의 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함할 수 있다. 일부 실시양태에서, 본원에 기재된 임의의 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성될 수 있다. 일부 실시양태에서, 본원에 기재된 임의의 엔도뉴클레아제는 엔도뉴클레아제 활성이 결여되거나 촉매적으로 사멸되도록 포함할 수 있고 구성될 수 있다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참고문헌으로부터 이용 가능하다(예를 들어, 문헌[Creighton, Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2nd edition (December 1993)] 참조). 하기 8개의 그룹은 각각 서로에 대해 보존적 치환인 아미노산을 함유한다:
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 리신(K);
5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M)
개요
고유한 기능 및 구조를 갖는 새로운 Cas 효소의 발견은 데옥시리보핵산(DNA) 편집 기술을 추가로 변경하여 속도, 특이성, 기능 및 사용 용이성을 개선할 잠재력을 제공할 수 있다. 미생물에서 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(CRISPR) 시스템의 예측된 유병률 및 미생물 종의 완전한 다양성에 비해, 기능적으로 특성규명된 CRISPR/Cas 효소는 문헌에 비교적 거의 없다. 이것은 부분적으로 엄청난 수의 미생물 종들이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 다수의 미생물 종을 나타내는 자연 환경적 지위(environmental niche)로부터 메타게놈 시퀀싱은 알려진 새로운 CRISPR/Cas 시스템의 수를 크게 증가시키고, 새로운 올리고뉴클레오티드 편집 기능의 발견을 가속화할 잠재성을 제공할 수 있다. 이러한 접근법의 결실에 대한 최근의 예는 2016년에 천연 미생물 군집의 메타게놈 분석으로부터 CasX/CasY CRISPR 시스템의 발견으로 입증되었다.
CRISPR/Cas 시스템은 미생물에서 적응 면역 시스템으로서 기능하는 것으로 기재된 RNA-유도 뉴클레아제 복합체이다. 자연적 맥락에서, CRISPR/Cas 시스템은 CRISPR(일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열) 오페론 또는 유전자좌에서 발생하며, 일반적으로 2개의 부분: (i) RNA 기반 표적화 요소를 코딩하는 동등하게 짧은 스페이서 서열에 의해 분리된 짧은 반복 서열(30-40 bp)의 어레이 및 (ii) 부속 단백질/효소와 함께 RNA 기반 표적화 요소에 의해 유도되는 뉴클레아제 폴리펩티드를 코딩하는 Cas를 코딩하는 ORF를 포함한다. 특정 표적 핵산 서열의 효율적인 뉴클레아제 표적화는 일반적으로 (i) 표적의 처음 6-8개의 핵산(표적 시드)과 crRNA 가이드 사이의 상보적 혼성화; 및 (ii) 표적 시드의 정의된 부근 내에 프로토스페이서 인접 모티프(PAM) 서열의 존재(PAM은 일반적으로 숙주 게놈 내에서 통상적으로 나타내지 않는 서열임) 둘 모두를 필요로 한다. 시스템의 정확한 기능 및 조직화에 따라, CRISPR-Cas 시스템은 공유된 기능적 특성 및 진화적 유사성에 기반하여 일반적으로 2가지 클래스, 5가지 타입 및 16가지 서브타입으로 조직화된다(도 1 참조).
클래스 I CRISPR-Cas 시스템은 대형 다중서브유닛 효과기 복합체를 가지며, 타입 I, III 및 IV를 포함한다.
타입 I CRISPR-Cas 시스템은 구성요소의 측면에서 중간 정도로 복잡한 것으로 간주된다. 타입 I CRISPR-Cas 시스템에서, RNA-표적화 요소의 어레이는 이들 다음에 프로토스페이서-인접 모티프(PAM)라 불리는 적합한 짧은 컨센서스(consensus) 서열이 뒤따를 때 뉴클레아제 복합체를 핵산 표적으로 유도하는 짧고 성숙한 crRNA를 방출시키도록 반복 요소에서 프로세싱되는 긴 전구체 crRNA(프리-crRNA)로서 전사된다. 이러한 프로세싱은 crRNA 유도 뉴클레아제 복합체의 뉴클레아제(Cas3) 단백질 구성요소를 또한 포함하는, 캐스케이드(Cascade)라 불리는 대형 엔도뉴클레아제 복합체의 엔도리보뉴클레아제 서브유닛(Cas6)을 통해 발생한다. Cas I 뉴클레아제는 주로 DNA 뉴클레아제로서 기능한다.
타입 III CRISPR 시스템은 Csm 또는 Cmr 단백질 서브유닛을 포함하는 반복체 관련 신비 단백질(repeat-associated mysterious protein: RAMP)과 함께, Cas10으로 알려진 중앙 뉴클레아제의 존재를 특징으로 할 수 있다. 타입 I 시스템에서와 같이, 성숙한 crRNA는 Cas6 유사 효소를 사용하여 프리-crRNA로부터 프로세싱된다. 타입 I 및 II 시스템과 달리, 타입 III 시스템은 DNA-RNA 듀플렉스(예컨대, RNA 폴리머라제에 대한 주형으로 사용되는 DNA 가닥)를 표적화하여 절단하는 것으로 보인다.
타입 IV CRISPR-Cas 시스템은 고도로 감소된 대형 서브유닛 뉴클레아제(csf1), Cas5(csf3) 및 Cas7(csf2) 그룹의 RAMP 단백질에 대한 2개의 유전자, 및 일부 경우에, 예측된 소형 서브유닛에 대한 유전자로 이루어진 효과기 복합체를 보유하고; 이러한 시스템은 통상적으로 내인성 플라스미드에서 발견된다.
클래스 II CRISPR-Cas 시스템은 일반적으로 단일 폴리펩티드 다중도메인 뉴클레아제 효과기를 가지며, 타입 II, V 및 VI를 포함한다.
타입 II CRISPR-Cas 시스템은 구성요소 측면에서 가장 단순한 것으로 간주된다. 타입 II CRISPR-Cas 시스템에서, CRISPR 어레이의 성숙한 crRNA로의 프로세싱은 특별한 엔도뉴클레아제 서브유닛의 존재를 필요로 하지 않고, 오히려 어레이 반복 서열에 상보적인 영역을 갖는 작은 트랜스-코딩된 crRNA(tracrRNA)를 필요로 하고; tracrRNA는 이의 상응하는 효과기 뉴클레아제(예를 들어, Cas9) 및 반복 서열 둘 모두와 상호작용하여 전구체 dsRNA 구조를 형성하고, 이는 내인성 RNAse III에 의해 절단되어 tracrRNA 및 crRNA 둘 모두가 로딩된 성숙한 효과기 효소를 생성한다. Cas II 뉴클레아제는 DNA 뉴클레아제로 알려져 있다. 타입 2 효과기는 일반적으로 RuvC 유사 뉴클레아제 도메인의 폴드 내에 삽입된 관련 없는 HNH 뉴클레아제 도메인과 함께 RNase H 폴드를 채택하는 RuvC 유사 엔도뉴클레아제 도메인으로 이루어진 구조를 나타낸다. RuvC 유사 도메인은 표적(예를 들어, crRNA 상보적) DNA 가닥의 절단을 담당하는 반면, HNH 도메인은 대체된 DNA 가닥의 절단을 담당한다.
타입 V CRISPR-Cas 시스템은 RuvC 유사 도메인을 포함하여, 타입 II 효과기와 유사한 뉴클레아제 효과기(예를 들어, Cas12) 구조를 특징으로 한다. 타입 II와 유사하게, 타입 V CRISPR 시스템의 대부분(전부는 아님)은 tracrRNA를 사용하여 프리-crRNA를 성숙한 crRNA로 프로세싱하지만, 프리-crRNA를 다수의 crRNA로 절단하기 위해 RNAse III를 필요로 하는 타입 II 시스템과는 달리, 타입 V 시스템은 효과기 뉴클레아제 자체를 사용하여 프리-crRNA를 절단할 수 있다. 타입-II CRISPR-Cas 시스템과 마찬가지로, 타입 V CRISPR-Cas 시스템은 다시 DNA 뉴클레아제로 알려져 있다. 타입 II CRISPR-Cas 시스템과 달리, 일부 타입 V 효소(예를 들어, Cas12a)는 이중 가닥 표적 서열의 첫 번째 crRNA 유도 절단에 의해 활성화되는 강력한 단일 가닥의 비특이적 데옥시리보뉴클레아제 활성을 갖는 것으로 보인다.
타입 VI CRIPSR-Cas 시스템은 RNA 가이드된 RNA 엔도뉴클레아제를 갖는다. RuvC 유사 도메인 대신에, 타입 VI 시스템(예를 들어, Cas13)의 단일 폴리펩티드 효과기는 2개의 HEPN 리보뉴클레아제 도메인을 포함한다. 타입 II 및 V 시스템 둘 모두와 달리, 타입 VI 시스템은 또한 프리-crRNA를 crRNA로 프로세싱하기 위해 tracrRNA를 필요로 하지 않는 것으로 보인다. 그러나, 타입 V 시스템과 유사하게, 일부 타입 VI 시스템(예를 들어, C2C2)은 표적 RNA의 첫 번째 crRNA 유도 절단에 의해 활성화된 강력한 단일 가닥의 비특이적 뉴클레아제(리보뉴클레아제) 활성을 보유하는 것으로 보인다.
이의 더 단순한 구조 때문에, 클래스 II CRISPR-Cas는 디자이너 뉴클레아제/게놈 편집 활용으로서 조작 및 개발을 위해 가장 널리 채택되어 왔다.
시험관내 사용을 위한 이러한 시스템의 초기 변경 중 하나는 문헌[Jinek et al. (Science. 2012 Aug 17;337(6096):816-21, 그 전체가 본원에 참고로 포함됨)]에서 찾을 수 있다. Jinek 연구는 처음으로 (i) 에스. 피오게네스 SF370으로부터 단리된, 재조합에 의해 발현되고 정제된 전장 Cas9(예를 들어, 클래스 II, 타입 II Cas 효소), (ii) 절단하고자 하는 표적 DNA 서열에 상보적인 ∼20 nt 5' 서열, 이어서 3' tracr-결합 서열을 갖는 정제된 성숙한 ~42 nt crRNA(전체 crRNA는 T7 프로모터 서열을 갖는 합성 DNA 주형으로부터 시험관내에서 전사됨); (iii) T7 프로모터 서열을 갖는 합성 DNA 주형으로부터 전사된, 시험관내에서 정제된 tracrRNA, 및 (iv) Mg2+를 포함하는 시스템을 기술하였다. Jinek은 이후 (ii)의 crRNA가 링커(예를 들어, GAAA)에 의해 (iii)의 5' 말단에 연결되어 Cas9를 그 자체로 표적으로 유도할 수 있는 단일 융합 합성 가이드 RNA(sgRNA)를 형성하는 개선된 조작된 시스템을 기술하였다.
그 전체가 본원에 참조로 포함된 문헌[Mali et al. (Science. 2013 Feb 15; 339(6121): 823-826.)]은 이후에 (i) C 말단 핵 국소화 서열(예를 들어, SV40 NLS) 및 적합한 폴리아데닐화 신호(예를 들어, TK pA 신호)와 함께 적합한 포유동물 프로모터 하의 코돈 최적화된 Cas9(예를 들어, 클래스 II, 타입 II Cas 효소)를 코딩하는 ORF; 및 (ii) 적합한 폴리머라제 III 프로모터(예를 들어, U6 프로모터) 하의 sgRNA(G로 시작하는 5' 서열에 이어서, 3' tracr-결합 서열에 결합된 20 nt의 상보적인 표적화 핵산 서열, 링커 및 tracrRNA 서열을 가짐)를 코딩하는 ORF를 코딩하는 DNA 벡터를 제공함으로써 포유동물 세포에서 사용하기 위해 상기 시스템을 변경하였다.
염기 편집
염기 편집은 이중 가닥 파손의 생성 및 복구를 필요로 하지 않는 하나의 표적 염기 또는 염기쌍의 다른 것으로의 전환(예를 들어, A:T에서 G:C로, C:G에서 T:A로)이다. 염기 편집은 DNA 또는 RNA 내의 특정 부위에 점 돌연변이를 도입할 수 있게 하는 DNA 및 RNA 염기 편집기의 도움으로 달성될 수 있다. 일반적으로, DNA 염기 편집기는 촉매적 불활성 뉴클레아제와, 단일 가닥 DNA(ssDNA)에만 작용하는 촉매적 활성 염기-변형 효소의 융합을 포함할 수 있다. RNA 염기 편집기는 유사한 RNA 특이적 효소로 구성될 수 있다. 염기 편집은 DNA 내의 비표적(off-target) 및 무작위 돌연변이를 감소시키면서 유전자 변형의 효율을 증가시킬 수 있다.
DNA 염기 편집기는 세포 및 유기체에서 단일 염기 치환을 위한 도구 역할을 하는 조작된 리보핵단백질 복합체이다. 이들은 조작된 염기-변형 효소를 dsDNA를 절단할 수 없는 촉매적으로 결핍된 Cas 변이체와 융합시켜 생성될 수 있지만, 프로토스페이서 인접 모티프(PAM) 서열 의존적 방식으로 dsDNA를 풀어서(unfold) 가이드 RNA가 이의 상보적인 표적을 찾아서 ssDNA 절단 부위를 나타내도록 할 수 있다. 가이드 RNA는 상보적 DNA에 어닐링하여, ssDNA의 단편을 대체하고 Cas '가위(scissors)'를 염기 변형 부위로 유도한다. 세포 복구 기구는 상보적인 편집된 주형으로부터의 정보를 사용하여 닉킹된(nicked) 비편집된 가닥을 복구할 것이다.
지금까지, 2가지 타입의 DNA 편집기, 시토신 염기(CBE) 및 아데닌 염기 편집기(ABE)가 개발되었다. 이들은 최소한의 비표적 DNA 편집으로 DNA 내의 점 돌연변이를 효율적이고 정확하게 편집하는 것으로 나타났다(문헌[Nat Biotechnol. 2017;35:435-437, Nat Biotechnol. 2017;35:438-440 and Nat Biotechnol. 2017;35:475-480, 이들 각각은 전체가 본원에 참조로 포함됨] 참조). 그러나, 최근의 연구 결과는 DNA에 비표적 변형이 존재하고 많은 비표적 변형이 DNA 염기 편집기에 의해 RNA에도 도입된다는 것을 나타낸다.
MG 염기 편집기
일부 양상에서, 본 개시내용은 (a) RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; (b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 경우에, RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 경우에, 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 경우에, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 경우에 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 tracr 서열을 포함한다.
일부 양상에서, 본 개시내용은 (a) 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 경우에 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 tracr 서열을 포함한다. 일부 경우에, RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 경우에, 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 경우에, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다.
일부 양상에서, 본 개시내용은 (a) 서열번호 360-368 또는 598 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 (b) 엔도뉴클레아제에 커플링된 염기 편집기; 및 (c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 포함하는 조작된 핵산 편집 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 tracr 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 닉카제 돌연변이를 포함한다. 일부 경우에, RuvC 도메인은 뉴클레아제 활성이 결여되어 있다. 일부 경우에, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, tracr 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, tracr 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 (a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) tracr 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체로서, 상기 tracr 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 구조체; 및 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, 타입 II Cas 엔도뉴클레아제를 포함하는 조작된 핵산 편집 시스템을 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 360, 362 또는 368 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475 또는 595 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제이다.일부 실시양태에서, 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 조작된 핵산 편집 시스템은 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 조작된 가이드 리보핵산 구조체는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 조작된 가이드 리보핵산 구조체는 가이드 리보핵산 서열 및 tracr 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물 또는 인간 게놈 서열에 상보적이다. 일부 실시양태에서, 가이드 리보핵산 서열은 길이가 15 내지 24 개의 뉴클레오티드이다. 일부 실시양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다.
NLS는 하기 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다:
표 1: 본 개시내용에 따라 Cas 효과기와 함께 사용될 수 있는 예시적인 NLS 서열
일부 실시양태에서, 엔도뉴클레아제는 염기 편집기에 직접 공유 결합되거나, 링커를 통해 염기 편집기에 공유 결합된다. 일부 실시양태에서, 본원에 기재된 임의의 효소 또는 도메인을 연결시키는 링커는 SGGSSGGSSGSETPGTSESATPESSGGSSGGS, SGSETPGTSESATPESA, GSGGS, SGSETPGTSESATPES, SGGSS, 또는 GAAA, 또는 본원에 기재된 임의의 다른 링커 서열에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열의 하나 또는 다수의 카피를 포함할 수 있다. 일부 실시양태에서, 폴리펩티드는 엔도뉴클레아제 및 염기 편집기를 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성된다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시스템은 Mg2+ 공급원을 추가로 포함한다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 70 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 88의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 360을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 71 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 89 중 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 361을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 73 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 91의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 363을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 75 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 93의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 365를 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 76 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 94의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 366을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 77 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 95의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 367을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 엔도뉴클레아제는 서열번호 78 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 가이드 RNA 구조체는 서열번호 96의 적어도 하나와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하고; 엔도뉴클레아제는 서열번호 368을 포함하는 PAM에 결합하도록 구성된다.
일부 실시양태에서, 염기 편집기는 아데닌 데아미나제를 포함한다. 일부 실시양태에서, 아데닌 데아미나제는 서열번호 57 또는 이의 변이체를 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제를 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58 또는 이의 변이체를 포함한다. 일부 실시양태에서, 본원에 기재된 조작된 핵산 편집 시스템은 우라실 DNA 글리코실화 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실화 억제제는 서열번호 67 또는 이의 변이체를 포함한다.
일부 실시양태에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT 또는 스미스-워터맨 상동성 검색 알고리즘에 의해 결정된다. 일부 실시양태에서, 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고 조건부 조성 점수 매트릭스 조정을 사용하여 상기 BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 핵산을 제공한다.
일부 양상에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된, 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 엔도뉴클레아제를 코딩하는 것인 핵산을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시양태에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간이다.
일부 양상에서, 본 개시내용은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 벡터로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 벡터를 제공한다. 일부 실시양태에서, 벡터는 본원에 기재된 핵산을 포함한다. 일부 실시양태에서, 벡터는 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서, 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조체를 코딩하는 핵산을 추가로 포함한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래의 비리온 또는 렌티바이러스이다. 일부 양상에서, 본 개시내용은 본원에 기재된 벡터를 포함하는 세포를 제공한다. 일부 양상에서, 본 개시내용은 본원에 기재된 세포를 배양하는 단계를 포함하는, 엔도뉴클레아제의 제조 방법을 제공한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; 상기 엔도뉴클레아제에 커플링된 염기 편집기; 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고, 여기서 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하는 것인 방법을 제공한다.
일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제는 염기 편집기에 직접 공유 결합되거나, 링커를 통해 염기 편집기에 공유 결합된다. 일부 실시양태에서, RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를, 클래스 2, 타입 II Cas 엔도뉴클레아제, 엔도뉴클레아제에 커플링된 염기 편집기 및 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체를 포함하는 복합체와 접촉시키는 단계를 포함하고; 여기서 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고; 상기 PAM은 서열번호 360-368 또는 598 또는 이의 변이체로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법을 제공한다.
일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 염기 편집기에 공유 결합되거나, 링커를 통해 염기 편집기에 커플링된다. 일부 실시양태에서, 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 또는 이의 변이체로부터 선택된 서열에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제를 포함하고; 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 아데닌을 포함하고; 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 아데닌 데아미나제는 서열번호 57 또는 이의 변이체에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 염기 편집기는 시토신 데아미나제를 포함하고; 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 시토신을 포함하고; 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 시토신을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 58 또는 이의 변이체에 대해 적어도 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 시토신 데아미나제는 서열번호 59-66 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 동일성을 갖는 서열을 포함한다.
일부 실시양태에서, 복합체는 우라실 DNA 글리코실라제 억제제를 추가로 포함한다. 일부 실시양태에서, 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시양태에서, PAM은 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열의 3' 말단에 바로 인접한다.
일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시양태에서, 클래스 2, 타입 II Cas 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 양상에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 본원에 기재된 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 여기서 엔도뉴클레아제는 조작된 가이드 리보핵산 구조체와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법을 제공한다.
일부 실시양태에서, 조작된 핵산 편집 시스템은 아데닌 데아미나제를 포함하고, 뉴클레오티드는 아데닌이고, 표적 핵산 유전자좌를 변형시키는 것은 아데닌을 구아닌으로 전환시키는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템은 시티딘 데아미나제 및 우라실 DNA 글리코실라제 억제제를 포함하고, 뉴클레오티드는 시토신이고 표적 핵산 유전자좌를 변형시키는 것은 아데닌을 우라실로 전환시키는 것을 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA 또는 박테리아 DNA를 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 시험관내에 있다. 일부 실시양태에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시양태에서, 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포 또는 인간 세포이다. 일부 실시양태에서, 세포는 동물 내에 있다.
일부 실시양태에서, 세포는 달팽이관 내에 있다. 일부 실시양태에서, 세포는 배아 내에 있다. 일부 실시양태에서, 배아는 2세포 배아이다. 일부 실시양태에서, 배아는 마우스 배아이다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 본원에 기재된 핵산 또는 본원에 기재된 벡터를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함한다.
일부 실시양태에서, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동 가능하게 연결된 프로모터를 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 캡핑된 mRNA를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 번역된 폴리펩타이드를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 핵산 편집 시스템을 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 리보핵산 구조체를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함한다.
일부 양상에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 양상에서, 본 개시내용은 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다.
일부 양상에서, 본 개시내용은 서열번호 360-368 또는 598 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및 상기 엔도뉴클레아제에 커플링된 염기 편집기를 포함하는 조작된 핵산 편집 폴리펩티드를 제공한다.
일부 실시양태에서, 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래된다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시양태에서, 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 아데닌 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 염기 편집기는 시토신 데아미나제이다.일부 실시양태에서, 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
본 개시내용의 시스템은 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열-특이적 결합)과 같은 다양한 적용을 위해 사용될 수 있다. 이러한 시스템은, 예를 들어, 대상체에서 질환을 유발할 수 있는 유전적으로 유전된 돌연변이를 해결(예를 들어, 제거 또는 대체)하여 유전자를 불활성화시킴으로써 세포에서 이의 기능을 확인하기 위해, 질환 유발 유전 요소를 검출하기 위한 진단 도구로서(예를 들어, 역전사된 바이러스 RNA 또는 질환 유발 돌연변이를 코딩하는 증폭된 DNA 서열의 절단을 통해), 특정 뉴클레오티드 서열(예를 들어, 박테리아에서 항생제 내성을 코딩하는 서열)을 표적화하고 검출하기 위한 프로브와 조합된 불활성화된 효소로서, 바이러스를 불활성화하거나 바이러스 게놈을 표적화하여 숙주 세포를 감염시킬 수 없도록 하기 위해, 가치있는 소분자, 거대분자 또는 2차 대사산물을 생산하도록 유기체를 조작하기 위해 유전자를 추가하거나 대사 경로를 수정하기 위해, 진화적 선택을 위한 유전자 구동 요소를 확립하기 위해, 바이오센서로서 외래 소분자 및 뉴클레오티드에 의한 세포 변화를 검출하기 위해 사용될 수 있다.
표 2: 본원에 언급된 단백질 및 핵산 서열의 서열 목록
실시예
실시예 1. - 염기 편집기를 위한 플라스미드 작제
염기 편집을 표적화하기 위해 CRISPR 기능을 이용하는 염기 편집 효소를 생성하기 위해, Cas 효과기 효소를 본원에 기재된 예시적인 데아미나제에 다양한 구성으로 융합시켰다. 이 과정은 융합 효소를 생성하기에 적합한 벡터를 작제하는 첫 번째 단계를 포함한다. 2개의 진입 플라스미드 벡터, MGA 및 MGC를 먼저 작제하였다.
T7 프로모터-His 태그-TadA*(ABE8.17m)-SV40 NLS를 함유하는 MGA(Metagenomi 아데닌 염기 편집기) 진입 플라스미드를 작제하기 위해, 3개의 DNA 단편을 pAL6으로부터 증폭시켰다. T7 프로모터-His 태그-APOBEC1(BE3)-UGI-SV40 NLS를 함유하는 MGC(Metagenomi 시토신 염기 편집기) 진입 플라스미드를 작제하기 위해, APOBEC1 및 UGI-SV40 NLS를 pAL9로부터 증폭시키고, 두 조각의 벡터 백본을 pAL6로부터 증폭시켰다(도 3 참조).
효과기 내로 돌연변이를 도입하기 위해, MG1-4, MG1-6, MG3-6, MG3-7, MG3-8, MG4-5, MG14-1, MG15-1 또는 MG18-1 효과기 유전자 서열을 함유하는 소스 플라스미드를 적절한 돌연변이를 포함하는 정방향 프라이머 및 역방향 프라이머를 사용하여 Q5 DNA 폴리머라제에 의해 증폭시켰다. 그 다음, 선형 DNA 단편을 인산화하고 라이게이션하였다. DNA 주형을 제조업체의 지침에 따라 KLD 효소 믹스(New England Biolabs)를 사용하여 DpnI로 분해시켰다.
pMGA 및 pMGC 발현 플라스미드를 생성하기 위해, 돌연변이된 효과기를 보유하는 플라스미드로부터 유전자를 증폭시키고 각각 XhoI 및 SacII 부위를 통해 MGA 및 MGC 진입 플라스미드로 클로닝하였다. T7 프로모터-sgRNA-양방향 터미네이터를 포함하는 sgRNA 발현 카세트를 BE 발현 플라스미드로 클로닝하기 위해, 한 세트의 프라이머(정방향 프라이머로서 P366)를 사용하여 T7 프로모터-스페이서 서열을 증폭시키는 한편, 또 다른 세토의 프라이머(역방향 프라이머로서 P367)를 사용하여 스페이서 서열-sgRNA 스캐폴드-양방향 터미네이터를 증폭시켰고, 여기서 pTCM 플라스미드를 주형으로서 사용하였다(도 2 참조). 2개의 단편을 XbaI 부위를 통해 pMGA 및 pMGC로 조립하여 각각 pMGA-sgRNA 및 pMGC-sgRNA를 생성하였다.
표 3 - 본원에 기재된 ABE 스크리닝 시스템을 위해 제조된 작제물의 요약
증폭된 모든 DNA 단편을 QIAquick 겔 추출 키트(Qiagen)에 의해 정제하고, NEBuilder HiFi DNA Assembly(New England Biolabs)를 통해 조립하고, 생성된 조립체를 제조업체의 지침에 따라 Endura 전기천공적격(Electrocompetent) 세포(Lucergen)를 통해 증식하였다(도 4 및 5 참조). 클로닝된 모든 유전자의 DNA 서열은 ELIM BIOPHARM에서 확인되었다.
표 4 - 본원에 기재된 선택된 시스템에 대해 분석된 보존된 촉매 잔기
실시예 2.- 단백질 발현 및 정제
pMGA 및 pMGC 플라스미드에서 T7 프로모터 구동된 돌연변이된 효과기 유전자를 상기 실시예 1에 기재된 각각의 플라스미드로 형질전환시킴으로써 제조업체의 지침(Thermo)에 따라 Magic Media 중의 이. 콜라이 BL21(DE3) 세포에서 발현시켰다. 16℃에서 40시간 인큐베이션한 후, 형질전환된 세포를 수거하고, 용해 완충액(HisTrap 평형 완충액: 20 mM Tris(Sigma T2319-100 ML), 300 mM 염화나트륨(VWR VWRVE529-500 ML), 5% 글리세롤, 10 mM MgCl2, 10 mM 이미다졸(Sigma 68268-100 ML-F) 포함; pH 7.5) 및 EDTA-무함유 프로테아제 억제제(Pierce)에 현??시키고, -80℃ 냉동고에서 냉동시켰다. 그 다음, 세포를 얼음 위에서 해동하고, 초음파 처리하고, 정화하고, 친화성 정제 전에 여과하였다. 단백질을 제조업체의 사양에 따라 Akta Avant FPLC 상의 Cytiva 5ml HisTrap FF 컬럼에 적용하고 단백질을 20 mM Tris(Sigma T2319-100 ML), 300 mM 염화나트륨(VWR VWRVE529-500 ML), 5% 글리세롤, 10 mM MgCl2, 250 mM 이미다졸 포함(Sigma 68268-100 ML-F); pH 7.5의 등용매 용출로 용출시켰다. His-태그된 효과기 단백질을 함유하는 용출된 분획을 농축시키고 50 mM Tris-HCl, 300 mM NaCl, 1 mM TCEP, 5% 글리세롤; pH 7.5로 완충액 교환하였다. Image Lab(Bio-Rad)에서 SDS PAGE 농도계로 상대적 순도를 결정한 후 단백질 농도를 비신코닌산 분석(Thermo)으로 결정하고 조정하였다(도 7 참조).
실시예 3. - 시험관내 닉카제 분석
IDT에 의해 합성된 6-카르복시플루오레세인(6-FAM) 표지된 프라이머 P141 및 P146(서열번호 179 및 180)을, Q5 DNA 폴리머라제를 사용하여 효과기의 표적화 서열을 함유하는 LacZ의 선형 단편을 증폭시키는 데 사용하였다. T7 프로모터에 이어서 20-bp 또는 22-bp 스페이서 서열을 함유하는 sgRNA를 함유하는 DNA 단편을 제조업체의 지침에 따라 HiScribe T7 고수율 RNA 합성 키트(New England Biolabs)를 사용하여 시험관내에서 전사하였다. 서열 목록에서 명명된 sgRNA에 상응하는 서열을 갖는 합성 sgRNA를 사용자 매뉴얼에 따라 Monarch RNA Cleanup 키트(New England Biolabs)로 정제하고 농도를 Nanodrop으로 측정하였다.
DNA 닉카제 활성을 결정하기 위해, 각각의 정제된 돌연변이된 효과기를 먼저 이의 동족 sgRNA로 보충하였다. 10 mM Tris pH 7.5, 10 mM MgCl2, 100 mM NaCl, 150 nM 효소, 150 nM RNA 및 15 nM DNA를 함유하는 15 μL 반응 혼합물에 선형 DNA 기질을 첨가하여 반응을 개시하였다. 반응물을 37℃에서 2시간 동안 인큐베이션하였다. 분해된 DNA를 AMPure XP SPRI 상자성 비드(Beckman Coulter)를 사용하여 정제하고 6 μL TE 완충액(10 mM Tris, 1 mM EDTA; pH 8.0)으로 용출시켰다. 닉킹된 DNA를 10% TBE-우레아 변성 겔(Biorad)에서 분해시키고 ChemiDoc(Bio-Rad)에 의해 이미지화하였다(도 7 참조, 이는 야생형 효소의 경우에 400개 및 200개 염기인 것에 비해 도시된 효소는 600개 및 200개 염기의 밴드의 생성에 의해 닉카제 활성을 나타냄을 보여준다). 결과는 결정적이지 않은 MG4-5(D17A)를 제외한 도 7에서 테스트된 모든 닉카제 돌연변이가 야생형 절단 활성 대신 예상된 닉카제 활성을 나타냈음을 보여주었다.
실시예 4.- 이. 콜라이 내로의 염기 편집기 도입
플라스미드를 제조업체의 지침에 따라 Lucergen의 전기천공적격 BL21(DE3) 세포로 형질전환시켰다. 전기천공 후, 세포를 37℃에서 1시간 동안 발현 회수 배지로 회수하고 100 L/mg 암피실린 및 0.1 mM IPTG를 함유하는 LB 플레이트에 도말하였다. 37℃에서 밤새 성장시킨 후, 콜로니를 채취하고 lacZ 유전자를 프라이머 P137 및 P360을 사용하여 Q5 DNA 폴리머라제(New England Biolabs)에 의해 증폭시켰다. 생성된 PCR 산물을 정제하고 ELIM BIOPHARM에서 생어 시퀀싱에 의해 시퀀싱하였다. 시토신 염기 편집기 또는 아데닌 염기 편집기 각각에 대한 표적화된 프로토스페이서 영역에 C에서 T로의 전환 또는 A에서 G로의 전환이 존재하는지 여부를 조사하여 염기 편집을 결정하였다.
이. 콜라이에서 편집 효율을 평가하기 위해, 플라스미드를 전기천공적격 BL21(DE3)(Lucergen)로 형질전환시키고 전기천공된 세포를 37℃에서 1시간 동안 발현 회수 배지로 회수하였다. 10 μL의 회수된 세포를 96웰 딥 웰 플레이트에서 100 μL/mg 암피실린 및 0.1 mM IPTG를 함유하는 990 μL SOB에 접종하고, 37℃에서 20시간 동안 성장시켰다. 염기 편집기 발현을 위해 유도된 1 μL 세포를 프라이머 P137 및 P360을 사용한 20 μL PCR 반응(Q5 DNA 폴리머라제)에서 lacZ 유전자의 증폭을 위해 사용하였다. 생성된 PCR 산물을 정제하고 ELIM BIOPHARM에서 생어 시퀀싱에 의해 시퀀싱하였다. 편집 효율의 정량화는 실시예 12에 기재된 바와 같이 Edit R에 의해 처리하였다.
표 5 - 관련 PAM 및 데아미나제와 함께 본원에 기재된 MG 염기 편집기
실시예 5. - 포유동물 세포에서의 단백질 뉴클레오펙션 및 앰플리콘 seq(예측)
뉴클레오펙션은 Lonza 4D 뉴클레오펙터(nucleofector) 및 Lonza SF 세포주 4D-Nucleofector X 키트 S(카탈로그 번호 V4XC-2032)를 사용하여 제조업체의 권장사항에 따라 포유동물 세포(예를 들어, K-562, Neuro-2A 또는 RAW264.7)에서 수행한다. SF 뉴클레오펙션 완충액을 조제한 후, 200,000개의 세포를 뉴클레오펙션당 5 μl의 완충액에 재현탁한다. 뉴클레오펙션당 나머지 15 μl의 완충액에서, Synthego의 20 pmol의 화학적으로 변형된 sgRNA를 18 pmol의 염기 편집 효소(예를 들어, ABE8e)와 합하고 실온에서 5분 동안 인큐베이션하여 복합체를 제조한다. 세포를 20 μl 뉴클레오펙션 큐벳에 첨가한 후, 단백질 용액을 첨가하고, 혼합물을 분쇄하여 혼합한다. 세포를 프로그램 CM-130으로 뉴클레오펙션하고, 그 직후에 회수를 위해 80 μl의 가온된 배지를 각 웰에 첨가한다. 5분 후, 각 샘플로부터의 25 μl를 48웰 폴리-d-리신 플레이트(Corning) 내의 250 μl의 신선한 배지에 첨가한다. 그 다음, 세포를 3일 더 배양한 후 게놈 DNA 추출을 위해 상기 리포펙션된 세포와 동일한 방식으로 처리한다.
Illumina 바코딩 후, PCR 산물을 30 μl H2O로 용출시키면서 Monarch DNA 겔 추출 키트(New England Biolabs)를 사용하여 2% 아가로스 겔로 전기영동하여 풀링하고 정제한다. DNA 농도를 Qubit dsDNA 고감도 분석 키트(Thermo Fisher Scientific)로 정량화하고 제조업체의 프로토콜에 따라 Illumina MiSeq 기기(페어드 엔드 리드(paired-end read), R1: 250 내지 280 사이클, R2: 0 사이클)에서 시퀀싱한다.
시퀀싱 리드를 MiSeq 리포터(Illumina)를 사용하여 역다중화하고 CRISPResso2를 사용하여 FASTQ 파일을 분석한다. 개별 대립유전자의 이중 편집을 Python 스크립트에 의해 분석한다. 염기 편집 값은 상이한 연구원들에 의해 수집된 n = 3개의 독립적인 생물학적 복제물을 대표하며, 평균 ± 표준 편차가 표시된다. 염기 편집 값은 정렬된 총 리드에 걸쳐 아데닌 돌연변이유발을 갖는 리드 수의 백분율로서 보고된다.
실시예 6. - 포유동물 세포에서 플라스미드 뉴클레오펙션 및 전체 게놈 seq(예측)
모든 플라스미드는 우라실 특이적 절제 시약(USER) 클로닝 방법에 의해 조립한다. SpCas9, SaCas9 및 모든 조작된 변형에 대한 가이드 RNA 플라스미드를 조립한다. 포유동물 세포 형질감염을 위한 플라스미드는 ZymoPURE Plasmid Midiprep 키트(Zymo Research Corporation)를 사용하여 제조한다. HEK293T 세포(ATCC CRL-3216)는 10% 소 태아 혈청(ThermoFisher Scientific)이 보충된 둘베코 변형 이글 배지(Dulbecco's modified Eagle's medium)(Corning)에서 배양하고 37℃에서 5% CO2로 유지한다.
HEK293T 세포를 동일한 배양 배지에서 48웰 폴리-d-리신 플레이트(Corning)에 시딩한다. 1.5 μl 리포펙타민 2000(ThermoFisher Scientific)으로 플레이팅한지 12 내지 16시간 후에 세포를 750 ng 염기 편집기 플라스미드, 250 ng 가이드 RNA 플라스미드 및 형질감염 대조군으로서 10 ng 녹색 형광 단백질을 사용하여 형질감염시킨다. 첫날 후 3일마다 배지를 교환하면서 세포를 배양한 다음, Å~1 PBS(ThermoFisher Scientific)로 세척한 후, 100 μl의 새로 준비된 용해 완충액(10 mM Tris-HCl, pH 7.5, 0.05% SDS, 25 ㎍ ml-1 프로테이나제 K(ThermoFisher Scientific))를 각각의 형질감염된 웰에 직접 첨가하여 게놈 DNA를 추출한다. 혼합물을 37℃에서 1시간 동안 인큐베이션한 다음, 80℃에서 30분 동안 열 불활성화한다. 이후 게놈 DNA 용해물을 고처리량 시퀀싱(HTS)을 위해 즉시 사용한다.
HEK293T 세포로부터의 게놈 DNA의 HTS를 수행한다. Illumina 바코딩 후, PCR 산물을 30μl H2O로 용출시키면서 Monarch DNA 겔 추출 키트(NEB)를 사용하여 2% 아가로스 겔로 전기영동하여 풀링하고 정제한다. DNA 농도를 Qubit dsDNA 고감도 분석 키트(Thermo Fisher Scientific)로 정량화화고 제조업체의 프로토콜에 따라 Illumina MiSeq 기기(페어드 엔드 리드, R1: 250 내지 280 사이클, R2: 0 사이클)에서 시퀀싱한다.
실시예 7. - 편집 윈도우의 결정(예측)
편집 윈도우 영역을 조사하기 위해, 지정된 sgRNA에서 가장 높은 C-T 전환 빈도를 나타내는 시토신을 1로 정규화하고, 이후에 동일한 sgRNA의 PAM 서열의 30nt 상류부터 10nt 하류에 이르는 위치에 있는 다른 시토신(총 43 bp)을 정규화한다. 그 다음, 정규화된 C-T 전환 빈도를 지정된 염기 편집기의 모든 테스트된 sgRNA에 대해 위치에 따라 분류하고 비교한다. 포괄적인 편집 윈도우(comprehensive editing window: CEW)는 정규화 후 평균 C-T 전환 효율이 0.6을 초과하는 위치에 걸쳐있는 것으로 정의된다.
각 시티딘 데아미나제에 대한 기질 선호도를 조사하기 위해, C 부위를 초기에 sgRNA 표적화 영역 내의 이의 위치에 따라 분류하고, 정규화된 C-T 전환 빈도가 0.8 이상인 적어도 하나의 C 부위를 함유하는 위치를 후속 분석에 포함시킨다. 그 다음, 선택된 C 부위를 편집된 시토신(NC 또는 CN)의 상류 또는 하류에 있는 염기 유형에 따라 비교한다. 엔도뉴클레아제의 N-말단과 C-말단 둘 모두에서 효율적인 C-T 전환을 나타내는 시티딘 데아미나제에 대해, 각각의 NT- 및 CT-CBE를 함께 통합하여 기질 선호도를 평가한다. 통계 분석을 위해, 일원 분산분석을 사용하고 p < 0.05를 유의한 것으로 간주한다.
실시예 8a.- 포유동물 세포에서 전체 게놈 시퀀싱 및 전사체학을 통한 비표적 분석 테스트(예측)
리포펙션 16 내지 20시간 전에, HEK293T 세포를 항생제가 없는 DMEM+GlutaMAX 배지(Thermo Fisher Scientific)에서 웰당 3.104개 세포의 밀도로 48웰 폴리-d-리신-코팅된 플레이트에 플레이팅한다. 750ng 닉카제 또는 염기 편집기 발현 플라스미드 DNA를 15μl Opti-MEM+GlutaMAX에서 250ng의 sgRNA 발현 플라스미드 DNA와 합한다. 이것을 웰당 1.5 μl 리포펙타민 2000 및 8.5 μl Opti-MEM + GlutaMAX를 포함하는 10μl의 지질 혼합물과 합한다. 형질감염 3일 후 세포를 수거하고 DNA 또는 RNA를 수거한다. DNA 분석을 위해, 세포를 PBS로 1회 세척한 다음, 제조업체의 지침에 따라 100 μl QuickExtract 완충액(Lucigen)에 용해시킨다. RNA 수거의 경우, MagMAX mirVana 총 RNA 단리 키트(Thermo Fisher Scientific)를 KingFisher Flex와 함께 사용한다.
포유동물 세포로부터의 게놈 DNA를 제조업체의 지침에 따라 96웰 플레이트 Nextera 인덱싱 프라이머(Illumina)를 사용하는 Nextera DNA Flex 라이브러리 준비 키트(Illumina)를 사용하여 단편화하고 어댑터-라이게션한다. 라이브러리 크기 및 농도를 단편 분석기(Agilent)로 확인하고 DNA를 Illumina HiSeq 시스템을 사용한 WGS를 위해 Novogene로 보낸다.
모든 표적화 NGS 데이터는 하기의 일반적인 4단계를 수행하여 분석한다. (1) 정렬; (2) 중복 마킹; (3) 변이체 호출; 및 (4) 아티팩트 및 생식계열 돌연변이를 제거하기 위한 변이체의 백그라운드 여과. 돌연변이 참조 및 대체 대립유전자는 참조 게놈의 플러스 가닥과 관련하여 보고된다.
전체 전사체 시퀀싱을 위해, NEBNext 폴리(A) mRNA 마그네틱 단리 모듈(New England BioLabs)을 사용하여 mRNA 선택을 수행한다. Illumina용 NEBNext Ultra II RNA 라이브러리 준비 키트(New England BioLabs)를 사용하여 RNA 라이브러리 준비를 수행한다. RNA 입력량에 기초하여, 어댑터 라이게이션된 DNA의 PCR 농축을 위해 12의 사이클 횟수를 사용한다. 이 방법으로 수행되는 모든 크기 선별을 위해 전반적으로 NEBNext 샘플 정제 비드(New England BioLabs)를 사용한다. Illumina(New England BioLabs)용 NEBNext Multiplex Oligos는 프로토콜에 설명된 PCR 레시피에 따라 멀티플렉스 인덱스를 위해 사용한다. 시퀀싱 전에, 4200 TapeStation System(Agilent)에서 고감도 D1000 ScreenTape를 사용하여 샘플을 품질 확인한다. NovaSeq(Novogene)를 사용하여 라이브러리를 풀링하고 시퀀싱한다. 그 다음, 표적화 RNA 시퀀싱을 수행한다. 제조업체의 지침에 따라 EZDnase(Thermo Fisher Scientific)가 포함된 SuperScript IV 원-스텝 RT-PCR 시스템을 사용하여 단리된 RNA로부터 역전사(RT-PCR)를 통한 PCR에 의해 상보적 DNA를 생성한다.
하기 프로그램을 사용한다: 58℃에서 12분 동안; 98℃에서 2분 동안; 이어서 앰플리콘에 따라 달라지는 PCR 사이클: CTNNB1 및 IP90의 경우; 32 사이클(98℃에서 10초 동안, 60℃에서 10초 동안, 72℃에서 30초 동안). 조합된 RT-PCR 후, 앰플리콘을 상기 설명한 바와 같이 바코딩하고 Illumina MiSeq 시퀀서를 사용하여 시퀀싱한다. 각 앰플리콘의 정방향 프라이머의 말단 후에 첫 번째 염기에서 시작하는 각 앰플리콘의 처음 125개 뉴클레오티드를 참조 서열에 대해 정렬하고 각 앰플리콘에서 최대 A-대-I 빈도 분석을 위해 사용한다. 프라이머를 사용하고 2단계 PCR 및 바코딩 방법을 사용하여 비표적 DNA 시퀀싱을 수행하여, 상기와 같이 Illumina MiSeq 시퀀서를 사용하여 시퀀싱할 샘플을 준비한다.
실시예 8b. - 전체 게놈 시퀀싱 및 전사체학에 의한 비표적 편집의 분석(예측)
실시예 8a에서와 같이 제조된 형질감염된 세포를 3일 후에 수거하고 제조업체의 지침에 따라 Agencourt DNAdvance 게놈 DNA 단리 키트(Beckman Coulter)를 사용하여 게놈 DNA를 단리한다. 관심대상의 온-타겟 및 비표적 게놈 영역을 측접 HTS 프라이머 쌍을 사용하여 PCR로 증폭시킨다. 주형으로서 5 ng의 게놈 DNA를 사용하여 제조업체의 지침에 따라 Phusion 고충실도 DNA 폴리머라제(ThermoFisher)로 PCR 증폭을 수행한다. 반응이 증폭의 선형 범위(각각 EMX1, FANCF, HEK293 부위 2, HEK293 부위 3, HEK293 부위 4 및 RNF2 프라이머에 대해 30, 28, 28, 28, 32 및 32 사이클)에서 중단된 것을 보장하기 위해 사이클 횟수를 각 프라이머 쌍에 대해 개별적으로 결정한다. PCR 산물을 RapidTips(Diffinity Genomics)를 사용하여 정제한다. 정제된 DNA를 시퀀싱 어댑터를 함유하는 프라이머를 이용한 PCR에 의해 증폭시킨다. 생성물을 Quant-iT™ PicoGreen dsDNA 분석 키트(ThermoFisher) 및 KAPA 라이브러리 정량화 키트-Illumina(KAPA Biosystems)를 사용하여 겔 정제하고 정량화한다. 샘플을 이전에 설명한 바와 같이 Illumina MiSeq에서 시퀀싱한다.
시퀀싱 리드를 MiSeq Reporter(Illumina)를 사용하여 자동으로 역다중화하고, 개별 FASTQ 파일을 맞춤형 Matlab 스크립트를 이용하여 분석한다. 각 리드를 스미스-워터맨 알고리즘을 사용하여 적절한 참조 서열에 쌍별로 정렬한다. Q-점수가 31 미만인 염기 호출은 N으로 대체되므로 뉴클레오티드 빈도의 계산에서 제외된다. 이러한 처리는 약 1/1,000의 예상 MiSeq 염기-호출 오류율을 산출한다. 리드 및 참조 서열이 갭을 함유하지 않은 정렬된 서열은 정렬 표에 저장되며, 여기에는 각 유전자좌에 대한 염기 빈도가 표 형식으로 기재되어 있다. 인델(indel) 빈도는 맞춤형 Matlab 스크립트를 이용하여 정량화하였다.
인델이 발생할 수 있는 윈도의 양쪽에 측접한 2개의 10-bp 서열에 대한 정확한 일치를 위해 시퀀싱 리드를 스캔한다. 정확한 일치가 위치하지 않으면, 리드는 분석에서 제외된다. 이러한 인델 윈도우의 길이가 참조 서열과 정확히 일치한다면, 리드는 인델을 함유하지 않는 것으로 분류된다. 인델 윈도우가 참조 서열보다 2개 이상의 염기가 길거나 짧다면, 시퀀싱 리드는 각각 삽입 또는 결실로 분류된다.
실시예 9. - 마우스 편집 실험(예측)
신규 데아미나제 도메인에 융합된 신규 DNA 표적화 뉴클레아제 도메인으로 이루어진 염기 편집기를 질환의 적절한 마우스 모델에서 테스트함으로써 치료 후보로서 검증될 수 있을 것으로 예상된다.
적절한 모델의 일례는 예를 들어 Herbert 등(10.1161/ATVBAHA.110.204040)에 의해 설명된 바와 같이 인간 PCSK9 단백질을 발현하도록 조작된 마우스를 포함한다. PCSK9 단백질은 LDL 수용체(LDLR) 수준을 조절하고 혈청 콜레스테롤 수준에 영향을 미친다. 인간 PCSK9 단백질을 발현하는 마우스는 상승된 콜레스테롤 수준 및 더 빠른 죽상동맥경화증 발달을 나타낸다. PCSK9는 비정상적으로 높은 혈장 지질 수준으로 인해 심혈관 질환의 위험이 증가된 사람들에서 지질 수준의 감소를 위한 검증된 약물 표적이다(https://doi.org/10.1038/s41569-018-0107-8). 게놈 편집을 통한 PCSK9 수준의 감소는 개체의 일생 동안 지질 수준을 영구적으로 저하시켜 일생 동안 지속되는 심혈관 질환 위험의 감소를 제공할 것으로 예상된다. 게놈 편집 접근법 중 하나는 서열을 편집하여 미성숙 정지 코돈을 생성함으로써 PCSK9 mRNA가 기능적 단백질로 번역되는 것을 방지하는 것을 목표로 PCSK9 유전자의 코딩 서열을 표적화는 것을 포함할 수 있다. 대부분의 단백질의 번역을 차단하기 위해 코딩 서열의 5' 말단에 가까운 영역을 표적화하는 것은 유용하다. 높은 효율 및 특이성을 갖는 정지 코돈(TGA, TAA, TAG)을 생성하는 것은 PCSK9 코딩 서열의 영역을 표적화하는 것을 필요로 할 것이며, 여기서 편집 윈도우는 가장 높은 빈도의 편집 이벤트가 정지 코돈을 초래하도록 적절한 서열 위에 배치될 것이다. 따라서, 광범위한 PAM을 갖는 다수의 염기 편집 시스템 또는 축퇴성 PAM을 갖는 염기 편집 시스템의 이용가능성은 PCSK9 유전자에서 더 많은 수의 잠재적 표적 부위에 접근하는 데 유용하다. 또한, 비표적 편집의 빈도가 낮은(예를 들어, 온-타겟 편집 이벤트의 1% 이하 범위) 추가적인 편집 시스템도 이러한 맥락에서 유전자 편집을 수행하는 데 유용하다.
치료 효과를 위해 요구되는 염기 편집의 효율은 혈장 지질 수준의 상당한 감소를 달성하기 위한 50% 이상의 범위 내이다. PCSK9 유전자에서 정지 코돈을 생성하기 위해 염기 편집기를 사용하는 예는 Carreras 등(https://doi.org/10.1186/s12915-018-0624-2)의 것으로, 여기서 PCSK9 대립유전자의 10% 내지 34%가 편집되어 정지 코돈을 생성하였다. 이러한 수준의 편집이 마우스에서 혈장 지질 수준의 측정 가능한 감소를 초래하기에 충분하였지만, 인간에서의 치료적 사용을 위해서는 더 높은 편집 효율이 요구될 것이다.
PCSK9 유전자에서 정지 코돈을 도입하기 위한 최적의 염기 편집(BE) 시스템 및 가이드를 식별하기 위해, Hepa1-6 세포와 같은 마우스 간 세포주에서 스크리닝을 수행할 수 있다. 이용가능한 다양한 BE 시스템으로 PCSK9 유전자를 표적화하는 가이드를 식별하기 위해 먼저 인 실리코(In silico) 스크리닝을 사용할 수 있다. 다수의 가능한 가이드 중에서 선택하기 위해, 인-실리코 분석을 수행하여, 편집될 때 정지 코돈을 생성할 수 있는 서열을 포함하는 편집 윈도우를 어느 가이드가 갖는지를 결정할 수 있다. 그 다음, 코딩 서열의 5' 말단에 더 가까운 가이드가 선호될 수 있다. 생성된 일련의 가이드와 BE 단백질을 조합하여 리보핵단백질 복합체(RNP)를 형성할 수 있고 Hepa1-6 세포로 뉴클레오펙션할 수 있다. 72시간 후, 표적 부위에서의 편집 효율을 NGS 분석에 의해 결정할 수 있다. 이들 시험관내 결과에 기초하여, 가장 높은 빈도의 정지 코돈 형성을 초래한 하나 이상의 BE/가이드 조합을 생체내 시험을 위해 선택할 수 있다.
인간 치료 환경에 적용하기 위해, 염기 편집기 및 가이드 RNA를 포함하는 염기 편집 구성요소를 전달하는 안전하고 효과적인 방법이 요구된다. 생체내 전달 방법은 바이러스성 또는 비바이러스성 방법으로 나뉠 수 있다. 바이러스 벡터 중에서, 아데노 관련 바이러스(AAV)는 이의 안전성 기록, 다수의 조직 및 세포 유형으로의 효율적인 전달 및 확립된 제조 공정으로 인해 임상 용도로 선택되는 바이러스이다. 큰 크기의 염기 편집기(BE)는 AAV의 패키징 용량을 초과하여 단일 아데노바이러스 관련 바이러스의 패키징을 방해한다. 스플릿 인테인(split intein) 기술을 사용하여 BE를 2개의 AAV로 패키징하는 접근법이 마우스에서 성공적인 것으로 입증되었지만(https://doi.org/10.1038/s41551-019-0501-5), 2개의 바이러스에 대한 필요성은 개발 및 제조를 복잡하게 만든다. AAV의 추가 단점은, 바이러스가 숙주 세포의 게놈 내로의 통합을 촉진하는 메커니즘을 가지고 있지 않고 대부분의 AAV 게놈이 에피솜으로 남아 있는 반면, AAV 게놈의 일부는 세포에서 자연적으로 발생하는 무작위 이중 가닥 파손에서 통합된다는 점이다(Curr Opin Mol Ther. 2009 August; 11(4): 442-447). 이는 유기체의 일생 동안 BE를 발현하는 유전자 서열의 지속을 야기할 수 있다. 더욱이, AAV 게놈은 형질도입된 세포의 핵 내부에서 에피솜으로서 지속되고 수년 동안 유지될 수 있으며, 이는 이들 세포에서 BE의 장기간 발현을 초래하여 비표적 효과의 위험을 증가시킬 수 있는데, 비표적 이벤트의 발생 위험이 편집 효소가 활성인 시간의 함수이기 때문이다. 아데노바이러스(Ad), 예컨대 Ad5는 DNA 페이로드를 포유동물의 간으로 효율적으로 전달할 수 있으며 최대 45kb의 DNA를 패키징할 수 있다. 그러나, 아데노바이러스는 사망을 포함한 심각한 이상반응(adverse event)을 초래할 수 있는 환자에서의 반응(https:// doi.org/10.1016/j.ymthe.2020.02.010)을 포함하여, 포유동물(http://dx.doi.org/10.1136/gut.48.5.733)에서 강력한 면역 반응을 유도하는 것으로 알려져 있다.
지질 나노입자 및 중합체 나노입자를 포함하는 비바이러스성 전달 벡터(doi:10.1038/mt.2012.79에서 검토됨)는 바이러스성 전달 벡터에 비해, 낮은 면역원성 및 핵산 카고(cargo)의 일시적인 발현을 포함하는 몇 가지 이점이 있다. 비바이러스성 전달 벡터에 의해 유발된 일시적인 발현은 비표적 이벤트를 최소화할 것으로 예상되기 때문에 게놈 편집 응용 분야에 특히 적합하다. 또한, 바이러스 벡터와 달리 비바이러스성 전달은 치료 효과를 달성하기 위해 반복 투여할 수 있는 잠재성이 있다. 또한, 실제로는 핵산의 크기가 증가하고 입자 크기가 증가할수록 패키징이 덜 효율적이 되지만, 비바이러스 벡터에 패키징될 수 있는 핵산 분자의 크기에 이론적인 제한은 없다.
BE는 가이드 RNA와 함께 BE를 코딩하는 합성 mRNA를 LNP로 캡슐화함으로써 지질 나노입자(LNP)와 같은 비바이러스 벡터를 사용하여 생체내에서 전달할 수 있다. 이것은 예를 들어 Finn 등(DOI: 10.1016/j.celrep.2018.02.014) 또는 Yin 등(doi:10.1038/nbt.3471)에 의해 설명된 바와 같이 당업계에 잘 알려진 방법론을 사용하여 수행할 수 있다. 전형적으로, LNP는 PCSK9 유전자의 발현을 방해하고자 시도할 때 표적 기관/세포 유형이기도 한 간의 간세포로 주로 카고를 전달한다. 이 접근법에 대한 개념 증명을 입증하기 위해, 본 발명자들은 데아미나제 도메인에 융합된 새로운 게놈 편집 단백질로 구성된 BE가 합성 mRNA로 코딩되고, 마우스의 PCSK9 유전자 내의 선택된 부위를 표적화하는 적절한 가이드 RNA와 함께 LNP에 패키징될 수 있을 것으로 예상하고 있다. 인간 PCSK9 유전자를 발현하도록 조작된 마우스의 경우, 가이드는 인간 PCSK9 유전자만을 표적화하거나 인간과 마우스 PCSK9 유전자 둘 모두를 표적화하도록 설계할 수 있다. 이들 LNP의 주입 후, 간 세포의 게놈 내의 표적 위치에서의 편집 효율을 앰플리콘 시퀀싱 또는 분해에 의한 인델 추적과 같은 기타 방법에 의해 분석할 수 있다(doi: 10.1093/nar/gku936). 생리학적 영향은 표준 방법을 사용하여 총 콜레스테롤 및 트리글리세리드 수준을 포함하는 마우스의 혈중 지질 수준을 측정함으로써 결정할 수 있다.
신규 BE를 평가하기 위해 마우스에서 모델링될 수 있는 질환의 또 다른 예는 원발성 고수산뇨증 I형이다. 원발성 고수산뇨증 I형(PH1)은 효소 알라닌-글리옥실레이트 아미노트랜스퍼라제를 코딩하는 AGXT 유전자의 결함에 의해 유발되는 희귀한 상염색체 열성 질환이다. 이는 글리옥실레이트 대사의 결함 및 독성 대사산물 옥살레이트의 축적을 초래한다. 이 질환을 치료하는 한 가지 접근법은 글리콜레이트로부터 글리옥실레이트를 생성하는 효소 글리콜레이트 옥시다제(GO)의 발현을 감소시켜 옥살레이트 형성에 이용가능한 기질(글리옥실레이트)의 양을 감소시키는 것이다. PH1은, AGXT 유전자의 두 카피 모두가 녹아웃되어(agxt -/- 마우스) 야생형 대조군에 비해 소변 중 옥살레이트 수준의 유의한 3배 증가가 초래된 마우스에서 모델링될 수 있다. 따라서, agxt -/- 마우스를 사용하여 내인성 마우스 GO 유전자의 코딩 서열에서 정지 코돈을 생성하도록 설계된 신규 염기 편집기의 효능을 평가할 수 있다. GO 유전자에 정지 코돈을 도입하기기 위한 최적의 BE 시스템 및 가이드를 식별하기 위해, Hepa1-6 세포와 같은 마우스 간 세포주에서 스크리닝을 수행할 수 있다. 인 실리코 스크리닝을 먼저 사용하여 이용가능한 다양한 BE 시스템으로 GO 유전자를 표적화하는 가이드를 식별할 수 있다. 다수의 가능한 가이드 중에서 선택하기 위해, 인-실리코 분석을 수행하여, 편집될 때 정지 코돈을 생성할 수 있는 서열을 포함하는 편집 윈도우를 어느 가이드가 갖는지를 결정할 수 있다. 그 다음, 코딩 서열의 5' 말단에 더 가까운 가이드가 선호될 수 있다. 생성된 일련의 가이드와 BE 단백질을 조합하여 리보핵단백질 복합체(RNP)를 형성할 수 있고 Hepa1-6 세포로 뉴클레오펙션할 수 있다. 72시간 후, 표적 부위에서의 편집 효율을 NGS 분석에 의해 결정할 수 있다. 이들 시험관내 결과에 기초하여, 가장 높은 빈도의 정지 코돈 형성을 초래한 하나 이상의 BE/가이드 조합을 생체내 시험을 위해 선택할 수 있다.
BE 및 가이드는 AAV 바이러스와 함께 BE를 발현하기 위한 스플릿 인테인 시스템 및 가이드를 전달하기 위한 제3 AAV를 사용하여 마우스에 전달할 수 있다. 대안적으로, 아데노바이러스의 >40Kb 패키징 용량 때문에 아데노바이러스 유형 5를 사용하여 BE 및 가이드를 단일 바이러스로 전달할 수 있다. 또한, BE를 적절한 LNP에 패키징된 가이드 RNA와 함께 mRNA로서 전달할 수 있다. LNP를 agxt -/- 마우스에 정맥내 주사한 후, 소변 중 옥살레이트 수준을 시간 경과에 따라 모니터링하여 옥살레이트 수준이 감소되었는지 여부를 결정할 수 있으며, 이는 BE가 활성이고 예상되는 치료 효과를 가졌다는 것을 암시한다. BE가 정지 코돈을 도입하였는지 여부를 결정하기 위해, GO 유전자의 적절한 영역을 처리된 마우스 및 대조군 마우스의 간으로부터 추출된 게놈 DNA로부터 PCR 증폭시킬 수 있다. 생성된 PCR 산물을 차세대 시퀀싱을 사용하여 시퀀싱하여 서열 변화의 빈도를 결정할 수 있다.
실시예 10. - 새로운 데아미나제의 유전자 발견
다양한 환경(토양, 퇴적물, 지하수, 호열성, 인간 및 비인간 마이크로바이옴)로부터의 4Tbp(테라 염기쌍)의 독점적 및 공개 조립된 메타게놈 시퀀싱 데이터를 마이닝하여 신규 탈아민 분해 효소를 발견하였다. 알려진 데아미나제의 HMM 프로필을 구축하고 HMMER3(hmmer.org)를 사용하여 예측된 모든 단백질에 대해 검색하여 본 발명자들의 데이터베이스로부터 데아미나제를 식별하였다. 예측된 및 참조(예를 들어, 진핵생물 APOBEC1, 박테리아 TadA) 데아미나제를 MAFFT를 사용하여 정렬하고, FastTree2를 사용하여 계통발생수(phylogenetic tree)를 추론하였다. 신규 패밀리 및 서브패밀리는 본원에 개시된 서열로 구성된 클레이드(clade)를 식별함으로써 정의하였다. 효소 기능을 나타내는 중요한 촉매 잔기의 존재에 기초하여 후보를 선택하였다(예를 들어, 서열번호 1-51, 385-386, 387-443, 444-447, 또는 488-475 참조).
실시예 11. - 플라스미드 작제
유전자의 DNA 단편은 Twist Bioscience 또는 Integrated DNA Technologies(IDT)에서 합성되었다. 플라스미드 DNA를 Endura 전기천공적격 세포(Lucigen)에서 증폭시키고 QIAprep Spin Miniprep Kit(Qiagen)에 의해 단리하였다. 플라스미드의 제한 효소 분해에 의해 벡터 백본을 제조하였다. 삽입체를 Elim BIOPHARM 또는 IDT에서 주문한 프라이머를 사용하여 Q5 고충실도 DNA 폴리머라제(New England Biolabs)에 의해 증폭시켰다. 벡터 백본과 삽입체 둘 모두를 Gel DNA 회수 키트(Zymo Research)를 사용하여 겔 추출에 의해 정제하였다. 하나 또는 다수의 DNA 단편을 NEBuilder HiFi DNA 조립(New England Biolabs)(서열번호 483-487)을 통해 벡터로 조립하였다.
실시예 12. - 시퀀싱에 의한 이. 콜라이에서의 염기 편집 효율의 평가
실시예 4에서와 같이 제조된 5 ng의 추출된 DNA를 주형으로서 사용하고, 프라이머(P137 및 P360)를 PCR 증폭을 위해 사용하고, 생성된 산물을 ELIM BIOPHARM에서 생어 시퀀싱을 위해 제출하였다. 시퀀싱을 위해 사용된 프라이머는 표 6 및 7(서열번호 523-531)에 나타낸다.
표 6 - 이. 콜라이에서 lacZ 유전자의 염기 편집 분석에 사용된 프라이머
표 7 - 이. 콜라이에서 우라실 글리코실라제 억제제(UGI)의 효과의 염기 편집 분석을 위해 사용된 프라이머
도 8은 생어 시퀀싱에 의해 평가된, 본 실험에 의해 조사된 효소에 의한 예시적인 염기 편집을 도시한다.
도 10은 표 3에 따른 TadA(ABE8.17m)(서열번호 596) 및 MG 닉카제를 사용한 아데닌 염기 편집기(ABE)의 염기 편집 효율을 도시한다. TadA는 tRNA 아데닌 데아미나제이고; TadA(ABE8.17m)는 이. 콜라이 TadA의 조작된 변이체이다. TadA(ABE8.17m)와 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 각 위치에서 Edit R에 의해 정량화된 A에서 G로의 전환의 백분율을 나타낸다. ABE8.17m은 실험의 양성 대조군으로서 사용하였다.
도 11은 래트 APOBEC1, MG 닉카제 및 바실러스 서브틸리스 박테리오파지(UGI(PBS1))의 우라실 글리코실라제 억제제를 포함하는 시토신 염기 편집기(CBE)의 염기 편집 효율을 도시한다. APOBEC1은 시토신 데아미나제이다. N-말단에서 rAPOBEC1와 융합되고 C-말단에서 UGI와 융합된 12가지의 MG 닉카제를 작제하고 이. 콜라이에서 테스트하였다. 3개의 가이드를 lacZ를 표적화하도록 설계하였다. 상자에 표시된 숫자는 Edit R에 의해 정량화된 C에서 T로의 전환의 백분율을 나타낸다. BE3는 실험에서 양성 대조군으로서 사용하였다.
도 12는 CBE의 염기 편집 활성에 미치는 MG 우라실 글리코실라제 억제제(UGI)의 효과를 도시한다. (a) MGC15-1은 N-말단 APOBEC1, MG15-1 닉카제 및 C-말단 UGI로 구성된다. 3가지 MG UGI를 이. 콜라이에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. (b) BE3은 N-말단 rAPOBEC1, SpCas9 닉카제 및 C-말단 UGI를 포함한다. 2가지 MG UGI를 HEK293T 세포에서 시토신 염기 편집 활성의 개선에 대해 테스트하였다. 편집 효율은 Edit R에 의해 정량화하였다.
실시예 13. - 세포 배양, 형질감염, 차세대 시퀀싱 및 염기 편집 분석
HEK293T 세포를 성장시키고 37℃, 5% CO2에서 10%(v/v) 소 태아 혈청(Gibco)이 보충된 둘베코 변형 이글 배지와 GlutaMAX(Gibco)에서 계대하였다. 5 x 104개의 세포를 세포 부착을 위해 처리된 96웰 세포 배양 플레이트(Costar)에 시딩하고, 20 내지 24시간 동안 성장시키고, 소비된 배지를 형질감염 직전에 새로운 배지로 재생하였다. 200 ng 발현 플라스미드 및 1 μL 리포펙타민 2000(ThermoFisher Scientific)을 제조업체의 지침에 따라 웰당 형질감염을 위해 사용하였다. 형질감염된 세포를 3일 동안 성장시키고, 수거하고, 제조업체의 지침에 따라 QuickExtract(Lucigen)를 이용하여 gDNA를 추출하였다. 염기 편집을 위한 표적화 영역을 표 8 및 9(서열번호 538-585)에 열거된 프라이머와 함께 Q5 고충실도 DNA 폴리머라제(New England Biolabs)를 사용하여 증폭시키고 주형으로서 DNA를 추출하였다.
표 8 - HEK293T에서 UGI 효과의 염기 편집 분석을 위해 사용된 프라이머
표 9a - A0A2K5RND7-MG 닉카제-MG69-1로 형질감염된 HEK293T 세포에서 표적화된 영역을 증폭시키기 위해 사용된 프라이머
제조업체의 지침에 따라 HighPrep PCR Clean-up System(MAGBIO)을 사용하여 PCR 산물을 정제하였다. 후보 효소의 염기 편집에 미치는 우라실 글리코실라제 억제제(UGI)의 효과는 생어 시퀀싱을 위해 PCR 산물을 Elim BIOPHARM에 제출하여 분석하였고, 효율은 Edit R로 정량화하였다. A0A2K5RND7-MG 닉카제-MG69-1의 염기 편집을 분석하기 위해, 차세대 시퀀싱(NGS)을 위해 사용된 어댑터를 KAPA HiFi HotStart ReadyMix PCR 키트(Roche) 및 TruSeq DNA 라이브러리 준비 키트(illumina)와 호환되는 프라이머를 사용한 후속 PCR 반응에 의해 PCR 산물에 추가하였다. 생성된 산물의 DNA 농도를 TapeStation(Agilent)으로 정량화하고, 샘플을 함께 풀링하여 NGS 분석을 위한 라이브러리를 제조하였다. 생성된 라이브러리를 Aria 실시간 PCR 시스템(Agilent)을 사용하여 qPCR에 의해 정량화하고, 제조업체의 지침에 따라 Illumina Miseq 기기를 사용하여 고처리량 시퀀싱을 수행하였다. 시퀀싱 데이터를 Cripresso2에 의해 염기 편집에 대해 분석하였다.
도 13은 CMP/dCMP-타입 데아미나제 도메인 함유 단백질(uniprot 수탁번호 A0A2K5RDN7), MG 닉카제 및 MG UGI를 포함하는 시토신 염기 편집기의 염기 편집 효율을 보여주는 염기 편집기가 표적화하는 부위의 지도를 도시한다. 작제물은 N-말단 A0A2K5RDN7, MG 닉카제 및 C-말단 MG69-1을 포함한다. 단순화를 위해, 도면에는 MG 닉카제의 정체만이 도시된다. BE3(APOBEC1)은 염기 편집에 대한 양성 대조군으로서 사용하였다. 음성 대조군으로는 공 벡터를 사용하였다. 상이한 날에 3회의 독립적인 실험을 수행하였다. 약어: R, 반복; NEG, 음성 대조군.
표 9b: 실시예 13의 작제물에 사용된 단백질 도메인
실시예 14. - 이. 콜라이에서 염기 편집기 돌연변이의 양성 선택
도 14는 이. 콜라이에서의 TadA 특성규명을 위한 양성 선택 방법을 도시한다. 패널 (a)는 TadA 선택에 사용된 한 가지 플라스미드 시스템의 지도를 도시한다. 벡터는 CAT(H193Y), CAT를 표적화는 sgRNA 발현 카세트 및 ABE 발현 카세트를 포함한다. 본 도면에는, 이. 콜라이로부터의 N-말단 TadA 및 스트렙토코커스 피오게네스로부터의 C-말단 SpCas9(D10A)가 도시되어 있다. 패널 (b)는 이. 콜라이 세포 내로 도입/형질전환될 때 CAT(H193Y)의 주형 가닥의 A2 위치가 편집되어 H193Y 돌연변이를 야생형으로 되돌리고 이의 활성을 복원시킴을 입증하는 시퀀싱 추적을 도시한다. 약어: CAT, 클로람페니콜 아세틸트랜스퍼라제.
농도가 10 ng/μL인 플라스미드 용액 1μL를 25μL BL21(DE3) 전기천공적격 세포(Lucigen)로 형질전환시키고, 37℃에서 1시간 동안 975μL 발현 회수 배지로 회수하였다. 50 μL의 생성된 세포를 100 ㎍/mL 카르베니실린, 0.1 mM IPTG 및 적당량의 클로람페니콜을 함유하는 LB 한천 플레이트에 도말하였다. 콜로니를 채취할 수 있을 때까지 플레이트를 37℃에서 인큐베이션하였다. 콜로니 PCR을 사용하여 염기 편집을 함유하는 게놈 영역을 증폭시키고, 생성된 산물을 생어 시퀀싱을 위해 ELIM BIOPHARM에 제출하였다. PCR 및 시퀀싱을 위해 사용된 프라이머는 표 10에 나열되어 있다(서열번호 532-537).
표 10 - CAT(H193Y)의 염기 편집 분석을 위해 사용된 프라이머
도 15는 TadA에 의해 유발된 돌연변이가 클로람페니콜(Cm)의 높은 내용성을 가능하게 함을 도시한다. 패널 (a)는 이. 콜라이의 항생제 내성을 선택하기 위해 상이한 농도의 클로람페니콜이 사용된 성장 플레이트의 사진을 도시한다. 이 예에서, 이. 콜라이(EcTadA)로부터의 TadA의 야생형 및 변이체 2가지를 테스트하였다. 패널 (b)는 돌연변이된 TadA를 보유하는 ABE가 야생형보다 더 높은 편집 효율을 나타낸다는 것을 입증하는 결과 요약 표를 도시한다. 이들 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다. 단순화를 위해, 표에는 데아미나제의 정체만이 도시되어 있지만, 효과기(SpCas9) 및 작제물 구성은 상기 도면에 도시되어 있다.
도 16은 양성 선택에서 MG TadA 활성의 조사를 도시한다. 패널 (a)는 8개의 MG68 TadA 후보를 0 내지 2 ㎍/mL의 클로람페니콜에 대해 테스트한 실험으로부터의 성장 플레이트의 사진(ABE는 N-말단 TadA 변이체 및 C-말단 SpCas9(D10A) 닉카제를 포함함)을 도시한다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 패널 (b)는 MG TadA 후보의 편집 효율을 나타내는 요약 표를 도시한다. 패널 (b)는 MG68-3 및 MG68-4가 아데닌의 염기 편집을 구동하였음을 입증한다. 이 실험에서, 콜로니는 0.5 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 17은 MG68-4 상의 D109N 돌연변이를 통한 MG68-4_nSpCas9의 염기 편집 효율의 개선을 보여준다. 패널 (a)는 야생형 MG68-4 및 이의 변이체가 0 내지 4㎍mL의 클로람페니콜에 대해 테스트된 성장 플레이트의 사진을 도시한다. 단순화를 위해, 데아미나제의 정체만이 도시된다. 이 실험에서 아데닌 염기 편집기는 N-말단 TadA 변이체와 C-말단 SpCas9(D10A) 닉카제를 포함한다. 패널 (b)는 MG TadA 후보의 편집 효율을 나타내는 요약 표를 도시한다. 패널 (b)는 MG68-4 및 MG68-4(D109N)가 아데닌의 염기 편집을 나타내고 D109N 돌연변이가 증가된 활성을 나타냄을 입증한다. 이 실험에서 콜로니는 0.5 ㎍mL Cm 이상인 플레이트로부터 채취하였다.
도 18은 MG68-4(D109N)_nMG34-1의 염기 편집을 도시한다. 패널 (a)는 N-말단 MG68-4(D109N) 및 C-말단 SpCas9(D10A) 닉카제를 포함하는 ABE가 0 내지 2 ㎍/mL의 클로람페니콜에 대해 테스트된 실험의 성장 플레이트의 사진을 도시한다. 패널 (b)는 sgRNA의 존재 및 부재 하의 편집 효율을 나타내는 요약 표를 도시한다. 이 실험에서, 콜로니는 1 ㎍/mL 이상의 Cm을 갖는 플레이트로부터 채취하였다.
도 19는 MG68-4-nMG34-1 염기 편집 활성의 개선을 위해 설계된 28가지의 MG68-4 변이체를 도시한다. 효소의 편집을 개선하기 위한 표적화 돌연변이유발을 위해 12개 잔기를 선택하였다.
본 개시내용의 바람직한 실시양태가 본원에 도시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명은 명세서 내에 제공된 특정 실시예에 의해 제한되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 설명되었지만, 본원의 실시양태의 설명 및 예시는 제한적인 의미로 해석되는 것을 의미하지 않는다. 수많은 변경, 변화 및 치환이 본 개시내용에서 벗어나지 않고 당업자에게 일어날 것이다. 또한, 본 발명의 모든 양상은 다양한 조건 및 변수에 의존하는 본원에 제시된 특정 묘사, 구성 또는 상대적 비율에 제한되지 않는 것으로 이해되어야 한다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실행하는데 사용될 수 있는 것으로 이해되어야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변경, 변화 또는 등가물도 포함하는 것으로 고려된다. 하기 청구범위는 본 발명의 범위를 정의하고, 이러한 청구범위 내의 방법 및 구조 및 이의 등가물이 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING
<110> METAGENOMI IP TECHNOLOGIES, LLC
<120> BASE EDITING ENZYMES
<130> 55921-715.601
<140>
<141>
<150> 63/222,351
<151> 2021-07-15
<150> 63/077,057
<151> 2020-09-11
<160> 593
<170> PatentIn version 3.5
<210> 1
<211> 186
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-2 deaminase
<400> 1
Met Ala Arg Val Leu Gly Leu Asp Pro Gly Phe Ala Thr Cys Gly Tyr
1 5 10 15
Ala Leu Val Asp Leu Thr Arg Lys Asp Gly Ala Pro Phe Val Asp Val
20 25 30
Arg Ser Leu Gly Thr Leu Arg Thr Ala Lys Ala Asp Lys Lys Arg Lys
35 40 45
Val Leu Ala Ala Asp Asp Asn Leu Arg Arg Ala Gln Glu Leu Ile Arg
50 55 60
Ala Leu Tyr Pro Leu Ala Ser Asn Ala Gln Ala Ile Val Ala Glu Ser
65 70 75 80
Met Ser Phe Pro Arg Asn Ser Ala Ala Ala Ala Lys Met Ala Met Cys
85 90 95
Trp Gly Ile Val Ala Thr Leu Ala Glu Met Asn Asp Leu Pro Ile Val
100 105 110
Gln Ala Thr Pro Lys Glu Ile Lys Ile Ala Val Ala Gly Val Gly Thr
115 120 125
Ala Thr Lys Glu Asp Val Ala Ala Ala Val Cys Ala Lys Cys Gly Arg
130 135 140
Gln Phe Ser Glu Glu Leu Leu Ala Gln Gly Leu Pro Lys Gly Met His
145 150 155 160
Glu His Ala Tyr Asp Ala Val Ala Ser Val Leu Ala Cys Leu Asn Ser
165 170 175
Asp Val Leu Arg Ala Ile Arg Arg Ala Gly
180 185
<210> 2
<211> 164
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-3 deaminase
<400> 2
Met Asp Arg Leu Ser Leu His Gln Tyr Ala Ile Ala Leu Ala Trp Val
1 5 10 15
Ala Ala Thr Arg Ser Glu Asp Pro Tyr Thr Arg Val Gly Cys Val Ala
20 25 30
Leu Ser Glu Gln Gly Asn Val Leu Ala Thr Ala Tyr Asn Gly Leu Lys
35 40 45
Pro Lys Ala Thr Phe Gly Pro Glu Phe Trp Asn Asn Arg Glu Ser Arg
50 55 60
Leu Pro Phe Met Val His Ala Glu Met Asn Leu Val Ser Leu Thr Lys
65 70 75 80
Arg Asn Glu Val His Thr Val Ala Ile Asn Ile Leu Pro Cys Pro Thr
85 90 95
Cys Ala Ala Phe Leu Ala Thr His Gly Val Gln Gln Val Val Tyr Ser
100 105 110
Glu Val Tyr His Arg Asp Lys Gly Thr Val Gly Leu Thr Val Leu Arg
115 120 125
Glu Tyr Gly Val Glu Ile His His Leu Pro Tyr Tyr Arg Val Arg Pro
130 135 140
Val Phe Leu Asp Met Asp Glu Ala His Arg Lys Val Arg Ser Glu Gln
145 150 155 160
Arg Thr Ala Ala
<210> 3
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-4 deaminase
<400> 3
Met Arg Glu Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
His Val Val Ser Ser Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Thr Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His His Gly Glu Glu
130 135
<210> 4
<211> 160
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-5 deaminase
<400> 4
Met Ser Asn Thr Gln Ser Leu His Thr Thr Phe Met His Ile Leu Phe
1 5 10 15
Glu Phe Ser Lys Leu Ser His Cys Val Ser Lys Gln Val Ala Ala Met
20 25 30
Ala Val Lys Asp Gly Arg Ile Ile Ser Thr Gly Ile Asn Gly Thr Ala
35 40 45
Pro Gly Tyr Thr Asn Cys Asp Asp Ile Phe Asn Lys Ser Asp Phe Asn
50 55 60
Arg Glu Leu His His Gln Phe Ser Asn Thr Tyr Glu Ile His Ala Glu
65 70 75 80
Met Asn Met Ile Leu Tyr Ala Ala Lys Asn Gly Ile Ser Leu Asp Gly
85 90 95
Ala Thr Leu Tyr Cys Ser Met Leu Pro Cys Trp Asn Cys Ile Lys His
100 105 110
Ile Ser Val Thr Gly Ile Lys His Ile Ile Tyr Ala Lys Arg Tyr Asp
115 120 125
Met Leu Ser Leu Glu Asp Glu Lys Asn Ile Tyr Tyr Tyr Cys Lys Lys
130 135 140
Leu Gly Ile Thr Ile Gln Gln Phe Asp Pro Asp Thr Leu Gly Ser Phe
145 150 155 160
<210> 5
<211> 124
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-6 deaminase
<400> 5
Met Thr Ser Gly Ile Leu Lys Leu Ala Leu Glu Glu Ala Glu Ser Ser
1 5 10 15
Thr Tyr Arg Phe Arg Val Gly Ala Val Val Phe Lys Gly Ser Arg Ile
20 25 30
Leu Ala Ser Gly His Asn Gly Ile Arg Ser Ser Arg Ile His Pro Leu
35 40 45
His Lys Asn Tyr Asn Asn Ala Leu His Ala Glu Gln Asp Ala Ile Leu
50 55 60
Asn Val Lys Asp Trp Ser Thr Leu Lys Gly Cys Ser Ile Leu Val Val
65 70 75 80
Lys Val Ser Lys Thr Lys Gly Thr Ile Ser Met Ala Lys Pro Cys Pro
85 90 95
Met Cys Gln Gln Leu Leu Arg His Val Gly Ile Lys Thr Met Tyr Phe
100 105 110
Ser Asn Glu Asn Gly Glu Ile Ile Ser Glu Lys Leu
115 120
<210> 6
<211> 132
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-7 deaminase
<400> 6
Met Thr Lys Arg Glu Ile Ala Tyr Phe Asn Ala Ala Lys Ala Val Ser
1 5 10 15
Ser Leu Ser Asp His Lys Tyr Lys Met Gly Cys Val Ile Val Asn Lys
20 25 30
His Arg Ile Ile Ser Ser Gly Phe Asn Ser Glu Thr Lys Cys His Arg
35 40 45
Ile Gln Ala Glu Leu Asp Met Asn Glu Tyr Lys Met His Ser Ser Gly
50 55 60
Lys Val His Ala Glu Thr Ser Ala Leu Leu Ser Leu Arg His Ile Asp
65 70 75 80
Leu Ser Lys Ala Ser Ile Phe Ile Tyr Arg Glu Leu Lys Asp Gly Thr
85 90 95
Lys Ala Leu Ala Arg Pro Cys Pro Cys Cys Gln Lys Leu Ile Arg Lys
100 105 110
Ala Gly Ile Lys His Val Tyr Tyr Thr Gly Asn Asn Ser Leu Ile Tyr
115 120 125
Glu Glu Phe Ile
130
<210> 7
<211> 142
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-8 deaminase
<400> 7
Ala Ala Gly Asp Phe Val Gln Val Arg Glu Tyr Ile Lys Ala Ala Arg
1 5 10 15
Asp Glu Ala Ala Lys Ser Arg Cys Asp Arg Ala His Val Gly Cys Val
20 25 30
Ile Val Asp Arg Val Thr Gly Arg Val Val Ser Arg Ala Phe Asn Glu
35 40 45
Thr Pro His Gly Leu Glu Pro Cys Asp Thr Gly Gly His Arg Met Ile
50 55 60
Asp Gly His Cys Val Asn Thr Val His Ala Glu Arg Asn Ala Ile Arg
65 70 75 80
Lys Met Lys Glu His Glu Ser Glu Tyr Thr Leu Tyr Val Thr His Tyr
85 90 95
Pro Cys Gln Gly Cys Ala His Leu Ile Ala Ser Cys Pro Glu Ile Val
100 105 110
Glu Val Val Tyr Leu Gly Asp Tyr Arg Asn Ser Lys Glu Ala Thr Ala
115 120 125
Leu Leu Met Gly Leu Ser Lys Gly Val His Arg Gly Glu Glu
130 135 140
<210> 8
<211> 82
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-9 deaminase
<400> 8
His Arg Ile Val Asp Asn His Cys Val Asn Thr Val His Ala Glu Arg
1 5 10 15
Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser Glu Tyr Thr Leu Tyr
20 25 30
Val Thr His Tyr Pro Cys Gln Gly Cys Ala His Leu Ile Ser Ser Cys
35 40 45
Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp Tyr Arg Asn Ser Ser
50 55 60
Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys Gly Val His Arg Gly
65 70 75 80
Glu Glu
<210> 9
<211> 115
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-10 deaminase
<400> 9
His Val Gly Cys Val Ile Val Asp His Ala Thr Gly Gln Val Val Ser
1 5 10 15
Ser Ala Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro Cys Asp Thr Gly
20 25 30
Gly His Arg Ile Val Asp Asp His Cys Val Asn Thr Val His Ala Glu
35 40 45
Arg Gly Ala Ile Arg Lys Met Ala Glu His Gly Ser Glu Tyr Thr Leu
50 55 60
Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His Leu Ile Ser Ser
65 70 75 80
Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp Tyr Asn Asn Ser
85 90 95
Ser Glu Ala Thr Asp Leu Leu Met Ser Leu Ser Lys Gly Val His Arg
100 105 110
Ala Glu Glu
115
<210> 10
<211> 186
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-11 deaminase
<400> 10
Met Ala Arg Val Leu Gly Leu Asp Pro Gly Phe Ala Thr Cys Gly Tyr
1 5 10 15
Ala Leu Val Asp Leu Thr Arg Lys Asp Gly Ala Pro Phe Val Asp Val
20 25 30
Arg Ser Leu Gly Thr Leu Arg Thr Ala Lys Ala Asp Lys Lys Arg Lys
35 40 45
Val Leu Ala Ala Asp Asp Asn Leu Arg Arg Ala Gln Glu Leu Ile Arg
50 55 60
Ala Leu Tyr Pro Leu Ala Ser Asn Ala Gln Ala Ile Val Ala Glu Ser
65 70 75 80
Met Ser Phe Pro Arg Asn Ser Ala Ala Ala Ala Lys Met Ala Met Cys
85 90 95
Trp Gly Ile Val Ala Thr Leu Ala Glu Met Asn Asp Leu Pro Ile Val
100 105 110
Gln Ala Thr Pro Lys Glu Ile Lys Ile Ala Val Ala Gly Val Gly Thr
115 120 125
Ala Thr Lys Glu Asp Val Ala Ala Ala Val Cys Ala Lys Cys Gly Arg
130 135 140
Gln Phe Ser Glu Glu Leu Leu Ala Gln Gly Leu Pro Lys Gly Met His
145 150 155 160
Glu His Ala Tyr Asp Ala Val Ala Ser Val Leu Ala Cys Leu Asn Ser
165 170 175
Asp Val Leu Arg Ala Ile Arg Arg Ala Gly
180 185
<210> 11
<211> 232
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-12 deaminase
<400> 11
Met Asp Asn Leu Pro Lys Tyr Glu Tyr Leu Asn Val Leu Asp Pro Glu
1 5 10 15
Arg Thr Gly Ile Ser Glu Thr Trp Leu Ser Tyr Phe Met Asn Ile Ala
20 25 30
Arg Val Ile Ala Thr Lys Ser Lys Asp Pro Ser Thr Lys Val Gly Ala
35 40 45
Val Ala Val Asp Thr Asn Thr Lys Arg Ile Leu Ala Thr Gly Tyr Asn
50 55 60
Gly Phe Pro Ala Gly Val Lys Glu Arg Pro Glu Arg Trp Glu Arg Pro
65 70 75 80
Val Lys Tyr Ser Tyr Ile Val His Ser Glu Ala Asn Ile Val Ala Ser
85 90 95
Ala Ala Arg Phe Gly Ile Asn Leu Thr Gly Ser Thr Leu Phe Val Thr
100 105 110
Leu His Pro Cys Val Asp Cys Ala Lys Ile Val Ala Ser Ala Gly Phe
115 120 125
Lys Asn Val Ile Tyr Ile Asp Thr Glu Ile Lys Ala Gln Val Gly Arg
130 135 140
Glu Trp Ile Thr Leu Leu Gln His Ser Lys Asn Ile Phe Glu Glu Ser
145 150 155 160
Arg Ile Gly Leu Tyr Ala Cys Arg Glu Val Pro Ala Lys Lys Lys Glu
165 170 175
Glu Pro Lys Leu Tyr Lys Thr Tyr Lys Gly Thr Val Glu Thr Thr Thr
180 185 190
Glu Leu Asn Asn Lys Arg Asp Lys Gln Leu Gly Asp Leu Val Phe Val
195 200 205
Lys Ser Arg Asn Thr Leu Tyr Glu Trp Asn Gly Val Ile Trp Thr Val
210 215 220
Ile Gly Glu Tyr Gln His Leu Leu
225 230
<210> 12
<211> 113
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-13 deaminase
<400> 12
Met Asp Asn Leu Pro Lys Tyr Glu Tyr Leu Asn Val Leu Asp Pro Glu
1 5 10 15
Arg Thr Arg Ile Ser Glu Thr Trp Leu Ser Tyr Phe Met Asn Ile Ala
20 25 30
Arg Val Ile Ala Thr Lys Ser Lys Asp Pro Ser Thr Lys Val Gly Ala
35 40 45
Val Ala Val Asp Thr Asn Thr Lys Arg Ile Leu Ala Thr Gly Tyr Asn
50 55 60
Gly Phe Pro Ala Gly Val Lys Glu Arg Pro Glu Arg Trp Glu Arg Pro
65 70 75 80
Val Lys Tyr Ser Tyr Ile Val His Ser Glu Ala Asn Ile Val Ala Ser
85 90 95
Ala Ala Arg Phe Gly Ile Asn Leu Thr Gly Ser Thr Leu Phe Val Thr
100 105 110
Leu
<210> 13
<211> 232
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-14 deaminase
<400> 13
Met Asp Asn Leu Pro Lys Tyr Glu Tyr Leu Asn Val Leu Asp Pro Glu
1 5 10 15
Arg Thr Arg Ile Ser Glu Thr Trp Leu Ser Tyr Phe Met Asn Ile Ala
20 25 30
Arg Val Ile Ala Thr Lys Ser Lys Asp Pro Ser Thr Lys Val Gly Ala
35 40 45
Val Ala Val Asp Thr Asn Thr Lys Arg Ile Leu Ala Thr Gly Tyr Asn
50 55 60
Gly Phe Pro Ala Gly Val Lys Glu Arg Pro Glu Arg Trp Glu Arg Pro
65 70 75 80
Val Lys Tyr Ser Tyr Ile Val His Ser Glu Ala Asn Ile Val Ala Ser
85 90 95
Ala Ala Arg Phe Gly Ile Asn Leu Thr Gly Ser Thr Leu Phe Val Thr
100 105 110
Leu His Pro Cys Val Asp Cys Ala Lys Ile Val Ala Ser Ala Gly Phe
115 120 125
Lys Asn Val Ile Tyr Ile Asp Thr Glu Ile Lys Pro Gln Val Gly Arg
130 135 140
Glu Trp Ile Thr Leu Leu Gln His Ser Lys Asn Ile Phe Glu Glu Ser
145 150 155 160
Arg Ile Gly Leu Tyr Ala Cys Arg Glu Val Pro Ala Lys Lys Lys Glu
165 170 175
Glu Pro Lys Leu Tyr Lys Thr Phe Lys Gly Thr Val Glu Thr Thr Val
180 185 190
Glu Leu Asn Asn Lys Arg Asp Lys Gln Leu Gly Asp Leu Val Phe Val
195 200 205
Lys Ser Arg Asn Thr Leu Tyr Glu Trp Asn Gly Val Ile Trp Thr Val
210 215 220
Ile Gly Glu Tyr Gln His Leu Leu
225 230
<210> 14
<211> 164
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-15 deaminase
<400> 14
Met Asp Arg Leu Ser Leu His Gln Tyr Ala Ile Ala Leu Ala Trp Val
1 5 10 15
Ala Ala Thr Arg Ser Glu Asp Pro Tyr Thr Arg Val Gly Cys Val Ala
20 25 30
Leu Ser Glu Gln Gly Asn Val Leu Ala Thr Ala Tyr Asn Gly Leu Lys
35 40 45
Pro Lys Ala Thr Phe Gly Pro Glu Phe Trp Asn Asn Arg Glu Ser Arg
50 55 60
Leu Pro Phe Met Val His Ala Glu Met Asn Leu Val Ser Leu Thr Lys
65 70 75 80
Arg Asn Glu Val His Thr Val Ala Ile Asn Ile Leu Pro Cys Pro Thr
85 90 95
Cys Ala Ala Phe Leu Ala Thr His Gly Val Gln Gln Val Val Tyr Ser
100 105 110
Glu Val Tyr His Arg Asp Lys Gly Thr Val Gly Leu Thr Val Leu Arg
115 120 125
Glu Tyr Gly Val Glu Ile His His Leu Pro Tyr Tyr Arg Val Arg Pro
130 135 140
Val Phe Leu Asp Met Asp Glu Ala His Arg Lys Val Arg Ser Glu Gln
145 150 155 160
Arg Thr Ala Ala
<210> 15
<211> 50
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-18 deaminase
<400> 15
Met Lys Gln Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp
50
<210> 16
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-19 deaminase
<400> 16
Met Lys Gln Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 17
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-20 deaminase
<400> 17
Met Lys Gln Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Gln Met Lys Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Ile Glu Val Val Tyr Ile Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 18
<211> 204
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-21 deaminase
<400> 18
Met Asn Ile Ala Arg Val Ile Ala Thr Lys Ser Lys Asp Pro Ser Thr
1 5 10 15
Lys Val Gly Ala Val Ala Val Asp Thr Asn Thr Lys Arg Ile Leu Ala
20 25 30
Thr Gly Tyr Asn Gly Phe Pro Ala Gly Val Lys Glu Arg Pro Glu Arg
35 40 45
Trp Glu Arg Pro Val Lys Tyr Ser Tyr Ile Val His Ser Glu Ala Asn
50 55 60
Ile Val Ala Ser Ala Ala Arg Phe Gly Ile Asn Leu Thr Gly Ser Thr
65 70 75 80
Leu Phe Val Thr Leu His Pro Cys Val Asp Cys Ala Lys Ile Val Ala
85 90 95
Ser Ala Gly Phe Lys Asn Val Ile Tyr Ile Asp Thr Glu Ile Lys Pro
100 105 110
Gln Val Gly Arg Glu Trp Ile Thr Leu Leu Gln His Ser Lys Asn Ile
115 120 125
Phe Glu Glu Ser Arg Ile Gly Leu Tyr Ala Cys Arg Glu Val Pro Ala
130 135 140
Lys Lys Lys Glu Glu Pro Lys Leu Tyr Lys Thr Phe Lys Gly Thr Val
145 150 155 160
Glu Thr Thr Val Glu Leu Asn Asn Lys Arg Asp Lys Gln Leu Gly Asp
165 170 175
Leu Ile Phe Val Arg Ser Arg Asn Thr Leu Tyr Glu Trp Asn Gly Val
180 185 190
Ile Trp Thr Val Ile Gly Glu Tyr Gln His Leu Leu
195 200
<210> 19
<211> 142
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-22 deaminase
<400> 19
Met Arg Glu Phe Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Gln Ser His Asp Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Asp Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Asn Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Val His His Ala Glu Glu Asp Cys Ser Ser Ser Pro Ala
130 135 140
<210> 20
<211> 142
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-23 deaminase
<400> 20
Met Arg Glu Phe Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Gln Ser His Asp Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Asn Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Val His His Ala Glu Glu Asp Cys Ser Ser Ser Pro Ala
130 135 140
<210> 21
<211> 142
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-24 deaminase
<400> 21
Met Arg Glu Phe Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Gln Thr His Asp Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Asn Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Val His His Ala Glu Glu Asp Cys Ser Ser Ser Pro Ala
130 135 140
<210> 22
<211> 142
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-25 deaminase
<400> 22
Met Arg Glu Phe Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Thr Ser His Asp Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Asn Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Val His His Ala Glu Glu Asp Cys Ser Ser Ser Pro Ala
130 135 140
<210> 23
<211> 136
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-26 deaminase
<400> 23
Met Arg Glu Leu Gly Ile Lys Ala Ala Arg Asp Glu Ala Lys Lys Ser
1 5 10 15
Arg Cys Asp Arg Ala His Val Gly Cys Val Ile Ile Asp Arg Ala Ser
20 25 30
Gly Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro Pro Thr Leu Glu
35 40 45
Pro Cys Asp Thr Gly Gly His Arg Met Val Asp Gly His Cys Val Asn
50 55 60
Thr Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Ala Glu His Gly
65 70 75 80
Ser Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala
85 90 95
His Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly
100 105 110
Asp Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Met Ser Leu Ser
115 120 125
Lys Gly Val His Arg Val Lys Gly
130 135
<210> 24
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-27 deaminase
<400> 24
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp His Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His
85 90 95
Leu Ile Ser Thr Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Glu Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 25
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-28 deaminase
<400> 25
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Glu
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro Asn Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asp His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Arg Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 26
<211> 36
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-29 deaminase
<400> 26
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser
35
<210> 27
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-30 deaminase
<400> 27
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Gly Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 28
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-31 deaminase
<400> 28
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Lys Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 29
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-32 deaminase
<400> 29
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Thr Asp His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 30
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-33 deaminase
<400> 30
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Val Asp Asp His Cys Val Asn Thr
50 55 60
Ile His Ala Glu Arg Asn Ala Ile Arg Gln Met Lys Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His
85 90 95
Phe Ile Ser Thr Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 31
<211> 40
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-34 deaminase
<400> 31
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Ser Ala Phe Asn
35 40
<210> 32
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-35 deaminase
<400> 32
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Ser Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Gln Met Thr Asp His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 33
<211> 142
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-36 deaminase
<400> 33
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Pro Ser His Asp Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Asp Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Glu Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Ile His Cys Ala Glu Glu Asp Arg Ser Ser Ser Pro Ala
130 135 140
<210> 34
<211> 142
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-37 deaminase
<400> 34
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Pro Ser His Asp Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Asp Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Glu Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Val His Cys Ala Glu Glu Asp Arg Ser Ser Ser Pro Ala
130 135 140
<210> 35
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-38 deaminase
<400> 35
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Ser Gly
20 25 30
Gln Val Val Ser Ser Ala Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Val Asp Asp His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Gly Ala Ile Leu Lys Met Ala Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Thr Leu Leu Met Ser Leu Ser Lys
115 120 125
Gly Val His His Val Glu Gly
130 135
<210> 36
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-39 deaminase
<400> 36
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Lys Gly Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His His Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Ser Ala Ile Arg Lys Met Thr Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His
85 90 95
Leu Ile Thr Ser Cys Pro Glu Ile Met Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Glu Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Val His His Val Glu Gly
130 135
<210> 37
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-40 deaminase
<400> 37
Met Arg Glu Tyr Ile Lys Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asp His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Arg Met Val Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 38
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-41 deaminase
<400> 38
Met Arg Glu Tyr Ile Gln Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Ser Gly
20 25 30
Gln Val Val Ser Ser Ala Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Val Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Ala Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Met Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Thr Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Val His His Val Glu Glu
130 135
<210> 39
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-42 deaminase
<400> 39
Met Arg Glu Tyr Ile Gln Ala Ala Arg Asp Glu Ala Lys Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Arg Val Val Ser Ser Ala Phe Asn Glu Thr Pro Pro Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Val Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Gly Ala Ile Arg Lys Met Ala Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Arg Gly Cys Gly His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Val His His Val Glu Glu
130 135
<210> 40
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-43 deaminase
<400> 40
Met Arg Glu Tyr Ile Gln Ala Ala Arg Asp Glu Ala Ser Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Ile His Ala Glu Arg Asn Ala Ile Arg Lys Met Pro Thr His Asp Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Ser Glu Ala Thr Ala Leu Leu Ser Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 41
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-44 deaminase
<400> 41
Met Arg Glu Tyr Ile Arg Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Gly
20 25 30
Gln Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Glu Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Ile Val Asp Asn His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Thr Glu His Gly Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ser Ser Cys Pro Glu Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Asn Asn Ser Ser Glu Ala Thr Ala Leu Leu Glu Gly Leu Ser Lys
115 120 125
Gly Val His Arg Gly Glu Glu
130 135
<210> 42
<211> 135
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-45 deaminase
<400> 42
Met Arg Glu Tyr Ile Arg Ala Ala Arg Asp Glu Ala Ala Lys Ser Arg
1 5 10 15
Cys Asp Arg Ala His Val Gly Cys Val Ile Val Asp Arg Ala Thr Ser
20 25 30
Arg Val Val Ser Arg Ala Phe Asn Glu Thr Pro His Gly Leu Asp Pro
35 40 45
Cys Asp Thr Gly Gly His Arg Met Ile Asp Gly His Cys Val Asn Thr
50 55 60
Val His Ala Glu Arg Asn Ala Ile Arg Lys Met Pro Ser His Asp Ser
65 70 75 80
Glu Tyr Thr Leu Tyr Val Thr His Tyr Pro Cys Gln Gly Cys Ala His
85 90 95
Leu Ile Ala Ser Cys Pro Asp Ile Val Glu Val Val Tyr Leu Gly Asp
100 105 110
Tyr Arg Asn Ser Lys Glu Ala Thr Ala Leu Leu Met Gly Leu Ser Lys
115 120 125
Gly Ile His His Ala Glu Glu
130 135
<210> 43
<211> 151
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-46 deaminase
<400> 43
Met Arg Val Arg Pro Asp Trp Asp Thr Tyr Phe Met Arg Ile Ala Lys
1 5 10 15
Val Val Ala Gln Arg Ser His Asp Glu Asp Thr Gln Val Gly Cys Val
20 25 30
Ile Val Ser Pro Asp Lys Arg Ile Leu Ser Thr Gly Tyr Asn Gly Phe
35 40 45
Pro Pro Gly Phe Pro Asp Gly Lys Leu Pro Arg Thr Arg Pro Gly Lys
50 55 60
Tyr Pro Tyr Ile Val His Ser Glu Ile Asn Ala Ile Val Ser Ala Leu
65 70 75 80
Asn Arg Asp Leu Arg Gly Ala Thr Leu Tyr Cys Arg Phe Thr Pro Cys
85 90 95
Lys Asp Cys Val Lys Ala Ile Ile Thr Ala Gly Ile Thr Arg Ile Val
100 105 110
Tyr Glu Glu Thr Tyr Ala Arg Asp Asn Thr Asp Ala Ala Val Val Phe
115 120 125
Glu Met Leu Glu Met Gly Gly Val Glu Ile Val Lys His Leu Glu His
130 135 140
Glu His Glu Ala Asp Ser Asp
145 150
<210> 44
<211> 159
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-47 deaminase
<400> 44
Met Ser Asn Thr Gln Ser Leu His Thr Thr Phe Met His Ile Leu Phe
1 5 10 15
Glu Phe Ser Lys Leu Ser His Cys Val Ser Lys Gln Val Ala Ala Met
20 25 30
Ala Val Lys Asp Gly Arg Ile Ile Ser Thr Gly Ile Asn Gly Thr Ala
35 40 45
Pro Gly Tyr Thr Asn Cys Asp Asp Ile Phe Asn Lys Ser Asp Phe Asp
50 55 60
Arg Glu Leu His His Gln Phe Ser Asn Thr Tyr Glu Ile His Ala Glu
65 70 75 80
Met Asn Met Ile Leu Tyr Ala Ala Lys Asn Gly Ile Ser Leu Asp Gly
85 90 95
Ala Thr Leu Tyr Cys Ser Met Leu Pro Cys Trp Asn Cys Ile Lys His
100 105 110
Ile Ser Val Thr Gly Ile Lys His Ile Ile Tyr Ala Lys Arg Tyr Asp
115 120 125
Met Leu Ser Leu Glu Asp Glu Lys Asn Ile Tyr Tyr Tyr Cys Lys Lys
130 135 140
Leu Gly Ile Thr Ile Gln Gln Phe Asp Pro Asp Thr Leu Gly Ser
145 150 155
<210> 45
<211> 160
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-48 deaminase
<400> 45
Met Ser Asn Thr Gln Ser Leu His Thr Thr Phe Met His Ile Leu Phe
1 5 10 15
Glu Phe Ser Lys Leu Ser His Cys Val Ser Lys Gln Val Ala Ala Met
20 25 30
Ala Val Lys Asp Gly Arg Ile Ile Ser Thr Gly Ile Asn Gly Thr Ala
35 40 45
Pro Gly Tyr Thr Asn Cys Asp Asp Ile Phe Asn Lys Ser Asp Phe Asp
50 55 60
Arg Glu Leu His His Gln Phe Ser Asn Thr Tyr Glu Ile His Ala Glu
65 70 75 80
Met Asn Met Ile Leu Tyr Ala Ala Lys Asn Gly Ile Ser Leu Asp Gly
85 90 95
Ala Thr Leu Tyr Cys Ser Met Leu Pro Cys Trp Asn Cys Ile Lys His
100 105 110
Ile Ser Val Thr Gly Ile Lys His Ile Ile Tyr Ala Lys Arg Tyr Asp
115 120 125
Met Leu Ser Leu Glu Asp Glu Lys Asn Ile Tyr Tyr Tyr Cys Lys Lys
130 135 140
Leu Gly Ile Thr Ile Gln Gln Phe Asp Pro Asp Thr Leu Gly Ser Phe
145 150 155 160
<210> 46
<211> 124
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-49 deaminase
<400> 46
Met Thr Ser Gly Ile Leu Lys Leu Ala Leu Glu Glu Ala Glu Ser Ser
1 5 10 15
Thr Tyr Arg Phe Arg Val Gly Ala Val Val Phe Lys Gly Ser Arg Ile
20 25 30
Leu Ala Ser Gly His Asn Gly Ile Arg Ser Ser Arg Ile His Pro Leu
35 40 45
His Lys Asn Tyr Asn Asn Ala Leu His Ala Glu Gln Asp Ala Ile Leu
50 55 60
Asn Val Lys Asp Trp Ser Thr Leu Lys Gly Cys Ser Ile Leu Val Val
65 70 75 80
Lys Val Ser Lys Thr Lys Gly Thr Ile Ser Met Ala Lys Pro Cys Pro
85 90 95
Met Cys Gln Gln Leu Leu Arg His Val Gly Ile Lys Thr Met Tyr Phe
100 105 110
Ser Asn Glu Asn Gly Glu Ile Ile Ser Glu Lys Leu
115 120
<210> 47
<211> 80
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG66 putative cytidine deaminase
<220>
<223> Description: MG66-50 deaminase
<400> 47
Met Val Asp Gly His Cys Val Asn Thr Val His Ala Glu Arg Gly Ala
1 5 10 15
Ile Arg Lys Met Thr Glu His Gly Ser Glu Tyr Thr Leu Tyr Val Thr
20 25 30
His Tyr Pro Cys Arg Gly Cys Ala His Leu Ile Ser Ser Cys Pro Glu
35 40 45
Ile Val Glu Val Val Tyr Leu Gly Asp Tyr Asn Asn Ser Ser Glu Ala
50 55 60
Thr Ala Leu Leu Met Gly Leu Ser Lys Gly Val His His Val Glu Gly
65 70 75 80
<210> 48
<211> 150
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG67 putative cytidine deaminase
<220>
<223> Description: MG67-2 deaminase
<400> 48
Met Thr Ala Cys Lys Asp Lys Pro Val Cys Asn Val Ala Gln Ala Asp
1 5 10 15
Ala Thr Leu Leu Ser Thr Cys Leu Arg Leu Leu Gln Thr Ala His Glu
20 25 30
Ile Lys Gln Asn Ala Tyr Ala Pro Tyr Ser Gly Phe Gln Val Gly Ala
35 40 45
Ala Val Leu Ala Lys Asn Gly Ser Ile Ile Thr Gly Val Asn Val Glu
50 55 60
Asn Gly Ser Leu Gly Leu Thr Ile Cys Ala Glu Arg Thr Ala Leu Ser
65 70 75 80
Lys Ala Val Ser Glu Gly Tyr Arg Pro Gly Asp Phe Val Ala Ile Ala
85 90 95
Val Ala Ala Ser Ala Asp Gly Phe Ser Pro Cys Gly Ala Cys Arg Glu
100 105 110
Val Ile Asn Glu Phe Gly Gln Asn Met Leu Val Val Phe Glu Tyr Gln
115 120 125
Asp Glu Val Val Val Ala Pro Leu Lys Thr Leu Leu Ala Tyr Asn Phe
130 135 140
Val Lys Gly Lys Pro Ser
145 150
<210> 49
<211> 62
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG67 putative cytdidine deaminase
<220>
<223> Description: MG67-4 deaminase
<400> 49
Met Ala Tyr Arg Pro Gly Asp Phe Val Ala Ile Ala Ile Ala Ala Ser
1 5 10 15
Ser Pro Asp Phe Ser Pro Cys Gly Ala Cys Arg Glu Val Ile Asn Glu
20 25 30
Phe Gly Asp Asp Met Ala Val Ile Phe Glu Ile Lys Gly Glu Thr Val
35 40 45
Val Ser Gln Leu Lys Glu His Leu Pro Tyr Asn Phe Lys Met
50 55 60
<210> 50
<211> 250
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-1 deaminase
<400> 50
Met Gln His Val Lys His Met Arg Thr Ala Val Arg Leu Ala Arg Tyr
1 5 10 15
Ala Leu Asp His Asp Glu Thr Pro Val Ala Cys Ile Phe Val His Thr
20 25 30
Pro Thr Gly Gln Val Met Ala Tyr Gly Met Asn Asp Thr Asn Lys Ser
35 40 45
Leu Thr Gly Val Ala His Ala Glu Phe Met Gly Ile Asp Gln Ile Lys
50 55 60
Ala Met Leu Gly Ser Arg Gly Val Val Asp Val Phe Lys Asp Ile Thr
65 70 75 80
Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Lys
85 90 95
Gln Leu Gly Ile Gly Lys Val Val Phe Gly Cys Gly Asn Glu Arg Phe
100 105 110
Gly Gly Asn Gly Thr Val Leu Ser Val Asn His Asp Thr Cys Thr Leu
115 120 125
Val Pro Lys Asn Asn Ser Ala Ala Gly Tyr Glu Ser Ile Pro Gly Ile
130 135 140
Leu Arg Lys Glu Ala Ile Met Leu Leu Arg Tyr Phe Tyr Val Arg Gln
145 150 155 160
Asn Glu Arg Ala Pro Lys Pro Arg Ser Lys Ser Asp Arg Val Leu Asp
165 170 175
Lys Asn Thr Phe Pro Pro Met Glu Trp Ser Lys Tyr Leu Asn Glu Glu
180 185 190
Ala Phe Ile Glu Thr Phe Gly Asp Asp Tyr Lys Thr Cys Phe Ala Asn
195 200 205
Lys Val Asp Leu Ser Ser Asn Ser Val Asp Trp Asp Leu Ile Asp Ser
210 215 220
His Gln Asp Asn Ile Ile Gln Glu Leu Glu Glu Gln Cys Lys Met Phe
225 230 235 240
Arg Phe Asn Val His Lys Lys Ser Lys Val
245 250
<210> 51
<211> 239
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-2 deaminase
<400> 51
Met Leu Leu Asn Lys Arg Ser Tyr Gly His Phe Tyr Phe Ile Ala Leu
1 5 10 15
Met Thr Glu Phe Ser Lys Trp Asp Glu Tyr Tyr Met Lys Leu Ala Leu
20 25 30
Met Glu Ala Glu Lys Ala Leu Asn Ser Asn Glu Val Pro Ile Gly Cys
35 40 45
Val Phe Val Lys Ser Asp Thr Glu Val Glu Ile Pro Pro Leu Pro Ser
50 55 60
Arg Tyr Ser Lys Asp Glu Phe His Ser Ser Val Ile Ala Ser Gly Arg
65 70 75 80
Asn Phe Thr Asn Glu Asn Tyr Asn Ala Thr His His Ala Glu Ile Met
85 90 95
Ala Leu Thr Asp Leu Ile Ser Cys Leu Glu Cys Asn Cys Lys Lys Ile
100 105 110
Asp Asn Met Gly Glu Pro Cys Lys Pro Thr Phe Ser Lys Asp Thr Glu
115 120 125
Cys Pro Gln Cys Asn Phe Asn Leu Lys Asn Val Thr Leu Tyr Val Thr
130 135 140
Ile Glu Pro Cys Ile Met Cys Ile Ser Ala Leu Met Glu Leu Gln Val
145 150 155 160
Ser Arg Ile Val Phe Gly Ala Asn Asn Asp Lys Phe Gly Gly Cys Gly
165 170 175
Gly Thr Leu Thr Asn Val Pro Glu Ile Leu Lys Asp Thr Cys Ser Lys
180 185 190
Asp Phe Glu Glu Ile Lys Ile Glu Arg Gly Leu Tyr Arg Glu Glu Ala
195 200 205
Val Ile Leu Leu Arg Lys Phe Tyr Leu Ile Gln Asn Pro Lys Ala Pro
210 215 220
Asn Pro Lys Lys Lys Ala Lys Arg Thr Leu Asn Leu Ile Val Asp
225 230 235
<210> 52
<211> 87
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG69 UGI
<220>
<223> Description: MG69-1 deaminase
<400> 52
Met Ser Lys Thr Ile Lys Asp Leu Glu Glu Phe Ala Ala Glu Lys Leu
1 5 10 15
Gly Tyr Asp Ile Val Phe Gln Glu Ser Ile Ser Met Glu Pro Gln Glu
20 25 30
Val Glu His Leu Ile Thr Thr Asp Glu Lys Ser Val Leu Val Asn Ser
35 40 45
Thr Tyr Asp Asp Asn Lys Glu Ile Thr Ile Ser Met Ile Ser Thr Pro
50 55 60
His Pro Glu Tyr Arg Pro Ile Ala Leu Ile Ile Gln Asp Met Glu Gly
65 70 75 80
Glu Val Gln Arg Lys Glu Leu
85
<210> 53
<211> 88
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG69 UGI
<220>
<223> Description: MG69-2 deaminase
<400> 53
Met Ser Lys Thr Ile Lys Asp Leu Glu Glu Phe Ala Ala Glu Lys Leu
1 5 10 15
Gly Tyr Asp Ile Val Phe Gln Glu Ser Ile Ser Met Glu Pro Gln Glu
20 25 30
Val Glu His Leu Ile Thr Thr Asp Glu Lys Ser Val Leu Val Asn Ser
35 40 45
Thr Tyr Asp Asp Asp Lys Glu Ile Thr Ile Ser Val Ile Ser Thr Pro
50 55 60
His Pro Glu Tyr Arg Pro Ile Ala Leu Val Ile Gln Asp Met Glu Gly
65 70 75 80
Glu Val Gln Arg Lys Glu Leu Tyr
85
<210> 54
<211> 84
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG69 UGI
<220>
<223> Description: MG69-3 deaminase
<400> 54
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu
<210> 55
<211> 67
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG69 UGI
<220>
<223> Description: MG69-4 deaminase
<400> 55
Met Ile Val Arg Val Thr Tyr Asn Val Glu Gln Glu Val Glu Ile Ser
1 5 10 15
Asn Lys Phe Asn Lys Asp Val Asp Ile Met Lys Pro Glu Glu Tyr Asp
20 25 30
Asp Tyr Ile Asp Asp Leu Met Phe Ala Leu Asn Glu Lys Leu Pro Glu
35 40 45
Tyr Ala Glu Ile Ser Cys Val Ile Asn Asp Asn Thr Gly Glu Val Leu
50 55 60
Phe Glu Gly
65
<210> 56
<211> 35
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG69 UGI
<220>
<223> Description: MG69-5 deaminase
<400> 56
Met Ser Lys Thr Ile Lys Asp Leu Glu Glu Phe Ala Ala Glu Lys Leu
1 5 10 15
Gly Tyr Asp Ile Val Phe Gln Glu Ser Ile Ser Met Glu Pro Gln Glu
20 25 30
Val Glu His
35
<210> 57
<211> 167
<212> PRT
<213> Escherichia coli
<220>
<223> Category: reference deaminase
<220>
<223> Description: P68398 TADA tRNA specific adenosine deaminase
<400> 57
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp
165
<210> 58
<211> 229
<212> PRT
<213> Rattus norvegicus
<220>
<223> Category: reference deaminase
<220>
<223> Description: P38483 APOBEC 1 C U editing deaminase
<400> 58
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 59
<211> 251
<212> PRT
<213> Heterocephalus glaber
<220>
<223> Category: reference deaminase
<220>
<223> Description: Aicda XM 004869540 cytidine deaminase
<400> 59
Met Ala Val Gly Ser Lys Pro Lys Ala Ala Leu Val Gly Pro His Trp
1 5 10 15
Glu Arg Glu Arg Ile Trp Cys Phe Leu Cys Ser Thr Gly Leu Gly Thr
20 25 30
Gln Gln Thr Gly Gln Thr Ser Arg Trp Leu Arg Pro Ala Ala Thr Gln
35 40 45
Asp Pro Val Ser Pro Pro Arg Ser Leu Leu Met Lys Gln Arg Lys Phe
50 55 60
Leu Tyr His Phe Lys Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr
65 70 75 80
Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser
85 90 95
Leu Asp Phe Gly Tyr Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu
100 105 110
Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys
115 120 125
Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala
130 135 140
Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg
145 150 155 160
Ile Phe Thr Ala Arg Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro
165 170 175
Glu Gly Leu Arg Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile Met
180 185 190
Thr Phe Lys Asp Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His
195 200 205
Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg
210 215 220
Leu Ser Arg Gln Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp
225 230 235 240
Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu
245 250
<210> 60
<211> 224
<212> PRT
<213> Petromyzon marinus
<220>
<223> Category: reference deaminase
<220>
<223> Description: PmCDA1 L1 AVN88313.1 cytidine deaminase
<400> 60
Met Ala Gly Tyr Glu Cys Val Arg Val Ser Glu Lys Leu Asp Phe Asp
1 5 10 15
Thr Phe Glu Phe Gln Phe Glu Asn Leu His Tyr Ala Thr Glu Arg His
20 25 30
Arg Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Ala Gly Gly Arg
35 40 45
Ser Arg Arg Leu Trp Gly Tyr Ile Ile Asn Asn Pro Asn Val Cys His
50 55 60
Ala Glu Leu Ile Leu Met Ser Met Ile Asp Arg His Leu Glu Ser Asn
65 70 75 80
Pro Gly Val Tyr Ala Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Ala
85 90 95
Asn Cys Ser Ser Lys Leu Asn Pro Trp Leu Lys Asn Leu Leu Glu Glu
100 105 110
Gln Gly His Thr Leu Thr Met His Phe Ser Arg Ile Tyr Asp Arg Asp
115 120 125
Arg Glu Gly Asp His Arg Gly Leu Arg Gly Leu Lys His Val Ser Asn
130 135 140
Ser Phe Arg Met Gly Val Val Gly Arg Ala Glu Val Lys Glu Cys Leu
145 150 155 160
Ala Glu Tyr Val Glu Ala Ser Arg Arg Thr Leu Thr Trp Leu Asp Thr
165 170 175
Thr Glu Ser Met Ala Ala Lys Met Arg Arg Lys Leu Phe Cys Ile Leu
180 185 190
Val Arg Cys Ala Gly Met Arg Glu Ser Gly Ile Pro Leu His Leu Phe
195 200 205
Thr Leu Gln Thr Pro Leu Leu Ser Gly Arg Val Val Trp Trp Arg Val
210 215 220
<210> 61
<211> 208
<212> PRT
<213> Petromyzon marinus
<220>
<223> Category: reference deaminase
<220>
<223> Description: PmCDA1 ABO15149.1 cytosine deaminase
<400> 61
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 62
<211> 199
<212> PRT
<213> Homo sapiens
<220>
<223> Category: reference deaminase
<220>
<223> Description: NP 663745.1 DNA dC- dU-editing deaminase
APOBEC-3A isoform a
<400> 62
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 63
<211> 198
<212> PRT
<213> Homo sapiens
<220>
<223> Category: reference deaminase
<220>
<223> Description: Q9GZX7.1 AICDA Single-stranded DNA cytosine
deaminase (Activation-induced cytidine deaminase, Cytidine
aminohydrolase)
<400> 63
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 64
<211> 197
<212> PRT
<213> Lampetra planeri
<220>
<223> Category: reference deaminase
<220>
<223> Description: LpCDA1L1 3 AVN88320.1 cytidine deaminase
<400> 64
Met Ala Gly Asp Glu Asn Val Arg Val Ser Glu Lys Leu His Phe Asn
1 5 10 15
Thr Phe Glu Phe Glu Phe Glu Asn Leu His Tyr Ala Glu Gly Arg Gly
20 25 30
Gln Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Glu Gly Gly Arg
35 40 45
Gly Glu Arg Leu Trp Gly Tyr Val Arg Asn Lys Pro Leu Gly Asp His
50 55 60
Ala Glu Val Ile Leu Met Ser Lys Ile Asn Asp His Leu Glu Thr His
65 70 75 80
Gln Asp Asn Tyr Thr Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Gly
85 90 95
Lys Cys Ser Ser Glu Leu Val Pro Trp Leu Gln Asn Leu Leu Lys Lys
100 105 110
Gln His Lys Leu Thr Met His Phe Ser Arg Ile Tyr Asp Lys Asp Arg
115 120 125
Ala Val Asp His Arg Gly Leu Cys Asp Leu Gln His Val Val Ser Asn
130 135 140
Gly Phe Gln Met Gly Val Met Gly Gln Thr Glu Val Asp Thr Cys Leu
145 150 155 160
Ala Glu Tyr Val Glu Ala Ser Gly Cys Pro Pro Leu Lys Trp Leu His
165 170 175
Met Thr Asp Ser Asn Ala Thr Gln Met Gln Asp Lys Leu Ser Ser Ile
180 185 190
Leu Met Asn Arg Phe
195
<210> 65
<211> 198
<212> PRT
<213> Lampetra planeri
<220>
<223> Category: reference deaminase
<220>
<223> Description: LpCDA1L1 1 AVN88319.1 cytidine deaminase
<400> 65
Met Ala Gly Asp Glu Asn Val Arg Val Ser Lys Lys Leu Asp Phe Asn
1 5 10 15
Thr Phe Glu Phe Glu Phe Glu Asn Leu His Tyr Ala Glu Gly Arg Gly
20 25 30
Arg Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Glu Gly Gly Arg
35 40 45
Gly Glu Arg Leu Trp Gly Tyr Val Arg Asn Asn Pro Leu Asp Asp His
50 55 60
Ala Glu Val Ile Leu Met Ser Lys Ile Asn Asp His Leu Glu Thr His
65 70 75 80
Gln Gly Asn Tyr Thr Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Gly
85 90 95
Asn Cys Ser Ser Glu Leu Val Pro Trp Leu Gln Asn Leu Leu Glu Glu
100 105 110
Gln Gln His Thr Leu Thr Met Tyr Phe Ser Arg Ile Tyr Asp Lys Asp
115 120 125
Arg Ala Val Asp His Arg Gly Leu Cys Asp Leu Gln His Val Val Ser
130 135 140
Asn Gly Phe Gln Met Gly Val Met Gly Gln Thr Glu Val Asp Thr Cys
145 150 155 160
Leu Ala Glu Tyr Val Glu Ala Ser Gly Cys Pro Pro Leu Lys Trp Leu
165 170 175
His Met Thr Asp Ser Asn Ala Thr Gln Thr Gln Asp Lys Leu Ser Ser
180 185 190
Ile Leu Met Asn Arg Phe
195
<210> 66
<211> 642
<212> DNA
<213> Lampetra planeri
<220>
<223> Category: reference deaminase
<220>
<223> Description: ljCDA1 cytidine deaminase
<400> 66
gccaacgccg agtacgtgcg cgtgggcgag aagctggaca gctgcacctt ccgcacccag 60
ttcctgaact accgccgcag ccgcagccgc cgctgctgcg tgatcttcga gctgaagcgc 120
cagaacagcc gcgtgcgctt ctggggctac gccatgaaca agccctggag caacgccgac 180
gtgggcatcc acgccgagtt cttctgcatc aagaaggtga agaagtacct gcgcaagaac 240
cccggcatct acaccatcaa ctggtacagc agctggagcc cctgcgccaa ctgcgccgag 300
aagatcctga actggtacaa caagaagctg atgggcaagg gccacaccct gaagatttgg 360
gcctgcaagc tgtacttcga gaacatcaag cgcaaccaga tcggcctgtg gaacctgcgc 420
aacaacggcg tgggcctggc catcatgctg ggcgagcact accagtggtg ctggaacaac 480
tacatccaga ccctgggccg caacctgaac gagaacaagt ggctgaaaaa gaccagcaac 540
cgcgcccgca cccgccgcag cgagctgagc atcatgatcc acgtgaagcg cctgcacacc 600
gcccgcctgc tgctgttcaa gcgcctgtgc ggctggttca gc 642
<210> 67
<211> 84
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Bacillus phage PBS2 sequence
<220>
<223> Category: reference UGI
<220>
<223> Description: P14739 UNGI BPPB2 (UGI)
<400> 67
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu
<210> 68
<211> 1245
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: adenine base editor
<220>
<223> Description: linker-His tag-adenine deaminse-linker-nickase
-linker-SV40 NLS
<400> 68
Met Gly Ser Ser His His His His His His Ser Glu Val Glu Phe Ser
1 5 10 15
His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg
20 25 30
Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg
35 40 45
Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr
50 55 60
Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln
65 70 75 80
Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Ser Thr Phe Glu Pro Cys
85 90 95
Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
100 105 110
Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
115 120 125
Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
130 135 140
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met
145 150 155 160
Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
165 170 175
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
180 185 190
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
195 200 205
Met Lys Lys Lys Val Phe Ala Phe Ala Leu Gly Lys Ala Ser Ile Gly
210 215 220
Tyr Cys Val Arg Asp Gly Phe Asn Ile Asn Glu Ala Asn Ser Ile Ile
225 230 235 240
Ile Asp Lys Asp His Ala Glu Thr Met Ser Leu Arg Asp Arg Arg Arg
245 250 255
Ile Lys Lys Thr Leu Asp Ala His His Ala Arg Glu Glu Tyr Phe Asn
260 265 270
Lys Val Trp Ser Gly Val Gly Leu Asn Ile Leu Asp Lys Asn Asn Asn
275 280 285
Asn Phe Lys Lys Glu Phe Pro Ser Lys Asn Glu Asp Val Ile Tyr Thr
290 295 300
Ser Cys Leu Leu Arg Ile Ala Leu Leu Gln Asn Gln Lys Leu Glu Glu
305 310 315 320
Trp Gln Ile Tyr Lys Ala Leu Tyr Asn Ala Phe Gln Arg Arg Gly Tyr
325 330 335
Asp Val Asn Ile Ala Trp Lys Ser Val Gln Thr Asp Asp Asp Lys Glu
340 345 350
Asn Ile Glu Arg Met Lys Lys Tyr Thr Cys Glu Asn Asp Ile Glu Leu
355 360 365
Ile Ile Ser Asp Glu Tyr Lys Tyr Pro Cys Tyr Tyr Asp Ala Leu Arg
370 375 380
Leu Gly Leu Trp Asn Glu Asp Glu Pro Thr Lys Leu Asn Arg Ser Ile
385 390 395 400
Pro Gln His Asn Ser Asn Lys Val Arg Thr Thr Glu Tyr Val Ala Pro
405 410 415
Arg Glu Leu Val Glu Lys Glu Leu Lys Gln Leu Trp Leu Asn Ala Gln
420 425 430
Leu Gln Leu Pro Gln Leu Asn Ser Ile Ser Ala Glu Glu Phe Leu Tyr
435 440 445
Gly Glu Tyr Lys Ile Pro Tyr Gly Ser Cys Val Gln Lys Glu Phe Lys
450 455 460
Gln Tyr Arg Gly Thr Lys Lys Asp Trp Gln Gly Val Leu Cys Gln Lys
465 470 475 480
Ile Pro Arg Phe Asp Asn Arg Ile Ile Ala Lys Cys Lys Leu Leu Pro
485 490 495
Lys Arg Asn Val Cys Lys Ala Asn Thr Ile Glu Asn Val Ser Phe Val
500 505 510
Leu Leu Met Lys Leu Lys Asn Leu Arg Phe Thr Val Ile Ser Gly Glu
515 520 525
Lys Leu Arg Leu Ser Pro Val Gln Ile Lys Gln Ile Tyr Glu Asn Trp
530 535 540
Leu Glu Lys Val Glu Asp Thr Tyr Asn Lys Asp Leu Glu Lys Ala Glu
545 550 555 560
Lys Leu Gly Lys Glu Asn Pro Glu Lys Arg Leu Asn Ile Thr Ile Thr
565 570 575
Arg Gln Glu Ile Glu Lys Ile Ile Gly Glu Lys Ile Ile Asp Lys Ile
580 585 590
Glu Pro Met Lys Ala Asp Ile Ser Gly Arg Ser Ser Phe Cys Arg Arg
595 600 605
Ala Cys Gln Ile Met Asn Lys Ile Ile Leu Asp Gly Glu Leu Tyr Pro
610 615 620
Gln Asn Val Asp Ile Ser Glu Phe Val Asp Arg Asp Asn Ala Lys Asn
625 630 635 640
Gly Ile Thr Glu Glu Glu Ile Gln Ser Met Leu Ser Lys Ile Gly Asp
645 650 655
Trp Asn Asn Leu Tyr Ile Pro Asp Asn Arg Glu Glu Asn Ala Gln Asn
660 665 670
Ala Ser Asn Ser Arg Ile Lys Thr Asp Ile Met Leu Gly Asn Ile Thr
675 680 685
Asn Pro Ile Val Arg Asn Arg Leu Gln Ile Phe Arg Asp Leu Leu Leu
690 695 700
Asn Leu Ala Glu Lys Tyr Gly Thr Pro Asp Glu Val Ile Phe Glu Phe
705 710 715 720
Val Arg Asp Gly Ala Asp Asn Ser Leu Tyr Gly Ser Lys Lys Ala Gln
725 730 735
Asp Thr Glu Arg Phe Met Lys Gln Gln Glu Lys Glu Asn Glu Gln Ile
740 745 750
Ile Asn Glu Leu Lys Asp Ala Gly Leu Tyr Val Asn Gly Gln Asn His
755 760 765
Ala Asn Ala Thr Tyr Phe Leu Met His Lys Leu Leu Lys Ser Gln Gly
770 775 780
Gly Lys Cys Ile Tyr Ser Gly Gln Asn Ile Ser Pro Ser Asn Tyr Asp
785 790 795 800
Glu Cys Glu Ile Asp His Ile Tyr Pro Arg Thr Leu Gly Gly Asn Asp
805 810 815
Ala Leu Tyr Asn Lys Val Val Cys Tyr Arg Arg Glu Asn Gln Asp Lys
820 825 830
Lys Gly Arg Thr Pro Tyr Glu Trp Leu Ser Pro Asp Ser Asp Lys Trp
835 840 845
Ala Asn Tyr Val Asn Arg Leu Asn Lys Ile Lys Lys Gln Leu Gly Lys
850 855 860
Lys Lys Phe Glu Leu Leu Thr Ser Lys Pro Glu Asp Cys Glu Lys Leu
865 870 875 880
Ile Glu Ser Tyr Asn Gly Leu Ala Glu Thr Ser His Ile Ala Arg Val
885 890 895
Ala Gln Gln Met Thr Ala Phe Ile Phe Gly Trp Gly Leu Gln Ile Gln
900 905 910
Gly Glu Ser Arg Arg Ile Phe Val Asn Asn Gly Ser Ser Thr Cys Ala
915 920 925
Ile Arg Lys Arg Tyr Gly Leu Asn Lys Leu Leu Gly Asp Asn Leu Lys
930 935 940
Lys Asn Arg Ser Asn Asp Lys His His Ala Leu Asp Ala Ile Cys Ile
945 950 955 960
Ser Phe Ser Arg Asp Phe Lys Tyr Asp Lys Glu Ile Lys Lys Asp Ile
965 970 975
Ile Lys Gly Phe Asn Pro Glu Ile Val Lys Asn Ala Ile Asp Lys Ile
980 985 990
Met Pro Tyr Pro Tyr Ala Asn Asp Lys Pro Phe Lys Gly Asn Thr Lys
995 1000 1005
Pro Leu Glu Thr Ile Tyr Gly Leu Arg Thr Tyr Gly Asp Lys Ser
1010 1015 1020
Tyr Ile Thr Gln Arg Val Glu Leu Asn Ser Ile Asp Lys Lys Ala
1025 1030 1035
Thr Lys Ile Lys Ser Ile Ile Asp Glu Thr Ile Lys Asn Asp Leu
1040 1045 1050
Leu Asn Lys Leu Lys Glu Asn Pro Thr Glu Gln Glu Trp Lys Leu
1055 1060 1065
Met Leu Gln Asn Tyr Ile His Pro Lys Lys Gln Thr Lys Val Lys
1070 1075 1080
Lys Val Met Ile Ser Val Ser Glu Gly Glu Ile Thr Lys Asp Ser
1085 1090 1095
Asn Asn Arg Glu Arg Met Gly Glu Phe Val Asp Phe Gly Thr Lys
1100 1105 1110
Gly Thr Gln His Gln Phe Lys His Ser Lys Arg His Lys Gly Gln
1115 1120 1125
Ile Leu Tyr Phe Asn Glu Lys Gly Val Val Glu Val Met Pro Val
1130 1135 1140
Tyr Ser Asn Ile Lys Thr Thr Asp Val Lys Asp Lys Leu Gln Asn
1145 1150 1155
Met Gly Cys Lys Leu Tyr Asn Lys Gly Gln Met Phe Tyr Ser Gly
1160 1165 1170
Cys Leu Val Asp Ile Pro Lys Pro Phe Lys Ala Gly Ser Lys Glu
1175 1180 1185
Tyr Pro Ala Gly Arg Tyr Gln Ile Lys Thr Ile Arg Ser Asp Lys
1190 1195 1200
Val Ala Glu Leu Glu Asp Ala Cys Gly Asn Lys Ile Ser Thr Asn
1205 1210 1215
Val Lys Tyr Leu Val Pro Ala Glu Phe Lys Lys Val Glu Ser Lys
1220 1225 1230
Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1235 1240 1245
<210> 69
<211> 1380
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: cytosine base editor
<220>
<223> Description: linker-His tag-cytidine deaminase-linker-nickase
-linker-uracil glycosylase inhibitor-linker-SV40 NLS
<400> 69
Met Gly Ser Ser His His His His His His Met Ser Ser Glu Thr Gly
1 5 10 15
Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu
20 25 30
Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu
35 40 45
Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr
50 55 60
Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe
65 70 75 80
Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp
85 90 95
Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu
100 105 110
Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg
115 120 125
Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu
130 135 140
Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly
145 150 155 160
Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His
165 170 175
Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu
180 185 190
Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg
195 200 205
Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His
210 215 220
Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser
225 230 235 240
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ala
245 250 255
Met Lys Lys Lys Val Phe Ala Phe Ala Leu Gly Lys Ala Ser Ile Gly
260 265 270
Tyr Cys Val Arg Asp Gly Phe Asn Ile Asn Glu Ala Asn Ser Ile Ile
275 280 285
Ile Asp Lys Asp His Ala Glu Thr Met Ser Leu Arg Asp Arg Arg Arg
290 295 300
Ile Lys Lys Thr Leu Asp Ala His His Ala Arg Glu Glu Tyr Phe Asn
305 310 315 320
Lys Val Trp Ser Gly Val Gly Leu Asn Ile Leu Asp Lys Asn Asn Asn
325 330 335
Asn Phe Lys Lys Glu Phe Pro Ser Lys Asn Glu Asp Val Ile Tyr Thr
340 345 350
Ser Cys Leu Leu Arg Ile Ala Leu Leu Gln Asn Gln Lys Leu Glu Glu
355 360 365
Trp Gln Ile Tyr Lys Ala Leu Tyr Asn Ala Phe Gln Arg Arg Gly Tyr
370 375 380
Asp Val Asn Ile Ala Trp Lys Ser Val Gln Thr Asp Asp Asp Lys Glu
385 390 395 400
Asn Ile Glu Arg Met Lys Lys Tyr Thr Cys Glu Asn Asp Ile Glu Leu
405 410 415
Ile Ile Ser Asp Glu Tyr Lys Tyr Pro Cys Tyr Tyr Asp Ala Leu Arg
420 425 430
Leu Gly Leu Trp Asn Glu Asp Glu Pro Thr Lys Leu Asn Arg Ser Ile
435 440 445
Pro Gln His Asn Ser Asn Lys Val Arg Thr Thr Glu Tyr Val Ala Pro
450 455 460
Arg Glu Leu Val Glu Lys Glu Leu Lys Gln Leu Trp Leu Asn Ala Gln
465 470 475 480
Leu Gln Leu Pro Gln Leu Asn Ser Ile Ser Ala Glu Glu Phe Leu Tyr
485 490 495
Gly Glu Tyr Lys Ile Pro Tyr Gly Ser Cys Val Gln Lys Glu Phe Lys
500 505 510
Gln Tyr Arg Gly Thr Lys Lys Asp Trp Gln Gly Val Leu Cys Gln Lys
515 520 525
Ile Pro Arg Phe Asp Asn Arg Ile Ile Ala Lys Cys Lys Leu Leu Pro
530 535 540
Lys Arg Asn Val Cys Lys Ala Asn Thr Ile Glu Asn Val Ser Phe Val
545 550 555 560
Leu Leu Met Lys Leu Lys Asn Leu Arg Phe Thr Val Ile Ser Gly Glu
565 570 575
Lys Leu Arg Leu Ser Pro Val Gln Ile Lys Gln Ile Tyr Glu Asn Trp
580 585 590
Leu Glu Lys Val Glu Asp Thr Tyr Asn Lys Asp Leu Glu Lys Ala Glu
595 600 605
Lys Leu Gly Lys Glu Asn Pro Glu Lys Arg Leu Asn Ile Thr Ile Thr
610 615 620
Arg Gln Glu Ile Glu Lys Ile Ile Gly Glu Lys Ile Ile Asp Lys Ile
625 630 635 640
Glu Pro Met Lys Ala Asp Ile Ser Gly Arg Ser Ser Phe Cys Arg Arg
645 650 655
Ala Cys Gln Ile Met Asn Lys Ile Ile Leu Asp Gly Glu Leu Tyr Pro
660 665 670
Gln Asn Val Asp Ile Ser Glu Phe Val Asp Arg Asp Asn Ala Lys Asn
675 680 685
Gly Ile Thr Glu Glu Glu Ile Gln Ser Met Leu Ser Lys Ile Gly Asp
690 695 700
Trp Asn Asn Leu Tyr Ile Pro Asp Asn Arg Glu Glu Asn Ala Gln Asn
705 710 715 720
Ala Ser Asn Ser Arg Ile Lys Thr Asp Ile Met Leu Gly Asn Ile Thr
725 730 735
Asn Pro Ile Val Arg Asn Arg Leu Gln Ile Phe Arg Asp Leu Leu Leu
740 745 750
Asn Leu Ala Glu Lys Tyr Gly Thr Pro Asp Glu Val Ile Phe Glu Phe
755 760 765
Val Arg Asp Gly Ala Asp Asn Ser Leu Tyr Gly Ser Lys Lys Ala Gln
770 775 780
Asp Thr Glu Arg Phe Met Lys Gln Gln Glu Lys Glu Asn Glu Gln Ile
785 790 795 800
Ile Asn Glu Leu Lys Asp Ala Gly Leu Tyr Val Asn Gly Gln Asn His
805 810 815
Ala Asn Ala Thr Tyr Phe Leu Met His Lys Leu Leu Lys Ser Gln Gly
820 825 830
Gly Lys Cys Ile Tyr Ser Gly Gln Asn Ile Ser Pro Ser Asn Tyr Asp
835 840 845
Glu Cys Glu Ile Asp His Ile Tyr Pro Arg Thr Leu Gly Gly Asn Asp
850 855 860
Ala Leu Tyr Asn Lys Val Val Cys Tyr Arg Arg Glu Asn Gln Asp Lys
865 870 875 880
Lys Gly Arg Thr Pro Tyr Glu Trp Leu Ser Pro Asp Ser Asp Lys Trp
885 890 895
Ala Asn Tyr Val Asn Arg Leu Asn Lys Ile Lys Lys Gln Leu Gly Lys
900 905 910
Lys Lys Phe Glu Leu Leu Thr Ser Lys Pro Glu Asp Cys Glu Lys Leu
915 920 925
Ile Glu Ser Tyr Asn Gly Leu Ala Glu Thr Ser His Ile Ala Arg Val
930 935 940
Ala Gln Gln Met Thr Ala Phe Ile Phe Gly Trp Gly Leu Gln Ile Gln
945 950 955 960
Gly Glu Ser Arg Arg Ile Phe Val Asn Asn Gly Ser Ser Thr Cys Ala
965 970 975
Ile Arg Lys Arg Tyr Gly Leu Asn Lys Leu Leu Gly Asp Asn Leu Lys
980 985 990
Lys Asn Arg Ser Asn Asp Lys His His Ala Leu Asp Ala Ile Cys Ile
995 1000 1005
Ser Phe Ser Arg Asp Phe Lys Tyr Asp Lys Glu Ile Lys Lys Asp
1010 1015 1020
Ile Ile Lys Gly Phe Asn Pro Glu Ile Val Lys Asn Ala Ile Asp
1025 1030 1035
Lys Ile Met Pro Tyr Pro Tyr Ala Asn Asp Lys Pro Phe Lys Gly
1040 1045 1050
Asn Thr Lys Pro Leu Glu Thr Ile Tyr Gly Leu Arg Thr Tyr Gly
1055 1060 1065
Asp Lys Ser Tyr Ile Thr Gln Arg Val Glu Leu Asn Ser Ile Asp
1070 1075 1080
Lys Lys Ala Thr Lys Ile Lys Ser Ile Ile Asp Glu Thr Ile Lys
1085 1090 1095
Asn Asp Leu Leu Asn Lys Leu Lys Glu Asn Pro Thr Glu Gln Glu
1100 1105 1110
Trp Lys Leu Met Leu Gln Asn Tyr Ile His Pro Lys Lys Gln Thr
1115 1120 1125
Lys Val Lys Lys Val Met Ile Ser Val Ser Glu Gly Glu Ile Thr
1130 1135 1140
Lys Asp Ser Asn Asn Arg Glu Arg Met Gly Glu Phe Val Asp Phe
1145 1150 1155
Gly Thr Lys Gly Thr Gln His Gln Phe Lys His Ser Lys Arg His
1160 1165 1170
Lys Gly Gln Ile Leu Tyr Phe Asn Glu Lys Gly Val Val Glu Val
1175 1180 1185
Met Pro Val Tyr Ser Asn Ile Lys Thr Thr Asp Val Lys Asp Lys
1190 1195 1200
Leu Gln Asn Met Gly Cys Lys Leu Tyr Asn Lys Gly Gln Met Phe
1205 1210 1215
Tyr Ser Gly Cys Leu Val Asp Ile Pro Lys Pro Phe Lys Ala Gly
1220 1225 1230
Ser Lys Glu Tyr Pro Ala Gly Arg Tyr Gln Ile Lys Thr Ile Arg
1235 1240 1245
Ser Asp Lys Val Ala Glu Leu Glu Asp Ala Cys Gly Asn Lys Ile
1250 1255 1260
Ser Thr Asn Val Lys Tyr Leu Val Pro Ala Glu Phe Lys Lys Val
1265 1270 1275
Glu Ser Lys Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1280 1285 1290
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1295 1300 1305
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1310 1315 1320
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1325 1330 1335
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1340 1345 1350
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1355 1360 1365
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1370 1375 1380
<210> 70
<211> 1025
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG1-4 (D9A) nickase
<400> 70
Met Lys Lys Lys Val Phe Ala Phe Ala Leu Gly Lys Ala Ser Ile Gly
1 5 10 15
Tyr Cys Val Arg Asp Gly Phe Asn Ile Asn Glu Ala Asn Ser Ile Ile
20 25 30
Ile Asp Lys Asp His Ala Glu Thr Met Ser Leu Arg Asp Arg Arg Arg
35 40 45
Ile Lys Lys Thr Leu Asp Ala His His Ala Arg Glu Glu Tyr Phe Asn
50 55 60
Lys Val Trp Ser Gly Val Gly Leu Asn Ile Leu Asp Lys Asn Asn Asn
65 70 75 80
Asn Phe Lys Lys Glu Phe Pro Ser Lys Asn Glu Asp Val Ile Tyr Thr
85 90 95
Ser Cys Leu Leu Arg Ile Ala Leu Leu Gln Asn Gln Lys Leu Glu Glu
100 105 110
Trp Gln Ile Tyr Lys Ala Leu Tyr Asn Ala Phe Gln Arg Arg Gly Tyr
115 120 125
Asp Val Asn Ile Ala Trp Lys Ser Val Gln Thr Asp Asp Asp Lys Glu
130 135 140
Asn Ile Glu Arg Met Lys Lys Tyr Thr Cys Glu Asn Asp Ile Glu Leu
145 150 155 160
Ile Ile Ser Asp Glu Tyr Lys Tyr Pro Cys Tyr Tyr Asp Ala Leu Arg
165 170 175
Leu Gly Leu Trp Asn Glu Asp Glu Pro Thr Lys Leu Asn Arg Ser Ile
180 185 190
Pro Gln His Asn Ser Asn Lys Val Arg Thr Thr Glu Tyr Val Ala Pro
195 200 205
Arg Glu Leu Val Glu Lys Glu Leu Lys Gln Leu Trp Leu Asn Ala Gln
210 215 220
Leu Gln Leu Pro Gln Leu Asn Ser Ile Ser Ala Glu Glu Phe Leu Tyr
225 230 235 240
Gly Glu Tyr Lys Ile Pro Tyr Gly Ser Cys Val Gln Lys Glu Phe Lys
245 250 255
Gln Tyr Arg Gly Thr Lys Lys Asp Trp Gln Gly Val Leu Cys Gln Lys
260 265 270
Ile Pro Arg Phe Asp Asn Arg Ile Ile Ala Lys Cys Lys Leu Leu Pro
275 280 285
Lys Arg Asn Val Cys Lys Ala Asn Thr Ile Glu Asn Val Ser Phe Val
290 295 300
Leu Leu Met Lys Leu Lys Asn Leu Arg Phe Thr Val Ile Ser Gly Glu
305 310 315 320
Lys Leu Arg Leu Ser Pro Val Gln Ile Lys Gln Ile Tyr Glu Asn Trp
325 330 335
Leu Glu Lys Val Glu Asp Thr Tyr Asn Lys Asp Leu Glu Lys Ala Glu
340 345 350
Lys Leu Gly Lys Glu Asn Pro Glu Lys Arg Leu Asn Ile Thr Ile Thr
355 360 365
Arg Gln Glu Ile Glu Lys Ile Ile Gly Glu Lys Ile Ile Asp Lys Ile
370 375 380
Glu Pro Met Lys Ala Asp Ile Ser Gly Arg Ser Ser Phe Cys Arg Arg
385 390 395 400
Ala Cys Gln Ile Met Asn Lys Ile Ile Leu Asp Gly Glu Leu Tyr Pro
405 410 415
Gln Asn Val Asp Ile Ser Glu Phe Val Asp Arg Asp Asn Ala Lys Asn
420 425 430
Gly Ile Thr Glu Glu Glu Ile Gln Ser Met Leu Ser Lys Ile Gly Asp
435 440 445
Trp Asn Asn Leu Tyr Ile Pro Asp Asn Arg Glu Glu Asn Ala Gln Asn
450 455 460
Ala Ser Asn Ser Arg Ile Lys Thr Asp Ile Met Leu Gly Asn Ile Thr
465 470 475 480
Asn Pro Ile Val Arg Asn Arg Leu Gln Ile Phe Arg Asp Leu Leu Leu
485 490 495
Asn Leu Ala Glu Lys Tyr Gly Thr Pro Asp Glu Val Ile Phe Glu Phe
500 505 510
Val Arg Asp Gly Ala Asp Asn Ser Leu Tyr Gly Ser Lys Lys Ala Gln
515 520 525
Asp Thr Glu Arg Phe Met Lys Gln Gln Glu Lys Glu Asn Glu Gln Ile
530 535 540
Ile Asn Glu Leu Lys Asp Ala Gly Leu Tyr Val Asn Gly Gln Asn His
545 550 555 560
Ala Asn Ala Thr Tyr Phe Leu Met His Lys Leu Leu Lys Ser Gln Gly
565 570 575
Gly Lys Cys Ile Tyr Ser Gly Gln Asn Ile Ser Pro Ser Asn Tyr Asp
580 585 590
Glu Cys Glu Ile Asp His Ile Tyr Pro Arg Thr Leu Gly Gly Asn Asp
595 600 605
Ala Leu Tyr Asn Lys Val Val Cys Tyr Arg Arg Glu Asn Gln Asp Lys
610 615 620
Lys Gly Arg Thr Pro Tyr Glu Trp Leu Ser Pro Asp Ser Asp Lys Trp
625 630 635 640
Ala Asn Tyr Val Asn Arg Leu Asn Lys Ile Lys Lys Gln Leu Gly Lys
645 650 655
Lys Lys Phe Glu Leu Leu Thr Ser Lys Pro Glu Asp Cys Glu Lys Leu
660 665 670
Ile Glu Ser Tyr Asn Gly Leu Ala Glu Thr Ser His Ile Ala Arg Val
675 680 685
Ala Gln Gln Met Thr Ala Phe Ile Phe Gly Trp Gly Leu Gln Ile Gln
690 695 700
Gly Glu Ser Arg Arg Ile Phe Val Asn Asn Gly Ser Ser Thr Cys Ala
705 710 715 720
Ile Arg Lys Arg Tyr Gly Leu Asn Lys Leu Leu Gly Asp Asn Leu Lys
725 730 735
Lys Asn Arg Ser Asn Asp Lys His His Ala Leu Asp Ala Ile Cys Ile
740 745 750
Ser Phe Ser Arg Asp Phe Lys Tyr Asp Lys Glu Ile Lys Lys Asp Ile
755 760 765
Ile Lys Gly Phe Asn Pro Glu Ile Val Lys Asn Ala Ile Asp Lys Ile
770 775 780
Met Pro Tyr Pro Tyr Ala Asn Asp Lys Pro Phe Lys Gly Asn Thr Lys
785 790 795 800
Pro Leu Glu Thr Ile Tyr Gly Leu Arg Thr Tyr Gly Asp Lys Ser Tyr
805 810 815
Ile Thr Gln Arg Val Glu Leu Asn Ser Ile Asp Lys Lys Ala Thr Lys
820 825 830
Ile Lys Ser Ile Ile Asp Glu Thr Ile Lys Asn Asp Leu Leu Asn Lys
835 840 845
Leu Lys Glu Asn Pro Thr Glu Gln Glu Trp Lys Leu Met Leu Gln Asn
850 855 860
Tyr Ile His Pro Lys Lys Gln Thr Lys Val Lys Lys Val Met Ile Ser
865 870 875 880
Val Ser Glu Gly Glu Ile Thr Lys Asp Ser Asn Asn Arg Glu Arg Met
885 890 895
Gly Glu Phe Val Asp Phe Gly Thr Lys Gly Thr Gln His Gln Phe Lys
900 905 910
His Ser Lys Arg His Lys Gly Gln Ile Leu Tyr Phe Asn Glu Lys Gly
915 920 925
Val Val Glu Val Met Pro Val Tyr Ser Asn Ile Lys Thr Thr Asp Val
930 935 940
Lys Asp Lys Leu Gln Asn Met Gly Cys Lys Leu Tyr Asn Lys Gly Gln
945 950 955 960
Met Phe Tyr Ser Gly Cys Leu Val Asp Ile Pro Lys Pro Phe Lys Ala
965 970 975
Gly Ser Lys Glu Tyr Pro Ala Gly Arg Tyr Gln Ile Lys Thr Ile Arg
980 985 990
Ser Asp Lys Val Ala Glu Leu Glu Asp Ala Cys Gly Asn Lys Ile Ser
995 1000 1005
Thr Asn Val Lys Tyr Leu Val Pro Ala Glu Phe Lys Lys Val Glu
1010 1015 1020
Ser Lys
1025
<210> 71
<211> 1059
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG1-6 (D13A) nickase
<400> 71
Met Glu Lys Glu Lys Asn Asn His Val Trp Gly Phe Ala Ile Gly Lys
1 5 10 15
Gly Ser Leu Gly Glu Ala Val Arg Val Gly Gly Asp Phe Lys His Ile
20 25 30
Ala Ser Val Leu Leu Asp Pro Glu Phe Gly Glu Ile Lys Thr Ala Ala
35 40 45
Leu Ala Arg Arg Gln Met Arg Thr Arg Lys Ala His Lys Ala Arg Glu
50 55 60
Lys Trp Leu Glu Glu Cys Leu Asp Gly Thr Gly Val Glu Ile Leu Lys
65 70 75 80
Arg Arg Glu Val Gly Ile Val Asp Gly Gln Trp Arg Leu Ile Ser Lys
85 90 95
Gly Asp Glu Arg Leu Glu Arg Glu Phe Pro Pro Asn Gly Glu Glu Val
100 105 110
Cys Tyr Asn Ser Ile Ala Leu Arg Cys Lys Leu Leu Leu Gly Glu Lys
115 120 125
Leu Glu Gly Trp Gln Val Phe Lys Ala Leu Asn Ser Ala Ile Gln Lys
130 135 140
Arg Gly Tyr Asp Glu Asn Ile Pro Trp Gly Glu Ala Glu Glu Lys Ser
145 150 155 160
Ser Lys Lys Asp Glu Asp Asp Tyr Ala Gln Lys Leu Ser Gln Tyr Glu
165 170 175
Arg Glu Lys Ser Glu Leu Phe Glu Ser Phe Ala Asp Gly Glu Lys Tyr
180 185 190
Asp Phe Pro Cys Phe Phe Lys Ala Tyr Lys Met Gly Leu Trp Ser Pro
195 200 205
Glu Asn Pro Arg Arg Val Glu Val Arg Ile Asp Cys Arg Ala Gln Lys
210 215 220
Ala Lys Ser Tyr Val Val Ala Arg Lys Tyr Val Glu Arg Glu Phe Glu
225 230 235 240
Cys Leu Val Glu Ala Ala Ala Lys Phe Phe Pro Lys Leu Lys Gly Arg
245 250 255
Ala Lys Phe Ile Leu Tyr Gly Val Ser Glu Thr Pro Tyr Ala Ser Tyr
260 265 270
Tyr Gly Asn Met Arg Lys Lys Phe Gly Leu Lys Arg Gly Ala Glu Ser
275 280 285
Asp Trp Thr Ala Leu Gly Gln Lys Val Pro Arg Phe Asp Asn Arg Ile
290 295 300
Ile Asp Lys Cys Arg Leu Ile Pro Arg Met Asn Val Cys Lys Ile Arg
305 310 315 320
Pro Leu Asn Glu Ala Arg Asn Glu Lys Asp Leu Leu Tyr Tyr Glu Val
325 330 335
Thr Leu Ala Leu Lys Leu Leu Asn Leu Arg Phe Phe Arg Asn Ser Asn
340 345 350
Ile Glu Gln Leu Thr Phe Glu Glu Phe Lys Lys Ala Phe Glu Ile Ala
355 360 365
Ser Gly Ala Lys Tyr Lys Met Thr Lys Thr Ala Met Lys Lys Phe Leu
370 375 380
Lys Ser Ile Ser Ala Thr Ala Leu Gly Asp Asp Tyr Ala Glu Ile Glu
385 390 395 400
Pro Pro Lys Glu Ser Gly Arg Ala Ser Phe Ser Arg Pro Ala Met Asp
405 410 415
Ile Leu Lys Glu Leu Ile Phe Ser Gly Met Pro Pro Arg Glu Phe Tyr
420 425 430
Gly Arg Lys Ile Pro Glu Ile Ser Asn Thr Asp Lys Asn Lys Gly Val
435 440 445
Val Ala Ser Asp Leu Asp Phe Ile Lys Leu Met Gly Asp Cys Pro Trp
450 455 460
Gly Gly Ile Phe Ile Pro Asp Val Gln Thr Tyr Gln Phe Ala Asn Ala
465 470 475 480
Ala Phe Pro Asn Pro Asp Ala Gln Ile Asn Lys Leu Ile Gly Ser Gln
485 490 495
Asn Asn Pro Ile Val Arg His Arg Leu Thr Phe Phe Phe Glu Arg Ile
500 505 510
Lys Phe Leu Glu Ser Lys Tyr Gly Val Pro Asp Lys Val Val Leu Glu
515 520 525
Phe Val Arg Asp Asp Phe Met Gly Glu Lys Glu Lys Lys Glu Met Arg
530 535 540
Ile Ala Met Lys Lys Arg Ala Glu Glu Lys Met Met Ile Ala Lys Asp
545 550 555 560
Leu Asp Glu His Gly Phe Lys Gly Gly Asn Leu Leu Leu Lys Met Glu
565 570 575
Leu Tyr Arg Lys Gln Asn Gly Ile Cys Leu Tyr Thr Gly Asp Ala Leu
580 585 590
Pro Leu Ser Glu Leu Ala Thr Leu Glu Ile Glu His Ile Val Pro Arg
595 600 605
Ser Arg Gly Gly Pro Asp Ala Gln Tyr Asn Tyr Val Ile Thr Arg Glu
610 615 620
Lys Thr Asn Lys Leu Lys Gly Asp Lys Thr Pro Tyr Glu Trp Leu Ser
625 630 635 640
Ser Asp Ala Lys Glu Trp Ala Ser Tyr Thr Asp Arg Val Asn Ala Cys
645 650 655
Ala Lys Ala Leu Gly Lys Lys Arg Cys Arg Leu Leu Leu Glu Lys Asp
660 665 670
Ala Glu Glu Leu Val Glu Lys Tyr Thr Ala Leu Ala Glu Thr Ala His
675 680 685
Ile Ala Lys Leu Ala Gln Lys Ile Val Cys Met His Phe Gly Phe Gln
690 695 700
Phe Gly Gly Leu Ser Gly Thr Lys Arg Val Phe Thr Val Pro Gly Ala
705 710 715 720
Leu Thr Ser Arg Ile Arg Lys Phe Tyr Gly Leu Asp Arg Ile Leu His
725 730 735
Asn Ala Ala Ala Glu Ser Glu Asn Leu Ser Phe Glu Glu Phe Leu Lys
740 745 750
Phe Ser Glu Asp Leu Glu Lys Lys Asn Arg Lys Asn Lys Lys His His
755 760 765
Ala Leu Asp Ala Met Cys Leu Cys Phe Ala Pro Thr Gly Val Asp Ser
770 775 780
Arg Arg Ala Lys Leu Gly Glu Ile Leu Pro Glu Lys Leu Arg Ser Glu
785 790 795 800
Lys Ala Ala Arg Glu Phe Phe Lys Ser Tyr Leu Asp Lys Ile Met Pro
805 810 815
Val Asp Val Ala Pro Lys Lys Pro Arg Leu Glu Asp Gly Ile Tyr Ser
820 825 830
Lys Arg Ile Ile Gly Gly Lys Ala Cys Met Val Lys Arg Asn Asn Leu
835 840 845
Val Asp Leu Ala Tyr Lys Ser Gly Leu Lys Pro Val Phe Asp Ile Pro
850 855 860
Thr Leu Ile Lys Leu Val Asp Lys Lys Glu Lys Gly Ile Ile Asn Pro
865 870 875 880
Gln Ile Arg Lys Met Ile Gly Glu Phe Ala Ala Thr Asn Pro Asp Glu
885 890 895
Ser Ala Trp Arg Lys Trp Cys Glu Glu Val Arg Leu Pro Ser Lys Ser
900 905 910
Gly Leu Gly Ala Arg Val Leu Arg Val Leu Val Tyr Tyr Gly Glu Ala
915 920 925
Asp Glu Tyr Lys Asp Leu Ser Lys Asp Gly Cys Gly Ala Tyr Arg Lys
930 935 940
Gly Asp Gly His Lys Gly Gln Val Val Trp Glu Ser Val Asp Gly Lys
945 950 955 960
Tyr Tyr Val Glu Pro Val Tyr Val His Ala Ser Lys Ala Gly Val Met
965 970 975
Ala Ala Leu Asn Ala Asn Pro Lys Lys Lys Arg Ile Cys Gly Met Phe
980 985 990
Asn Ser His Cys Thr Val Asp Val Gly Asp Val Tyr Asn Asp Arg Gly
995 1000 1005
Asp Phe Ile Leu Pro Ala Gly Arg Tyr Met Val Asn Thr Ile Leu
1010 1015 1020
Thr Thr Gly Arg Cys Val Leu Thr Asn Ala Asp Gly Glu Lys Arg
1025 1030 1035
Asn Pro Ile Asn Ile Asn Tyr Leu Met Arg Ala Gly Met Arg Arg
1040 1045 1050
Val Glu Leu Ser Glu Leu
1055
<210> 72
<211> 1134
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG3-6 (D13A) nickase
<400> 72
Met Ser Thr Asp Met Lys Asn Tyr Arg Ile Gly Val Ala Val Gly Asp
1 5 10 15
Arg Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Asp Gly Leu Pro
20 25 30
Ile Gln Lys Leu Ala Leu Val Thr Phe Arg His Asp Gly Gly Leu Asp
35 40 45
Pro Thr Lys Asn Lys Thr Pro Met Ser Arg Lys Glu Thr Arg Gly Ile
50 55 60
Ala Arg Arg Thr Met Arg Met Asn Arg Glu Arg Lys Arg Arg Leu Arg
65 70 75 80
Asn Leu Asp Asn Val Leu Glu Asn Leu Gly Tyr Ser Val Pro Glu Gly
85 90 95
Pro Glu Pro Glu Thr Tyr Glu Ala Trp Thr Ser Arg Ala Leu Leu Ala
100 105 110
Ser Ile Lys Leu Ala Ser Ala Asp Glu Leu Asn Glu His Leu Val Arg
115 120 125
Ala Val Arg His Met Ala Arg His Arg Gly Trp Ala Asn Pro Trp Trp
130 135 140
Ser Leu Asp Gln Leu Glu Lys Ala Ser Gln Glu Pro Ser Glu Thr Phe
145 150 155 160
Glu Ile Ile Leu Ala Arg Ala Arg Glu Leu Phe Gly Glu Lys Val Pro
165 170 175
Ala Asn Pro Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Glu
180 185 190
Val Leu Leu Arg Pro Arg Asp Glu Lys Lys Arg Lys Thr Gly Tyr Val
195 200 205
Arg Gly Thr Pro Leu Met Phe Ala Gln Val Arg Gln Gly Asp Gln Leu
210 215 220
Ala Glu Leu Arg Arg Ile Cys Glu Val Gln Gly Ile Glu Asp Gln Tyr
225 230 235 240
Glu Ala Leu Arg Leu Gly Val Phe Asp His Lys His Pro Tyr Val Pro
245 250 255
Lys Glu Arg Val Gly Lys Asp Pro Leu Asn Pro Ser Thr Asn Arg Thr
260 265 270
Ile Arg Ala Ser Leu Glu Phe Gln Glu Phe Arg Ile Leu Asp Ser Val
275 280 285
Ala Asn Leu Arg Val Arg Ile Gly Ser Arg Ala Lys Arg Glu Leu Thr
290 295 300
Glu Ala Glu Tyr Asp Ala Ala Val Glu Phe Leu Met Asp Tyr Ala Asp
305 310 315 320
Lys Glu Gln Pro Ser Trp Ala Asp Val Ala Glu Lys Ile Gly Val Pro
325 330 335
Gly Asn Arg Leu Val Ala Pro Val Leu Glu Asp Val Gln Gln Lys Thr
340 345 350
Ala Pro Tyr Asp Arg Ser Ser Ala Ala Phe Glu Lys Ala Met Gly Lys
355 360 365
Lys Thr Glu Ala Arg Gln Trp Trp Glu Ser Thr Asp Asp Asp Gln Leu
370 375 380
Arg Ser Leu Leu Ile Ala Phe Leu Val Asp Ala Thr Asn Asp Thr Glu
385 390 395 400
Glu Ala Ala Ala Glu Ala Gly Leu Ser Glu Leu Tyr Lys Ser Trp Pro
405 410 415
Ala Glu Glu Arg Glu Ala Leu Ser Asn Ile Asp Phe Glu Lys Gly Arg
420 425 430
Val Ala Tyr Ser Gln Glu Thr Leu Ser Lys Leu Ser Glu Tyr Met His
435 440 445
Glu Tyr Arg Val Gly Leu His Glu Ala Arg Lys Ala Val Phe Gly Val
450 455 460
Asp Asp Thr Trp Arg Pro Pro Leu Asp Lys Leu Glu Glu Pro Thr Gly
465 470 475 480
Gln Pro Ala Val Asp Arg Val Leu Thr Ile Leu Arg Arg Phe Val Leu
485 490 495
Asp Cys Glu Arg Gln Trp Gly Arg Pro Arg Ala Ile Thr Val Glu His
500 505 510
Thr Arg Thr Gly Leu Met Gly Pro Thr Gln Arg Gln Lys Ile Leu Asn
515 520 525
Glu Gln Lys Lys Asn Arg Ala Asp Asn Glu Arg Ile Arg Asp Glu Leu
530 535 540
Arg Glu Ser Gly Val Asp Asn Pro Ser Arg Ala Glu Val Arg Arg His
545 550 555 560
Leu Ile Val Gln Glu Gln Glu Cys Gln Cys Leu Tyr Cys Gly Thr Met
565 570 575
Ile Thr Thr Thr Thr Ser Glu Leu Asp His Ile Val Pro Arg Ala Gly
580 585 590
Gly Gly Ser Ser Arg Arg Glu Asn Leu Ala Ala Val Cys Arg Ala Cys
595 600 605
Asn Ala Lys Lys Lys Arg Glu Leu Phe Tyr Ala Trp Ala Gly Pro Val
610 615 620
Lys Ser Gln Glu Thr Ile Glu Arg Val Arg Gln Leu Lys Ala Phe Lys
625 630 635 640
Asp Ser Lys Lys Ala Lys Met Phe Lys Asn Gln Ile Arg Arg Leu Asn
645 650 655
Gln Thr Glu Ala Asp Glu Pro Ile Asp Glu Arg Ser Leu Ala Ser Thr
660 665 670
Ser Tyr Ala Ala Val Ala Val Arg Glu Arg Leu Glu Gln His Phe Asn
675 680 685
Glu Gly Leu Ala Leu Asp Asp Lys Ser Arg Val Val Leu Asp Val Tyr
690 695 700
Ala Gly Ala Val Thr Arg Glu Ser Arg Arg Ala Gly Gly Ile Asp Glu
705 710 715 720
Arg Ile Leu Leu Arg Gly Glu Arg Asp Lys Asn Arg Phe Asp Val Arg
725 730 735
His His Ala Val Asp Ala Ala Val Met Thr Leu Leu Asn Arg Ser Val
740 745 750
Ala Leu Thr Leu Glu Gln Arg Ser Gln Leu Arg Arg Thr Phe Tyr Glu
755 760 765
Gln Gly Leu Asp Lys Leu Asp Arg Asn Gln Leu Lys Pro Glu Glu Asp
770 775 780
Trp Arg Asp Phe Thr Gly Leu Ala Pro Ala Ser Gln Glu Lys Phe Leu
785 790 795 800
Glu Trp Arg Lys Ala Ala Thr Ile Leu Gly Asp Leu Leu Ala Glu Ala
805 810 815
Ile Glu Asp Asp Ser Ile Ala Val Val Ser Pro Leu Arg Leu Arg Pro
820 825 830
Gln Asn Gly Ser Val His Leu Glu Thr Ile Ser Ala Val Lys Lys Gln
835 840 845
Thr Leu Gly Ser Asp Trp Pro Ala Asp Ala Val Lys Arg Ile Val Asp
850 855 860
Pro Glu Ile Tyr Leu Ala Met Lys Asp Ala Leu Gly Lys Leu Lys Glu
865 870 875 880
Leu Pro Glu Asp Ser Ala Arg Ser Leu Glu Leu Pro Asp Gly Arg Phe
885 890 895
Val Glu Ala Asp Asp Glu Val Leu Phe Phe Pro Glu Asn Ala Ala Ser
900 905 910
Ile Leu Thr Pro Arg Gly Val Ala Glu Ile Gly Gly Ser Ile His His
915 920 925
Ala Arg Leu Tyr Gly Trp Leu Thr Lys Lys Gly Glu Leu Lys Val Gly
930 935 940
Met Leu Arg Val Tyr Gly Ala Glu Phe Pro Trp Leu Met Arg Glu Ser
945 950 955 960
Gly Ser Arg Asn Val Leu Ser Met Pro Ile His Arg Gly Ser Gln Ser
965 970 975
Phe Arg Asp Met Gln Asp Thr Thr Arg Lys Ala Val Glu Ser Gly Glu
980 985 990
Ala Val Glu Phe Ala Trp Ile Thr Gln Asn Asp Glu Leu Glu Phe Asp
995 1000 1005
Pro Asp Asp Tyr Ile Ala His Gly Gly Lys Asp Glu Leu Arg Gln
1010 1015 1020
Phe Leu Gly Phe Met Pro Glu Cys Arg Trp Arg Val Asp Gly Phe
1025 1030 1035
Lys Lys Asn Tyr Gln Ile Arg Ile Arg Pro Ala Met Leu Ser Arg
1040 1045 1050
Glu Gln Leu Pro Ser Asp Ile Gln Arg Arg Leu Glu Ser Lys Thr
1055 1060 1065
Leu Thr Lys Asn Glu Ser Leu Leu Leu Lys Ala Leu Asp Thr Gly
1070 1075 1080
Leu Val Val Ala Ile Gly Gly Leu Leu Pro Leu Glu Thr Leu Lys
1085 1090 1095
Val Ile Arg Arg Asn Asn Leu Gly Phe Pro Arg Trp Arg Gly Asn
1100 1105 1110
Gly Asn Leu Pro Thr Ser Phe Glu Val Arg Ser Ser Ala Leu Arg
1115 1120 1125
Ala Leu Gly Val Glu Gly
1130
<210> 73
<211> 1131
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG3-7 (D12A) nickase
<400> 73
Met Ser Glu His Thr Lys Tyr Arg Ile Gly Ile Ala Val Gly Asp Arg
1 5 10 15
Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Asp Gly Phe Pro Leu
20 25 30
Ser Asn Leu Ala Met Val Thr Tyr Arg His Asp Gly Gly Leu Asp Pro
35 40 45
Thr Thr Asn Lys Ser Pro Lys Ser Arg Lys Glu Thr Arg Gly Val Ala
50 55 60
Leu Arg Thr Met Arg Met Arg Arg Arg Lys Lys Ser Arg Leu Lys Asp
65 70 75 80
Leu Asp Lys Thr Leu Arg Ala Leu Gly Tyr Val Val Pro Ala Cys Glu
85 90 95
Glu Pro Gln Thr Tyr Glu Ala Trp Lys Ser Arg Ala Leu Leu Ala Thr
100 105 110
Thr Lys Val Glu Gly Ala Gln Glu Leu Gly Glu His Leu Val Arg Ala
115 120 125
Val Arg His Met Ala Arg His Arg Gly Trp Arg Asn Pro Trp Trp Thr
130 135 140
Phe Asn Gln Leu Glu Ile Ala Ser Thr Ala Pro Ser Asp Thr Phe Ala
145 150 155 160
Lys Ile Arg Glu Arg Ala Glu Lys Glu Trp Pro Gly Val Val Pro Glu
165 170 175
Glu Ala Thr Leu Gly Met Ile Gly Ala Leu Ala Ala Ser Asn Asn Val
180 185 190
Leu Leu Arg Pro Arg Thr Tyr Arg Lys Asp Gln Pro Arg His Ser Lys
195 200 205
Lys Leu Asn Val Leu Gly Gln Glu Pro Ile Leu Val Asp Lys Val Arg
210 215 220
Gln Glu Asp Leu Leu Ala Glu Leu Arg Thr Ile Cys Lys Lys Gln Asp
225 230 235 240
Ile Glu Asp Gln Tyr Glu Lys Leu Ala Gln Ala Val Phe Glu Gln Thr
245 250 255
Arg Pro Tyr Val Pro Leu Asp Arg Val Gly Lys Asp Pro Leu Gln Pro
260 265 270
Asn Lys Ser Arg Ala Ser Arg Ala Ser Leu Glu Phe Gln Arg Phe Arg
275 280 285
Ile Leu Asp Ala Val Ala His Leu Arg Val Arg Val Gly Ala Ser Asp
290 295 300
Arg Arg Ala Leu Thr Asp Glu Glu His Asp Lys Ala Val His Phe Leu
305 310 315 320
Met Gly Tyr Ser Lys Lys Asp Val Pro Thr Trp Gly Asp Val Ala Asp
325 330 335
Glu Ile Gly Val Glu Pro Ala His Leu Ile Ala Pro Val Ile Asp Asp
340 345 350
Val Arg Leu Asn Lys Ala Pro Tyr Asp Arg Ser Ser Thr Glu Phe Glu
355 360 365
Gln Lys Met Lys Lys Lys Thr Arg Ala Arg Gln Trp Trp Asp Glu Ala
370 375 380
Asn Leu Glu Ser Arg Ser Gln Leu Ile Leu Leu Val Ser Asp Pro Thr
385 390 395 400
Asp Glu Thr Met Arg Leu Ala Glu Val Ser Gly Leu Tyr Glu Val Phe
405 410 415
Glu Ser Trp Pro Asp Glu Glu Lys Glu Ala Leu Glu Gly Leu Lys Val
420 425 430
Glu Ser Gly Arg Ala Ala Tyr Ser Thr Asp Thr Leu Asn Lys Leu Ser
435 440 445
Asp His Met Arg Leu Lys Arg Ile Asp Leu His Glu Ala Arg Lys Ile
450 455 460
Ala Phe Gly Val Asp Asp Met Trp His Pro Pro Leu Asp Arg Ile Asp
465 470 475 480
Glu Pro Thr Gly Gln Pro Thr Val Asp Arg Val Leu Thr Ile Val Arg
485 490 495
Arg Phe Ile Phe Asp Cys Glu Arg Ala Trp Gly Cys Pro Glu Asn Val
500 505 510
Val Ile Glu His Ala Arg Thr Gly Leu Met Gly Pro Ala Gln Arg Ala
515 520 525
Asp Val Leu Asn Glu Ile Ala Lys Asn Arg Lys Lys Asn Asp Lys Ile
530 535 540
Arg Glu Asp Leu Arg Ala Gly Gly Ile Asn Asn Pro Thr Arg Ala Asp
545 550 555 560
Ile Arg Arg Asn Ala Ile Val Gln Asp Gln Glu Ser Gln Cys Leu Tyr
565 570 575
Cys Gly Ala Thr Ile Gly Val Ser Tyr Ser Glu Leu Asp His Ile Val
580 585 590
Pro Arg Ala Gly Gly Gly Ser Ser Arg Arg Glu Asn Leu Ala Ala Val
595 600 605
Cys Arg Ala Cys Asn Asp Ser Lys Lys Asp Thr Pro Phe Ala Val Trp
610 615 620
Ala Lys Asn Thr Ser Arg Pro Val Thr Leu Glu Gly Thr Ile Gln Arg
625 630 635 640
Leu Arg Glu Leu Lys Ala Phe Lys Arg Pro Lys Asp Arg Arg Met Val
645 650 655
Asp Leu Ile Ile Arg Arg Leu Lys Gln Thr Glu Lys Asp Asp Pro Ile
660 665 670
Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr Ala Ala Thr Ala Ile Arg
675 680 685
Glu Arg Ile Glu Gln Tyr Phe Asn Glu Lys Ala Glu Lys Leu Asp Leu
690 695 700
Ala Lys Val His Ile Asp Val Tyr Ser Gly Ser Leu Thr Arg Glu Ser
705 710 715 720
Arg Arg Ala Gly Gly Ile Asp Lys Met Val Leu Leu Arg Gly Gln Ser
725 730 735
Asp Lys Asn Arg Phe Asp Val Arg His His Ala Ile Asp Ala Ala Val
740 745 750
Leu Thr Leu Leu Asn Arg Ser Val Ala Val Thr Leu Glu Gln Arg Arg
755 760 765
Leu Ile Lys Gln Gln Arg Glu Tyr Ser Leu Glu Lys Ser Arg Arg Glu
770 775 780
Arg Asp Asn Val Trp Arg Asp Phe Met Gly Leu Gly Pro Ala Ala Gln
785 790 795 800
Glu Lys Phe Ala Lys Trp Lys Lys Thr Ala Tyr Val Leu Ala Asp Ile
805 810 815
Ile Lys Glu Ala Ile Ser Asn Asp Ala Ile Pro Val Val Ser Pro Leu
820 825 830
Arg Leu Arg Pro Gln Asn Gly Ser Val His Leu Asp Thr Val Asp Ala
835 840 845
Val Leu Glu Arg Thr Ile Gly Asp Ala Trp Thr Val Asp Gln Val His
850 855 860
Arg Ile Val Asn Pro Gln Ile Tyr Leu Ala Phe Ala Gly Tyr Leu Gly
865 870 875 880
Asn Gln Lys Ala Leu Asp Pro Asp Ser Ser Arg Val Leu Ala Leu Asn
885 890 895
Asp Gly Arg Lys Leu Thr Ala Glu Asp Val Ile Tyr Val Phe Pro Glu
900 905 910
Lys Ala Ala Ser Ile Leu Thr Pro Arg Gly Val Val Lys Ile Gly Glu
915 920 925
Ser Val His His Val Arg Leu Tyr Ala Trp Lys Asn Arg Lys Gly Lys
930 935 940
Ala Glu Val Gly Met Leu Arg Val Phe Gly Ala Glu Phe Pro Trp Leu
945 950 955 960
Met Arg Glu Ser Gly Val Lys Asp Val Leu Arg Val Pro Ile His Thr
965 970 975
Gly Ser Gln Ser Tyr Arg Asp Leu Ser Phe Thr Val Arg Lys Asn Ile
980 985 990
Glu Lys Gly Glu Ala Ala Glu Ile Gly Trp Leu Thr Gln Asn Glu Glu
995 1000 1005
Leu Glu Phe Asn Pro Glu Ser Tyr Leu Gln Glu Gly Gly Lys Asp
1010 1015 1020
Lys Leu Ala Lys Phe Leu Ala Phe Leu Pro Glu Thr Arg Trp Arg
1025 1030 1035
Val Asp Gly Phe Pro Met Pro Asp Lys Leu Arg Ile Arg Pro Ala
1040 1045 1050
Leu Leu Ser Arg Glu Glu Ile Pro Glu Gly Val Phe Arg Thr Glu
1055 1060 1065
Glu Gln Ser Leu Leu Glu Glu Ala Leu Thr Lys Gly Leu Ile Ile
1070 1075 1080
Ala Thr Lys Gly Leu Leu Ser Leu Pro Asp Val Lys Val Leu Arg
1085 1090 1095
Arg Asn Asn Leu Gly Ile Pro Arg Trp Arg Gly Gly Ser Tyr Arg
1100 1105 1110
Pro Val Ser Leu Asp Ile Gln Arg Ala Ala Leu Ala Ala Leu Asp
1115 1120 1125
Glu Gln Glu
1130
<210> 74
<211> 1132
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG3-8 (D13A) nickase
<400> 74
Met Ser Thr Asp Met Lys Asn Tyr Arg Ile Gly Val Ala Val Gly Asp
1 5 10 15
Arg Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Ala Gly Phe Pro
20 25 30
Ile Gln Lys Leu Ala Leu Val Thr Phe Arg His Asp Gly Gly Leu Asp
35 40 45
Pro Thr Asp Asn Pro Lys Ser Arg Lys Glu Thr Arg Gly Glu Ala Arg
50 55 60
Arg Arg Met Arg Met Thr Arg Arg Arg Lys Gln Arg Leu Arg Asp Leu
65 70 75 80
Asp Lys Val Leu Glu Asn Leu Gly Tyr Thr Val Pro Glu Gly Pro Glu
85 90 95
Pro Glu Thr Tyr Glu Ala Trp Thr Ser Arg Ala Leu Leu Ala Ser Ile
100 105 110
Lys Leu Ala Ser Ala Asp Glu Leu Asn Glu His Leu Val Arg Ala Val
115 120 125
Arg His Ile Ala Arg His Arg Gly Trp Val Asn Pro Trp Trp Ser Leu
130 135 140
Asp Gln Leu Glu Arg Ala Ser Gln Glu Pro Ser Glu Thr Phe Glu Ile
145 150 155 160
Ile Leu Ala Arg Ala Arg Glu Leu Phe Gly Glu Arg Val Pro Ala Asn
165 170 175
Pro Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Glu Val Leu
180 185 190
Leu Arg Pro Arg Ala Glu Lys Lys Lys Lys Thr Gly Tyr Val Arg Gly
195 200 205
Thr Pro Leu Leu Ala Ala Gln Val Arg Gln Ile Asp Gln Val Ala Glu
210 215 220
Leu Arg Arg Ile Cys Glu Val Gln Gly Ile Glu Glu Gln Tyr Glu Thr
225 230 235 240
Leu Arg Asn Ala Ile Phe Ala His Lys Val Ala Tyr Val Pro Thr Glu
245 250 255
Arg Val Gly Lys Asp Pro Leu Ala Pro Ser Lys Asn Arg Thr Ile Arg
260 265 270
Ala Ser Leu Glu Phe Gln Glu Phe Arg Ile Leu Asp Ser Val Ala Asn
275 280 285
Leu Arg Val Arg Thr Asp Ser Arg Ala Lys Arg Glu Leu Thr Glu Gly
290 295 300
Glu Tyr Asp Ala Ala Val Glu Phe Leu Met Gly Tyr Thr Ala Lys Glu
305 310 315 320
Gln Pro Ser Trp Ala Asp Val Ala Glu Glu Ile Gly Val Pro Gly Asn
325 330 335
Arg Leu Ile Ala Pro Val Leu Glu Asp Val Gln Gln Lys Thr Ala Pro
340 345 350
Phe Asp Arg Ser Ser Ala Ala Phe Glu Lys Ala Met Ser Lys Arg Thr
355 360 365
Glu Ala Arg Gln Trp Trp Glu Ala Asn Asp Asp Asp Gln Leu Arg Ser
370 375 380
Leu Phe Ile Met Phe Leu Ala Asp Ala Thr Asn Asp Thr Glu Glu Ala
385 390 395 400
Ala Ala Val Ala Gly Leu Pro Glu Leu Tyr Met Ser Trp Pro Ala Glu
405 410 415
Glu Arg Glu Ala Leu Ser Asn Ile Asp Phe Glu Lys Gly Arg Val Ala
420 425 430
Tyr Ser His Glu Thr Leu Ser Lys Leu Ser Glu Tyr Met His Glu His
435 440 445
Arg Val Gly Leu His Glu Ala Arg Lys Ala Val Phe Gly Val Asp Asp
450 455 460
Thr Trp Arg Pro Pro Leu Ala Lys Leu Glu Glu Pro Thr Gly Gln Pro
465 470 475 480
Thr Val Asp Arg Val Leu Thr Ile Leu Arg Arg Phe Val Leu Asp Cys
485 490 495
Glu Arg Gln Trp Gly Arg Pro Arg Ala Ile Thr Val Glu His Ala Arg
500 505 510
Ile Gly Leu Val Gly Pro Ala Gln Arg Gln Asn Ile Leu Lys Glu Gln
515 520 525
Glu Asp Asn Arg Lys Asn Asn Glu Cys Ile Arg Asp Glu Leu Arg Lys
530 535 540
Ser Gly Val Glu Asn Pro Ser Arg Thr Glu Val Arg Arg His Leu Val
545 550 555 560
Val Gln Asp Gln Glu Ser Gln Cys Leu Tyr Cys Gly Ala Val Ile Arg
565 570 575
Thr Asp Thr Ser Glu Leu Asp His Ile Val Pro Arg Ala Gly Gly Gly
580 585 590
Ser Ser Arg Arg Glu Asn Leu Ala Ala Val Cys Arg Tyr Cys Asn Ser
595 600 605
Lys Lys Asp Arg Thr Leu Phe Tyr Asp Trp Ala Gly Ser Val Arg Leu
610 615 620
Gln Glu Thr Ile Asp Arg Val Arg Gln Leu Lys Ala Phe Lys Asp Ser
625 630 635 640
Lys Lys Ala Lys Met Phe Lys Asn Gln Ile Arg Arg Leu Arg Gln Thr
645 650 655
Glu Ala Asp Glu Pro Ile Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr
660 665 670
Ala Ala Val Ala Val Arg Glu Arg Leu Glu Gln His Phe Asn Glu Gly
675 680 685
Leu Ala Pro Asp Asp Lys Asn Arg Val Val Leu Asp Val Tyr Ala Gly
690 695 700
Ser Val Thr Arg Glu Ser Arg Arg Ala Gly Gly Ile Asp Glu Arg Ile
705 710 715 720
Leu Leu Arg Gly Glu Arg Asp Lys Asn Arg Phe Asp Val Arg His His
725 730 735
Ala Ile Asp Ala Ala Val Met Thr Leu Leu Asn Arg Ser Val Ala Leu
740 745 750
Thr Leu Glu Gln Arg Ser Gln Leu Arg Arg Ala Phe Tyr Glu Gln Gly
755 760 765
Leu Asp Lys Leu Asp Arg Asp Gln Leu Lys Pro Glu Glu Asp Trp Arg
770 775 780
Asn Phe Ile Gly Leu Ser Leu Ala Ser Gln Glu Lys Phe Leu Glu Trp
785 790 795 800
Lys Lys Val Thr Thr Val Leu Gly Asp Leu Leu Ala Glu Ala Ile Glu
805 810 815
Asp Asp Ser Ile Ala Val Val Ser Pro Leu Arg Leu Arg Pro Gln Asn
820 825 830
Gly Arg Val His Lys Asp Thr Ile Ala Ala Val Lys Lys Gln Thr Leu
835 840 845
Gly Ser Ala Trp Ser Ala Asp Ala Val Lys Arg Ile Val Asp Pro Glu
850 855 860
Ile Tyr Leu Ala Met Lys Asp Ala Leu Gly Lys Ser Lys Val Leu Pro
865 870 875 880
Glu Asp Ser Ala Arg Thr Leu Glu Leu Ser Asp Gly Arg Tyr Leu Glu
885 890 895
Ala Asp Asp Glu Val Leu Phe Phe Pro Lys Asn Ala Ala Ser Ile Leu
900 905 910
Thr Pro Arg Gly Val Ala Glu Ile Gly Gly Ser Ile His His Ala Arg
915 920 925
Leu Tyr Ser Trp Leu Thr Lys Lys Gly Glu Leu Lys Ile Gly Met Leu
930 935 940
Arg Val Tyr Gly Ala Glu Phe Pro Trp Leu Met Arg Glu Ser Gly Ser
945 950 955 960
His Asp Val Leu Arg Met Pro Ile His Pro Gly Ser Gln Ser Phe Arg
965 970 975
Asp Met Gln Asp Thr Thr Arg Lys Ala Val Glu Ser Ser Glu Ala Val
980 985 990
Glu Phe Ala Trp Ile Thr Gln Asn Asp Glu Leu Glu Phe Glu Pro Glu
995 1000 1005
Asp Tyr Ile Ala His Gly Gly Lys Asp Glu Leu Arg Gln Phe Leu
1010 1015 1020
Glu Phe Met Pro Glu Cys Arg Trp Arg Val Asp Gly Phe Lys Lys
1025 1030 1035
Asn Tyr Gln Ile Arg Ile Arg Pro Ala Met Leu Ser Arg Glu Gln
1040 1045 1050
Leu Pro Ser Asp Ile Gln Arg Arg Leu Glu Ser Lys Thr Leu Thr
1055 1060 1065
Glu Asn Glu Ser Leu Leu Leu Lys Ala Leu Asp Thr Gly Leu Val
1070 1075 1080
Val Ala Ile Gly Gly Leu Leu Pro Leu Gly Thr Leu Lys Val Ile
1085 1090 1095
Arg Arg Asn Asn Leu Gly Phe Pro Arg Trp Arg Gly Asn Gly Asn
1100 1105 1110
Leu Pro Thr Ser Phe Glu Val Arg Ser Ser Ala Leu Arg Ala Leu
1115 1120 1125
Gly Val Glu Gly
1130
<210> 75
<211> 1055
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG4-5 (D17A) nickase
<400> 75
Met Gly Asp Gln Gln Thr Leu Gln Ala Thr Ser Tyr Cys Leu Gly Leu
1 5 10 15
Ala Val Gly Val Gln Gly Val Gly Trp Ala Val Ile Asp Leu Asp Asp
20 25 30
Gln Gly Gln Pro Leu Gly Val Arg Arg Thr Gly Val Arg Cys Phe Asp
35 40 45
Ser Gly Val Gly Ser Glu Thr Glu Phe Glu Lys Gly Val Asp Glu Pro
50 55 60
Pro Ser Thr Lys Arg Arg Gln Ala Arg Gln Gln Arg Arg Gln Leu Trp
65 70 75 80
Arg Arg Ala Gln Arg Gln Arg Arg Val Phe Arg Ala Leu Gln Glu Ala
85 90 95
Gly Leu Leu Pro Pro Gly Pro Pro Thr Pro Val Ser Arg Asp Lys Ile
100 105 110
Leu Arg Thr Leu Asp Ala Asp Leu Ala Ile Gln Phe Gly Ser Leu Glu
115 120 125
Asp Arg Ile Ala Ala His Leu Leu Pro Tyr Arg Leu Arg Ala Leu Ala
130 135 140
Leu Asp Thr Pro Leu Pro Pro Tyr Ala Leu Gly Arg Ala Phe Tyr His
145 150 155 160
Leu Ala Gln Arg Arg Gly Phe Leu Ser Asn Lys Lys Ala Leu Lys Glu
165 170 175
Glu Lys Glu Ala Gly Glu Val Lys Lys Gly Ile Ala Glu Leu Gln Glu
180 185 190
Glu Met Asn Arg Ala Gly Ala Arg Ala Leu Gly Glu Tyr Phe Ser Ser
195 200 205
Leu Asp Pro Glu Gln Arg Arg Ile Arg Asn Arg Trp Thr Ala Arg Gln
210 215 220
Met Tyr Leu Asp Glu Phe Asp Arg Val Trp Glu Ala Gln Ser Arg Tyr
225 230 235 240
His Pro Arg Leu Thr Asp Glu Leu Lys Thr Lys Val Arg Arg Ala Ile
245 250 255
Phe Phe Gln Arg Pro Leu Lys Ser Gln Lys Gly Leu Ile Gly Arg Cys
260 265 270
Glu Leu Glu Pro Arg His Arg Arg Ala Pro Leu Ala Ser Leu Leu Ala
275 280 285
Gln Arg Phe Arg Tyr Trp Gln Lys Ile Asn Asp Leu Glu Val Ile Gln
290 295 300
Pro Asp Gly Val Val Arg Pro Leu Ser Pro Glu Glu Arg His Lys Leu
305 310 315 320
Ala His Phe Leu Glu Thr Gln Ala Glu Ala Thr Phe Ala Arg Ile Arg
325 330 335
Lys Leu Leu Asp Leu Lys Lys Pro Lys Gly Ser Gln Glu Asp Phe Ala
340 345 350
Phe Asn Leu Glu Arg Gly Gly Glu Lys Arg Ile Leu Gly Asn Arg Thr
355 360 365
Ala Ala Lys Met Ala Ala Val Leu Gly Gln Arg Trp Ala Ala Met Asp
370 375 380
Asp Glu Asp Lys Arg Arg Leu Val Asn Glu Ile Leu Ser Phe Glu Lys
385 390 395 400
Glu Ala Pro Leu Ala Arg Arg Leu Val Arg Ala Trp Asn Leu Asp Glu
405 410 415
Pro Thr Ala Ala Gln Leu Ala Ala Leu Asp Phe Glu Pro Gly Tyr Ala
420 425 430
Ala Leu Ser Ala Arg Ala Ile Arg Lys Leu Leu Pro Leu Met Gln Arg
435 440 445
Glu Gly Met Arg Phe Ala Thr Ala Arg Lys Gln Val Tyr Gly Asp His
450 455 460
Leu Leu Gly Thr Arg Ala Tyr Asp Ala Leu Pro Pro Val Ala Lys Ala
465 470 475 480
Ile Pro Ser Leu Arg Asn Pro Ala Val Cys Arg Ala Leu Thr Glu Val
485 490 495
Arg Lys Val Val Asn Ala Leu Val Arg Ala Tyr Gly Lys Pro Ala Met
500 505 510
Val Arg Ile Glu Leu Ala Arg Asp Met Lys Arg Gly Arg Lys Gln Arg
515 520 525
Lys Glu Thr Trp Gln Ala Met Arg Glu Asn Glu Arg Cys Arg Leu Asp
530 535 540
Ala Arg Lys Leu Leu Gln Asp His Gly Ile Gln Glu Pro Arg Pro Ala
545 550 555 560
Asp Ile Leu Lys Val Leu Leu Ala Glu Glu Cys Asn Trp Glu Cys Pro
565 570 575
Tyr Thr Gly Lys Ala Ile Ser Met Asp Ala Leu Ile Gly Ser Gln Pro
580 585 590
Gln Phe Asp Val Glu His Ile Ile Pro Phe Ser Arg Ser Leu Asp Asn
595 600 605
Ser Phe Leu Asn Lys Thr Leu Cys Tyr His Glu Glu Asn Arg Asn Val
610 615 620
Lys Gln Asn Arg Thr Pro Phe Glu Ala Tyr Gly Gly Asp Glu Gln Arg
625 630 635 640
Trp His Glu Ile Leu Gln Arg Val Arg Arg Phe Arg Gly Ser Ala Ala
645 650 655
Glu Ser Lys Leu Arg Lys Phe Gln Leu Arg Gln Leu Pro Ala Asp Phe
660 665 670
Thr Asn Arg His Leu Asn Asp Thr Arg Tyr Ala Ser Arg Leu Ala Ala
675 680 685
Asp Tyr Leu Ala Leu Leu Tyr Gly Gly Arg Val Asp Ala Asn Gly Arg
690 695 700
Gln Arg Val Gln Val Gly Thr Gly Ala Thr Thr Gly Phe Leu Arg Asp
705 710 715 720
Glu Trp Gly Leu Asn Ala Ile Leu Gly Asp Asn Asp Glu Lys Glu Arg
725 730 735
Ala Asp His Arg His His Ala Ile Asp Ala Val Val Ile Ala Leu Thr
740 745 750
Gly Pro Gly Thr Val Gln Ala Leu Thr Arg Ala Ala Leu Arg Ala Lys
755 760 765
Glu Leu Gly Arg Arg Leu Phe Val Pro Leu Asp Pro Pro Trp Ala Asp
770 775 780
Arg Asp Ser Phe Leu Arg Asp Val Arg Ala Ser Val Glu Ala Ile Thr
785 790 795 800
Val Ser Tyr Arg Val Asp Arg Lys Val Ser Gly Gln Leu His Glu Glu
805 810 815
Ser Asn Tyr Ser Lys Pro His Met Thr Val Asp Asn Lys Gly Asn Leu
820 825 830
Val Glu His Arg His Ile Arg Lys Pro Leu Lys Asp Met Ser Val Glu
835 840 845
Glu Val Glu Ala Ile Val Asp Asp Arg Val Arg Lys Leu Val Gln Glu
850 855 860
Lys Leu Arg Gln Leu Gly Gln Glu Pro Lys Lys Ala Phe Ala Asp Glu
865 870 875 880
Ala Asn His Pro Tyr Phe Thr Thr Ala Asp Gly Arg Leu Val Pro Ile
885 890 895
His Lys Ala Arg Ile Arg Lys Thr Val Ala Thr Ile Thr Val Gly Pro
900 905 910
Pro Gln Cys Pro Arg His Val Ala Pro Gly Leu Asn His His Ile Glu
915 920 925
Ile Leu Ala Val Arg Asp Pro Ala Gly Ala Val Thr His Trp Glu Gly
930 935 940
Glu Leu Val Ser Leu Phe Glu Ala Ala Arg Arg Val Lys Ala Gly Glu
945 950 955 960
Pro Val Val Arg Arg Asn His Gly Pro Asn Lys Asp Phe Leu Phe Ser
965 970 975
Leu Ala Lys Gly Glu Tyr Val Glu Met Glu Leu Gln Pro Gly Lys Arg
980 985 990
Gln Leu Phe Arg Val Thr Val Ile Ser Ala Lys Gln Ile Glu Phe Arg
995 1000 1005
Leu His His Asp Ala Arg Pro Thr Met Leu Leu Arg Lys Thr Pro
1010 1015 1020
Gly Ala Arg Val Ile Arg Ser Pro Gly Ser Leu Phe Lys Ala Lys
1025 1030 1035
Ala Arg Lys Val Ala Val Asp Pro Leu Gly Asn Val Phe Pro Ala
1040 1045 1050
Asn Asp
1055
<210> 76
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG14-1 (D23A) nickase
<400> 76
Met Glu Ile Thr Ile Asn Arg Glu Ile Gly Lys Leu Gly Leu Pro Arg
1 5 10 15
His Leu Val Leu Gly Met Ala Pro Gly Ile Ala Ser Cys Gly Phe Ala
20 25 30
Leu Ile Asp Thr Ala Asn His Glu Ile Leu Asp Leu Gly Val Arg Leu
35 40 45
Phe Asp Ser Pro Thr His Pro Lys Thr Gly Gln Ser Leu Ala Val Ile
50 55 60
Arg Arg Gly Phe Arg Ser Thr Arg Arg Asn Ile Asp Arg Thr Gln Ala
65 70 75 80
Arg Leu Lys His Cys Leu Gln Val Leu Lys Ala Tyr Gly Leu Ile Pro
85 90 95
Gln Asp Ala Thr Lys Glu Tyr Phe His Thr Thr Lys Gly Asp Lys Gln
100 105 110
Pro Leu Lys Leu Arg Val Asp Gly Leu Asp Arg Leu Leu Asn Asp Arg
115 120 125
Glu Trp Ala Leu Val Leu Tyr Ser Leu Cys Lys Arg Arg Gly Tyr Ile
130 135 140
Pro His Gly Glu Gly Asn Gln Asp Lys Ser Ser Glu Gly Gly Lys Val
145 150 155 160
Leu Ser Ala Leu Ala Ala Asn Lys Glu Ala Ile Ala Glu Thr Ser Cys
165 170 175
Arg Thr Val Gly Glu Trp Leu Ala Gln Gln Pro Gln Ser Arg Asn Arg
180 185 190
Gly Gly Asn Tyr Asp Lys Tyr Val Thr His Ala Gln Leu Ile Glu Glu
195 200 205
Thr His Ile Leu Phe Asp Ala Gln Arg Ser Phe Gly Ser Lys Tyr Ala
210 215 220
Ser Pro Glu Phe Glu Ala Ala Tyr Ile Glu Val Cys Asp Trp Glu Arg
225 230 235 240
Ser Arg Lys Asp Phe Asp Arg Arg Thr Tyr Asp Leu Val Gly His Cys
245 250 255
Ser Tyr Phe Pro Thr Glu Lys Arg Ala Ala Arg Cys Thr Leu Thr Ser
260 265 270
Glu Leu Val Ser Ala Tyr Gly Ala Leu Gly Asn Ile Thr Ile Ile His
275 280 285
Glu Asn Gly Thr Ser Arg Ala Leu Ser Ala Thr Glu Arg Asp Glu Cys
290 295 300
Ile Ala Ile Leu Phe Ser Cys Glu Pro Ile Arg Gly Asn Lys Asp Cys
305 310 315 320
Ala Val Lys Phe Gly Ala Leu Arg Lys Ala Leu Asp Leu Ser Ser Gly
325 330 335
Asp Tyr Phe Lys Gly Val Pro Ala Ala Asp Glu Lys Thr Arg Glu Val
340 345 350
Tyr Lys Pro Lys Gly Trp Arg Val Leu Arg Asn Thr Leu Asn Ala Ala
355 360 365
Asn Pro Ile Leu Leu Gln Arg Leu Arg Asp Asp Arg Asp Leu Ala Asp
370 375 380
Ala Val Met Glu Ala Val Ala Tyr Ser Ser Ala Leu Pro Val Leu Gln
385 390 395 400
Glu Gln Leu Gln Gly Leu Pro Leu Ser Glu Ala Glu Ile Glu Ala Leu
405 410 415
Cys Arg Leu Pro Tyr Ser Ser Lys Ala Leu Asn Gly Tyr Gly Asn Arg
420 425 430
Ser Lys Lys Ala Leu Asp Met Leu Leu Asp Cys Leu Glu Glu Pro Glu
435 440 445
Val Leu Asn Leu Thr Gln Ala Glu Asn Asp Cys Gly Leu Leu Gly Leu
450 455 460
Arg Ile Ala Gly Ala Gln Leu Glu Arg Ser Asp Arg Leu Met Pro Tyr
465 470 475 480
Glu Thr Trp Ile Glu Arg Thr Gly Arg Thr Asn Asn Asn Pro Val Val
485 490 495
Ile Arg Ser Met Ser Gln Met Arg Lys Val Val Asn Ala Ile Cys Arg
500 505 510
Lys Trp Gly Val Pro Asn Glu Ile His Val Glu Leu Asp Arg Glu Leu
515 520 525
Arg Leu Pro Gln Arg Ala Lys Asp Glu Ile Ala Lys Ala Asn Lys Lys
530 535 540
Asn Glu Lys Asn Arg Glu Arg Ile Ala Gly Gln Ile Ala Glu Leu Arg
545 550 555 560
Gly Cys Thr Ala Asp Glu Val Thr Gly Lys Gln Ile Glu Lys Tyr Arg
565 570 575
Leu Trp Glu Glu Gln Glu Tyr Phe Asp Leu Tyr Thr Gly Ala Lys Ile
580 585 590
Glu Val Asp Arg Leu Ile Ser Asp Asp Thr Tyr Thr Gln Ile Asp His
595 600 605
Ile Leu Pro Phe Ser Arg Thr Gly Glu Asn Ser Arg Asn Asn Lys Val
610 615 620
Leu Val Leu Ala Lys Ser Asn Gln Asp Lys Arg Glu Gln Thr Pro Tyr
625 630 635 640
Glu Trp Met Ser His Asp Gly Ala Pro Ser Trp Asp Ala Phe Glu Arg
645 650 655
Arg Val Gln Glu Asn Gln Lys Leu Ser Arg Arg Lys Lys Asn Phe Leu
660 665 670
Leu Glu Lys Asp Leu Asp Thr Lys Glu Gly Glu Phe Leu Ala Arg Ser
675 680 685
Phe Thr Asp Thr Ala Tyr Met Ser Arg Glu Val Cys Ala Tyr Leu Ala
690 695 700
Asp Cys Leu Leu Phe Pro Asp Asp Gly Ala Lys Ala His Val Val Pro
705 710 715 720
Thr Thr Gly Arg Ala Thr Ala Trp Leu Arg Arg Arg Trp Gly Leu Asn
725 730 735
Phe Gly Ser Asn Gly Glu Lys Asp Arg Ser Asp Asp Arg His His Ala
740 745 750
Thr Asp Ala Cys Val Ile Ala Ala Cys Ser Pro Ser Leu Val Ile Lys
755 760 765
Thr Ala Arg Ile Asn Gln Glu Thr His Trp Ser Ile Thr Arg Gly Met
770 775 780
Asn Glu Thr Gln Arg Arg Asp Ala Ile Met Lys Ala Leu Glu Ser Val
785 790 795 800
Met Pro Trp Glu Thr Phe Ala Asn Glu Val Arg Ala Ala His Asp Phe
805 810 815
Val Val Pro Thr Arg Phe Val Pro Arg Lys Gly Lys Gly Glu Leu Phe
820 825 830
Glu Gln Thr Val Tyr Arg Tyr Ala Gly Val Asn Ala Gln Gly Lys Asp
835 840 845
Ile Ala Arg Lys Ala Ser Ser Asp Lys Asp Ile Val Met Gly Asn Ala
850 855 860
Val Val Ser Ala Asp Glu Lys Ser Val Ile Lys Val Ser Glu Met Leu
865 870 875 880
Cys Leu Arg Leu Trp His Asp Pro Glu Ala Lys Lys Gly Gln Gly Ala
885 890 895
Trp Tyr Ala Asp Pro Val Tyr Lys Ala Asp Ile Pro Ala Leu Lys Asp
900 905 910
Gly Thr Tyr Val Pro Arg Ile Ala Lys Ala His Thr Gly Arg Lys Ala
915 920 925
Trp Lys Pro Val Pro Glu Ser Ala Met Ala Lys Pro Pro Leu Glu Ile
930 935 940
Tyr Phe Gly Asp Leu Val Gln Ile Gly Asp Phe Ile Gly Arg Phe Ser
945 950 955 960
Gly Tyr Asn Ile Asn Asn Ala Asn Trp Ser Phe Thr Asp Arg Leu Thr
965 970 975
Arg Leu Asn Leu Ser Cys Pro Thr Val Gly Gln Leu Asn Asn Asp Leu
980 985 990
Ser Pro Val Val Ile Arg Glu Ser Pro Ile Lys
995 1000
<210> 77
<211> 1082
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG15-1 (D8A) nickase
<400> 77
Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly Trp
1 5 10 15
Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu Gly
20 25 30
Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly Ala
35 40 45
Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val Ile
50 55 60
Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys Lys
65 70 75 80
His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val Pro
85 90 95
Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu Lys
100 105 110
Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys His
115 120 125
Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp Glu
130 135 140
Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys Asn
145 150 155 160
Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg Lys
165 170 175
Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg Ala
180 185 190
Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn Leu
195 200 205
Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile Leu
210 215 220
Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser Pro
225 230 235 240
Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu Glu
245 250 255
Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met Ala
260 265 270
Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg Gly
275 280 285
Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp Leu
290 295 300
Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val Leu
305 310 315 320
Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu Lys
325 330 335
Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu Lys
340 345 350
Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala Leu
355 360 365
Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln Leu
370 375 380
Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr Ile
385 390 395 400
Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu Ala
405 410 415
Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser Leu
420 425 430
Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val Tyr
435 440 445
Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser Leu
450 455 460
Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile Ser
465 470 475 480
Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn Pro
485 490 495
Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe Arg
500 505 510
Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys Asn
515 520 525
Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg Pro
530 535 540
Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn Gly
545 550 555 560
Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu Lys
565 570 575
Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg Ser
580 585 590
Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu Asn
595 600 605
Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala Pro
610 615 620
Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg Asn
625 630 635 640
Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr Thr
645 650 655
Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile Ser
660 665 670
Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys Gly
675 680 685
Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val Thr
690 695 700
Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn Gly
705 710 715 720
Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr Gln
725 730 735
Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu Trp
740 745 750
Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys Lys Asn
755 760 765
Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn Phe Arg Tyr
770 775 780
Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp Ile Pro Glu Thr
785 790 795 800
Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val Ser His Met Pro Asn
805 810 815
Arg Lys Ile His Gly Pro Ala His Lys Glu Thr Ile Arg Ser Gly Arg
820 825 830
Leu Lys Glu Glu Gly Tyr Thr Ile Ser Lys Thr Ala Leu Ile Asp Leu
835 840 845
Lys Leu Thr Glu Asp Lys Glu Glu Ile Lys Gly Tyr Tyr Asn Lys Glu
850 855 860
Ser Asp Arg Leu Leu Tyr Glu Ala Leu Lys Lys Gln Leu Gln Arg Tyr
865 870 875 880
Gly Gly Lys Ala Lys Glu Ala Phe Lys Glu Pro Phe His Lys Pro Lys
885 890 895
Ala Asp Gly Thr Pro Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu
900 905 910
Lys Ser Thr Met Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser
915 920 925
Asn Gly Asn Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly
930 935 940
Lys Lys Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys
945 950 955 960
Glu Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala
965 970 975
Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro Asn
980 985 990
Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys Ala Ala
995 1000 1005
Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser Arg Phe
1010 1015 1020
Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser Ile Ser
1025 1030 1035
Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val Gly Ile
1040 1045 1050
Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val Leu Gly
1055 1060 1065
Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe Arg
1070 1075 1080
<210> 78
<211> 1348
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: nickase
<220>
<223> Description: nMG18-1 (D12A) nickase
<400> 78
Met Asp Gln Ser Lys Glu Tyr Tyr Ile Gly Leu Ala Gly Gly Thr Asp
1 5 10 15
Ser Val Gly Trp Ala Val Leu Asn Pro Asp Tyr Thr Val Val Lys Lys
20 25 30
Arg Gly Lys Ser Leu Trp Gly Val Arg Leu Phe Glu Ser Gly Gln Thr
35 40 45
Ala Ala Glu Arg Arg Leu Ala Arg Ser Ala Arg Arg Arg Thr Asp Arg
50 55 60
Lys Lys Trp Arg Leu Lys Leu Leu Lys Glu Leu Phe Ala Glu Glu Val
65 70 75 80
Ala Ala Cys Asp Pro Ala Phe Phe Ala Arg Leu Ala Glu Ser Arg Tyr
85 90 95
Trp Glu Asp Asp Lys Lys Val Asp Gly Ala Asp Thr Leu Phe His Asp
100 105 110
Ala Asp Phe Thr Asp Lys Asp Tyr His Arg Gln Phe Pro Thr Ile Tyr
115 120 125
His Leu Arg Arg His Leu Met Cys Cys Thr Glu Lys Pro Asp Ile Arg
130 135 140
Leu Leu Tyr Leu Ala Val Ala His Met Ile Lys Asn Arg Gly His Phe
145 150 155 160
Leu Asn Glu Gly Gln Asp Leu Asn Gln Val Arg Arg Phe Asp Asp Val
165 170 175
Trp Gln Asn Leu Cys Ala Ala Val Ser Asp Val Leu Gly Ile Glu Leu
180 185 190
Ala Val Glu Asn Gly Ala Lys Ala Ala Glu Val Leu Thr Ser Ser Val
195 200 205
Lys Ile Lys Glu Lys Thr Lys Gln Leu Glu Ser Val Leu Gly Glu Gly
210 215 220
Glu Ser Glu Ala Asp Arg Ser Val Cys Lys Ala Leu Ala Gly Leu Leu
225 230 235 240
Ala Gly Ala Lys Val Ser Ala Val Asp Leu Phe Asn Gly Asp Glu Ala
245 250 255
Leu Lys Glu Cys Gly Lys Phe Ser Leu Ala Glu Lys Ser Ile Glu Glu
260 265 270
Leu Glu Pro Asp Leu Gly Asp Ala Leu Gly Glu Glu Arg Phe Ser Leu
275 280 285
Leu Gln Tyr Ala Tyr Ala Ala Tyr Asn Trp Ala Val Phe Ala Arg Leu
290 295 300
Leu Pro Glu Gly Lys Thr Ile Ser Glu Val Lys Thr Glu Glu Tyr Glu
305 310 315 320
Ala Tyr Lys Ala Asp Leu Arg Ala Leu Lys Gln Leu Val Lys Gln Tyr
325 330 335
Ala Ser Asp Gln Tyr Tyr Arg Val Phe Arg Ser Ala Lys Ile Lys Gly
340 345 350
Asn Tyr Ala Ser Tyr Val Gly Lys Thr Asn Cys Gly Asn Glu Lys Ser
355 360 365
Asn Pro Glu Ser Cys Lys Pro Glu Glu Phe Phe Ala Phe Leu Lys Lys
370 375 380
Glu Leu Lys Pro Leu Trp Ser Gln Asn Ile Pro Ala Ala Ala Ser Leu
385 390 395 400
Ala Ala Lys Leu Glu Ser Gly Thr Leu Leu Arg Arg Gln Arg Ser Gly
405 410 415
Glu Asn Ala Ala Ile Pro Tyr Gln Ala His Leu Gln Glu Leu Gln Ile
420 425 430
Ile Leu Lys Asn Met Gln Gln Phe Tyr Pro Phe Leu Gln Lys Ala Asp
435 440 445
Glu Asn Gly Phe Thr Pro Ala Tyr Lys Ile Glu Lys Leu Leu Thr Phe
450 455 460
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Asp Ala His Lys Glu Lys
465 470 475 480
Gly Phe Cys Trp Ile Val Lys Lys Ala Asp Val Pro Val Leu Pro Trp
485 490 495
Asn Phe Asp Gln Val Val Asp Glu Asn Ala Cys Glu Asp Ala Phe Ile
500 505 510
Gly Arg Met Ser Ala Thr Cys Thr Tyr Leu Val Gly Glu Asn Val Leu
515 520 525
Pro Gln Asn Ser Pro Leu Tyr Cys Arg Phe Met Val Leu Asn Glu Leu
530 535 540
Asn Asn Leu Arg Ile Arg Ser Glu Lys Ile Thr Pro Ala Leu Lys Gln
545 550 555 560
Ala Ile Phe Thr Gln Leu Phe Cys Ala Gly Lys Gly Gly Lys Val Thr
565 570 575
Gln Lys Lys Leu Leu Asp Phe Leu His Ser Gln Gly Ile Asp Ala Asn
580 585 590
Lys Gln Asp Ile Ser Gly Ile Asp Gly Asp Phe Lys Ala Ser Met Ala
595 600 605
Pro Ala Val Lys Leu Gln Ser Ile Phe Thr Glu Pro Leu Pro Pro Glu
610 615 620
Ile Leu Glu Arg Leu Ala Phe Ala Leu Thr Val Ser Gly Glu Ser His
625 630 635 640
Lys Met Leu Gln Asn Arg Ile Arg Ala Ile Leu Pro Asn Ala Asp Asn
645 650 655
Ala Val Ile Arg Lys Val Cys Ala Leu Lys Phe Thr Gly Trp Gly Arg
660 665 670
Leu Ser Gln Lys Leu Leu Thr Glu Ile Tyr Asp Val Asp Gln Thr Thr
675 680 685
Gly Glu Cys Arg Ser Leu Met Asp Leu Leu Trp Ser Thr Asn Asn Asn
690 695 700
Leu Met Gln Leu Leu Ser Gly Asp Phe Thr Phe Ala Ala Gly Ile Asp
705 710 715 720
Ala Tyr Asn Ala Ala Gln Asn Gly Thr Glu Asn Ile Phe Asp Tyr Asp
725 730 735
His Leu Val Lys Asp Leu Tyr Val Ser Pro Ser Val Lys Arg Gly Leu
740 745 750
Trp Gln Thr Leu Leu Leu Val Lys Glu Val Arg Lys Ile Met Gly Cys
755 760 765
Asp Pro Ala Arg Val Phe Ile Glu Met Ala Arg Gly Val Ser Pro Glu
770 775 780
Gln Lys Asn Lys Arg Thr Val Ser Arg Lys Asp Gln Leu Leu Ala Leu
785 790 795 800
Tyr Lys Ala Cys Lys Glu Asp Ala Arg Asp Trp Cys Gly Glu Leu Glu
805 810 815
Ala Leu Pro Glu Asp Lys Leu Arg Ser Asp Lys Leu Tyr Leu Tyr Tyr
820 825 830
Thr Gln Met Gly Arg Cys Met Tyr Ser Gly Glu Pro Ile Arg Leu Asp
835 840 845
Asp Leu Met His Asp Thr Ala Asn Gln Leu Tyr Asp Ile Asp His Ile
850 855 860
Tyr Pro Gln Ser Lys Thr Lys Asp Asp Ser Leu Thr Asn Arg Val Leu
865 870 875 880
Val Lys Arg Gln Leu Asn Ala Ile Lys Ser Asn Asp Tyr Pro Leu Pro
885 890 895
Gln Thr Met Arg Gln Thr Ala Leu Trp Lys Ala Leu Leu Glu Lys Gly
900 905 910
Leu Ile Ser Lys Gln Lys Tyr Leu Arg Leu Thr Arg Thr Thr Pro Phe
915 920 925
Thr Glu Glu Glu Leu Ala Gly Phe Ile Asn Arg Gln Leu Val Glu Thr
930 935 940
Arg Gln Ser Thr Lys Ala Ala Ala His Leu Leu Glu Gln Leu Leu Pro
945 950 955 960
Asn Thr Glu Val Val Tyr Val Lys Ala Gly Leu Ala Ala Asp Phe Arg
965 970 975
Gln Glu Phe Gly Phe Val Lys Cys Arg Asp Ala Asn Asp Phe His His
980 985 990
Ala Lys Asp Ala Tyr Leu Asn Ala Val Val Gly Asn Val Tyr His Glu
995 1000 1005
Lys Phe Thr Lys Asn Pro Leu Arg Phe Val Arg Ser Gly Gln Glu
1010 1015 1020
Tyr Ser Leu Asn Leu Ser Ala Leu Phe Gln Asn Trp Asn Ile Tyr
1025 1030 1035
Lys Gly Gly Arg Val Ile Trp Gln Lys Gly Glu Asp Gly Ser Leu
1040 1045 1050
Glu Thr Val Arg Ala Arg Met Ala Lys Asn Asp Pro Met Val Thr
1055 1060 1065
Arg Tyr Cys Thr Glu Gly Arg Gly Ala Leu Tyr Asp Leu Gln Pro
1070 1075 1080
Met Lys Lys Ser Lys Gly Gln Leu Pro Leu Lys Ser Ser Asp Glu
1085 1090 1095
Arg Leu Gln His Ile Asp Arg Tyr Gly Gly Tyr Asn Lys Leu Ala
1100 1105 1110
Gly Ala Tyr Phe Thr Leu Ala Ala Tyr Tyr Lys Lys Gly Lys Arg
1115 1120 1125
Val Lys Ser Ile Glu Ser Val Pro Leu Tyr Leu Ala Ala Lys Leu
1130 1135 1140
Gln Arg Asp Pro Ala Ala Leu Gln Gln Tyr Leu Ala Asp Gln Leu
1145 1150 1155
Gly Thr Asp Arg Val Glu Ile Leu Val Pro Glu Ile Lys Leu Gly
1160 1165 1170
Thr Leu Phe Lys Trp Asn Gly Tyr Pro Met Thr Leu Ser Gly Arg
1175 1180 1185
Thr Gly Pro Gln Leu Leu Phe Arg Asn Ala Ala Glu Leu Arg Thr
1190 1195 1200
Asn Ala Glu Gln Glu Gln Tyr Ile Lys Lys Met Ser Arg Tyr Leu
1205 1210 1215
Glu Lys Cys Lys Gly Arg Lys Glu Pro Leu Pro Ile Arg Pro Ala
1220 1225 1230
Tyr Asp Lys Leu Thr Pro Glu Glu Asn Leu Gln Leu Tyr Asp Ala
1235 1240 1245
Phe Thr Gln Trp Leu Thr Ser Gly Ile Tyr Ala Lys Arg Leu Ser
1250 1255 1260
Leu Gln Gly Lys Phe Leu Leu Glu Lys Arg Asp Ala Phe Ala Ala
1265 1270 1275
Leu Ser Pro Glu Ala Gln Val Arg Gln Leu Met Glu Ile Leu His
1280 1285 1290
Leu Phe Gln Cys Asn Pro Val Ala Ala Asn Leu Ser Glu Leu Gly
1295 1300 1305
Gly Ala Ala His Ala Gly Ile Leu Leu Ala Ser Lys Asn Ile Asp
1310 1315 1320
Gly Lys Val Pro Val Ser Ile Val His Gln Ser Val Thr Gly Tyr
1325 1330 1335
Phe Thr Gln Glu Val Cys Leu Asn Asp Leu
1340 1345
<210> 79
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG1-4 (D9A) protospacer and PAM for in vitro
nickase assay
<400> 79
ccgtgagcca ccacgtcgca agcctcgacc aggaagg 37
<210> 80
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG1-6 (D13A) protospacer and PAM for in vitro
nickase assay
<400> 80
tccgtgagcc accacgtcgc aagcctcgac tagaacgg 38
<210> 81
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG3-6 (D13A) protospacer and PAM for in vitro
nickase assay
<400> 81
agccaccacg tcgcaagcct cgacgtgggt ta 32
<210> 82
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG3-7 (D12A) protospacer and PAM for in vitro
nickase assay
<400> 82
agccaccacg tcgcaagcct cgacgtgtta c 31
<210> 83
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG3-8 (D13A) protospacer and PAM for in vitro
nickase assay
<400> 83
agccaccacg tcgcaagcct cgacgtgggt ta 32
<210> 84
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG4-5 (D17A) protospacer and PAM for in vitro
nickase assay
<400> 84
agccaccacg tcgcaagcct cgacggcca 29
<210> 85
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG14-1 (D23A) protospacer and PAM for in vitro
nickase assay
<400> 85
tccgtgagcc accacgtcgc aagcctcgac ggcggggacg 40
<210> 86
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG15-1 (D8A) protospacer and PAM for in vitro
nickase assay
<400> 86
ccgtgagcca ccacgtcgca agcctcgact ggacctg 37
<210> 87
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: target sequence
<220>
<223> Description: nMG18-1 (D12A) protospacer and PAM for in vitro
nickase assay
<400> 87
agccaccacg tcgcaagcct cgaccgtaat tg 32
<210> 88
<211> 121
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG1-4 (D9A) single guide RNA for in vitro
nickase assay
<400> 88
ccaccacgtc gcaagcctcg acgttttgat ttactcgaaa gagtccaatc ataattgacc 60
ggagaataat tgattcctct acaatgtacg aataaattca ttctctaaac cttaaaaatt 120
t 121
<210> 89
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG1-6 (D13A) single guide RNA for in vitro
nickase assay
<400> 89
ccaccacgtc gcaagcctcg acgttttgac ttgaaaaagt cttaactgat tttgccgaat 60
ttcaagctct gcattgcacc ttggcattcg gcatatttt 99
<210> 90
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG3-6 (D13A) single guide RNA for in vitro
nickase assay
<400> 90
ccaccacgtc gcaagcctcg acgttgagaa tcgaaagatt cttaataagg catccttccg 60
atgctgactt ctcaccgtcc gttttccaat aggagcgggc ggtatgtttt 110
<210> 91
<211> 113
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG3-7 (D12A) single guide RNA for in vitro
nickase assay
<400> 91
ccaccacgtc gcaagcctcg acgttgggaa ccgaaaggtt cccaataagg cgcatcttgg 60
cgctgacttc tcaccgtcct cttgctgctt agcagagggc ggtatgtttt ttt 113
<210> 92
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG3-8 (D13A) single guide RNA for in vitro
nickase assay
<400> 92
ccaccacgtc gcaagcctcg acgttgagaa tctttcgaaa gaaagattct taataaggca 60
tccttccgat gctgacttct caccgtccgg ctcctcttag gaacgggcgg tatgtttt 118
<210> 93
<211> 124
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG4-5 (D17A) single guide RNA for in vitro
nickase assay
<400> 93
ccaccacgtc gcaagcctcg acgctgtggc ttgcggggga aaccccttgt cacagtaagg 60
gactttcgtt cgcgaaaggc aacctcgcca gcatcgctgg gcgaggacca gggcaaggcg 120
attt 124
<210> 94
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG14-1 (D23A) single guide RNA for in vitro
nickase assay
<400> 94
ccaccacgtc gcaagcctcg acgtcttgag cgaaagctcc agacaagggg agccacttaa 60
gtggcttacc cgtaaagtaa cccccgttca atcttcggat tgggcggggc gaactttt 118
<210> 95
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG15-1 (D8A) single guide RNA for in vitro
nickase assay
<400> 95
ccaccacgtc gcaagcctcg acgttgtaat tccctagaaa taggttatta caataaggtc 60
caacaggagt gttggtaccg taaagctcta acggcaccca cgggtgccgt tatctttt 118
<210> 96
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: single guide RNA
<220>
<223> Description: nMG18-1 (D12A) single guide RNA for in vitro
nickase assay
<400> 96
ccaccacgtc gcaagcctcg acgtttgaga gtagtgaaaa ctacgagttc aaatacaatt 60
ttttcaaatt gccctatagg gccctcacag tgtgagattt t 101
<210> 97
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA1-4 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 97
cgtttgccgt ctgaatttga cc 22
<210> 98
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA1-4 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 98
gaagatcagg atatgtggcg ga 22
<210> 99
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA1-4 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 99
acgggtaaca gtttctttat gg 22
<210> 100
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA1-6 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 100
cgttgctgca taaaccgact ac 22
<210> 101
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA1-6 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 101
aaaacccgaa actgtggagc gc 22
<210> 102
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA1-6 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 102
gattgaaaat ggtctgctgc tg 22
<210> 103
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-6 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 103
tacgggtaac agtttcttta tg 22
<210> 104
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-6 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 104
gcgttggcaa tttaaccgcc ag 22
<210> 105
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-6 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 105
ctgaatatcg acggtttcca ta 22
<210> 106
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-7 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 106
cacatttaat gttgatgaaa gc 22
<210> 107
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-7 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 107
acacaaatca gcgatttcca tg 22
<210> 108
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-7 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 108
atggatgagc agacgatggt gc 22
<210> 109
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-8 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 109
ttcatctgtg gtgcaacggg cg 22
<210> 110
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-8 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 110
acgagcatca tcctctgcat gg 22
<210> 111
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA3-8 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 111
cgacccgcat tgaccctaac gc 22
<210> 112
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA4-5 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 112
cacaaatcag cgatttccat gt 22
<210> 113
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA4-5 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 113
tgatgaagca gaacaacttt aa 22
<210> 114
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA4-5 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 114
aatattgaaa cccacggcat gg 22
<210> 115
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA14-1 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 115
tcaaaaaatg gctttcgcta cc 22
<210> 116
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA14-1 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 116
aagcagcgtt gttgcagtgc ac 22
<210> 117
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA14-1 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 117
tcagccggaa aacctaccgg at 22
<210> 118
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA15-1 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 118
gaagatcagg atatgtggcg ga 22
<210> 119
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA15-1 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 119
aacgtcgaaa acccgaaact gt 22
<210> 120
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA15-1 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 120
aaacccacgg catggtgcca at 22
<210> 121
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA18-1 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 121
aaaacccgaa actgtggagc gc 22
<210> 122
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA18-1 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 122
ggcaactctg gctcacagta cg 22
<210> 123
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGA18-1 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 123
ccggaaaacc taccggattg at 22
<210> 124
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: ABE8.17m sgRNA spacer 1 (targeting E. coli lacZ)
<400> 124
tttctttcac agatgtggat 20
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: ABE8.17m sgRNA spacer 2 (targeting E. coli lacZ)
<400> 125
caggatatgt ggcggatgag 20
<210> 126
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: ABE8.17m sgRNA spacer 3 (targeting E. coli lacZ)
<400> 126
tgcgaatacg cccacgcgat 20
<210> 127
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC1-4 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 127
cggcgtttca tctgtggtgc aa 22
<210> 128
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC1-4 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 128
gccaggacag tcgtttgccg tc 22
<210> 129
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC1-4 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 129
tcagccgcgc tgtactggag gc 22
<210> 130
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC1-6 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 130
cccttcccaa cagttgcgca gc 22
<210> 131
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC1-6 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 131
ctgtcgtcgt cccctcaaac tg 22
<210> 132
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC1-6 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 132
ctacgtctga acgtcgaaaa cc 22
<210> 133
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-6 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 133
gtgacggcag ttatctggaa ga 22
<210> 134
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-6 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 134
atgatttcag ccgcgctgta ct 22
<210> 135
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-6 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 135
ttactgccgc ctgttttgac cg 22
<210> 136
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-7 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 136
cgaatggcgc tttgcctggt tt 22
<210> 137
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-7 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 137
tcccctcaaa ctggcagatg ca 22
<210> 138
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-7 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 138
atctacacca acgtgaccta tc 22
<210> 139
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-8 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 139
ttcatctgtg gtgcaacggg cg 22
<210> 140
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-8 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 140
acgagcatca tcctctgcat gg 22
<210> 141
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC3-8 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 141
cgacccgcat tgaccctaac gc 22
<210> 142
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC4-5 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 142
caacgggcgc tgggtcggtt ac 22
<210> 143
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC4-5 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 143
cacaaatcag cgatttccat gt 22
<210> 144
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC4-5 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 144
aaggcggcgg agccgacacc ac 22
<210> 145
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC14-1 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 145
cggtcaatcc gccgtttgtt cc 22
<210> 146
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC14-1 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 146
tcctttgcga atacgcccac gc 22
<210> 147
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC14-1 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 147
ggtcggctta cggcggtgat tt 22
<210> 148
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC15-1 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 148
gccgatcgcg tcacactacg tc 22
<210> 149
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC15-1 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 149
gatccgcgct ggctaccggc ga 22
<210> 150
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC15-1 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 150
ccttcccgcc cggtgcagta tg 22
<210> 151
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC18-1 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 151
tcagccgcgc tgtactggag gc 22
<210> 152
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC18-1 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 152
gaccagccct tcccggctgt gc 22
<210> 153
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: MGC18-1 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 153
tccgtttatc cgggcaaacc at 22
<210> 154
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: BE3 sgRNA spacer 1 (targeting E. coli lacZ)
<400> 154
cctctggatg tcgctccaca 20
<210> 155
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: BE3 sgRNA spacer 2 (targeting E. coli lacZ)
<400> 155
gggacgcgcg aattgaatta 20
<210> 156
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: BE3 sgRNA spacer 3 (targeting E. coli lacZ)
<400> 156
cgttttacaa cgtcgtgact 20
<210> 157
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG1-4 (D9A)
<400> 157
tgaaaaagaa agttttcgca tttgcgcttg gtaaagcaag 40
<210> 158
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG1-4 (D9A)
<400> 158
tggtatatct ccttcttaaa gttaaac 27
<210> 159
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG1-6 (D13A)
<400> 159
accatgtttg gggctttgcg attggcaaag ggtct 35
<210> 160
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG1-6 (D13A)
<400> 160
tgttcttttc tttctccatg gtata 25
<210> 161
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG3-6 (D13A)
<400> 161
attatcgcat tggcgtggcg gtcggggatc gcagc 35
<210> 162
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG3-6 (D13A)
<400> 162
tcttcatatc ggttgacatg g 21
<210> 163
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG3-7 (D12A)
<400> 163
agtaccgcat tggcatcgcg gtgggcgatc gctcg 35
<210> 164
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG3-7 (D12A)
<400> 164
tagtatgttc gctcatggta ta 22
<210> 165
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG3-8 (D13A)
<400> 165
attaccgcat tggcgtggcg gtaggtgatc gtagt 35
<210> 166
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG3-8 (D13A)
<400> 166
tcttcatatc agtgctcatg g 21
<210> 167
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG4-5 (D17A)
<400> 167
gctactgctt gggcctggcg gtaggtgtgc aagga 35
<210> 168
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG4-5 (D17A)
<400> 168
tggtcgcctg cagggtct 18
<210> 169
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG14-1 (D23A)
<400> 169
acctggttct gggtatggcg ccgggcatcg cctca 35
<210> 170
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG14-1 (D23A)
<400> 170
ggcgaggcaa gcctaatt 18
<210> 171
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG15-1 (D8A)
<400> 171
actatgtgct cggcctggcg gtcggtattg cttca 35
<210> 172
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG15-1 (D8A)
<400> 172
tcatggtata tctccttctt aaagt 25
<210> 173
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG18-1 (D12A)
<400> 173
taaagagtac tacattggtc tggcgggtgg tacggactcg 40
<210> 174
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of MG18-1 (D12A)
<400> 174
ctctggtcca tggtatatct c 21
<210> 175
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of SpCas9 (D10A)
<400> 175
gataagaaat actcaatagg actggcgatt ggcacaaata gc 42
<210> 176
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Site-directed mutagenesis of SpCas9 (D10A)
<400> 176
catggtatat ctccttctta aagtt 25
<210> 177
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: For lacZ sequencing
<400> 177
ccaggcttta cactttatgc t 21
<210> 178
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: For lacZ sequencing
<400> 178
gtatgtggtg gatgaagcc 19
<210> 179
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify the fragment for nickase assay
<400> 179
agcttccagg gggaaacg 18
<210> 180
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify the fragment for nickase assay
<400> 180
attaacctat aaaaataggc gtatca 26
<210> 181
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify T7 promoter-His tag-adenine deaminase for
MGA entry plasmid
<400> 181
gatataccat gggcagcagt catcatcatc accatcactc cgaggttgaa tttagtcatg 60
<210> 182
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify T7 promoter-His tag-adenine deaminase for
MGA entry plasmid
<400> 182
agactttcct cttcttcttg ggagacccgc cagagcctcg aggacccacc agagctgcct 60
<210> 183
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify SV40 NLS-vector backbone for
MGA entry plasmid
<400> 183
tctggcgggt ctcccaagaa gaagaggaaa gtctaagatc cggctgctaa caaag 55
<210> 184
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify SV40 NLS-vector backbone for
MGA entry plasmid
<400> 184
ctccttgcat gctctagaat taattaaacc attccttgcg gcggc 45
<210> 185
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify vector backbone for
MGA entry plasmid
<400> 185
aggaatggtt taattaattc tagagcatgc aaggagatgg cgcccaac 48
<210> 186
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify vector backbone for
MGA entry plasmid
<400> 186
gtgatggtga tgatgatgac tgctgcccat ggtatatctc cttcttaaag ttaaac 56
<210> 187
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify T7 promoter-His-tag-cytosine deaminase for
MGC entry plasmid
<400> 187
aggagatata ccatgggcag cagtcatcat catcaccatc acatgtcgtc tgagaccggg 60
<210> 188
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify T7 promoter-His-tag-cytosine deaminase for
MGC entry plasmid
<400> 188
taatatctga aagattggta gaaccaccag acccgcggca gattcaggtg tcgcactttc 60
<210> 189
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify UGI-SV40 NLS for MGC entry plasmid
<400> 189
cgacacctga atctgccgcg ggtctggtgg ttctaccaat cttt 44
<210> 190
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify UGI-SV40 NLS for MGC entry plasmid
<400> 190
ttagactttc ctcttcttct tgggagaacc accagaaagc attttgatct tgttttcgcc 60
<210> 191
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify SV40 NLS-vector backbone for
MGC entry plasmid
<400> 191
ctggtggttc tcccaagaag aagaggaaag tctaagatcc ggctgctaac aaag 54
<210> 192
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify SV40 NLS-vector backbone for
MGC entry plasmid
<400> 192
ctccttgcat gctctagaat taattaacca ttccttgcgg cggcg 45
<210> 193
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify vector backbone for MGC entry plasmid
<400> 193
aggaatggtt aattaattct agagcatgca aggagatggc gcccaaca 48
<210> 194
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify vector backbone for MGC entry plasmid
<400> 194
gtgatgatga tgactgctgc ccatggtata tctccttctt aaagttaaac 50
<210> 195
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG1-4 (D9A) for pMGA expression plasmid
<400> 195
aaagtagtgg aggcagctct ggtgggtcca tgaaaaagaa agttttcgca tttgc 55
<210> 196
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG1-4 (D9A) for pMGA expression plasmid
<400> 196
ctcttcttct tgggagaccc gccagagcct ttgctttcga cttttttaaa ttcgg 55
<210> 197
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG1-6 (D13A) for pMGA expression plasmid
<400> 197
gaaagtagtg gaggcagctc tggtgggtcc atggagaaag aaaagaacaa ccat 54
<210> 198
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG1-6 (D13A) for pMGA expression plasmid
<400> 198
cctcttcttc ttgggagacc cgccagagcc cagttcactt aactcgacgc 50
<210> 199
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-6 (D13A) for pMGA expression plasmid
<400> 199
gaaagtagtg gaggcagctc tggtgggtcc atgtcaaccg atatgaagaa ttatc 55
<210> 200
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-6 (D13A) for pMGA expression plasmid
<400> 200
cctcttcttc ttgggagacc cgccagagcc cccctctact ccaagcgc 48
<210> 201
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-7 (D12A) for pMGA expression plasmid
<400> 201
gaaagtagtg gaggcagctc tggtgggtcc atgagcgaac atactaagta cc 52
<210> 202
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-7 (D12A) for pMGA expression plasmid
<400> 202
cctcttcttc ttgggagacc cgccagagcc ttcttgttca tcaagggctg 50
<210> 203
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-8 (D13A) for pMGA expression plasmid
<400> 203
gaaagtagtg gaggcagctc tggtgggtcc atgagcactg atatgaagaa ttac 54
<210> 204
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-8 (D13A) for pMGA expression plasmid
<400> 204
cctcttcttc ttgggagacc cgccagagcc accctcgacg cctaacgc 48
<210> 205
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG4-5 (D17A) for pMGA expression plasmid
<400> 205
gaaagtagtg gaggcagctc tggtgggtcc atgggagatc agcagacc 48
<210> 206
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG4-5 (D17A) for pMGA expression plasmid
<400> 206
cctcttcttc ttgggagacc cgccagagcc atcgttcgcg ggaaacac 48
<210> 207
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG14-1 (D23A) for pMGA expression plasmid
<400> 207
gaaagtagtg gaggcagctc tggtgggtcc atggaaatta caattaaccg tgaga 55
<210> 208
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG14-1 (D23A) for pMGA expression plasmid
<400> 208
cctcttcttc ttgggagacc cgccagagcc cttaatcggg ctctcacg 48
<210> 209
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG15-1 (D8A) for pMGA expression plasmid
<400> 209
gaaagtagtg gaggcagctc tggtgggtcc atgaactatg tgctcggcc 49
<210> 210
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG15-1 (D8A) for pMGA expression plasmid
<400> 210
cctcttcttc ttgggagacc cgccagagcc acggaacgtt tggcgctt 48
<210> 211
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG18-1 (D12A) for pMGA expression plasmid
<400> 211
gaaagtagtg gaggcagctc tggtgggtcc atggaccaga gtaaagagta ct 52
<210> 212
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG18-1 (D12A) for pMGA expression plasmid
<400> 212
cctcttcttc ttgggagacc cgccagagcc cagatcattt aaacacacct cttg 54
<210> 213
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify SpCas9 (D10A) for pMGA expression plasmid
<400> 213
gaaagtagtg gaggcagctc tggtgggtcc atggataaga aatactcaat aggac 55
<210> 214
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify SpCas9 (D10A) for pMGA expression plasmid
<400> 214
cctcttcttc ttgggagacc cgccagagcc gtcacctccc agctgact 48
<210> 215
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG1-4 (D9A) for pMGC expression plasmid
<400> 215
acatccgaaa gtgcgacacc tgaatctgcc atgaaaaaga aagttttcgc atttgc 56
<210> 216
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG1-4 (D9A) for pMGC expression plasmid
<400> 216
atctgaaaga ttggtagaac caccagaccc tttgctttcg acttttttaa attcgg 56
<210> 217
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG1-6 (D13A) for pMGC expression plasmid
<400> 217
acatccgaaa gtgcgacacc tgaatctgcc atggagaaag aaaagaacaa ccat 54
<210> 218
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG1-6 (D13A) for pMGC expression plasmid
<400> 218
atctgaaaga ttggtagaac caccagaccc cagttcactt aactcgacgc 50
<210> 219
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-6 (D13A) for pMGC expression plasmid
<400> 219
catccgaaag tgcgacacct gaatctgcca tgtcaaccga tatgaagaat tatc 54
<210> 220
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-6 (D13A) for pMGC expression plasmid
<400> 220
atctgaaaga ttggtagaac caccagaccc cccctctact ccaagcgc 48
<210> 221
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-7 (D12A) for pMGC expression plasmid
<400> 221
acatccgaaa gtgcgacacc tgaatctgcc atgagcgaac atactaagta cc 52
<210> 222
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-7 (D12A) for pMGC expression plasmid
<400> 222
atctgaaaga ttggtagaac caccagaccc ttcttgttca tcaagggctg 50
<210> 223
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-8 (D13A) for pMGC expression plasmid
<400> 223
acatccgaaa gtgcgacacc tgaatctgcc atgagcactg atatgaagaa ttac 54
<210> 224
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG3-8 (D13A) for pMGC expression plasmid
<400> 224
atctgaaaga ttggtagaac caccagaccc accctcgacg cctaacgc 48
<210> 225
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG4-5 (D17A) for pMGC expression plasmid
<400> 225
acatccgaaa gtgcgacacc tgaatctgcc atgggagatc agcagacc 48
<210> 226
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG4-5 (D17A) for pMGC expression plasmid
<400> 226
atctgaaaga ttggtagaac caccagaccc atcgttcgcg ggaaacac 48
<210> 227
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG14-1 (D23A) for pMGC expression plasmid
<400> 227
acatccgaaa gtgcgacacc tgaatctgcc atggaaatta caattaaccg tgag 54
<210> 228
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG14-1 (D23A) for pMGC expression plasmid
<400> 228
atctgaaaga ttggtagaac caccagaccc cttaatcggg ctctcacga 49
<210> 229
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG15-1 (D8A) for pMGC expression plasmid
<400> 229
acatccgaaa gtgcgacacc tgaatctgcc atgaactatg tgctcggcc 49
<210> 230
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG15-1 (D8A) for pMGC expression plasmid
<400> 230
atctgaaaga ttggtagaac caccagaccc acggaacgtt tggcgctt 48
<210> 231
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG18-1 (D12A) for pMGC expression plasmid
<400> 231
atccgaaagt gcgacacctg aatctgccat ggaccagagt aaagagtac 49
<210> 232
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify nMG18-1 (D12A) for pMGC expression plasmid
<400> 232
tatctgaaag attggtagaa ccaccagacc ccagatcatt taaacacacc tcttg 55
<210> 233
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify SpCas9 (D10A) for pMGC expression plasmid
<400> 233
acatccgaaa gtgcgacacc tgaatctgcc atggataaga aatactcaat aggac 55
<210> 234
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify SpCas9 (D10A) for pMGC expression plasmid
<400> 234
atctgaaaga ttggtagaac caccagaccc gtcacctccc agctgact 48
<210> 235
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-4_sgRNA spacer 1
<400> 235
ggtcaaattc agacggcaaa cgctatagtg agtcgtatta aggt 44
<210> 236
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-4_sgRNA spacer 1
<400> 236
tatagcgttt gccgtctgaa tttgaccgtt ttgatttact cgaaagagtc 50
<210> 237
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-4_sgRNA spacer 2
<400> 237
caaaactccg ccacatatcc tgatcttcct atagtgagtc gtattaaggt 50
<210> 238
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-4_sgRNA spacer 2
<400> 238
tataggaaga tcaggatatg tggcggagtt ttgatttact cgaaagagtc 50
<210> 239
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-4_sgRNA spacer 3
<400> 239
caaaacccat aaagaaactg ttacccgtct atagtgagtc gtattaaggt 50
<210> 240
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-4_sgRNA spacer 3
<400> 240
tatagacggg taacagtttc tttatgggtt ttgatttact cgaaagagtc 50
<210> 241
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-6_sgRNA spacer 1
<400> 241
caaaacgtag tcggtttatg cagcaacgct atagtgagtc gtattaaggt 50
<210> 242
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-6_sgRNA spacer 1
<400> 242
tagcgttgct gcataaaccg actacgtttt gacttgaaaa agtcttaact 50
<210> 243
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-6_sgRNA spacer 2
<400> 243
caaaacgcgc tccacagttt cgggttttct atagtgagtc gtattaaggt 50
<210> 244
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-6_sgRNA spacer 2
<400> 244
tagaaaaccc gaaactgtgg agcgcgtttt gacttgaaaa agtcttaact 50
<210> 245
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-6_sgRNA spacer 3
<400> 245
caaaaccagc agcagaccat tttcaatcct atagtgagtc gtattaaggt 50
<210> 246
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA1-6_sgRNA spacer 3
<400> 246
taggattgaa aatggtctgc tgctggtttt gacttgaaaa agtcttaact 50
<210> 247
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-6_sgRNA spacer 1
<400> 247
ctcaaccata aagaaactgt tacccgtact atagtgagtc gtattaaggt 50
<210> 248
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-6_sgRNA spacer 1
<400> 248
atagtacggg taacagtttc tttatggttg agaatcgaaa gattcttaat 50
<210> 249
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-6_sgRNA spacer 2
<400> 249
ctcaacctgg cggttaaatt gccaacgcct atagtgagtc gtattaaggt 50
<210> 250
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-6_sgRNA spacer 2
<400> 250
taggcgttgg caatttaacc gccaggttga gaatcgaaag attcttaata 50
<210> 251
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-6_sgRNA spacer 3
<400> 251
ctcaactatg gaaaccgtcg atattcagct atagtgagtc gtattaaggt 50
<210> 252
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-6_sgRNA spacer 3
<400> 252
tagctgaata tcgacggttt ccatagttga gaatcgaaag attcttaata 50
<210> 253
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-7_sgRNA spacer 1
<400> 253
cccaacgctt tcatcaacat taaatgtgct atagtgagtc gtattaaggt 50
<210> 254
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-7_sgRNA spacer 1
<400> 254
tcactatagc acatttaatg ttgatgaaag cgttgggaac cgaaaggttc 50
<210> 255
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-7_sgRNA spacer 2
<400> 255
cccaaccatg gaaatcgctg atttgtgtct atagtgagtc gtattaaggt 50
<210> 256
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-7_sgRNA spacer 2
<400> 256
tcactataga cacaaatcag cgatttccat ggttgggaac cgaaaggttc 50
<210> 257
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-7_sgRNA spacer 3
<400> 257
cccaacgcac catcgtctgc tcatccatct atagtgagtc gtattaaggt 50
<210> 258
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-7_sgRNA spacer 3
<400> 258
tcactataga tggatgagca gacgatggtg cgttgggaac cgaaaggttc 50
<210> 259
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA4-5_sgRNA spacer 1
<400> 259
cacagcacat ggaaatcgct gatttgtgct atagtgagtc gtattaaggt 50
<210> 260
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA4-5_sgRNA spacer 1
<400> 260
cactatagca caaatcagcg atttccatgt gctgtggctt gcggggga 48
<210> 261
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA4-5_sgRNA spacer 2
<400> 261
cacagcttaa agttgttctg cttcatcact atagtgagtc gtattaaggt 50
<210> 262
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA4-5_sgRNA spacer 2
<400> 262
cactatagtg atgaagcaga acaactttaa gctgtggctt gcggggga 48
<210> 263
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA4-5_sgRNA spacer 3
<400> 263
cacagcccat gccgtgggtt tcaatattct atagtgagtc gtattaaggt 50
<210> 264
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA4-5_sgRNA spacer 3
<400> 264
cactatagaa tattgaaacc cacggcatgg gctgtggctt gcggggga 48
<210> 265
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA14-1_sgRNA spacer 1
<400> 265
caagacggta gcgaaagcca ttttttgact atagtgagtc gtattaaggt 50
<210> 266
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA14-1_sgRNA spacer 1
<400> 266
cactatagtc aaaaaatggc tttcgctacc gtcttgagcg aaagctcc 48
<210> 267
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA14-1_sgRNA spacer 2
<400> 267
caagacgtgc actgcaacaa cgctgcttct atagtgagtc gtattaaggt 50
<210> 268
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA14-1_sgRNA spacer 2
<400> 268
cactatagaa gcagcgttgt tgcagtgcac gtcttgagcg aaagctcc 48
<210> 269
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA14-1_sgRNA spacer 3
<400> 269
caagacatcc ggtaggtttt ccggctgact atagtgagtc gtattaaggt 50
<210> 270
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA14-1_sgRNA spacer 3
<400> 270
cactatagtc agccggaaaa cctaccggat gtcttgagcg aaagctcc 48
<210> 271
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA15-1_sgRNA spacer 1
<400> 271
tacaactccg ccacatatcc tgatcttcct atagtgagtc gtattaaggt 50
<210> 272
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA15-1_sgRNA spacer 1
<400> 272
tataggaaga tcaggatatg tggcggagtt gtaattccct agaaataggt 50
<210> 273
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA15-1_sgRNA spacer 2
<400> 273
tacaacacag tttcgggttt tcgacgttct atagtgagtc gtattaaggt 50
<210> 274
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA15-1_sgRNA spacer 2
<400> 274
tatagaacgt cgaaaacccg aaactgtgtt gtaattccct agaaataggt 50
<210> 275
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA15-1_sgRNA spacer 3
<400> 275
tacaacattg gcaccatgcc gtgggtttct atagtgagtc gtattaaggt 50
<210> 276
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA15-1_sgRNA spacer 3
<400> 276
tatagaaacc cacggcatgg tgccaatgtt gtaattccct agaaataggt 50
<210> 277
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA18-1_sgRNA spacer 1
<400> 277
tcaaacgcgc tccacagttt cgggttttct atagtgagtc gtattaaggt 50
<210> 278
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA18-1_sgRNA spacer 1
<400> 278
tatagaaaac ccgaaactgt ggagcgcgtt tgagagtagt gaaaactacg 50
<210> 279
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA18-1_sgRNA spacer 2
<400> 279
tcaaaccgta ctgtgagcca gagttgccct atagtgagtc gtattaaggt 50
<210> 280
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA18-1_sgRNA spacer 2
<400> 280
tatagggcaa ctctggctca cagtacggtt tgagagtagt gaaaactacg 50
<210> 281
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA18-1_sgRNA spacer 3
<400> 281
tcaaacatca atccggtagg ttttccggct atagtgagtc gtattaaggt 50
<210> 282
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA18-1_sgRNA spacer 3
<400> 282
tatagccgga aaacctaccg gattgatgtt tgagagtagt gaaaactacg 50
<210> 283
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify ABE8.17m_sgRNA spacer 1
<400> 283
atccacatct gtgaaagaaa ctatagtgag tcgtattagg a 41
<210> 284
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify ABE8.17m_sgRNA spacer 1
<400> 284
tttctttcac agatgtggat gttttagagc tagaaatagc aagtt 45
<210> 285
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify ABE8.17m_sgRNA spacer 2
<400> 285
ctcatccgcc acatatcctg ctatagtgag tcgtattagg a 41
<210> 286
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify ABE8.17m_sgRNA spacer 2
<400> 286
caggatatgt ggcggatgag gttttagagc tagaaatagc aagtt 45
<210> 287
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify ABE8.17m_sgRNA spacer 3
<400> 287
atcgcgtggg cgtattcgca ctatagtgag tcgtattagg a 41
<210> 288
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify ABE8.17m_sgRNA spacer 3
<400> 288
tgcgaatacg cccacgcgat gttttagagc tagaaatagc aagtt 45
<210> 289
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-4_spacer 1
<400> 289
caaaacttgc accacagatg aaacgccgct atagtgagtc gtattaaggt 50
<210> 290
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-4_spacer 1
<400> 290
tatagcggcg tttcatctgt ggtgcaagtt ttgatttact cgaaagagtc 50
<210> 291
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-4_spacer 2
<400> 291
caaaacgacg gcaaacgact gtcctggcct atagtgagtc gtattaaggt 50
<210> 292
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-4_spacer 2
<400> 292
tataggccag gacagtcgtt tgccgtcgtt ttgatttact cgaaagagtc 50
<210> 293
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-4_spacer 3
<400> 293
caaaacgcct ccagtacagc gcggctgact atagtgagtc gtattaaggt 50
<210> 294
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-4_spacer 3
<400> 294
tatagtcagc cgcgctgtac tggaggcgtt ttgatttact cgaaagagtc 50
<210> 295
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-6_spacer 1
<400> 295
caaaacgctg cgcaactgtt gggaagggct atagtgagtc gtattaaggt 50
<210> 296
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-6_spacer 1
<400> 296
tagcccttcc caacagttgc gcagcgtttt gacttgaaaa agtcttaact 50
<210> 297
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-6_spacer 2
<400> 297
caaaaccagt ttgaggggac gacgacagct atagtgagtc gtattaaggt 50
<210> 298
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-6_spacer 2
<400> 298
tagctgtcgt cgtcccctca aactggtttt gacttgaaaa agtcttaact 50
<210> 299
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-6_spacer 3
<400> 299
caaaacggtt ttcgacgttc agacgtagct atagtgagtc gtattaaggt 50
<210> 300
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC1-6_spacer 3
<400> 300
tagctacgtc tgaacgtcga aaaccgtttt gacttgaaaa agtcttaact 50
<210> 301
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-6_spacer 1
<400> 301
ctcaactctt ccagataact gccgtcacct atagtgagtc gtattaaggt 50
<210> 302
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-6_spacer 1
<400> 302
aggtgacggc agttatctgg aagagttgag aatcgaaaga ttcttaataa 50
<210> 303
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-6_spacer 2
<400> 303
tcaacagtac agcgcggctg aaatcatcta tagtgagtcg tattaaggtc 50
<210> 304
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-6_spacer 2
<400> 304
agatgatttc agccgcgctg tactgttgag aatcgaaaga ttcttaataa 50
<210> 305
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-6_spacer 3
<400> 305
ctcaaccggt caaaacaggc ggcagtaact atagtgagtc gtattaaggt 50
<210> 306
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-6_spacer 3
<400> 306
tagttactgc cgcctgtttt gaccggttga gaatcgaaag attcttaata 50
<210> 307
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-7_spacer 1
<400> 307
cccaacaaac caggcaaagc gccattcgct atagtgagtc gtattaaggt 50
<210> 308
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-7_spacer 1
<400> 308
cactatagcg aatggcgctt tgcctggttt gttgggaacc gaaaggttc 49
<210> 309
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-7_spacer 2
<400> 309
cccaactgca tctgccagtt tgaggggact atagtgagtc gtattaaggt 50
<210> 310
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-7_spacer 2
<400> 310
cactatagtc ccctcaaact ggcagatgca gttgggaacc gaaaggttc 49
<210> 311
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-7_spacer 3
<400> 311
cccaacgata ggtcacgttg gtgtagatct atagtgagtc gtattaaggt 50
<210> 312
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-7_spacer 3
<400> 312
cactatagat ctacaccaac gtgacctatc gttgggaacc gaaaggttc 49
<210> 313
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC4-5_spacer 1
<400> 313
cacagcgtaa ccgacccagc gcccgttgct atagtgagtc gtattaaggt 50
<210> 314
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC4-5_spacer 1
<400> 314
cactatagca acgggcgctg ggtcggttac gctgtggctt gcggggga 48
<210> 315
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC4-5_spacer 2
<400> 315
cacagcacat ggaaatcgct gatttgtgct atagtgagtc gtattaaggt 50
<210> 316
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC4-5_spacer 2
<400> 316
cactatagca caaatcagcg atttccatgt gctgtggctt gcggggga 48
<210> 317
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC4-5_spacer 3
<400> 317
cacagcgtgg tgtcggctcc gccgccttct atagtgagtc gtattaaggt 50
<210> 318
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC4-5_spacer 3
<400> 318
cactatagaa ggcggcggag ccgacaccac gctgtggctt gcggggga 48
<210> 319
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC14-1_spacer 1
<400> 319
caagacggaa caaacggcgg attgaccgct atagtgagtc gtattaaggt 50
<210> 320
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC14-1_spacer 1
<400> 320
cactatagcg gtcaatccgc cgtttgttcc gtcttgagcg aaagctcc 48
<210> 321
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC14-1_spacer 2
<400> 321
caagacgcgt gggcgtattc gcaaaggact atagtgagtc gtattaaggt 50
<210> 322
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC14-1_spacer 2
<400> 322
cactatagtc ctttgcgaat acgcccacgc gtcttgagcg aaagctcc 48
<210> 323
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC14-1_spacer 3
<400> 323
caagacaaat caccgccgta agccgaccct atagtgagtc gtattaaggt 50
<210> 324
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC14-1_spacer 3
<400> 324
cactataggg tcggcttacg gcggtgattt gtcttgagcg aaagctcc 48
<210> 325
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC15-1_spacer 1
<400> 325
tacaacgacg tagtgtgacg cgatcggcct atagtgagtc gtattaaggt 50
<210> 326
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC15-1_spacer 1
<400> 326
ataggccgat cgcgtcacac tacgtcgttg taattcccta gaaataggtt 50
<210> 327
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC15-1_spacer 2
<400> 327
tacaactcgc cggtagccag cgcggatcct atagtgagtc gtattaaggt 50
<210> 328
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC15-1_spacer 2
<400> 328
ataggatccg cgctggctac cggcgagttg taattcccta gaaataggtt 50
<210> 329
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC15-1_spacer 3
<400> 329
tacaaccata ctgcaccggg cgggaaggct atagtgagtc gtattaaggt 50
<210> 330
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC15-1_spacer 3
<400> 330
atagccttcc cgcccggtgc agtatggttg taattcccta gaaataggtt 50
<210> 331
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC18-1_spacer 1
<400> 331
tcaaacgcct ccagtacagc gcggctgact atagtgagtc gtattaaggt 50
<210> 332
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC18-1_spacer 1
<400> 332
ctatagtcag ccgcgctgta ctggaggcgt ttgagagtag tgaaaactac 50
<210> 333
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC18-1_spacer 2
<400> 333
tcaaacgcac agccgggaag ggctggtcct atagtgagtc gtattaaggt 50
<210> 334
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC18-1_spacer 2
<400> 334
ctataggacc agcccttccc ggctgtgcgt ttgagagtag tgaaaactac 50
<210> 335
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC18-1_spacer 3
<400> 335
tcaaacatgg tttgcccgga taaacggact atagtgagtc gtattaaggt 50
<210> 336
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC18-1_spacer 3
<400> 336
ctatagtccg tttatccggg caaaccatgt ttgagagtag tgaaaactac 50
<210> 337
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify BE3_sgRNA spacer 1
<400> 337
tgtggagcga catccagagg ctatagtgag tcgtattagg a 41
<210> 338
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify BE3_sgRNA spacer 1
<400> 338
cctctggatg tcgctccaca gttttagagc tagaaatagc aagtt 45
<210> 339
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify BE3_sgRNA spacer 2
<400> 339
taattcaatt cgcgcgtccc ctatagtgag tcgtattagg a 41
<210> 340
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify BE3_sgRNA spacer 2
<400> 340
gggacgcgcg aattgaatta gttttagagc tagaaatagc aagtt 45
<210> 341
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify BE3_sgRNA spacer 3
<400> 341
agtcacgacg ttgtaaaacg ctatagtgag tcgtattagg a 41
<210> 342
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify BE3_sgRNA spacer 3
<400> 342
cgttttacaa cgtcgtgact gttttagagc tagaaatagc aagtt 45
<210> 343
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: For lacZ sequencing
<400> 343
cgaacatcca aaagtttgtg ttttt 25
<210> 344
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: For lacZ sequencing
<400> 344
tgagcgcatt tttacgcgc 19
<210> 345
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: For lacZ sequencing
<400> 345
gaaaacggca acccgtgg 18
<210> 346
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify sgRNA expression cassette
<400> 346
ccgccgccgc aaggaatggt ttaattaatt acggccagtc atgcataatc 50
<210> 347
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify sgRNA expression cassette
<400> 347
gactgttggg cgccatctcc ttgcatgctc actgagcctc cacctagcct 50
<210> 348
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-8_sgRNA spacer 1
<400> 348
ctcaaccgcc cgttgcacca cagatgaact atagtgagtc gtattaaggt 50
<210> 349
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-8_sgRNA spacer 1
<400> 349
tatagttcat ctgtggtgca acgggcggtt gagaatcttt cgaaagaaag 50
<210> 350
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-8_sgRNA spacer 2
<400> 350
ctcaacccat gcagaggatg atgctcgtct atagtgagtc gtattaaggt 50
<210> 351
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-8_sgRNA spacer 2
<400> 351
atagacgagc atcatcctct gcatgggttg agaatctttc gaaagaaaga 50
<210> 352
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-8_sgRNA spacer 3
<400> 352
ctcaacgcgt tagggtcaat gcgggtcgct atagtgagtc gtattaaggt 50
<210> 353
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGA3-8_sgRNA spacer 3
<400> 353
tatagcgacc cgcattgacc ctaacgcgtt gagaatcttt cgaaagaaag 50
<210> 354
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-8_sgRNA spacer 1
<400> 354
ctcaaccgcc cgttgcacca cagatgaact atagtgagtc gtattaaggt 50
<210> 355
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-8_sgRNA spacer 1
<400> 355
tatagttcat ctgtggtgca acgggcggtt gagaatcttt cgaaagaaag 50
<210> 356
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-8_sgRNA spacer 2
<400> 356
ctcaacccat gcagaggatg atgctcgtct atagtgagtc gtattaaggt 50
<210> 357
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-8_sgRNA spacer 2
<400> 357
atagacgagc atcatcctct gcatgggttg agaatctttc gaaagaaaga 50
<210> 358
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-8_sgRNA spacer 3
<400> 358
ctcaacgcgt tagggtcaat gcgggtcgct atagtgagtc gtattaaggt 50
<210> 359
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Amplify MGC3-8_sgRNA spacer 3
<400> 359
tatagcgacc cgcattgacc ctaacgcgtt gagaatcttt cgaaagaaag 50
<210> 360
<211> 4
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG1-4 (D9A) nickase PAM
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<400> 360
nrrr 4
<210> 361
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG1-6 (D13A) nickase PAM
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, t, g, unknown or other
<400> 361
nnrray 6
<210> 362
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG3-6 (D13A) nickase PAM
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (6)..(6)
<223> a, c, t, g, unknown or other
<400> 362
nnrggnt 7
<210> 363
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG3-7 (D12A) nickase PAM
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (4)..(4)
<223> a, c, t, g, unknown or other
<400> 363
nnrnyay 7
<210> 364
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG3-8 (D13A) nickase PAM
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, t, g, unknown or other
<400> 364
nnrggty 7
<210> 365
<211> 5
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG4-5 (D17A) nickase PAM
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<400> 365
nrccv 5
<210> 366
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG14-1 (D23A) nickase PAM
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (3)..(4)
<223> a, c, t, g, unknown or other
<400> 366
nrnngrka 8
<210> 367
<211> 5
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG15-1 (D8A) nickase PAM
<220>
<221> modified_base
<222> (1)..(4)
<223> a, c, t, g, unknown or other
<400> 367
nnnnc 5
<210> 368
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: PAM
<220>
<223> Description: nMG18-1 (D12A) nickase PAM
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<400> 368
nrwart 6
<210> 369
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> Category: NLS
<220>
<223> Description: SV40
<400> 369
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 370
<211> 16
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
nucleoplasmin bipartite NLS sequence
<220>
<223> Category: NLS
<220>
<223> Description: nucleoplasmin bipartite NLS
<400> 370
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 371
<211> 9
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
c-myc NLS sequence
<220>
<223> Category: NLS
<220>
<223> Description: c-myc NLS
<400> 371
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 372
<211> 11
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
c-myc NLS sequence
<220>
<223> Category: NLS
<220>
<223> Description: c-myc NLS
<400> 372
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 373
<211> 38
<212> PRT
<213> Homo sapiens
<220>
<223> Category: NLS
<220>
<223> Description: hRNPA1 M9 NLS
<400> 373
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 374
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Importin-alpha IBB domain sequence
<220>
<223> Category: NLS
<220>
<223> Description: Importin-alpha IBB domain
<400> 374
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 375
<211> 8
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Myoma T protein sequence
<220>
<223> Category: NLS
<220>
<223> Description: Myoma T protein
<400> 375
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 376
<211> 8
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Myoma T protein sequence
<220>
<223> Category: NLS
<220>
<223> Description: Myoma T protein
<400> 376
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 377
<211> 8
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
p53 sequence
<220>
<223> Category: NLS
<220>
<223> Description: p53
<400> 377
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 378
<211> 12
<212> PRT
<213> Mus sp.
<220>
<223> Category: NLS
<220>
<223> Description: mouse c-abl IV
<400> 378
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 379
<211> 5
<212> PRT
<213> Influenza virus
<220>
<223> Category: NLS
<220>
<223> Description: influenza virus NS1
<400> 379
Asp Arg Leu Arg Arg
1 5
<210> 380
<211> 7
<212> PRT
<213> Influenza virus
<220>
<223> Category: NLS
<220>
<223> Description: influenza virus NS1
<400> 380
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 381
<211> 10
<212> PRT
<213> Hepatitis delta virus
<220>
<223> Category: NLS
<220>
<223> Description: Hepatitis virus delta antigen
<400> 381
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 382
<211> 10
<212> PRT
<213> Mus sp.
<220>
<223> Category: NLS
<220>
<223> Description: mouse Mx1 protein
<400> 382
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 383
<211> 20
<212> PRT
<213> Homo sapiens
<220>
<223> Category: NLS
<220>
<223> Description: human poly(ADP-ribose) polymerase
<400> 383
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 384
<211> 17
<212> PRT
<213> Homo sapiens
<220>
<223> Category: NLS
<220>
<223> Description: steroid hormone receptor (human) glucocorticoid
<400> 384
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 385
<211> 170
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-3 deaminase
<400> 385
Met Asn Glu Gln Thr Ser Thr Asp Glu Gln Phe Met Gln Gln Ala Leu
1 5 10 15
Ala Leu Ala Asp Glu Ala Glu Arg Gln Gly Glu Val Pro Val Gly Ala
20 25 30
Leu Leu Val His Gln Gly Thr Val Ile Gly Arg Gly Phe Asn Gln Val
35 40 45
Ile Thr Gln Leu Asp Pro Ser Ala His Ala Glu Met Leu Ala Ile Arg
50 55 60
Asp Ala Ala Arg Tyr Leu Gln Asn Tyr Arg Ile Leu Asp Thr Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Leu Val His
85 90 95
Ala Arg Val Lys Arg Leu Val Tyr Gly Ala Ser Asp Pro Arg Thr Gly
100 105 110
Ala Cys Gly Ser Val Phe Asn Val Val Ala Asp Thr Arg Leu Asn His
115 120 125
Gln Leu Glu Val Val Ala Gly Val Leu Gly Ser Gln Cys Gly Glu Arg
130 135 140
Leu Ser Ala Phe Phe Arg Gln Arg Arg Ala Ala Gln Lys Ala Leu Lys
145 150 155 160
Lys Ala Ala Gln Asn Phe Gln Ser Pro Ser
165 170
<210> 386
<211> 167
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4 deaminase
<400> 386
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asp Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 387
<211> 173
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-5 deaminase
<400> 387
Met Ser Thr Asp Phe Thr Ser Ala Ala Gln Gln Glu Leu Asp Ile Ala
1 5 10 15
Tyr Met Arg Lys Ala Ile Ala Leu Ala Ala Gln Ala Glu Ala Asp Gly
20 25 30
Glu Val Pro Val Gly Ala Val Leu Val His Asn Asn Glu Ile Ile Gly
35 40 45
Val Gly Arg Asn Arg Val Ile Gly Gly Cys Asp Pro Ser Leu His Ala
50 55 60
Glu Phe Glu Ala Ile Arg Gln Gly Ala Gln Glu Ile Gly Asn Tyr Arg
65 70 75 80
Leu Leu Glu Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys
85 90 95
Ala Gly Leu Leu Val His Ser Arg Ile Gly Arg Leu Val Tyr Gly Thr
100 105 110
Pro Asp Leu Lys Thr Gly Ala Ala Gly Ser Leu Met Asn Leu Leu Gln
115 120 125
His Pro Glu Leu Asn His Gln Ile Ala Ile Thr Ser Gly Val Leu Gln
130 135 140
Ala Asp Cys Ala Ala Gln Leu Ser Gly Phe Phe Ser Ala Gln Arg Glu
145 150 155 160
Arg Lys Lys Ala Leu Lys Lys Arg Leu Lys Pro Asn Leu
165 170
<210> 388
<211> 182
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-6 deaminase
<400> 388
Met Ser Glu Ile Pro Gln Val Val Thr Glu Gln Gln Thr Asp Glu Arg
1 5 10 15
Trp Met His Tyr Ala Leu Ala Leu Ala Asp Lys Ala Glu Gln Ala Gly
20 25 30
Glu Ile Pro Val Gly Ala Val Leu Val Lys Asp Asn Gln Val Ile Gly
35 40 45
Glu Gly Trp Asn Met Ser Ile Cys Arg His Asp Pro Ser Ala His Ala
50 55 60
Glu Met Leu Ala Ile Arg Glu Ala Ala Val Arg Val Gln Asn Tyr Arg
65 70 75 80
Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys
85 90 95
Ala Gly Leu Leu Val His Ser Arg Val Lys Arg Leu Val Phe Gly Ala
100 105 110
Phe Asp Ala Lys Thr Gly Ala Ala Gly Ser Val Thr Asp Leu Val Arg
115 120 125
His Pro Val Leu Asn His Gln Leu Glu Val Thr Ser Gly Val Leu Ala
130 135 140
Glu Gln Cys Ala Asp Lys Leu Ser Ser Phe Phe Arg Arg Arg Arg Gln
145 150 155 160
Glu His Lys Ala Ala Lys Ala Leu Arg Gln Ala Gln Asp Pro Glu Asn
165 170 175
Gln Gly Asn Ser Glu Ser
180
<210> 389
<211> 151
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-7 deaminase
<400> 389
Met Ser Asp Glu Ile Trp Ile Lys His Ala Leu Thr Leu Ala Asp Lys
1 5 10 15
Ala Tyr Gln Gln Gly Glu Val Pro Val Gly Ala Val Leu Val Lys Asn
20 25 30
Asn Gln Ile Ile Ala Glu Gly Trp Asn Gln Pro Ile Ala His His Asp
35 40 45
Pro Ser Ala His Ala Glu Ile Met Ala Leu Arg Leu Ala Gly Gln Ala
50 55 60
Glu Gln Asn Tyr Arg Leu Pro Glu Thr Thr Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ala Arg Ile Gly Arg
85 90 95
Leu Val Phe Gly Ala Tyr Asp Pro Lys Thr Gly Ala Ala Gly Ser Val
100 105 110
Phe Asp Ile Phe Ser Asp Ala Arg His Asn His Gln Ile Glu Val Val
115 120 125
Ser Gly Val Leu Ser Glu Leu Cys Gly Asp Lys Leu Arg Ala Phe Phe
130 135 140
Arg Glu Arg Arg Lys Lys Arg
145 150
<210> 390
<211> 166
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-8 deaminase
<400> 390
Met Pro Gln Ser Glu Gln Asp Ile Tyr Trp Ile Arg Tyr Ala Met Gln
1 5 10 15
Leu Ala Glu Arg Ala Glu Gln Ala Gly Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val Leu Asp Asn Gln Ala Leu Gly Glu Gly Trp Asn Leu Ser Ile
35 40 45
Ser Arg His Asp Pro Cys Ala His Ala Glu Ile Met Ala Ile Arg Gln
50 55 60
Ala Gly Glu Arg Ile Gly Asn Tyr Arg Leu Leu Gly Ala Thr Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Val His Ser
85 90 95
Arg Ile Ala Arg Val Val Tyr Gly Ala Ser Asp Leu Lys Thr Gly Ala
100 105 110
Ala Gly Ser Val Phe Asp Val Leu Ser Asp Pro Arg His Asn His Val
115 120 125
Val Glu Ile Thr Gly Gly Val Glu Ser Glu Ala Cys Ser Gln Gln Leu
130 135 140
Ser Asp Phe Phe Arg Arg Arg Arg Ala Glu Gln Lys Ala Glu Lys Gln
145 150 155 160
Arg Leu Lys Asp Asn Gln
165
<210> 391
<211> 168
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-9 deaminase
<400> 391
Met Asn Val Ala Ala Asp Glu Gln Trp Met Lys Glu Ala Leu Arg Gln
1 5 10 15
Ala Glu Arg Ala Leu Leu Ala Gly Glu Val Pro Val Gly Ala Val Val
20 25 30
Val Ser Gln Asn Asn Ile Val Gly Gln Gly Phe Asn Arg Asn Leu Leu
35 40 45
Asp Arg Asp Pro Thr Ala His Ala Glu Ile Ile Ala Leu Arg Glu Ala
50 55 60
Ala Ala Asn Ile Gly Asn His Arg Leu Leu Asp Cys Glu Leu Tyr Ala
65 70 75 80
Thr Ile Glu Pro Cys Ala Met Cys Ala Gly Ala Ile Thr His Ala Arg
85 90 95
Val Arg Arg Leu Val Tyr Gly Ala Glu Asp Leu Lys Ala Gly Ala Val
100 105 110
His Ser Val Met Gln Val Val Asn His Pro Ala Leu Asn His Arg Val
115 120 125
Glu Val Lys Gly Gly Val Leu Ala Glu Arg Cys Gly Glu Leu Leu Gln
130 135 140
Gln Phe Phe Trp Ala Arg Arg Ala Glu Gln Ser Gly Ile Ser Gly Ala
145 150 155 160
Asn Glu Asp Gln Leu Arg Arg Gly
165
<210> 392
<211> 143
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-10 deaminase
<400> 392
Met Leu Leu Ala Met Glu Gln Ala Arg Ala Ala Glu Glu Ala Gly Glu
1 5 10 15
Val Pro Val Gly Ala Val Ile Leu Ser Pro Glu Gly Glu Val Val Ala
20 25 30
Arg Gly Glu Asn Arg Val Leu Arg Asp Ser Asp Pro Thr Ala His Ala
35 40 45
Glu Met Val Ala Leu Arg Ala Ala Gly Arg Val Leu Gly Asn Tyr Arg
50 55 60
Leu Pro Gly Cys Thr Leu Tyr Ser Thr Leu Glu Pro Cys Ser Met Cys
65 70 75 80
Ser Gly Ala Ile Leu His Ala Arg Val Ala Arg Leu Val Phe Ala Ala
85 90 95
Ser Asp Pro Lys Ala Gly Ala Cys Gly Ser Val Leu Glu Val Met Asn
100 105 110
His Pro Arg Leu Asn His Gln Val Glu Leu Val Gly Gly Val Leu Ala
115 120 125
Leu Glu Cys Gly Gln Met Leu Thr Glu Phe Phe Arg Ala Arg Arg
130 135 140
<210> 393
<211> 210
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-11 deaminase
<400> 393
Met Ser Ala Glu Ile Asp Leu Thr Asp Lys Ala Phe Met Arg Gln Ala
1 5 10 15
Leu Asp Gln Ala Gln Asn Ala Trp Leu Leu Gly Glu Val Pro Val Gly
20 25 30
Ala Val Ile Val Arg Glu Gly Arg Val Ile Ala Thr Gly Tyr Asn Arg
35 40 45
Pro Ile Gly Asp Asn Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu
50 55 60
Arg Gln Ala Ala Ser Leu Leu Gly Asn Tyr Arg Leu Pro Gly Cys Thr
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Met Ala Leu Met
85 90 95
His Ala Arg Leu Asp Arg Val Val Phe Gly Ala Pro Asp Pro Lys Thr
100 105 110
Gly Ala Ala Gly Ser Val Ile Asn Leu Phe Asp Glu Pro Arg Leu Asn
115 120 125
His His Cys Ala Leu Arg Gly Gly Val Glu Ala Gln Asp Cys Ala Arg
130 135 140
Leu Leu Gln Asp Phe Phe Arg Glu Arg Arg Arg Gln Ile Gln Ala Leu
145 150 155 160
Gln Gln Lys Pro Ala Ile Pro Ala Asp Arg Ala Asp Pro Asp Glu Gln
165 170 175
His Ala Ser Leu His Ala Glu Gly Pro Ala Pro Leu Ala Gly Ile Asp
180 185 190
Val Arg His Leu Asp Glu Pro Asp Ala Ala Ala Thr Ser Asn Pro Glu
195 200 205
Ser Pro
210
<210> 394
<211> 159
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-12 deaminase
<400> 394
Met Glu Ile Lys Ala Arg Met Arg Asp Ile Met Thr Asp Asp Glu Arg
1 5 10 15
Trp Met Ala Lys Ala Leu Arg Leu Ala Lys Glu Gly Ala Gln Ala Gly
20 25 30
Glu Val Pro Val Gly Ala Ile Leu Val Phe Ser Gly Glu Gln Leu Ala
35 40 45
Ala Ala Tyr Asn Ser Pro Ile Arg Leu Arg Asp Ala Thr Ala His Ala
50 55 60
Glu Ile Leu Ala Leu Arg Leu Gly Gly Glu Arg Leu Gln Asn Tyr Arg
65 70 75 80
Leu Thr Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys
85 90 95
Ala Gly Ala Leu Val Gln Ala Arg Ile Ala Arg Leu Val Phe Gly Ala
100 105 110
Arg Asp Ser Arg Val Gly Ala Ala Gly Ser Ala Leu Asp Leu Ala Arg
115 120 125
Glu Pro Arg Phe Asn His Gln Val Thr Val Val Gly Gly Val Leu Ala
130 135 140
Ser Glu Cys Glu Gln Val Leu Arg Glu Phe Phe Arg Ala Arg Arg
145 150 155
<210> 395
<211> 205
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-13 deaminase
<400> 395
Met Pro Glu Pro Phe Gln Gly Gly Asp Pro Ala Asp Pro Ala Arg Ala
1 5 10 15
Ala Ala Glu Ala Gln Asp Leu Ala Asp Arg Ala Phe Met Arg Leu Ala
20 25 30
Leu Asp Gln Ala His Asn Ala Trp Leu Leu Gly Glu Val Pro Val Gly
35 40 45
Ala Val Ile Val His Glu Gly Arg Val Leu Ala Thr Gly Tyr Asn Arg
50 55 60
Pro Ile Gly Asp Ser Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu
65 70 75 80
Arg Gln Ala Ala Ser Leu Leu Gly Asn Tyr Arg Leu Pro Gly Cys Thr
85 90 95
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Met Ala Leu Leu
100 105 110
His Ala Arg Ile Glu Arg Val Val Phe Gly Ala Ser Asp Pro Lys Thr
115 120 125
Gly Ala Ala Gly Ser Val Leu Asp Leu Phe Ala Gln Pro Leu Leu Asn
130 135 140
His His Ala Ser Leu Arg Ala Gly Val Glu Ala Gln Ala Cys Gly Ala
145 150 155 160
Leu Leu Gln Glu Phe Phe Arg Glu Arg Arg Ala Arg Ala Arg Ala Gln
165 170 175
Gln Gln Leu Pro Ala His Gly Gly Gly Ile Asp Val Arg His Leu Asp
180 185 190
Ala Pro Glu Pro Gly Asp Glu Ser Asp Pro Phe Asp Glu
195 200 205
<210> 396
<211> 159
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-14 deaminase
<400> 396
Met Gly Ser Asp Gln Asp Phe Met Arg Leu Ala Leu Leu Glu Ala Glu
1 5 10 15
Lys Ala Gly Ala Ile Gly Glu Val Pro Val Gly Ala Val Ile Val Lys
20 25 30
Asp Gly Lys Val Val Ala Arg Gly His Asn Gln Pro Val Ser Gly His
35 40 45
Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Glu Ala Gly Gln
50 55 60
Val Leu Gly Asn Tyr Arg Leu Pro Ala Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Ala Met Cys Ile Gly Ala Met Ile His Ala Arg Ile Arg
85 90 95
Arg Val Ile Phe Gly Ala His Asp Pro Lys Thr Gly Ala Ala Gly Ser
100 105 110
Val Ile Asn Leu Phe Glu Glu Lys Thr Leu Asn His His Ala Thr Val
115 120 125
Thr Gly Gly Ile Leu Ala Ser Asp Cys Ala Gln Leu Leu Lys Ala Phe
130 135 140
Phe Ala Met Arg Arg Lys Glu Ala Lys Thr Pro Ser Leu Ser Gly
145 150 155
<210> 397
<211> 168
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-15 deaminase
<400> 397
Met Glu Pro Met Glu Glu His Arg His Phe Met Gly Leu Ala Ile Glu
1 5 10 15
Glu Ala Ala Arg Ala Tyr Glu Leu Asn Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val Gly Ser Ala Gly Glu Ile Leu Ser Arg Ala Ser Asn Ala Pro
35 40 45
Ile Arg Ser Ala Asp Pro Ser Ala His Ala Glu Met Ile Ala Leu Arg
50 55 60
Gln Ala Ala Arg Ala Ser Gly Asn Tyr Arg Leu Pro Gly Ser Val Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Val Gly Ala Met Leu His
85 90 95
Ala Arg Ile Ala Thr Leu Val Phe Gly Ala Arg Asp Pro Arg Thr Gly
100 105 110
Ala Ala Gly Ser Val Val Asp Leu Thr Ser Val Pro Ala Phe Asn His
115 120 125
Tyr Val Arg Val Ile Ala Gly Val Arg Ala Glu Glu Cys Ser Glu Leu
130 135 140
Leu Arg Arg Phe Phe Arg Glu Arg Arg Arg Glu Gly Lys Ser Gly Tyr
145 150 155 160
Gly Gly Glu Val Pro Lys Arg Pro
165
<210> 398
<211> 153
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-16 deaminase
<400> 398
Met Ala Asp Glu Asp Ile Lys Phe Met Arg Leu Ala Leu Glu Leu Ala
1 5 10 15
Lys Lys Ala Glu Phe Ile Asp Glu Val Pro Val Gly Ala Leu Ile Ile
20 25 30
Lys Asp Gly Glu Ile Ile Gly Thr Gly Met Asn Ser Cys Ile Ser Asp
35 40 45
His Asp Pro Thr Ser His Ala Glu Ile Lys Ala Ile Arg Asp Ala Ala
50 55 60
Asn Thr Ile Lys Asn Tyr Arg Leu Asn Gly Cys Ser Ile Tyr Val Thr
65 70 75 80
Leu Glu Pro Cys Ala Met Cys Val Gly Ala Ile Gln His Ala Arg Ile
85 90 95
Glu Lys Ile Ile Tyr Gly Ala Asn Asp Pro Lys Thr Gly Ala Cys Gly
100 105 110
Ser Val Ile Asp Leu Met Ser Ile Lys Glu Ile Asn His His Thr Glu
115 120 125
Ala Ile Gly Gly Val Leu Gln Lys Glu Cys Gly Gln Ile Leu Lys Asp
130 135 140
Phe Phe Leu Ser Lys Arg Lys Lys Pro
145 150
<210> 399
<211> 148
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-17 deaminase
<400> 399
Met Gln Arg Ala Leu Gly Arg Ala Gly Asp Ala Arg Ala Gln Gly Glu
1 5 10 15
Val Pro Val Gly Ala Val Val Val Cys Ala Gly Glu Val Val Gly Glu
20 25 30
Gly Cys Asn Arg Asn Ile Ser Leu Asp Asp Pro Ser Ala His Ala Glu
35 40 45
Ile Leu Ala Leu Arg Ala Ala Gly Gln Arg Leu Gly Asn Tyr Arg Leu
50 55 60
Pro Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Val
65 70 75 80
Gly Ala Ala Ile His Ser Arg Leu Asp Gly Val Val Phe Gly Ala Thr
85 90 95
Asp Pro Lys Thr Gly Ala Leu Gly Gly Ala Phe Asp Leu Pro Ala Ser
100 105 110
His Ala His Asn His Val Leu Ser Val Arg Gly Gly Leu Leu Ala Asp
115 120 125
Glu Cys Gly Ala Leu Leu Lys Ala Phe Phe Arg Asp Arg Arg Lys Ala
130 135 140
Pro Arg Ala Pro
145
<210> 400
<211> 191
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-18 deaminase
<400> 400
Met Gln Lys Lys Val Asp Asp Phe Leu Lys Ile Val Glu Pro Pro Asp
1 5 10 15
Ala Glu Arg Arg Thr Lys Gly Lys Leu Leu Gln Gln Arg Ala Val Asp
20 25 30
Glu Gln Trp Met Gly Leu Ala Leu Gln Arg Gly Glu Glu Ala Gly Arg
35 40 45
Gln Gly Glu Val Pro Val Gly Ala Val Val Val Gly Lys Asp Gly Phe
50 55 60
Leu Thr Ala Ala Gly Asn Ser Pro Ile Gly Leu Ala Asp Pro Ser Ala
65 70 75 80
His Ala Glu Met Leu Ala Ile Arg Ala Ala Ala Lys Leu Leu Gly Asn
85 90 95
Tyr Arg Leu Pro Glu Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Ile
100 105 110
Met Cys Met Gly Ala Leu Ile Gln Ala Arg Ile Ser Arg Leu Val Phe
115 120 125
Gly Ala Ala Asp Pro Lys Thr Gly Ala Ala Ile Ser Val Tyr Ala Ile
130 135 140
Gly Thr Asp Gln Arg Leu Asn His Thr Val Ala Val Thr Gly Gly Ile
145 150 155 160
Leu Ala Glu Ala Cys Ala Gln Leu Leu Lys Asn Phe Phe Lys Lys Arg
165 170 175
Arg Gly His Ser Pro Val Ile Asn Ser Pro Phe Leu Lys Thr Pro
180 185 190
<210> 401
<211> 144
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-19 deaminase
<400> 401
Met Arg Glu Ala Tyr Ala Leu Ala Leu Ile Ala Tyr Glu Gln Gly Glu
1 5 10 15
Val Pro Val Gly Ala Val Leu Val Gly Glu Asp Asp Glu Ile Leu Gly
20 25 30
Arg Gly Trp Asn Gln Val Ile Gln Arg His Asp Pro Met Ala His Ala
35 40 45
Glu Cys Val Ala Ile Gln Glu Ala Ala Ala Gln Leu Arg Asn Tyr Arg
50 55 60
Leu Asn Gly Ser Thr Leu Tyr Val Thr Leu Glu Pro Cys Cys Met Cys
65 70 75 80
Ala Gly Ala Met Val His Ala Arg Ile Ala Arg Leu Val Phe Gly Ala
85 90 95
Arg Asp Val Arg Ser Gly Ala Ala Gly Ser Ala Tyr Asn Leu Leu Ala
100 105 110
Gly Asp Leu Leu Asn His Arg Val Lys Ile Asp Glu Gly Ile Leu Gln
115 120 125
Gln Glu Cys Ser His Leu Leu Arg Asn Phe Phe Lys Gln Arg Arg Asp
130 135 140
<210> 402
<211> 195
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-20 deaminase
<400> 402
Met Thr Ser Gln Val Ser Arg Gln Gln Pro Leu Ser Gly Asn Asn Leu
1 5 10 15
Val His Asn Asp Leu Ile Ala Ser Val Cys Pro Pro Gly Leu Val Pro
20 25 30
Ala Gln Gln Asp Glu Phe Trp Met Gln Gln Ala Leu Val Leu Ala Arg
35 40 45
Gln Ala Glu Met Met Gly Glu Val Pro Val Gly Ala Val Val Val Lys
50 55 60
Asn Gln Gln Leu Ile Gly Tyr Gly Tyr Asn Gln Ser Ile Thr Leu Asn
65 70 75 80
Asp Pro Ser Ala His Ala Glu Val Leu Ala Leu Arg Met Ala Gly Gln
85 90 95
Thr Leu Thr Asn Tyr Arg Leu Pro Asp Thr Thr Leu Tyr Val Thr Leu
100 105 110
Glu Pro Cys Ala Met Cys Ala Thr Thr Met Val His Ala Arg Val Ala
115 120 125
Arg Leu Val Tyr Gly Ala Ala Asp Leu Lys Thr Gly Ala Ala Gly Ser
130 135 140
Val Leu Asn Leu Thr Asn Tyr Thr Ala Phe Asn His Gln Leu Ser Cys
145 150 155 160
Val Ser Gly Val Leu Gln Arg Asp Cys Ser Tyr Leu Leu Ser Asn Phe
165 170 175
Phe Lys Leu Arg Arg Thr Gln His Lys Ala Lys Lys Val Ser Gly Thr
180 185 190
Phe Ile Arg
195
<210> 403
<211> 162
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-21 deaminase
<400> 403
Met Asp His Glu Arg Tyr Met Arg Arg Ala Ile Glu Leu Ala Gln Gln
1 5 10 15
Ala Glu Ser Leu Gly Glu Val Pro Val Gly Ala Val Ile Val His Asp
20 25 30
His Gln Ile Ile Gly Glu Gly Phe Asn Glu Val Ile Arg Arg Asn Asp
35 40 45
Pro Ser Ala His Ala Glu Ala Gln Ala Ile Arg Ala Ala Gly Gln His
50 55 60
Leu Ala Asn Tyr Arg Leu Val Asn Thr Thr Leu Tyr Val Ser Leu Glu
65 70 75 80
Pro Cys Ala Met Cys Ala Gly Leu Ile Val His Ala Arg Val Lys Thr
85 90 95
Val Val Phe Ala Thr Pro Asp Pro Arg Thr Gly Ala Thr Gly Thr Ala
100 105 110
Ile Gln Val Leu Asn His Pro Ser Met Asn His His Val Glu Val Val
115 120 125
Ser Gly Val Leu Gln Glu Gln Ser Ala Thr Ile Leu Gln Asn Phe Phe
130 135 140
Arg Lys Lys Arg Glu Leu Ala Lys Met Lys Lys Phe His Glu Lys Arg
145 150 155 160
Val Asn
<210> 404
<211> 166
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-22 deaminase
<400> 404
Met Ser Asp Glu His Phe Met Arg Leu Ala Leu Ala Gln Ala Ala Leu
1 5 10 15
Ala Glu Ala Glu Gly Glu Ile Pro Val Gly Ala Val Val Val Leu Asn
20 25 30
Gly Glu Val Val Gly Ser Gly Tyr Asn Ser Pro Ile Gly Arg His Asp
35 40 45
Pro Thr Ala His Ala Glu Ile Arg Ala Leu Arg Ala Ala Ala Ala Thr
50 55 60
Leu Gly Asn Tyr Arg Leu Val Gly Cys Glu Leu Phe Val Thr Leu Glu
65 70 75 80
Pro Cys Leu Met Cys Ala Gly Ala Ile Gln His Ala Arg Ile Ala Arg
85 90 95
Leu Val Tyr Gly Ala Ala Asp Tyr Lys Thr Gly Val Cys Gly Ser Thr
100 105 110
Leu Asp Val Phe Gly Glu Leu Pro Gly Ser Pro Val Pro Arg Leu Asn
115 120 125
His His Thr Gln Val Thr Gly Gly Val Leu Gly Asp Glu Cys Ser Arg
130 135 140
Gln Leu Ser Ala Phe Phe Ala Arg Arg Arg Ala Glu Lys Asn Ala Ala
145 150 155 160
Lys Asn His Val Phe Gln
165
<210> 405
<211> 161
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-23 deaminase
<400> 405
Met Asp Ser Leu Val Glu Arg His Glu His Tyr Met Met Leu Ala Leu
1 5 10 15
Arg Leu Ala Glu Lys Gly Ala Asp Arg Gly Glu Val Pro Val Gly Ala
20 25 30
Val Val Val Ser Pro Lys Gly Gln Ile Leu Ser Leu Ala His Asn Glu
35 40 45
Pro Ile Asp Leu His Asp Pro Thr Gly His Ala Glu Ile Ile Ala Ile
50 55 60
Arg Lys Ala Ala Gln Arg Ile Gly Asn Tyr Arg Leu Val Gly Cys Ser
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Tyr Gly Ala Ile Ile
85 90 95
His Ala Arg Ile Lys Arg Leu Phe Phe Gly Ala Tyr Asp Pro Lys Ala
100 105 110
Gly Ala Gly Thr Val Phe Gly Leu Phe Ser Ser Pro Phe Phe Asn His
115 120 125
Gln Pro Glu Val Arg Gly Gly Ile Leu Ala Glu Leu Cys Glu Lys Val
130 135 140
Leu Lys Glu Phe Phe Glu Lys Leu Arg Ser Ser Lys Cys Cys Ser Ser
145 150 155 160
Gly
<210> 406
<211> 152
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-24 deaminase
<400> 406
Met Thr Glu Asp Glu Arg Trp Met Glu Glu Ala Leu Ala Leu Ala Arg
1 5 10 15
Glu Ala Ser Asn Asp Gly Glu Ala Pro Val Gly Ala Val Val Val His
20 25 30
Ala Gly Glu Ile Ile Gly Arg Gly Arg Asn Arg Ile Glu Gly Leu Ala
35 40 45
Asp Pro Thr Ala His Ala Glu Leu Leu Ala Leu Arg Gln Ala Ser Met
50 55 60
Asn Leu Gly Arg Trp Arg Leu Thr Gly Cys Ala Leu Phe Val Thr Leu
65 70 75 80
Glu Pro Cys Ala Met Cys Leu Gly Ala Cys Tyr Ala Ala Arg Val Asp
85 90 95
Arg Leu Val Tyr Gly Ala Thr Ser Pro Lys Phe Gly Ala Ala Gly Ser
100 105 110
Ser Val Thr Leu Ala Gly Val Glu Arg Leu Asn His Arg Leu Glu Val
115 120 125
Val Ser Gly Val Leu Glu Lys Glu Cys Ala Arg Leu Leu Ala Lys Phe
130 135 140
Phe Arg Gly Leu Arg Gly Lys Gly
145 150
<210> 407
<211> 168
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-25 deaminase
<400> 407
Met Asp Asp Gln His Trp Met Gly Arg Ala Leu Ala Leu Ala Glu Arg
1 5 10 15
Ala Ala Glu Gln Gly Glu Val Pro Gly Gly Ala Val Leu Val Ile Glu
20 25 30
Asn Glu Ile Val Gly Glu Gly Trp Ser Arg Pro Ile Ala Thr Gln Asp
35 40 45
Pro Ser Ala His Ala Glu Ile Leu Ala Leu Arg Asp Ala Gly Leu Arg
50 55 60
Arg Gly Asn Tyr Arg Leu Ser Gly Ser Val Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Val Met Cys Ala Gly Ala Ile Val His Ala Arg Val Asp Thr
85 90 95
Leu Val Phe Gly Ala Ala Asp Pro Lys Ala Gly Ala Cys Gly Ser Val
100 105 110
Phe Asp Leu Leu Pro Ser Asp Gly Arg Phe Asn His His Thr Gln Cys
115 120 125
Arg Gly Pro Ile Leu Ala Asp Ala Cys Gly Thr Ile Leu Arg Ala Phe
130 135 140
Phe Ala Asn Lys Arg Ala Ser Pro Arg Ala Arg Ala Asn Ala Ser Ala
145 150 155 160
Ala His Glu Arg Pro Glu Asn Asp
165
<210> 408
<211> 173
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-26 deaminase
<400> 408
Met Ser Glu Ser Gln Phe Asp Glu Thr Gln Tyr Arg Trp Met Asp Arg
1 5 10 15
Ala Leu Glu Leu Ala Gly Gln Ala Ala Asn Leu Gly Glu Val Pro Val
20 25 30
Gly Ala Val Ile Val Ser Ala Glu Gly Glu Leu Leu Gly Glu Gly Phe
35 40 45
Asn Gln Pro Ile Lys Val Gln Asp Pro Thr Ala His Ala Glu Ile Met
50 55 60
Ala Ile Arg Gln Ala Cys Arg Lys Thr Gly Asn Tyr Arg Leu Pro Gly
65 70 75 80
Ala Val Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala
85 90 95
Ile Val His Ala Arg Leu Ala Arg Val Val Phe Ala Thr Cys Glu Pro
100 105 110
Lys Ala Gly Ala Val Glu Ser Thr Leu Arg Phe Phe Asp Leu Pro Gln
115 120 125
Leu Asn His Arg Val Glu Tyr Thr Gly Gly Leu Arg Arg Ser Glu Ala
130 135 140
Ser Ser Leu Leu Ser His Phe Phe Gln Ser Arg Arg Glu Glu Lys Ala
145 150 155 160
Leu Leu Lys Lys Asn Ser Arg Gln Gln Gln Ser Asp Cys
165 170
<210> 409
<211> 164
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-27 deaminase
<400> 409
Met Arg Glu Glu Lys Asp Leu Ile Phe Met Lys Lys Ala Leu His Leu
1 5 10 15
Ala Glu Glu Ala Trp Arg Gln Gly Glu Val Pro Val Gly Ala Val Val
20 25 30
Val Asp Gly Glu Gly Gln Ile Ile Gly Gln Gly Tyr Asn Gln Ser Ile
35 40 45
Ala Leu Leu Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu Arg Gln
50 55 60
Ala Ala Lys Lys Lys Lys Asn Tyr Arg Leu Ser Gly Ser Thr Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Pro Met Cys Leu Gly Ala Met Val Gln Ala
85 90 95
Arg Ile Asp Arg Leu Val Phe Gly Ala Tyr Asp Pro Lys Asn Gly Ala
100 105 110
Val Ser Ser Ile Met Asn Phe Pro Leu Asp Lys Met Asn His Arg Phe
115 120 125
Glu Ile Glu Gly Gly Leu Leu Ser Gln Glu Cys Ala Thr Ile Leu Lys
130 135 140
Glu Phe Phe Gln Ser Arg Arg Gly Glu Thr Asn Asn Lys Lys Glu Thr
145 150 155 160
Ala Lys Glu Glu
<210> 410
<211> 153
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-28 deaminase
<400> 410
Met Asp Thr Asp Glu Gln Phe Met Gln His Ala Ile Gln Leu Ala His
1 5 10 15
Lys Ala Gln Ser Gln Gly Glu Val Pro Val Gly Ala Ile Leu Val Lys
20 25 30
Asp Asn Lys Ile Ile Gly Lys Gly Trp Asn Gln Pro Ile Thr Arg His
35 40 45
Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile Arg His Ala Gly Gln
50 55 60
Ala Leu Lys Asn Tyr Arg Leu Pro Asp Thr Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Asn Met Cys Ala Gly Met Ile Ile His Ala Arg Ile Lys
85 90 95
Arg Leu Val Phe Ala Ala Tyr Asp Pro Lys Thr Gly Ala Ala Gly Ser
100 105 110
Val Phe Asp Thr Leu Thr Asp Pro Arg Asn Asn His Thr Val Glu Ile
115 120 125
Glu Gly Gly Val Leu Glu Glu Pro Cys Ala Glu Met Leu Arg His Phe
130 135 140
Phe Arg Gln Arg Arg Lys Lys Thr Pro
145 150
<210> 411
<211> 158
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-29 deaminase
<400> 411
Met Ser Glu Leu Glu Asn Asn Asn Pro Gln His Ile Lys Trp Met Arg
1 5 10 15
Glu Ala Ile Lys Leu Ala Gln Lys Ala Gln Glu Cys Gly Glu Val Pro
20 25 30
Val Gly Ala Leu Ile Thr Lys Asn Asp Thr Leu Ile Ser Ser Ala Tyr
35 40 45
Asn Gln Pro Ile Thr Lys His Asp Pro Thr Ala His Ala Glu Ile Gln
50 55 60
Ala Leu Gln Gln Ala Gly Lys Ile Leu Gln Asn Tyr Arg Leu Asn Asp
65 70 75 80
Thr Val Leu Tyr Ile Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala
85 90 95
Ile Val His Ala Arg Ile Gly Thr Val Val Phe Gly Ala Tyr Asp His
100 105 110
Lys Thr Gly Val Ala Gly Ser Ala Gly Asn Ile Phe Thr Ala Glu Phe
115 120 125
Ser Asn His Lys Pro Lys Ile Ile Gly Gly Thr Leu Glu Lys Glu Cys
130 135 140
Ser Leu Ile Ile Arg Asn Phe Phe Gln Ala Arg Arg Gln Lys
145 150 155
<210> 412
<211> 182
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-30 deaminase
<400> 412
Met Pro Asn Phe Leu Lys Gln Leu Gln Gln Ile Ile Ala Phe Glu Thr
1 5 10 15
Ser Cys Ala Ala Asp Trp Ser Glu Gln Gln Lys His Val Phe Trp Met
20 25 30
Gln Gln Ala Leu Lys Val Ala Ala Tyr Gly Glu Gln Leu Gly Glu Val
35 40 45
Pro Val Gly Ala Val Ala Val Val Glu Asn Gln Leu Ile Ala Val Gly
50 55 60
Trp Asn Ala Ser Ile Ser Lys His Asp Pro Thr Ala His Ala Glu Val
65 70 75 80
Met Ala Leu Arg Ala Ala Gly Thr Val Leu Lys Asn Tyr Arg Gln Leu
85 90 95
Gln Leu Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly
100 105 110
Ala Met Val His Ala Arg Ile Ala Gln Leu Val Tyr Gly Ala Ser Asp
115 120 125
Pro Lys Thr Gly Ala Val Asp Ser Val Phe Asn Leu Leu Arg His Pro
130 135 140
Asn Leu Asn His Gln Ala Pro Val Leu Gly Gly Val Leu Ala Thr Glu
145 150 155 160
Cys Arg Thr Gln Leu Gln Asp Phe Phe Arg Arg Arg Arg Gln Glu Lys
165 170 175
Lys Gln Ala Gln Gln Lys
180
<210> 413
<211> 167
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-31 deaminase
<400> 413
Met Glu Ser Val Asp Glu Gln Trp Met Arg Tyr Ala Ile Arg Leu Ala
1 5 10 15
Gln Arg Ala Glu Glu Gln Gly Glu Val Pro Val Gly Ala Val Leu Val
20 25 30
Lys Gly Asp Arg Cys Leu Ala Glu Gly Trp Asn Val Pro Val Gln Arg
35 40 45
His Asp Pro Thr Ala His Ala Glu Met Val Ala Ile Arg Asp Ala Gly
50 55 60
Ile Ala Leu Glu Asn Tyr Arg Leu Ile Asp Ser Thr Leu Tyr Val Thr
65 70 75 80
Leu Glu Pro Cys Val Met Cys Met Gly Ala Ile Ala His Ala Arg Ile
85 90 95
Lys Arg Leu Val Phe Gly Ala Phe Asp Pro Lys Arg Gly Ala Val Cys
100 105 110
Asn Ala Leu Ser Leu Thr Asp Ala Ser Phe Leu Asn His Lys Val Val
115 120 125
Trp Asp Gly Gly Val Phe Glu Gln Glu Cys Ser Glu Leu Leu Ile Asp
130 135 140
Phe Phe Lys Ala Arg Arg Lys Val Thr Lys Pro Glu Val Val Val Thr
145 150 155 160
Asn Pro Gln Arg His Gly Met
165
<210> 414
<211> 160
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-32 deaminase
<400> 414
Met Tyr Asn Gln Gln Ala Ile Asp Lys His Phe Met Asn Cys Ala Leu
1 5 10 15
Glu Leu Ala Thr Phe Ala Ala Asp Ser Gly Glu Val Pro Val Gly Ala
20 25 30
Val Ile Val Arg Lys Asn Thr Ile Val Ala Lys Gly Ser Asn Ser Pro
35 40 45
Ile Ala Asp His Asp Pro Thr Ala His Ala Glu Ile Ile Ala Ile Arg
50 55 60
Lys Ala Thr Ala Gln Cys Ala Asn Tyr Arg Thr Pro Asp Thr Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Ile Met Cys Met Gly Ala Ile Ile Gln
85 90 95
Ala Arg Ile Gly Arg Leu Val Phe Gly Ala Tyr Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Cys Tyr Ser Ile Gly Gln Asp Asn Leu Leu Asn His
115 120 125
Ser Leu Glu Ile Ala Gly Gly Ile Asn Glu Gln Gln Cys Ala Ile Leu
130 135 140
Leu Lys Lys Phe Phe Lys Ile Arg Arg Lys Lys Gly Ser Lys Asn Asn
145 150 155 160
<210> 415
<211> 150
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-33 deaminase
<400> 415
Met Ser Asp Leu Glu Trp Met Arg Arg Ala Ile Thr Leu Ala Gln Lys
1 5 10 15
Ala Glu Gln Gln Gly Glu Val Pro Val Gly Ala Leu Leu Val Arg Glu
20 25 30
Gly Val Cys Val Gly Glu Gly Trp Asn Gln Pro Ile Leu Arg His Asp
35 40 45
Pro Ser Ala His Ala Glu Ile Asn Ala Leu Arg Asp Ala Gly Gln Ala
50 55 60
Thr Glu Asn Tyr Arg Leu Ile Asp Thr Val Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Val Met Cys Met Gly Ala Ile Ala Asn Ala Arg Val Arg Arg
85 90 95
Leu Val Phe Gly Ala Ser Asp Pro Ala Arg Gly Ala Ala Gly Ser Ile
100 105 110
Leu Ser Leu Ser Asn Ala Ser Phe Leu Asn His His Ile Glu Thr Glu
115 120 125
Gly Gly Leu Leu Ala Glu Glu Cys Ser Glu Leu Leu Arg Ser Phe Phe
130 135 140
Ala Arg Arg Arg Arg Lys
145 150
<210> 416
<211> 155
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-34 deaminase
<400> 416
Met Ser Pro Val Val Ala Glu Ser Asp Arg Ala Trp Met Arg His Ala
1 5 10 15
Leu Glu Leu Ala Asn Arg Ala Gly Glu Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Val Met Val Lys Asp Gly Gln Leu Val Gly Glu Gly Trp Asn Arg
35 40 45
Val Ile Gly Leu Asn Asp Pro Ser Ala His Ala Glu Ile Leu Ala Leu
50 55 60
Arg Glu Ala Gly Gln Arg Leu Gly Asn Tyr Arg Leu Pro Gly Cys Ser
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Met Leu
85 90 95
His Ala Arg Leu Glu Arg Val Tyr Phe Gly Thr Gly Asp Pro Lys Thr
100 105 110
Gly Ala Leu Gly Gly Thr Phe Asp Leu Phe Ala Asp Tyr Pro His Asn
115 120 125
His Arg Ile Glu Thr Gln Gly Gly Leu Leu Glu Ile Glu Cys Ser Ser
130 135 140
Leu Leu Lys Glu Phe Phe Arg Ala Arg Arg Leu
145 150 155
<210> 417
<211> 194
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-35 deaminase
<400> 417
Met Gly Leu Asn Gly Leu Thr His His Ser Pro Phe Ile Pro Ile Ser
1 5 10 15
Glu Asn Ile Asp Thr Ser Asp Lys Leu Ala Leu Gln Ile Met Ser Leu
20 25 30
Lys Leu Ser Asn Pro Asp Glu Lys Trp Met Arg His Ala Gln Ser Leu
35 40 45
Ala Glu His Ala Ala Ala Gln Gly Glu Ile Pro Val Gly Ala Val Ile
50 55 60
Val Gln Ala Gly Glu Cys Ile Ala Glu Gly Trp Asn Gln Pro Ile Ala
65 70 75 80
Asn Asn Asp Pro Thr Ala His Ala Glu Ile Ile Ala Leu Arg Lys Ala
85 90 95
Ala Gln Tyr Leu Asn Asn Tyr Arg Leu Val Asn Thr Leu Leu Tyr Val
100 105 110
Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Ile Ile Gln Ala Arg
115 120 125
Val Lys Arg Val Ile Phe Gly Ala Tyr Asp Pro Lys Ala Gly Ala Ala
130 135 140
Gly Ser Arg Phe Asp Ile Leu Arg Asp Thr Arg His Asn Tyr Gln Val
145 150 155 160
Glu Cys Ile Ser Gly Val Leu Ala Lys Glu Cys Ser Asp Tyr Leu Ser
165 170 175
Arg Phe Phe Lys Asn Arg Arg Thr Arg Ala Lys Pro Ser Arg Phe Pro
180 185 190
Lys Pro
<210> 418
<211> 174
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-36 deaminase
<400> 418
Met Gln Asp Asp Thr Val Pro Glu Glu Ile Asp His Glu Arg Trp Met
1 5 10 15
Arg Gln Ala Leu Asn Glu Ala Met Asp Ala Ala Glu Glu Gly Glu Val
20 25 30
Pro Val Gly Ala Val Val Val Tyr Glu Asn Arg Ile Ile Gly Arg Gly
35 40 45
His Asn Arg Thr Val Ala Thr His Asp Pro Ser Ala His Ala Glu Ile
50 55 60
Leu Ala Leu Gly Ala Ala Gly Ala Ala Val Gly Asp Trp Arg Leu Thr
65 70 75 80
Gly Val Asp Ile Tyr Val Ser Leu Glu Pro Cys Ala Met Cys Ala Gly
85 90 95
Ala Ile Gln Leu Gly Arg Leu Arg Arg Ala Val Phe Gly Pro Arg Asp
100 105 110
Pro Lys Phe Gly Gly Cys Gly Ser Val Leu Asp Val Leu Arg Glu Pro
115 120 125
Arg Leu Asn His Gln Val Glu Val Ile Glu Gly Val Met Ala Ala Glu
130 135 140
Ser Gln His Leu Leu Lys Glu Phe Phe Arg Arg Leu Arg Ala Lys Asp
145 150 155 160
Arg Val Pro Ala Thr Pro Asp Pro Phe Pro Asn Ala Gly Glu
165 170
<210> 419
<211> 149
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-37 deaminase
<400> 419
Met Glu Glu Glu Tyr Phe Met Arg Glu Ala Leu Lys Glu Ala Glu Lys
1 5 10 15
Ala Ala Gln Glu Gly Glu Val Pro Ile Gly Ala Val Val Val Gly Pro
20 25 30
Ser Arg Glu Ile Ile Gly Arg Gly Tyr Asn Arg Pro Ile Gly Leu Cys
35 40 45
Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Glu Ala Ala Lys
50 55 60
Arg Leu Gly Asn Tyr Arg Leu Leu Asp Cys Glu Ile Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Leu Val Tyr Ala Arg Leu Lys
85 90 95
Arg Leu Val Phe Gly Ala His Asp Pro Lys Ala Gly Ala Cys Gly Ser
100 105 110
Val Tyr Asn Ile Val Gln Asp Lys Arg Leu Asn His Gln Leu Glu Val
115 120 125
Ala Gly Gly Leu Leu Ala Glu Glu Cys Arg Ala Leu Leu Gln Ala Phe
130 135 140
Phe Lys Ser Arg Arg
145
<210> 420
<211> 160
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-38 deaminase
<400> 420
Met Phe Glu Phe Ser Asp Asn Lys Ala Glu Phe Phe Met Lys Gln Ala
1 5 10 15
Ile Leu Gln Ala Ile Arg Ala Trp Lys Lys Gly Glu Val Pro Val Gly
20 25 30
Ala Val Val Val Ser Gly Ala Gly Gln Ile Leu Ala Ser Ala His Asn
35 40 45
Cys Pro Ile Ser Leu Asp Asp Pro Thr Ala His Ala Glu Ile Leu Ala
50 55 60
Leu Arg Leu Ala Ala Gly Lys Val Gly Asn Tyr Arg Leu Thr Asp Ser
65 70 75 80
Trp Leu Ile Ser Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met
85 90 95
Val Trp Ala Arg Val Lys Gly Val Val Phe Gly Ala Arg Asp Pro Val
100 105 110
Ser Gly Ala Phe Gly Ser Val Met Asp Ile Asn Glu Val Pro Gly Leu
115 120 125
Asn His Arg Ile Glu Val Thr Glu Gly Val Leu Ala Ala Glu Cys Ser
130 135 140
Gln Leu Leu Lys Asp Phe Phe Lys Arg Arg Arg Gln Ser Ser Ala Gly
145 150 155 160
<210> 421
<211> 148
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-39 deaminase
<400> 421
Met Thr Asp Glu Asn Trp Met Gln Arg Ala Leu Gln Leu Ala Ala Gln
1 5 10 15
Ala Glu Ala Val Gly Glu Val Pro Val Gly Ala Val Ile Val Lys Asn
20 25 30
Asp Thr Leu Val Ala Glu Gly Phe Asn Gln Pro Ile Gly Ala His Asp
35 40 45
Ala Thr Ala His Ala Glu Ile Val Ala Leu Arg Arg Ala Gly Glu Ala
50 55 60
Leu Gly Asn Tyr Arg Leu Val Asp Thr Thr Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Ser Met Cys Val Gly Ala Met Ile His Ala Arg Val Ala Lys
85 90 95
Val Val Phe Gly Ala Ser Asp Pro Arg Thr Gly Ala Leu Gly Gly Ala
100 105 110
Phe Asp Leu Gln Gln Ala Gly Arg His Asn His Arg Phe Asp Val Val
115 120 125
Ser Gly Val Met Ala Asp Ser Ser Arg Gln Leu Leu Gln Asn Phe Phe
130 135 140
Arg Val Arg Arg
145
<210> 422
<211> 149
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-40 deaminase
<400> 422
Met Thr Glu Asp Glu Lys Trp Met Asn Leu Ala Ile Glu Gln Ala Ile
1 5 10 15
Lys Ala Gln Asp Glu Asp Glu Val Pro Val Gly Ala Val Leu Val Lys
20 25 30
Asn Gly Leu Leu Leu Ser Gln Ala His Asn Gln Pro Ile Ser Thr Asn
35 40 45
Asp Ala Thr Ala His Ala Glu Ile Gln Ala Leu Arg Lys Ala Gly Ile
50 55 60
Lys Leu Gln Asn Tyr Arg Leu Thr Asp Ser Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Ala Met Cys Leu Gly Ala Met Met His Ala Arg Ile Ala
85 90 95
Arg Ile Val Tyr Gly Ala Asn Asp Leu Lys Thr Gly Ala Cys Gly Ser
100 105 110
Ser Glu Asn Leu Leu Asn Ala Asn Cys Phe Asn His Lys Ile His Leu
115 120 125
Ile Ser Gly Val Leu Glu Asn Glu Cys Lys Gln Leu Leu Lys Lys Phe
130 135 140
Phe Asn Ser Arg Arg
145
<210> 423
<211> 185
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-41 deaminase
<400> 423
Met Asn Gln Val Asn Cys Gly Arg Ile Gly Ser Arg Leu Ile Arg Thr
1 5 10 15
Gly Gly Val Asn Ile Ser Arg Ala Pro Ile Glu Glu Asp Pro Val Asn
20 25 30
Asp Leu Gln Tyr Ala Gln Asp Thr Lys Trp Met Arg Cys Ala Leu Asp
35 40 45
Cys Ala Arg Arg Ala Tyr Ser Thr Glu Glu Val Pro Ile Gly Ala Val
50 55 60
Leu Val Arg Asn Glu Gln Ile Ile Gly Glu Gly Phe Asn Gln Thr Ile
65 70 75 80
Arg Asn Leu Asp Pro Thr Ser His Ala Glu Ile Met Ala Ile Arg Ser
85 90 95
Ala Ala Glu Asn Ile Gly Asn Tyr Arg Leu Ser Asp Thr Thr Leu Tyr
100 105 110
Val Thr Ile Glu Pro Cys Met Met Cys Leu Gly Ala Ile Ile His Ala
115 120 125
Arg Val Glu Arg Leu Val Phe Gly Ala Gln Glu Pro Lys Ala Gly Val
130 135 140
Leu Lys Ser His Pro Val Phe Asp Gly Asp Phe Leu Asn His Gln Val
145 150 155 160
Lys Trp Ser Ser Gly Ile Leu Glu Ser Glu Cys Ser Arg Leu Met Arg
165 170 175
Asp Phe Phe Ile His Lys Arg Thr Leu
180 185
<210> 424
<211> 203
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-42 deaminase
<400> 424
Met Ala Pro Val Pro Leu Lys Gln Pro Leu Ala Gly Glu Ser Phe Asp
1 5 10 15
Ala His Asp His Ala Met Met Arg Leu Ala Ile Asp Gln Ala Leu Asn
20 25 30
Ala Gln Leu His Gly Glu Val Pro Val Gly Ala Val Leu Val Lys Gly
35 40 45
Gly Gln Val Ile Ala Thr Gly Tyr Asn His Pro Ile Gly Ser His Asp
50 55 60
Pro Thr Ala His Ala Glu Ile Arg Thr Leu Arg Met Ala Ala Glu Gln
65 70 75 80
Leu Gly Asn Tyr Arg Leu Gly Glu Ser Thr Leu Tyr Val Thr Leu Glu
85 90 95
Pro Cys Met Met Cys Leu Gly Ala Met Leu His Ala Arg Ile Thr Arg
100 105 110
Val Val Phe Gly Ala Ser Asp Pro Lys Thr Gly Val Cys Gly Gly Val
115 120 125
Leu Asp Leu Pro Ala Glu Gly Arg Leu Asn His Gln Thr Thr Val Gln
130 135 140
Gly Gly Leu Leu Ala Glu Glu Cys Gly Glu Leu Leu Gln Arg Phe Phe
145 150 155 160
Ala Glu Arg Arg Ala Gln Arg Arg Ala Asp Arg Glu Ala Leu Arg Ala
165 170 175
Gln Gln Asp Glu Leu Leu Arg Trp Ala Ala Thr Leu Pro Ala Glu Glu
180 185 190
Glu Val Gly Thr Leu Arg Leu Asp Glu Glu Thr
195 200
<210> 425
<211> 150
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-43 deaminase
<400> 425
Met Ala Met Ala Leu Ala Glu Ala Glu Lys Ala Met Gln Ile Gly Glu
1 5 10 15
Val Pro Ile Gly Ala Val Val Val Gly Pro Asp Gln Gln Leu Leu Gly
20 25 30
Thr Gly Tyr Asn Gln Ser Ile Cys Leu Asn Asp Pro Ser Ala His Ala
35 40 45
Glu Met Leu Ala Ile Arg Ala Ala Ala Ala Gln Leu Gly Asn Tyr Arg
50 55 60
Leu Arg Asp Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys
65 70 75 80
Met Gly Ala Ile Leu His Ser Arg Ile Gln Arg Val Val Phe Ala Ala
85 90 95
Ala Asp Pro Lys Thr Gly Ala Cys Gly Ser Val Leu Ser Leu Gln Ser
100 105 110
Glu Pro Arg Leu Asn His His Cys Ser Val Thr Gln Gly Val Leu Ala
115 120 125
Glu Arg Ala Ala Ser Leu Ile Lys Gly Phe Phe Lys Ala Arg Arg Gln
130 135 140
Val Lys Lys Cys Arg Cys
145 150
<210> 426
<211> 164
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-44 deaminase
<400> 426
Met Leu His Met Val Tyr Tyr Glu Ile Asn Glu Thr Asn Ser Gln Asp
1 5 10 15
Val Phe Phe Met Arg Arg Ala Leu Thr Leu Ala Gln Lys Ala Ala Ser
20 25 30
Ala Asp Glu Val Pro Val Gly Ala Val Ala Ile Ala Asn Asn Glu Ile
35 40 45
Ile Gly Glu Gly Phe Asn Cys Pro Ile Gly Thr His Asp Pro Thr Ala
50 55 60
His Ala Glu Ile Met Ala Leu Arg Gln Ala Ala Gln Lys Ser Asn Asn
65 70 75 80
Tyr Arg Leu Pro Glu Val Thr Leu Tyr Val Thr Leu Glu Pro Cys Val
85 90 95
Met Cys Val Gly Ala Met Leu His Ala Arg Ile Lys Arg Leu Val Phe
100 105 110
Gly Ala Ile Asp Gln Lys Thr Gly Ala Val Val Ser Val Phe Lys Ile
115 120 125
Leu Asp Glu Lys Asn Leu Asn His Arg Ile Gln Tyr Gln Ser Gly Val
130 135 140
Leu Ala Val Pro Cys Gly Lys Ile Leu Ser Asp Phe Phe Lys Asp Arg
145 150 155 160
Arg Gly Val Ile
<210> 427
<211> 180
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-45 deaminase
<400> 427
Met Thr Ala Leu Ile Thr Thr Ser Asn Ile His Asp Lys Met Met Ser
1 5 10 15
Leu Ala Leu Lys Glu Ala Phe Lys Ala Tyr Lys Leu Gly Glu Ile Pro
20 25 30
Val Gly Cys Val Ile Thr Asp Glu Asn Asn Glu Leu Val Ala Thr Gly
35 40 45
Phe Asn Arg Thr Ile Ile Asp Asn Asp Pro Ser Ala His Ala Glu Ile
50 55 60
Val Ala Leu Arg Lys Ala Gly Glu Lys Leu Gln Asn Tyr Arg Leu Val
65 70 75 80
Asn Leu Asn Leu Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Ser Gly
85 90 95
Ala Ile Ile His Ala Arg Ile Lys Arg Val Phe Phe Gly Ala Tyr Asp
100 105 110
Leu Lys Thr Gly Ala Cys Gly Ser Val Phe Asn Val Leu Asn Asp Asp
115 120 125
Arg His Asn His Lys Val Glu Ile Tyr Gly Gly Ile Leu Lys Glu Glu
130 135 140
Cys Ser Ser Met Leu Ser Asp Phe Phe Lys Ala Arg Arg Lys Met Gln
145 150 155 160
Lys Glu Gly Arg Asp Trp Ile Val Glu Ser Gly Lys Asp Arg Thr Trp
165 170 175
Leu Asn Lys Asp
180
<210> 428
<211> 153
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-46 deaminase
<400> 428
Met Ile Ser Asp Thr Glu Phe Met Gly Ala Ala Leu Glu Leu Ala Leu
1 5 10 15
Ala Ala Ser Lys Leu Gly Glu Val Pro Val Gly Ala Val Val Val Lys
20 25 30
Gly Gly Arg Ile Ile Gly Thr Gly Ser Asn Ala Pro Ile Ser Arg His
35 40 45
Asp Pro Thr Ala His Ala Glu Ile Leu Ala Leu Arg Ala Ala Ala Ser
50 55 60
Ala Leu Glu Asn Tyr Arg Leu Thr Glu Cys Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Ala Met Cys Ala Gly Ala Ile Gln His Ala Arg Ile Ala
85 90 95
Arg Leu Val Phe Gly Ala Ser Asp Ser Lys Thr Gly Ala Cys Gly Ser
100 105 110
Val Val Asn Leu Phe Gly Glu Pro Met Leu Asn His His Thr Gln Val
115 120 125
Gln Gly Gly Met Leu Ala Arg Asp Cys Gly Glu Leu Leu Ser Asp Phe
130 135 140
Phe Arg Gln Arg Arg Ala Ala Val Gln
145 150
<210> 429
<211> 160
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-47 deaminase
<400> 429
Met Ser Gly Ser Asp Ala Ala Ala Ser Arg Ala Cys Met Glu Gln Ala
1 5 10 15
Leu Ala Cys Ala Arg Asp Ala Glu Ala Ala Gly Glu Val Pro Val Gly
20 25 30
Ala Val Ile Val Asp Ala Ala Gly Ala Val Val Ala Arg Ala Ala Asn
35 40 45
Ala Pro Ile Ala Arg Asn Asp Pro Thr Ala His Ala Glu Leu Leu Val
50 55 60
Leu Arg Ala Ala Gly Arg Val Leu Gly Asn Tyr Arg Leu Pro Gly Cys
65 70 75 80
Val Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Val Gly Ala Leu
85 90 95
Val His Ala Arg Ile Ala Arg Ile Val Tyr Gly Ala Pro Asp Pro Lys
100 105 110
Thr Gly Ala Cys Gly Ser Val Phe Asp Leu Ala Ala Asn Ser Lys Met
115 120 125
Asn His Arg Ile Glu Val Ala Gly Gly Val Leu Ala Glu Glu Cys Gly
130 135 140
Ala Leu Leu Lys Gln Phe Phe Ala Ala Arg Arg Gly Arg Asp Ala Pro
145 150 155 160
<210> 430
<211> 151
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-48 deaminase
<400> 430
Met Phe Ser Arg Ala Asp Gln Val Phe Met Arg Gln Ala Leu Glu Leu
1 5 10 15
Ala Lys Gln Ala Lys Gly Glu Gly Glu Val Pro Val Gly Ala Val Leu
20 25 30
Thr Leu Asn Asp Leu Pro Ile Ala Thr Ala Tyr Asn Gln Ser Ile Thr
35 40 45
His Gln Asp Pro Thr Ala His Ala Glu Ile Ile Val Leu Arg Glu Ala
50 55 60
Ala Lys Ile Leu Lys Asn Tyr Arg Leu Val Asn Thr Val Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Ile His Ala Arg
85 90 95
Val Lys Arg Leu Ile Tyr Ala Thr Ala Asp Pro Arg Thr Gly Ala Cys
100 105 110
Gly Ser Ile Phe Asn Leu Ile Asn His Gln Ala Leu Asn His Gln Ile
115 120 125
Gln Tyr Glu Ser Gly Leu Leu Ala Glu Glu Ser Lys Leu Leu Leu Gln
130 135 140
Gln Phe Phe Gln Lys Arg Arg
145 150
<210> 431
<211> 148
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-49 deaminase
<400> 431
Met Asn Asp Glu His Tyr Ile Gln Tyr Ala Leu Asn Leu Ala Gln Lys
1 5 10 15
Ala Glu Ser Glu Asn Glu Val Pro Val Gly Ala Leu Ile Val Cys Asn
20 25 30
Asn Gln Ile Ile Ala Glu Gly Trp Asn Gln Pro Ile Gln Leu His Asp
35 40 45
Ser Ser Ala His Ala Glu Met Leu Ala Leu Arg Lys Ala Ser His His
50 55 60
Ile Glu Asn Tyr Arg Leu Lys Asn Thr Thr Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Ala Met Cys Val Gly Ala Met Ile His Ala Arg Ile Gln Lys
85 90 95
Leu Val Phe Gly Ala Trp Asp Gln Lys Ala Gly Ala Val His Ser Val
100 105 110
Phe Gln Leu Ile Asp Asp Thr Arg His Asn His Ala Ile Glu Trp Arg
115 120 125
Gly Gly Val Met Ala Asp Ala Cys Ser Arg Val Leu Lys Asn Phe Phe
130 135 140
Lys Gln Arg Arg
145
<210> 432
<211> 153
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-50 deaminase
<400> 432
Met Thr Ser His Asp Asp Thr Tyr Trp Ile Ile His Ala Leu Thr Leu
1 5 10 15
Ala Lys Lys Ala Glu Gln Gln Gly Glu Val Pro Val Gly Ala Val Ile
20 25 30
Val His Asp His Gln Ile Val Gly Glu Gly Trp Asn Gln Pro Ile Gly
35 40 45
Ala Gly Asp Pro Thr Ala His Ala Glu Ile Ile Ala Met Arg Asn Ala
50 55 60
Ala Gln His Leu Lys Asn Tyr Arg Leu Ile Asn Cys Thr Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Ala Met Cys Val Gly Ala Met Val His Ala Arg
85 90 95
Ile Ser Arg Leu Val Phe Gly Ala Phe Asp Pro Lys Ala Gly Ala Val
100 105 110
Thr Ser Val Met Gln Leu Leu Asp Ala Pro His Phe Asn His Ile Val
115 120 125
Thr His Gln Gly Gly Ile Cys Ala Glu Lys Cys Ser Glu Ile Leu Lys
130 135 140
Ser Phe Phe Ala Met Lys Arg Lys Thr
145 150
<210> 433
<211> 155
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-51 deaminase
<400> 433
Met Thr Asp Asp Arg Asp Leu Tyr Trp Met Gln Gln Ala Leu Leu Leu
1 5 10 15
Ala Val Asp Ala Gly Arg Arg Gly Glu Val Pro Val Gly Ala Leu Leu
20 25 30
Val Leu Asp Glu Val Ser Ile Gly Val Gly Tyr Asn Arg Pro Ile Gly
35 40 45
Asp Arg Asp Pro Thr Ala His Ala Glu Ile Ile Ala Leu Arg Asp Ala
50 55 60
Ala Lys Lys Ile Asn Asn Tyr Arg Leu Leu Asp Thr Thr Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Met Met Cys Ala Ala Ala Met Val His Ala Arg
85 90 95
Ile Lys Arg Leu Val Tyr Gly Ala Pro Asp Pro Lys Ala Gly Ala Ile
100 105 110
Val Ser Gln Ala Gln Ile Leu Asp Ala Pro Phe Phe Asn His Arg Val
115 120 125
Ala Tyr Tyr Gly Asn Leu Leu Ala Met Pro Cys Gly Glu Leu Leu Arg
130 135 140
Thr Phe Phe Lys Ala Lys Arg Leu Ser Ser Thr
145 150 155
<210> 434
<211> 153
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-52 deaminase
<400> 434
Met Arg Leu Ala Met Asp Met Ala Lys Glu Ala Tyr Ser Ile Gly Glu
1 5 10 15
Val Pro Val Gly Cys Val Ile Ala Asp Ala Asp Gly Asn Val Ile Ser
20 25 30
Thr Gly Tyr Asn Arg Ser Ile Thr Asp Asn Asp Pro Ser Ala His Ala
35 40 45
Glu Met Val Ala Ile Arg Asn Ala Gly Ser Leu Leu Lys Asn Tyr Arg
50 55 60
Met Pro Gly Leu Ser Leu Tyr Val Thr Leu Glu Pro Cys Cys Met Cys
65 70 75 80
Ser Gly Ala Ile Ile His Ala Arg Ile Ala Arg Val Tyr Tyr Gly Ala
85 90 95
Ser Asp Leu Lys Thr Gly Ala Cys Gly Ser Val Phe Asn Val Met Ser
100 105 110
Asp Pro Arg His Asn His Ser Val Glu Cys Ile Gly Gly Ile Leu Ala
115 120 125
Asp Glu Cys Ser Lys Met Leu Ser Asp Phe Phe Lys Glu Arg Arg Gln
130 135 140
Gln Lys Lys Ala Glu Ala Thr Lys Leu
145 150
<210> 435
<211> 174
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-53 deaminase
<400> 435
Met Thr Val Asn His Glu Tyr Phe Met Arg Leu Ala Ile Glu Gln Ala
1 5 10 15
Leu Leu Ala Tyr Gln Ala Gly Glu Ile Pro Val Gly Ala Val Ile Val
20 25 30
Asp Thr Asp Gly Asn Val Ile Gly Arg Gly Phe Asn Arg Thr Ile Leu
35 40 45
Asp Asn Asp Pro Ser Ala His Ala Glu Ile Val Ala Leu Arg Asp Ala
50 55 60
Gly Glu Arg Val Lys Asn Tyr Arg Leu Ile Asn Leu Asp Met Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Thr Met Cys Ser Gly Ala Leu Ile His Ser Arg
85 90 95
Leu Asn Asn Leu Tyr Phe Gly Ala Tyr Asp Leu Lys Thr Gly Ala Cys
100 105 110
Gly Ser Arg Phe Asn Ile Leu Gly Ser Ser Glu Tyr Asn His Ile Val
115 120 125
Asn Val Thr Gly Gly Ile Leu Lys Glu Glu Cys Gln Asn Ile Ile Ser
130 135 140
Asp Phe Phe Lys Ala Arg Arg Lys Met Gln Lys Asp Gly Arg Asp Trp
145 150 155 160
Ile Val Glu Ser Gly Lys Val Arg Ser Trp Gln Lys Asn Val
165 170
<210> 436
<211> 172
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-54 deaminase
<400> 436
Met Thr Ser Pro Thr Ala Gly Leu Gly Glu Thr Asp Glu Tyr Trp Met
1 5 10 15
Asn Arg Ala Leu Ala Leu Ala Ala Glu Ala Gly Glu Ser Gly Glu Val
20 25 30
Pro Val Gly Ala Val Val Val Leu Asp Gly Arg Glu Val Gly Ala Gly
35 40 45
Tyr Asn Gly Pro Ile Gly Ser Cys Asp Pro Thr Ala His Ala Glu Ile
50 55 60
Arg Ala Leu Arg Asp Ala Gly Ala Arg Ala Gly Asn Tyr Arg Leu Pro
65 70 75 80
Gly Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Val Gly
85 90 95
Ala Ile Val His Ala Arg Ile Asn Arg Leu Val Tyr Gly Thr Thr Glu
100 105 110
Pro Lys Ala Gly Ala Val Glu Ser Ile Arg Gln Thr Leu Arg Asp Asp
115 120 125
His Phe Asn Trp Gln Val Glu Ala Thr Gly Gly Val Leu Ala Ser Gln
130 135 140
Cys Arg Glu Ile Ile Gln Arg Phe Phe Ala Gly Arg Arg Glu Tyr His
145 150 155 160
Arg Leu Arg Lys Gln Thr Leu Ser Val Lys Glu Gln
165 170
<210> 437
<211> 158
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-55 deaminase
<400> 437
Met Pro Asp Leu Asp Asp Gly Tyr Trp Met Gln Gln Ala Leu Lys Leu
1 5 10 15
Ala Ala Gln Ala Lys Asp Gln Gly Glu Val Pro Val Gly Ala Leu Val
20 25 30
Val Gly Glu Gln Lys Leu Leu Gly Gln Gly Tyr Asn Gln Val Ile Ser
35 40 45
Leu Gln Asp Pro Ser Ala His Ala Glu Val Met Ala Leu Arg Gly Ala
50 55 60
Gly Ile Thr Gln Gln Asn Tyr Arg Leu Val Asn Thr Thr Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Met Met Cys Ala Gly Val Leu Val His Ala Arg
85 90 95
Ile Lys Arg Leu Val Phe Gly Ala Tyr Asp Pro Lys Ala Gly Ala Ile
100 105 110
Ser Ser Cys Ala Gln Leu Leu Thr Leu Pro His Leu Asn His Gln Ile
115 120 125
Leu Val Gln Gly Gly Ile Leu Ala Lys Glu Cys Gly Gln Gln Leu Thr
130 135 140
Asp Phe Phe Lys Ala Lys Arg Gln Ala Lys His Asp Lys Gly
145 150 155
<210> 438
<211> 157
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-56 deaminase
<400> 438
Met Thr Ala Ala Ala Glu Phe Asp Glu His Asp Leu Arg Trp Met Arg
1 5 10 15
Gln Ala Leu Glu Leu Ala Arg Arg Ala Glu Arg Asp His Ala Glu Val
20 25 30
Pro Val Gly Ala Val Leu Val Ile Asp Asn Glu Val Ile Gly Ser Gly
35 40 45
Met Asn Arg Asn Ile Ile Asp His Asp Ala Ser Ala His Ala Glu Ile
50 55 60
Val Cys Leu Arg Asp Ala Gly Gln Arg Val Ala Asn His Arg Phe Pro
65 70 75 80
Gly Ser Thr Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly
85 90 95
Ala Ile Val His Ala Arg Val Gly Arg Val Val Tyr Ala Ala Ser Asp
100 105 110
Pro Lys Thr Gly Ala Ala Gly Ser Val Phe Asp Ile Leu Thr Ser Glu
115 120 125
Arg His Asn His Arg Val Ala Val Arg Gly Gly Leu Leu Ala Glu Glu
130 135 140
Ser Ala Arg Leu Leu Gln Leu Phe Phe Arg Ser Arg Arg
145 150 155
<210> 439
<211> 176
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-57 deaminase
<400> 439
Met Ser Glu Ser Ser Ala Val Tyr Ser Asp Glu Tyr Trp Leu Arg Tyr
1 5 10 15
Ala Leu Gln Leu Ala Glu Arg Ala Tyr Gln Gln Gly Glu Val Pro Val
20 25 30
Gly Ala Val Leu Val Arg Asp Asn Gln Ile Leu Gly Glu Gly Trp Asn
35 40 45
Gln Ser Ile Ser Gln His Asp Ala Thr Ala His Ala Glu Ile Met Ala
50 55 60
Leu Arg Ala Ala Gly Leu Val Ala Gly Asn Tyr Arg Leu Pro Asn Thr
65 70 75 80
Ser Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Leu
85 90 95
Leu His Ala Arg Val Glu Arg Val Val Phe Gly Ala Tyr Asp Pro Lys
100 105 110
Thr Gly Ala Val Gly Ser Met Phe Asp Val Leu Leu Asp Ala Arg His
115 120 125
Asn His Gln Val Gln Leu Thr Gly Gly Val Leu Gln Ala Asp Cys Val
130 135 140
Ala Gln Leu Gln Ala Phe Phe Lys Glu Arg Arg Leu Ala Gln Lys Leu
145 150 155 160
Ala Lys Phe Asn Ser Val Thr Ile Ser Ser Pro Thr Ser Thr Glu Asn
165 170 175
<210> 440
<211> 158
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-58 deaminase
<400> 440
Met Ser Leu Ala Asp Arg His Glu Met Phe Met Gln Met Ala Leu Gln
1 5 10 15
Gln Ala Gln Leu Ala Tyr Asp Cys Ala Glu Val Pro Val Gly Ala Val
20 25 30
Val Val Asn Ser Ala Gly Glu Val Ile Gly Lys Gly Tyr Asn Arg Thr
35 40 45
Ile Ile Asp Ser Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu Arg
50 55 60
Gln Ala Ala Ala His Glu Gln Asn Tyr Arg Leu Pro Asp Leu Thr Val
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ile Gly Ala Leu Thr His
85 90 95
Ala Arg Ile Ala His Val Val Tyr Gly Ala Ser Asp Pro Lys Thr Gly
100 105 110
Ala Cys Gly Ser Val Leu Cys Ile Gln Ala Asn Lys Lys Ile Asn His
115 120 125
His Thr Arg Ile Thr Ser Gly Val Leu Glu Gln Ala Cys Ala Glu Lys
130 135 140
Leu Arg His Phe Phe Arg Glu Arg Arg Lys Gly Ser Lys Leu
145 150 155
<210> 441
<211> 154
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-59 deaminase
<400> 441
Met Ala Asp Asp Asp Phe Met Ala Leu Ala Ile Glu Gln Ala Leu Leu
1 5 10 15
Ala Gln Ala Gln Gly Glu Val Pro Val Gly Ala Val Leu Val Asp Gly
20 25 30
Ser Gly His Val Ile Gly Arg Gly Ala Asn Ala Val Ile Gly Leu Ser
35 40 45
Asp Pro Thr Ala His Ala Glu Ile Val Ala Leu Arg Ser Ala Ala Lys
50 55 60
Leu Leu Gly Asn Tyr Arg Leu Pro Gln Thr Thr Leu Phe Val Thr Leu
65 70 75 80
Glu Pro Cys Ala Met Cys Leu Gly Ala Leu Phe His Ala Arg Val Ser
85 90 95
Arg Ile Val Phe Gly Ala Pro Asp Pro Lys Thr Gly Ala Cys Gly Ser
100 105 110
Arg Leu Asp Leu Thr Ala Pro Asp Leu Ile Asn Phe His Ala Ser Val
115 120 125
Arg Gly Gly Val Met Gln Glu Ala Cys Gly His Leu Leu Thr Asp Phe
130 135 140
Phe Lys Arg Lys Arg Ser Glu Lys Leu Ser
145 150
<210> 442
<211> 204
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-60 deaminase
<400> 442
Met Arg Val Ala Leu Gly Ala Ala Arg Glu Ala Gln Ala Ala Gly Glu
1 5 10 15
Val Pro Val Gly Ala Val Ile Val Arg Asp Gly Val Leu Ile Ala Thr
20 25 30
Gly Arg Asn Ala Pro Arg Gln Gln His Asp Pro Thr Ala His Ala Glu
35 40 45
Ile Ala Ala Leu Arg Ala Ala Ala Arg Arg Leu Gly Asn Tyr Arg Leu
50 55 60
Asp Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Leu Met Cys Val
65 70 75 80
Gly Ala Met Leu His Ala Arg Leu Glu Arg Val Val Phe Gly Ala Pro
85 90 95
Asp Pro Lys Thr Gly Ala Ala Gly Ser Val Phe Asn Ala Leu Ala Glu
100 105 110
Pro Lys Leu Asn His Gln Thr Thr Val Glu Gly Gly Val Leu Ala Thr
115 120 125
Glu Cys Ala Ala Leu Leu Gln Val Phe Phe Gly Gln Arg Arg Leu Leu
130 135 140
Gln Arg Ile Ser Ala Gln Pro Leu Arg Asp Asp Ala Leu Arg Thr Ser
145 150 155 160
Glu Ala Arg Met Ala Ala Phe Ala Ser Pro Leu Ser Arg Trp Val Cys
165 170 175
Asp Leu Pro Ala Leu Gln Gly Leu Arg Leu His Tyr Leu Asp Met Gly
180 185 190
Pro Ser Thr Glu Gly Arg Ala Trp Leu Leu Leu His
195 200
<210> 443
<211> 168
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-61 deaminase
<400> 443
Met Asn Thr Glu Gln Ser Lys Pro Leu Leu Gly Asp Ala His Phe Met
1 5 10 15
Gln Gln Ala Leu Gln Leu Ala Asp Ala Ala Phe Ala Leu Gln Glu Val
20 25 30
Pro Val Gly Ala Val Val Val Gln Asp Gly Ile Ile Ile Gly Arg Gly
35 40 45
Phe Asn Ala Pro Ile Thr Gln His Asp Pro Cys Ala His Ala Glu Ile
50 55 60
Leu Ala Leu Arg Asp Ala Ala Lys Asn Ile Gly Asn Tyr Arg Leu Val
65 70 75 80
Gly Cys Glu Leu Phe Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly
85 90 95
Ala Met Met His Ala Arg Ile Ala Arg Val Val Tyr Gly Ala Tyr Asp
100 105 110
Leu Lys Thr Gly Ala Cys Gly Ser Val Gln Asn Val Phe Asn Glu Pro
115 120 125
Arg Trp Asn His His Thr Ile Cys Thr Gly Gly Val Leu Ala Glu Gln
130 135 140
Cys Gly Thr Lys Leu Ser Gln Phe Phe Ala Leu Arg Arg Ala Gln Lys
145 150 155 160
Lys Ser Leu Thr Ala Thr Trp Thr
165
<210> 444
<211> 283
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG121 deaminase
<220>
<223> Description: MG121-1 deaminase
<400> 444
Met Lys Val Thr Leu Gly Gly Gln Thr Ile Asp Val Glu Glu Val Leu
1 5 10 15
Lys Arg Ile Ser Ser Thr Thr Val Ala Ala Ala Leu Ile Lys Asp Gly
20 25 30
Glu Val Val Ala Val Glu Glu Thr Gly Gly Glu His Ala Glu Lys Lys
35 40 45
Leu Val Arg Lys His Asp Val Glu Gly Ala Val Ile Phe Val Thr Ala
50 55 60
Arg Pro Cys Arg Tyr Cys Ala Glu Ala Met Ala Glu Ala Gly Val Ala
65 70 75 80
Gly Val Val Tyr Leu Gly Lys Gly Arg Gly Tyr Gly Pro Tyr Leu Leu
85 90 95
Glu Arg Leu Gly Val Pro Cys Val Glu Val His Pro Ser Glu Pro Pro
100 105 110
Ala Trp Arg Pro Val Pro Arg Leu Asp Val Leu Ile Thr Phe Gly Gly
115 120 125
Asn Pro Tyr Leu Thr Glu Glu Asp Val Ala Ala Arg Thr Tyr Ala Leu
130 135 140
Leu Thr Gly Ile Gly Val Glu Ala Glu Val Val Pro Ala Pro Asn Asn
145 150 155 160
Met Ala Gly Arg Val Glu Val Met Val Lys Arg Gly Asp Pro Asp Arg
165 170 175
Ala His Gly Arg Leu Lys Glu Thr Phe Gly Pro Val Phe Lys Val Arg
180 185 190
Arg Phe Gln Leu Ser Gly Asp Tyr Glu Asp Arg Glu Ser Leu Ala Glu
195 200 205
Asp Val Leu Glu Val Val Glu Pro Leu Ile Glu Asp Pro Phe Ala Val
210 215 220
Arg Ala Asn Val Ala Ser Pro Gly Pro Thr Phe Ser Gly Ser Lys Glu
225 230 235 240
Ala Glu Val Phe Ile Gly Asp Val Leu Thr Ser Ala Gly His Glu Val
245 250 255
Asp Leu Glu Asp Pro Arg Thr Leu Val His Val Asp Val Leu Gly Arg
260 265 270
Arg Val Ser Val Gly Val Glu Arg Arg Asp Gly
275 280
<210> 445
<211> 279
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG121 deaminase
<220>
<223> Description: MG121-2 deaminase
<400> 445
Val Lys Ile Thr Leu Ala Gly Glu Thr Ile Asp Val Glu Lys Val Leu
1 5 10 15
Arg Glu Ile Pro Thr Arg Thr Val Thr Ala Ala Leu Ile Lys Asp Gly
20 25 30
Glu Val Lys Ala Tyr Glu Glu Ala Asp Gly Glu His Ala Glu Lys Lys
35 40 45
Leu Ile Arg Asn His Asp Val Ser Asp Gly Val Val Phe Val Thr Ile
50 55 60
Arg Pro Cys Leu Tyr Cys Ala Arg Glu Leu Ala Lys Ala Gly Val Ala
65 70 75 80
Gly Val Val Tyr Ile Gly Arg Gly Arg Gly Leu Gly Pro Tyr Tyr Leu
85 90 95
Ala Arg Lys Gly Ile Glu Val Val Glu Val Asn Pro Ser Arg Pro Leu
100 105 110
His Tyr Asp Pro Val Glu Arg Leu Asp Val Leu Val Thr Phe Gly Gly
115 120 125
Asn Pro Tyr Leu Thr Glu Glu Asp Val Ala Ala Arg Val Tyr Cys Leu
130 135 140
Leu Thr Gly Lys Gly Ile Lys Ala Glu Ile Ala Pro Ala Pro Glu Asn
145 150 155 160
Leu Ala Gly Arg Val Glu Val Met Ile Thr Asp Gly Asp Ser Glu Arg
165 170 175
Ala Ala Arg Val Ile Glu Arg Glu Leu Pro Thr Phe Asn Val Arg His
180 185 190
Phe Leu Leu Ser Asp Arg Phe Asp Asp Arg Glu Glu Leu Ser Lys Arg
195 200 205
Val Leu Glu Glu Ile Glu Pro Arg Val Glu Asp Pro Phe Ala Val Arg
210 215 220
Ala Arg Ile Ala Arg Ala Gly Leu Phe Ser Ser Ser Arg Asp Ala Glu
225 230 235 240
Val Phe Leu Gly Asp Val Leu Thr Ser Ala Gly His Glu Val Asp Leu
245 250 255
Asp Glu Pro Arg Thr Val Val His Val Asp Val Leu Gly Asp Arg Val
260 265 270
Ser Val Gly Val Glu Lys Arg
275
<210> 446
<211> 283
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG121 deaminase
<220>
<223> Description: MG121-3 deaminase
<400> 446
Met Lys Val Thr Leu Gly Gly Gln Thr Ile Asp Val Glu Glu Val Leu
1 5 10 15
Lys Arg Ile Ser Ser Thr Thr Val Ala Ala Ala Leu Ile Lys Asp Gly
20 25 30
Glu Val Val Ala Val Glu Glu Thr Gly Gly Glu His Ala Glu Lys Lys
35 40 45
Leu Val Arg Lys His Asp Val Glu Gly Ala Val Ile Phe Val Thr Ala
50 55 60
Arg Pro Cys Arg Tyr Cys Ala Glu Ala Met Ala Glu Ala Gly Val Ala
65 70 75 80
Gly Val Val Tyr Leu Gly Lys Gly Arg Gly Tyr Gly Pro Tyr Leu Leu
85 90 95
Glu Arg Leu Gly Val Pro Cys Val Glu Val His Pro Ser Glu Pro Pro
100 105 110
Ala Trp Arg Pro Val Pro Arg Leu Asp Val Leu Ile Thr Phe Gly Gly
115 120 125
Asn Pro Tyr Leu Thr Glu Glu Asp Val Ala Ala Arg Thr Tyr Ala Leu
130 135 140
Leu Thr Gly Ile Gly Ile Glu Ala Glu Val Val Pro Ala Pro Asn Asn
145 150 155 160
Met Ala Gly Arg Val Glu Val Met Val Lys Arg Gly Asp Pro Asp Arg
165 170 175
Ala His Gly Arg Leu Lys Glu Thr Phe Gly Ser Val Phe Lys Val Arg
180 185 190
Arg Phe Gln Leu Ser Gly Asp Tyr Glu Asp Arg Glu Ser Leu Ala Glu
195 200 205
Asp Val Leu Glu Val Val Glu Pro Leu Ile Glu Asp Pro Phe Ala Val
210 215 220
Arg Ala Asn Val Ala Ser Pro Gly Pro Thr Phe Ser Gly Ser Lys Glu
225 230 235 240
Ala Glu Val Phe Ile Gly Asp Val Leu Thr Ser Ala Gly His Glu Val
245 250 255
Asp Leu Glu Asp Pro Arg Thr Leu Val His Val Asp Val Leu Gly Arg
260 265 270
Arg Val Ser Val Gly Val Glu Arg Arg Asp Gly
275 280
<210> 447
<211> 280
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
uncultivated organism
<220>
<223> Category: MG121 deaminase
<220>
<223> Description: MG121-4 deaminase
<400> 447
Met Arg Ser Ala Glu Tyr Leu Ala Tyr Leu Arg Arg Arg Tyr Gly Leu
1 5 10 15
Arg Pro Asn Arg Arg Leu Gly Gln His Phe Met Val Asp Asp Arg Leu
20 25 30
Leu Arg Phe Met Val Glu Ala Ala Gly Val Gly Pro Glu Asp Thr Val
35 40 45
Leu Glu Ile Gly Pro Gly Pro Gly Leu Leu Thr Arg Tyr Leu Ile Glu
50 55 60
Arg Ala Gly Arg Val Val Ala Val Glu Leu Asp Glu Arg Leu Val Glu
65 70 75 80
Val Leu Glu Arg Glu Leu Gly Asp Ala Glu Asn Leu Glu Ile Val His
85 90 95
Ala Asp Phe Leu Glu Tyr Gly Val Pro Glu Glu Val Asn Lys Val Val
100 105 110
Ser Asn Leu Pro Tyr Gln Ile Ser Ser Glu Ala Thr Phe Glu Ile Leu
115 120 125
Arg Ser Asp Val Glu Arg Ala Val Leu Thr Tyr Gln Arg Glu Phe Ala
130 135 140
Glu Arg Met Thr Ala Glu Pro Gly Thr Arg Gly Tyr Gly Arg Leu Thr
145 150 155 160
Val Met Val Asn Leu Leu Ala Arg Val Glu Val Leu Arg Ala Val Pro
165 170 175
Arg Arg Ala Phe Val Pro Pro Pro Arg Val Ser Ser Ala Ile Val Arg
180 185 190
Leu Glu Pro Arg Pro Glu Ser Glu Leu Pro Asp Val Asp Pro Glu Thr
195 200 205
Leu Glu Ala Val Cys Arg Gly Leu Phe Gln His Arg Arg Lys Thr Val
210 215 220
Arg Asn Ala Leu Arg Leu Ser Ala His Glu Trp Gly Gly Asp Glu Glu
225 230 235 240
Val Val Glu Glu Val Leu Arg Arg Leu Pro Glu Glu Leu Leu Asp Lys
245 250 255
Arg Pro Leu His Leu Thr Pro Glu Glu Val Val Arg Val Ala Arg Cys
260 265 270
Val Glu Arg Ala Arg Gly Ser Ser
275 280
<210> 448
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V1
<400> 448
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 449
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V2
<400> 449
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 450
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V3
<400> 450
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 451
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V4
<400> 451
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 452
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V5
<400> 452
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 453
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V6
<400> 453
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 454
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V7
<400> 454
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Cys Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 455
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V8
<400> 455
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 456
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V9
<400> 456
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 457
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V10
<400> 457
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Ser Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 458
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V11
<400> 458
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Arg
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 459
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V12
<400> 459
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Arg Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 460
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V13
<400> 460
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Pro Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 461
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V14
<400> 461
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 462
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V15
<400> 462
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 463
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V16
<400> 463
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 464
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V17
<400> 464
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 465
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V18
<400> 465
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Cys Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 466
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V19
<400> 466
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 467
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V20
<400> 467
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Cys Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 468
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V21
<400> 468
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Cys Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 469
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V22
<400> 469
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Cys Tyr Phe Phe Arg Trp Arg Arg Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 470
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V23
<400> 470
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Cys Tyr Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 471
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V24
<400> 471
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg Tyr Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Cys Tyr Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 472
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V25
<400> 472
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Cys Tyr Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 473
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V26
<400> 473
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Cys Arg Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 474
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V27
<400> 474
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Arg
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Cys Arg Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 475
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: MG68 putative adenosine deaminase (TadA-like)
<220>
<223> Description: MG68-4_V28
<400> 475
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Arg Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Ser Thr Phe Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Val Glu Asn Pro Lys Arg
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Asn Arg
130 135 140
Leu Leu Cys Asp Phe Phe Arg Trp Arg Pro Ala Gln Lys Asn Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn
165
<210> 476
<211> 962
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: adenine base editor
<220>
<223> Description: MG68-4_V1-nMG34-1 (D10A)
<400> 476
Met Thr Asp Ser Gln Asn Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala
1 5 10 15
Leu Lys Leu Ala Gln Lys Ala Trp Asp Glu Gly Glu Val Pro Val Gly
20 25 30
Ala Ile Leu Val Arg Lys Gly Glu Val Ile Gly His Gly Trp Asn Arg
35 40 45
Ser Ile Gly Ser His Asp Pro Ser Ala His Ala Glu Ile Met Ala Ile
50 55 60
Arg Glu Ala Gly Val Arg Ile Gly Asn Tyr Arg Met Leu Asp Thr Val
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val
85 90 95
His Gly Arg Ile Ser Arg Leu Val Phe Gly Ala Glu Asn Pro Lys Thr
100 105 110
Gly Ala Cys Gly Ser Val Met Asp Ile Ala Arg His Pro Ala Leu Asn
115 120 125
His Gln Leu Gln Val Asp Gly Gly Val Met Ala Ala Pro Cys Ala Arg
130 135 140
Leu Leu Ser Asp Phe Phe Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala
145 150 155 160
Arg Asp Asn Ser Ser Gly Asn Gly Thr Ser Gly Gly Ser Ser Gly Gly
165 170 175
Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
180 185 190
Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Glu Arg Glu Leu Val Leu
195 200 205
Gly Ile Ala Tyr Gly Gly Lys Tyr Thr Gly Leu Ala Val Val Asp Arg
210 215 220
Arg His Asn Gln Val Leu Tyr Ala Asn Arg Leu Lys Met Arg Asp Asp
225 230 235 240
Val Ala Gly Ile Leu Lys Asp Arg Arg Lys Gln Arg Gly Ile Arg Arg
245 250 255
Thr Ala Gln Thr Lys Lys Lys Arg Leu Arg Glu Leu Lys Asn Tyr Leu
260 265 270
Lys Ser Ile Gly Tyr Asn Glu Ser Thr Ala Thr Phe Glu Thr Val Tyr
275 280 285
Ser Leu Ala His Lys Arg Gly Tyr Asp Tyr Ala Asp Met Pro Glu Glu
290 295 300
Lys Thr Ser Glu Glu Ile Glu Ala Met Asp Val Glu Glu Arg Lys Gln
305 310 315 320
Trp Glu Lys Glu Lys Gln Glu Trp Glu Glu Thr Lys Arg Asn Ser Arg
325 330 335
His Arg Lys Glu Val Val Lys Asp Val His Lys Ala Met Ile Glu Gly
340 345 350
Arg Ala Thr Glu Glu Gln Ile Lys Arg Val Glu Arg Ile Phe Asn Lys
355 360 365
Gln Tyr Arg Pro Lys Arg Phe Asn Asn Arg Ile Leu Thr Lys Cys Lys
370 375 380
Val Glu Asp Cys Gly Val Asn Thr Pro Leu Arg Lys Asn Val Arg Asp
385 390 395 400
Leu Leu Ile Glu Asn Ile Val Arg Phe Phe Pro Ile Glu Gln Ser Glu
405 410 415
Lys Asp Asn Leu Lys Asp Ala Val Leu Asp Lys Asn Arg Arg Glu Glu
420 425 430
Val Lys Ser Phe Phe Arg Lys His Lys Thr Asp Glu His Ile Arg Lys
435 440 445
Gln Val Tyr Asp Ile Ala Asp Asn Lys Leu Ser Gly Arg Thr Val Phe
450 455 460
Cys Lys Glu His Ile Leu Glu His Thr Glu His Ser Lys Glu Glu Arg
465 470 475 480
Lys Val Phe Arg Leu Ala Pro Ser Leu Lys Thr Lys Ile Glu Asn Val
485 490 495
Leu Ala Val Ile Lys Asp Glu Ile Leu Pro Lys Phe Thr Val Asn Lys
500 505 510
Val Val Met Glu Ser Asn Asn Phe Asp Ile Ala Ala Lys Thr Gln Gly
515 520 525
Lys Lys Arg Leu Ala Lys Glu Glu Tyr Gly Lys Gly Pro Arg Glu Gly
530 535 540
Lys Glu Thr Arg Lys Glu Ala Leu Leu Arg Glu Thr Asp Gly Arg Cys
545 550 555 560
Ile Tyr Cys Gly Lys Ser Ile Asp Ile Ser Asn Ala His Asp Asp His
565 570 575
Ile Phe Pro Arg Lys Ala Gly Gly Leu Asn Ile Phe Ala Asn Leu Val
580 585 590
Ala Cys Cys Ala Val Cys Asn Glu Asn Lys Lys Gly Arg Thr Pro Leu
595 600 605
Glu Ser Gly Ile Ser Pro Lys Pro Glu Ile Ile Ala Phe Met Lys Asn
610 615 620
Asp Leu Lys Lys Lys Ile Leu Glu Asp Ala Arg Asn Ile Asn Thr Val
625 630 635 640
Asp Phe Asn Lys Tyr Met Ser His Ala Ser Ile Gly Trp Arg Tyr Met
645 650 655
Arg Asp Arg Leu Arg Glu Ser Ala Gly Asn Lys Lys Leu Pro Ile Glu
660 665 670
Arg Gln Ser Gly Ile Tyr Thr Ala Tyr Phe Arg Arg Trp Trp Gly Phe
675 680 685
Lys Lys Glu Arg Gly Asn Thr Leu His His Ala Leu Asp Ala Val Ile
690 695 700
Leu Ala Ser Arg Lys Gly Tyr Ser Asp Asp Gly Leu Val Asp Met Thr
705 710 715 720
Leu Lys Pro Lys Tyr Asn Lys Gly Gly Glu Phe Asp Pro Glu Lys His
725 730 735
Leu Pro Glu Pro Ile Glu Phe Lys Met Asp Lys Gly Ser Arg Gly Ser
740 745 750
Ala Leu His Asp Arg Asn Pro Leu Ser Tyr Lys Lys Gly Ile Ile Thr
755 760 765
Arg Arg Phe Met Val Thr Glu Ile Glu Cys Gly Lys Glu Asp Asp Val
770 775 780
Ile Ser Glu Thr Tyr Arg Glu Lys Leu Lys Glu Ala Phe Lys Arg Phe
785 790 795 800
Asp Thr Lys Lys Gly Lys Cys Leu Thr Asp Lys Glu Ala Lys Glu Ala
805 810 815
Gly Phe Cys Ile Lys Lys Asn Glu Leu Val Met Ser Leu Lys Cys Ser
820 825 830
Ile Lys Gly Thr Gly Pro Gly Gln Met Ile Arg Ile Asn Asn Asn Val
835 840 845
Phe Lys Thr Asn Val His Asn Val Gly Val Asp Val Tyr Leu Asp Glu
850 855 860
Lys Gly Lys Lys Lys Ala Tyr Glu Arg Lys Asn Pro Arg Leu Ser Lys
865 870 875 880
His Phe Ile Glu Pro Pro Pro Gln Pro Asn Gly Arg Val Ser Phe Thr
885 890 895
Leu Lys Arg Arg Asp Met Val Thr Val Glu Gly Glu Asp Ala Ile Tyr
900 905 910
Arg Ile Lys Lys Leu Gly Thr Ser Pro Thr Ile Glu Ala Val Val Gly
915 920 925
Ser Asp Gly Lys Thr Arg Thr Val Ser Ala Thr Lys Leu Thr Lys Ala
930 935 940
Asn Ser Ala Glu Leu Glu Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg
945 950 955 960
Lys Val
<210> 477
<211> 1589
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: adenine base editor
<220>
<223> Description: MG68-4_V1-nSpCas9 (D10A)
<400> 477
Met Gly Ser Ser His His His His His His Met Thr Asp Ser Gln Asn
1 5 10 15
Asp Thr Asp Glu Tyr Trp Met Gly Glu Ala Leu Lys Leu Ala Gln Lys
20 25 30
Ala Trp Asp Glu Gly Glu Val Pro Val Gly Ala Ile Leu Val Arg Lys
35 40 45
Gly Glu Val Ile Gly His Gly Trp Asn Arg Ser Ile Gly Ser His Asp
50 55 60
Pro Ser Ala His Ala Glu Ile Met Ala Ile Arg Glu Ala Gly Val Arg
65 70 75 80
Ile Gly Asn Tyr Arg Met Leu Asp Thr Val Leu Tyr Val Thr Leu Glu
85 90 95
Pro Cys Ala Met Cys Ala Gly Ala Leu Val His Gly Arg Ile Ser Arg
100 105 110
Leu Val Phe Gly Ala Glu Asn Pro Lys Thr Gly Ala Cys Gly Ser Val
115 120 125
Met Asp Ile Ala Arg His Pro Ala Leu Asn His Gln Leu Gln Val Asp
130 135 140
Gly Gly Val Met Ala Ala Pro Cys Ala Arg Leu Leu Ser Asp Phe Phe
145 150 155 160
Arg Trp Arg Arg Ala Gln Lys Lys Ala Ala Arg Asp Asn Ser Ser Gly
165 170 175
Asn Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly
180 185 190
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly
195 200 205
Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser
210 215 220
Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys
225 230 235 240
Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu
245 250 255
Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg
260 265 270
Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile
275 280 285
Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp
290 295 300
Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys
305 310 315 320
Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala
325 330 335
Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val
340 345 350
Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala
355 360 365
His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn
370 375 380
Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr
385 390 395 400
Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp
405 410 415
Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu
420 425 430
Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly
435 440 445
Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn
450 455 460
Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr
465 470 475 480
Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala
485 490 495
Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser
500 505 510
Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
515 520 525
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu
530 535 540
Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe
545 550 555 560
Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala
565 570 575
Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
580 585 590
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu
595 600 605
Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
610 615 620
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro
625 630 635 640
Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg
645 650 655
Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala
660 665 670
Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu
675 680 685
Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met
690 695 700
Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His
705 710 715 720
Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val
725 730 735
Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu
740 745 750
Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
755 760 765
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe
770 775 780
Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu
785 790 795 800
Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu
805 810 815
Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
820 825 830
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr
835 840 845
Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg
850 855 860
Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg
865 870 875 880
Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
885 890 895
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
900 905 910
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser
915 920 925
Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys
930 935 940
Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met
945 950 955 960
Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
965 970 975
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg
980 985 990
Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
995 1000 1005
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1010 1015 1020
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1025 1030 1035
Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln
1040 1045 1050
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1055 1060 1065
Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1070 1075 1080
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1085 1090 1095
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1100 1105 1110
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1115 1120 1125
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1130 1135 1140
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1145 1150 1155
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1160 1165 1170
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1175 1180 1185
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1190 1195 1200
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1205 1210 1215
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1220 1225 1230
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1235 1240 1245
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1250 1255 1260
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1265 1270 1275
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1280 1285 1290
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1295 1300 1305
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1310 1315 1320
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1325 1330 1335
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1340 1345 1350
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1355 1360 1365
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1370 1375 1380
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1385 1390 1395
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1400 1405 1410
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1415 1420 1425
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1430 1435 1440
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1445 1450 1455
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1460 1465 1470
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1475 1480 1485
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1490 1495 1500
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1505 1510 1515
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1520 1525 1530
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1535 1540 1545
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1550 1555 1560
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly
1565 1570 1575
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 478
<211> 1361
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: cytosine base editor
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)
<400> 478
Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr
1 5 10 15
Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His
20 25 30
Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys
35 40 45
Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His
50 55 60
Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys
65 70 75 80
Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr
85 90 95
Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr
100 105 110
Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala
115 120 125
Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp
130 135 140
Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser
145 150 155 160
Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala
165 170 175
His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu
180 185 190
Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg
195 200 205
Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys
210 215 220
His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys
225 230 235 240
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
245 250 255
Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly
260 265 270
Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu
275 280 285
Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly
290 295 300
Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val
305 310 315 320
Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys
325 330 335
Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val
340 345 350
Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu
355 360 365
Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys
370 375 380
His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp
385 390 395 400
Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys
405 410 415
Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg
420 425 430
Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg
435 440 445
Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn
450 455 460
Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile
465 470 475 480
Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser
485 490 495
Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu
500 505 510
Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met
515 520 525
Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg
530 535 540
Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp
545 550 555 560
Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val
565 570 575
Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu
580 585 590
Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu
595 600 605
Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala
610 615 620
Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln
625 630 635 640
Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr
645 650 655
Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu
660 665 670
Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser
675 680 685
Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val
690 695 700
Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser
705 710 715 720
Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile
725 730 735
Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn
740 745 750
Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe
755 760 765
Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys
770 775 780
Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg
785 790 795 800
Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn
805 810 815
Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu
820 825 830
Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg
835 840 845
Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu
850 855 860
Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala
865 870 875 880
Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg
885 890 895
Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr
900 905 910
Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile
915 920 925
Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys
930 935 940
Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val
945 950 955 960
Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn
965 970 975
Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr
980 985 990
Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu
995 1000 1005
Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys
1010 1015 1020
Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn
1025 1030 1035
Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp
1040 1045 1050
Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val
1055 1060 1065
Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu
1070 1075 1080
Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser
1085 1090 1095
Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu
1100 1105 1110
Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu
1115 1120 1125
Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu
1130 1135 1140
Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro
1145 1150 1155
Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met
1160 1165 1170
Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn
1175 1180 1185
Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys
1190 1195 1200
Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu
1205 1210 1215
Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala
1220 1225 1230
Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro
1235 1240 1245
Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys
1250 1255 1260
Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser
1265 1270 1275
Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser
1280 1285 1290
Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val
1295 1300 1305
Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val
1310 1315 1320
Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe
1325 1330 1335
Arg Ser Gly Gly Ser Ser Ser Gly Gly Gly Ala Ser Ser Gly Gly
1340 1345 1350
Ser Pro Lys Lys Lys Arg Lys Val
1355 1360
<210> 479
<211> 1441
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: cytosine base editor
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)-UGI (PBS1)
<400> 479
Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr
1 5 10 15
Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His
20 25 30
Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys
35 40 45
Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His
50 55 60
Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys
65 70 75 80
Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr
85 90 95
Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr
100 105 110
Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala
115 120 125
Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp
130 135 140
Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser
145 150 155 160
Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala
165 170 175
His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu
180 185 190
Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg
195 200 205
Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys
210 215 220
His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys
225 230 235 240
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
245 250 255
Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly
260 265 270
Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu
275 280 285
Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly
290 295 300
Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val
305 310 315 320
Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys
325 330 335
Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val
340 345 350
Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu
355 360 365
Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys
370 375 380
His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp
385 390 395 400
Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys
405 410 415
Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg
420 425 430
Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg
435 440 445
Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn
450 455 460
Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile
465 470 475 480
Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser
485 490 495
Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu
500 505 510
Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met
515 520 525
Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg
530 535 540
Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp
545 550 555 560
Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val
565 570 575
Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu
580 585 590
Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu
595 600 605
Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala
610 615 620
Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln
625 630 635 640
Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr
645 650 655
Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu
660 665 670
Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser
675 680 685
Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val
690 695 700
Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser
705 710 715 720
Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile
725 730 735
Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn
740 745 750
Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe
755 760 765
Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys
770 775 780
Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg
785 790 795 800
Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn
805 810 815
Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu
820 825 830
Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg
835 840 845
Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu
850 855 860
Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala
865 870 875 880
Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg
885 890 895
Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr
900 905 910
Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile
915 920 925
Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys
930 935 940
Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val
945 950 955 960
Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn
965 970 975
Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr
980 985 990
Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu
995 1000 1005
Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys
1010 1015 1020
Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn
1025 1030 1035
Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp
1040 1045 1050
Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val
1055 1060 1065
Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu
1070 1075 1080
Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser
1085 1090 1095
Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu
1100 1105 1110
Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu
1115 1120 1125
Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu
1130 1135 1140
Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro
1145 1150 1155
Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met
1160 1165 1170
Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn
1175 1180 1185
Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys
1190 1195 1200
Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu
1205 1210 1215
Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala
1220 1225 1230
Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro
1235 1240 1245
Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys
1250 1255 1260
Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser
1265 1270 1275
Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser
1280 1285 1290
Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val
1295 1300 1305
Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val
1310 1315 1320
Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe
1325 1330 1335
Arg Ser Gly Gly Ser Ser Arg Thr Asn Leu Ser Asp Ile Ile Glu
1340 1345 1350
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met
1355 1360 1365
Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
1370 1375 1380
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn
1385 1390 1395
Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
1400 1405 1410
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
1415 1420 1425
Ala Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1430 1435 1440
<210> 480
<211> 1442
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: cytosine base editor
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-1
<400> 480
Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr
1 5 10 15
Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His
20 25 30
Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys
35 40 45
Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His
50 55 60
Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys
65 70 75 80
Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr
85 90 95
Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr
100 105 110
Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala
115 120 125
Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp
130 135 140
Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser
145 150 155 160
Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala
165 170 175
His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu
180 185 190
Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg
195 200 205
Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys
210 215 220
His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys
225 230 235 240
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
245 250 255
Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly
260 265 270
Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu
275 280 285
Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly
290 295 300
Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val
305 310 315 320
Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys
325 330 335
Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val
340 345 350
Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu
355 360 365
Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys
370 375 380
His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp
385 390 395 400
Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys
405 410 415
Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg
420 425 430
Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg
435 440 445
Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn
450 455 460
Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile
465 470 475 480
Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser
485 490 495
Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu
500 505 510
Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met
515 520 525
Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg
530 535 540
Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp
545 550 555 560
Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val
565 570 575
Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu
580 585 590
Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu
595 600 605
Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala
610 615 620
Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln
625 630 635 640
Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr
645 650 655
Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu
660 665 670
Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser
675 680 685
Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val
690 695 700
Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser
705 710 715 720
Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile
725 730 735
Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn
740 745 750
Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe
755 760 765
Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys
770 775 780
Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg
785 790 795 800
Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn
805 810 815
Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu
820 825 830
Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg
835 840 845
Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu
850 855 860
Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala
865 870 875 880
Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg
885 890 895
Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr
900 905 910
Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile
915 920 925
Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys
930 935 940
Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val
945 950 955 960
Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn
965 970 975
Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr
980 985 990
Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu
995 1000 1005
Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys
1010 1015 1020
Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn
1025 1030 1035
Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp
1040 1045 1050
Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val
1055 1060 1065
Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu
1070 1075 1080
Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser
1085 1090 1095
Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu
1100 1105 1110
Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu
1115 1120 1125
Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu
1130 1135 1140
Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro
1145 1150 1155
Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met
1160 1165 1170
Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn
1175 1180 1185
Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys
1190 1195 1200
Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu
1205 1210 1215
Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala
1220 1225 1230
Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro
1235 1240 1245
Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys
1250 1255 1260
Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser
1265 1270 1275
Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser
1280 1285 1290
Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val
1295 1300 1305
Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val
1310 1315 1320
Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe
1325 1330 1335
Arg Ser Gly Gly Ser Ser Ser Lys Thr Ile Lys Asp Leu Glu Glu
1340 1345 1350
Phe Ala Ala Glu Lys Leu Gly Tyr Asp Ile Val Phe Gln Glu Ser
1355 1360 1365
Ile Ser Met Glu Pro Gln Glu Val Glu His Leu Ile Thr Thr Asp
1370 1375 1380
Glu Lys Ser Val Leu Val Asn Ser Thr Tyr Asp Asp Asn Lys Glu
1385 1390 1395
Ile Thr Ile Ser Met Ile Ser Thr Pro His Pro Glu Tyr Arg Pro
1400 1405 1410
Ile Ala Leu Ile Ile Gln Asp Met Glu Gly Glu Val Gln Arg Lys
1415 1420 1425
Glu Leu Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1430 1435 1440
<210> 481
<211> 1443
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: cytosine base editor
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-2
<400> 481
Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr
1 5 10 15
Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His
20 25 30
Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys
35 40 45
Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His
50 55 60
Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys
65 70 75 80
Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr
85 90 95
Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr
100 105 110
Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala
115 120 125
Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp
130 135 140
Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser
145 150 155 160
Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala
165 170 175
His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu
180 185 190
Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg
195 200 205
Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys
210 215 220
His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys
225 230 235 240
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
245 250 255
Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly
260 265 270
Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu
275 280 285
Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly
290 295 300
Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val
305 310 315 320
Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys
325 330 335
Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val
340 345 350
Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu
355 360 365
Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys
370 375 380
His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp
385 390 395 400
Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys
405 410 415
Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg
420 425 430
Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg
435 440 445
Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn
450 455 460
Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile
465 470 475 480
Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser
485 490 495
Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu
500 505 510
Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met
515 520 525
Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg
530 535 540
Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp
545 550 555 560
Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val
565 570 575
Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu
580 585 590
Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu
595 600 605
Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala
610 615 620
Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln
625 630 635 640
Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr
645 650 655
Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu
660 665 670
Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser
675 680 685
Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val
690 695 700
Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser
705 710 715 720
Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile
725 730 735
Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn
740 745 750
Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe
755 760 765
Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys
770 775 780
Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg
785 790 795 800
Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn
805 810 815
Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu
820 825 830
Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg
835 840 845
Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu
850 855 860
Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala
865 870 875 880
Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg
885 890 895
Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr
900 905 910
Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile
915 920 925
Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys
930 935 940
Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val
945 950 955 960
Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn
965 970 975
Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr
980 985 990
Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu
995 1000 1005
Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys
1010 1015 1020
Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn
1025 1030 1035
Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp
1040 1045 1050
Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val
1055 1060 1065
Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu
1070 1075 1080
Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser
1085 1090 1095
Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu
1100 1105 1110
Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu
1115 1120 1125
Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu
1130 1135 1140
Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro
1145 1150 1155
Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met
1160 1165 1170
Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn
1175 1180 1185
Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys
1190 1195 1200
Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu
1205 1210 1215
Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala
1220 1225 1230
Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro
1235 1240 1245
Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys
1250 1255 1260
Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser
1265 1270 1275
Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser
1280 1285 1290
Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val
1295 1300 1305
Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val
1310 1315 1320
Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe
1325 1330 1335
Arg Ser Gly Gly Ser Ser Ser Lys Thr Ile Lys Asp Leu Glu Glu
1340 1345 1350
Phe Ala Ala Glu Lys Leu Gly Tyr Asp Ile Val Phe Gln Glu Ser
1355 1360 1365
Ile Ser Met Glu Pro Gln Glu Val Glu His Leu Ile Thr Thr Asp
1370 1375 1380
Glu Lys Ser Val Leu Val Asn Ser Thr Tyr Asp Asp Asp Lys Glu
1385 1390 1395
Ile Thr Ile Ser Val Ile Ser Thr Pro His Pro Glu Tyr Arg Pro
1400 1405 1410
Ile Ala Leu Val Ile Gln Asp Met Glu Gly Glu Val Gln Arg Lys
1415 1420 1425
Glu Leu Tyr Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1430 1435 1440
<210> 482
<211> 1422
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: cytosine base editor
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-
<400> 482
Met Gly Ser Ser His His His His His His Gly Met Ser Ser Glu Thr
1 5 10 15
Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His
20 25 30
Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys
35 40 45
Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His
50 55 60
Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys
65 70 75 80
Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr
85 90 95
Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr
100 105 110
Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala
115 120 125
Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp
130 135 140
Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser
145 150 155 160
Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala
165 170 175
His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu
180 185 190
Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg
195 200 205
Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys
210 215 220
His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys
225 230 235 240
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
245 250 255
Gly Met Asn Tyr Val Leu Gly Leu Ala Val Gly Ile Ala Ser Val Gly
260 265 270
Trp Ala Val Leu Glu Leu Asn Glu Glu Asp Asn Pro Ile Arg Ile Glu
275 280 285
Gly Leu Gly Ala Arg Ile Phe Asp Lys Ala Glu Val Pro Lys Thr Gly
290 295 300
Ala Ser Leu Ala Ala Pro Arg Arg Met Ser Arg Gly Ile Arg Arg Val
305 310 315 320
Ile Arg Arg Arg Arg Phe Arg Leu Gln Arg Val Arg Ser Tyr Leu Lys
325 330 335
Lys His Asn Ile Leu Pro Ala Glu Lys Val Asp His Leu Tyr Asp Val
340 345 350
Pro Ser Ala Ile Asp Ile Tyr Glu Leu Arg Lys Arg Ala Leu Thr Glu
355 360 365
Lys Val Thr Ala Glu Glu Trp Ala Arg Leu Leu Ile Phe Phe Ala Lys
370 375 380
His Arg Gly Phe Lys Ser Asn Arg Lys Lys Ala Ser Gly Asp Ala Asp
385 390 395 400
Glu Gly Glu Met Leu Lys Ala Ile Ala Ala Asn Ala Glu Ile Leu Lys
405 410 415
Asn Tyr Arg Thr Val Gly Glu Met Leu Cys Asp Asn Glu Lys Phe Arg
420 425 430
Lys Arg Lys Arg Asn Arg Asp Gly Ala Tyr Asn Phe Thr Val Ser Arg
435 440 445
Ala Met Leu Met Glu Glu Ile His Thr Leu Phe Glu Ile Gln Arg Asn
450 455 460
Leu Gly Gln Lys Phe Ala Asp Glu Lys Leu Glu Glu Glu Tyr Val Ile
465 470 475 480
Leu Phe Ala Ala Gln Arg Lys Phe Asp Glu Gly Pro Gly Glu Asn Ser
485 490 495
Pro Tyr Ala Gly Asn Gln Ile Glu Lys Met Ile Gly Ser Cys Thr Leu
500 505 510
Glu Gly Lys Lys Glu Lys Arg Ala Pro Lys Ala Ser Tyr Ala Phe Met
515 520 525
Ala Phe Asn Leu Trp Gln Lys Ile Asn His Leu Lys Val Asn Arg Arg
530 535 540
Gly Ser Glu Arg Phe Leu Thr Glu Glu Glu Arg Arg Arg Ile Ala Asp
545 550 555 560
Leu Ala Trp Lys Lys Glu Lys Leu Thr Tyr Gly Ser Leu Arg Lys Val
565 570 575
Leu Ser Leu Asp Pro Glu Asp Arg Phe Val Gly Leu Arg Tyr Asp Leu
580 585 590
Lys Lys Gly Lys Ala Glu Asn Leu Glu Glu Pro Val Ser Glu Ala Glu
595 600 605
Lys Arg Ser Phe Ser Trp Val Lys Asp Tyr His Ser Ile Arg Lys Ala
610 615 620
Leu Asp Lys Val Glu Lys Asn Arg Ile Leu Lys Leu Ser His Glu Gln
625 630 635 640
Leu Asp Thr Ile Ala Thr Ala Phe Ser Val Tyr Lys Asn Glu Glu Thr
645 650 655
Ile Glu Lys Tyr Leu Glu Glu Gly Gly Ile Gly Lys Ala Asp Gly Glu
660 665 670
Ala Leu Leu Glu Arg Leu Ser Gly Phe Ser Lys Phe Gly His Leu Ser
675 680 685
Leu Lys Ala Cys Tyr Lys Leu Leu Pro Phe Leu Glu Lys Gly Glu Val
690 695 700
Tyr Ser Arg Ala Cys Glu Leu Ala Gly Tyr Asp Phe Ser Lys Ser Ser
705 710 715 720
Leu Glu Asn Ile Asp Asp Ile Pro Asn Pro Val Val Lys Arg Ser Ile
725 730 735
Ser Gln Thr Leu Lys Val Ile Asn Ala Ile Ile Leu Arg Tyr Gly Asn
740 745 750
Pro Val Glu Val His Ile Glu Leu Ala Arg Glu Leu Ala Arg Ser Phe
755 760 765
Arg Asp Arg Lys Lys Met Glu Lys Gly Met Gln Glu Asn Gln Ala Lys
770 775 780
Asn Glu Lys Ile Arg Gln Arg Leu Ile Ser Glu Phe Gly Val Leu Arg
785 790 795 800
Pro Lys Gly Met Asp Ile Val Lys Phe Lys Leu Cys Glu Glu Gln Asn
805 810 815
Gly Glu Cys Ala Tyr Ser Gln Lys His Phe Asp Met Glu Lys Leu Leu
820 825 830
Lys Asp Pro Ser Tyr Ala Glu Val Asp His Ile Ile Pro Tyr Ser Arg
835 840 845
Ser Phe Asp Asp Ser Tyr Asn Asn Lys Val Leu Val Leu Thr Lys Glu
850 855 860
Asn Arg Glu Lys Arg Asn Arg Ile Pro Met Glu Tyr Leu Ala Asp Ala
865 870 875 880
Pro Glu Arg Lys Asn Arg Phe Ile His Trp Val Lys Ser Thr Ile Arg
885 890 895
Asn Ser Arg Lys Arg Glu Asn Leu Leu Arg Thr Asp Tyr Thr Ala Thr
900 905 910
Thr Glu Asn Glu Trp Lys Arg Arg Asn Leu Gln Asp Thr Gln Tyr Ile
915 920 925
Ser Lys Tyr Leu Tyr Asn Tyr Leu Arg His His Leu Val Leu Ala Lys
930 935 940
Gly Tyr Thr Glu Arg Lys Arg Arg Ile Ile Pro Val Asn Gly Ala Val
945 950 955 960
Thr Ala Tyr Phe Arg Lys Arg Leu Gly Ile Asn Lys Ile Arg Glu Asn
965 970 975
Gly Asp Leu His His Ala Val Asp Ala Val Ile Ile Ala Cys Ala Thr
980 985 990
Gln Gly Ile Val Asn Lys Val Ser Arg Tyr Ser Lys Ser Arg Glu Leu
995 1000 1005
Trp Asp Tyr Glu Val Asp Met Glu Thr Gly Glu Val Leu Gln Lys
1010 1015 1020
Lys Asn Lys Asn Thr Lys Asp Val Phe Pro Glu Pro Trp Leu Asn
1025 1030 1035
Phe Arg Tyr Glu Leu Glu Gln Lys Val Arg Val Arg Pro Leu Asp
1040 1045 1050
Ile Pro Glu Thr Ala Asp Ile Thr Glu Met Glu Glu Pro Phe Val
1055 1060 1065
Ser His Met Pro Asn Arg Lys Ile His Gly Pro Ala His Lys Glu
1070 1075 1080
Thr Ile Arg Ser Gly Arg Leu Lys Glu Glu Gly Tyr Thr Ile Ser
1085 1090 1095
Lys Thr Ala Leu Ile Asp Leu Lys Leu Thr Glu Asp Lys Glu Glu
1100 1105 1110
Ile Lys Gly Tyr Tyr Asn Lys Glu Ser Asp Arg Leu Leu Tyr Glu
1115 1120 1125
Ala Leu Lys Lys Gln Leu Gln Arg Tyr Gly Gly Lys Ala Lys Glu
1130 1135 1140
Ala Phe Lys Glu Pro Phe His Lys Pro Lys Ala Asp Gly Thr Pro
1145 1150 1155
Gly Pro Ile Val Asn Lys Val Lys Ile Met Glu Lys Ser Thr Met
1160 1165 1170
Leu Ile Pro Val Asn Gly Gly Lys Gly Leu Ala Ser Asn Gly Asn
1175 1180 1185
Met Val Arg Ile Asp Val Phe Arg Ala Glu Glu Lys Gly Lys Lys
1190 1195 1200
Lys Tyr Tyr Phe Ile Pro Val Tyr Val Ala Asp Thr Val Lys Glu
1205 1210 1215
Glu Leu Pro Asn Arg Ala Val Leu Ala His Lys Pro Tyr Glu Ala
1220 1225 1230
Trp Lys Ile Met Lys Glu Glu Asn Phe Ile Phe Ser Leu Tyr Pro
1235 1240 1245
Asn Asp Leu Ile Phe Val Asp Ala Gly Lys Glu Ile Pro Phe Lys
1250 1255 1260
Ala Ala Leu Lys Gly Ser Thr Leu Asp Pro Glu Lys Lys Ala Ser
1265 1270 1275
Arg Phe Leu Met Tyr Tyr Lys Gly Ala Asp Ile Ala Thr Gly Ser
1280 1285 1290
Ile Ser Gly Val Asn His Asp Glu Thr Tyr Lys Ala Arg Gly Val
1295 1300 1305
Gly Ile Gln Ser Leu Arg Glu Ile Lys Lys Cys Cys Ile Asp Val
1310 1315 1320
Leu Gly Asn Ile Ser Phe Ala Ser Lys Glu Lys Arg Gln Thr Phe
1325 1330 1335
Arg Ser Gly Gly Ser Ser Ile Val Arg Val Thr Tyr Asn Val Glu
1340 1345 1350
Gln Glu Val Glu Ile Ser Asn Lys Phe Asn Lys Asp Val Asp Ile
1355 1360 1365
Met Lys Pro Glu Glu Tyr Asp Asp Tyr Ile Asp Asp Leu Met Phe
1370 1375 1380
Ala Leu Asn Glu Lys Leu Pro Glu Tyr Ala Glu Ile Ser Cys Val
1385 1390 1395
Ile Asn Asp Asn Thr Gly Glu Val Leu Phe Glu Gly Gly Ser Gly
1400 1405 1410
Gly Ser Pro Lys Lys Lys Arg Lys Val
1415 1420
<210> 483
<211> 10943
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: Plasmid
<220>
<223> Description: pET21-CAT (H193Y)-sgRNA-TadA-nSpCas9 (D10A)
<400> 483
gaaataattt tgtttaactt taagaaggag atataccatg ggcagcagtc atcatcatca 60
ccatcacatg tctgaagtcg aatttagcca cgaatactgg atgcgtcacg cgctgacgct 120
ggcgaaacgt gcctgggatg agcgggaagt gccggtcggc gcggtattag tgcataacaa 180
tcgggtaatc ggcgaaggct ggaaccgccc gattggtcgc catgatccca ccgcacatgc 240
agaaatcatg gccctgcggc agggtggtct ggtgatgcaa aattatcgtc tgatcgacgc 300
cacgttgtat gtcacgcttg aaccatgtgt aatgtgtgcc ggagcgatga tccacagtcg 360
cattggtcgc gtggtctttg gtgcgcgtga cgcgaaaact ggcgctgcgg gatctttaat 420
ggatgtgctg catcatccgg gtatgaatca ccgagtggaa attacggaag gaatactggc 480
ggatgagtgc gcggcgttgc tcagtgactt ctttcgcatg cgccgccagg aaattaaagc 540
gcagaaaaaa gcgcaatcct cgacggattc aggcgggtcg tcgggaggaa gcagtggcag 600
cgagactccc ggaacttcgg agagcgctac accagaaagt agtggaggca gctctggtgg 660
gtccatggat aagaaatact caataggact ggcgattggc acaaatagcg tcggatgggc 720
tgtgatcact gatgaatata aggttccttc taaaaagttc aaggttctgg gaaatacaga 780
ccgccacagt atcaaaaaaa atcttatagg ggctcttctg tttgacagtg gagagacagc 840
cgaagctact agactcaaac ggacagctag gagaaggtat acaagacgga agaataggat 900
ttgttatctc caggagattt tttcaaatga gatggccaaa gtggatgata gtttctttca 960
tagacttgaa gagtcttttt tggtggaaga agacaagaag catgaaagac atcctatttt 1020
tggaaatata gtggatgaag ttgcttatca cgagaaatat ccaactatct atcatctgag 1080
aaaaaaattg gtggattcta ctgataaagc cgatttgcgc ctgatctatt tggccctggc 1140
ccacatgatt aagtttagag gtcatttttt gattgagggc gatctgaatc ctgataatag 1200
tgatgtggac aaactgttta tccagttggt gcaaacctac aatcaactgt ttgaagaaaa 1260
ccctattaac gcaagtggag tggatgctaa agccattctt tctgcaagat tgagtaaatc 1320
aagaagactg gaaaatctca ttgctcagct ccccggtgag aagaaaaatg gcctgtttgg 1380
gaatctcatt gctttgtcat tgggtttgac ccctaatttt aaatcaaatt ttgatttggc 1440
agaagatgct aaactccagc tttcaaaaga tacttacgat gatgatctgg ataatctgtt 1500
ggctcaaatt ggagatcaat atgctgattt gtttttggca gctaagaatc tgtcagatgc 1560
tattctgctt tcagacatcc tgagagtgaa tactgaaata actaaggctc ccctgtcagc 1620
ttcaatgatt aaacgctacg atgaacatca tcaagacttg actcttctga aagccctggt 1680
tagacaacaa cttccagaaa agtataaaga aatctttttt gatcaatcaa aaaacggata 1740
tgcaggttat attgatggcg gcgcaagcca agaagaattt tataaattta tcaaaccaat 1800
tctggaaaaa atggatggta ctgaggaact gttggtgaaa ctgaatagag aagatttgct 1860
gcgcaagcaa cggacctttg acaacggctc tattccccat caaattcact tgggtgagct 1920
gcatgctatt ttgagaagac aagaagactt ttatccattt ctgaaagaca atagagagaa 1980
gattgaaaaa atcttgactt ttaggattcc ttattatgtt ggtccattgg ccagaggcaa 2040
tagtaggttt gcatggatga ctcggaagtc tgaagaaaca attaccccat ggaattttga 2100
agaagttgtc gataaaggtg cttcagctca atcatttatt gaacgcatga caaactttga 2160
taaaaatctt ccaaatgaaa aagtgctgcc aaaacatagt ttgctttatg agtattttac 2220
cgtttataac gaattgacaa aggtcaaata tgttactgaa ggaatgagaa aaccagcatt 2280
tctttcaggt gaacagaaga aagccattgt tgatctgctc ttcaaaacaa ataggaaagt 2340
gaccgttaag caactgaaag aagattattt caaaaaaata gaatgttttg atagtgttga 2400
aatttcagga gttgaagata gatttaatgc ttcactgggt acataccatg atttgctgaa 2460
aattattaaa gataaagatt ttttggataa tgaagaaaat gaagacatcc tggaggatat 2520
tgttctgaca ttgaccctgt ttgaagatag ggagatgatt gaggaaagac ttaaaacata 2580
cgctcacctc tttgatgata aggtgatgaa acagcttaaa agacgcagat atactggttg 2640
gggaaggttg tccagaaaat tgattaatgg tattagggat aagcaatctg gcaaaacaat 2700
actggatttt ttgaaatcag atggttttgc caatcgcaat tttatgcagc tcatccatga 2760
tgatagtttg acatttaaag aagacatcca aaaagcacaa gtgtctggac aaggcgatag 2820
tctgcatgaa catattgcaa atctggctgg tagccctgct attaaaaaag gtattctcca 2880
gactgtgaaa gttgttgatg aattggtcaa agtgatgggg cggcataagc cagaaaatat 2940
cgttattgaa atggcaagag aaaatcagac aactcaaaag ggccagaaaa attccagaga 3000
gaggatgaaa agaatcgaag aaggtatcaa agaactggga agtcagattc ttaaagagca 3060
tcctgttgaa aatactcaat tgcaaaatga aaagctctat ctctattatc tccaaaatgg 3120
aagagatatg tatgtggacc aagaactgga tattaatagg ctgagtgatt atgatgtcga 3180
tcacattgtt ccacaaagtt tccttaaaga cgattcaata gacaataagg tcctgaccag 3240
gtctgataaa aatagaggta aatccgataa cgttccaagt gaagaagtgg tcaaaaagat 3300
gaaaaactat tggagacaac ttctgaacgc caagctgatc actcaaagga agtttgataa 3360
tctgaccaaa gctgaaagag gaggtttgag tgaacttgat aaagctggtt ttatcaaacg 3420
ccaattggtt gaaactcgcc aaatcactaa gcatgtggca caaattttgg atagtcgcat 3480
gaatactaaa tacgatgaaa atgataaact tattagagag gttaaagtga ttaccctgaa 3540
atctaaactg gtttctgact tcagaaaaga tttccaattc tataaagtga gagagattaa 3600
caattaccat catgcccatg atgcctatct gaatgccgtc gttggaactg ctttgattaa 3660
gaaatatcca aaacttgaaa gcgagtttgt ctatggtgat tataaagttt atgatgttag 3720
gaaaatgatt gctaagtctg agcaagaaat aggcaaagca accgcaaagt atttctttta 3780
ctctaatatc atgaacttct tcaaaacaga aattacactt gcaaatggag agattcgcaa 3840
acgccctctg atcgaaacta atggggaaac tggagaaatt gtctgggata aagggagaga 3900
ttttgccaca gtgcgcaaag tgttgtccat gccccaagtc aatatcgtca agaaaacaga 3960
agtgcagaca ggcggattct ctaaggagtc aattctgcca aaaagaaatt ccgacaagct 4020
gattgctagg aaaaaagact gggacccaaa aaaatatggt ggttttgata gtccaaccgt 4080
ggcttattca gtcctggtgg ttgctaaggt ggaaaaaggg aaatccaaga agctgaaatc 4140
cgttaaagag ctgctgggga tcacaattat ggaaagaagt tcctttgaaa aaaatcccat 4200
tgactttctg gaagctaaag gatataagga agttaaaaaa gacctgatca ttaaactgcc 4260
taaatatagt ctttttgagc tggaaaacgg taggaaacgg atgctggcta gtgccggaga 4320
actgcaaaaa ggaaatgagc tggctctgcc aagcaaatat gtgaattttc tgtatctggc 4380
tagtcattat gaaaagttga agggtagtcc agaagataac gaacaaaaac aattgtttgt 4440
ggagcagcat aagcattatc tggatgagat tattgagcaa atcagtgaat tttctaagag 4500
agttattctg gcagatgcca atctggataa agttcttagt gcatataaca aacatagaga 4560
caaaccaata agagaacaag cagaaaatat cattcatctg tttaccttga ccaatcttgg 4620
agcacccgct gcttttaaat actttgatac aacaattgat aggaaaagat atacctctac 4680
aaaagaagtt ctggatgcca ctcttatcca tcaatccatc actggtcttt atgaaacacg 4740
cattgatttg agtcagctgg gaggtgacgg ctctggcggg tctcccaaga agaagaggaa 4800
agtctaagat ccggctgcta acaaagcccg aaaggaagct gagttggctg ctgccaccgc 4860
tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg gttttttgct 4920
gaaaggagga actatatccg gattggcgaa tgggacgcgc cctgtagcgg cgcattaagc 4980
gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 5040
gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 5100
ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 5160
aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 5220
cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 5280
ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 5340
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 5400
cttacaattt aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 5460
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 5520
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 5580
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 5640
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 5700
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 5760
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 5820
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 5880
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 5940
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 6000
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 6060
acgagcgtga caccacgatg cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg 6120
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 6180
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 6240
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 6300
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 6360
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 6420
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 6480
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 6540
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 6600
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 6660
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 6720
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 6780
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 6840
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 6900
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6960
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 7020
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 7080
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 7140
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 7200
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 7260
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 7320
cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg 7380
gtatttcaca ccgcaatggt gcactctcag tacaatctgc tctgatgccg catagttaag 7440
ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 7500
acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 7560
gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 7620
aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat gtctgcctgt 7680
tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct tctgataaag 7740
cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt gtaaggggga 7800
tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac gatacgggtt 7860
actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact ggcggtatgg 7920
atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt taatacagat 7980
gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa cataatggtg 8040
cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa gaccattcat 8100
gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg ctcgcgtatc 8160
ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt cctcaacgac 8220
aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc ctgcttctcg 8280
ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg 8340
aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa 8400
atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata 8460
agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct 8520
ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg 8580
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 8640
ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac 8700
cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa 8760
gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg 8820
gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac 8880
gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac 8940
cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga 9000
catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata 9060
tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag 9120
cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc 9180
atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg 9240
aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat 9300
gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac 9360
gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt 9420
aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat 9480
cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc 9540
cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac 9600
cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac 9660
tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg 9720
aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct 9780
gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg 9840
gtttaattaa tttgatcggc acgtaagagg ttccaacttt caccataatg aaataagatc 9900
actaccgggc gtattttttg agttatcgag attttcagga gctaaggaag ctaaaatgga 9960
gaaaaaaatc actggatata ccaccgttga tatatcccaa tggcatcgta aagaacattt 10020
tgaggcattt cagtcagttg ctcaatgtac ctataaccag accgttcagc tggatattac 10080
ggccttttta aagaccgtaa agaaaaataa gcacaagttt tatccggcct ttattcacat 10140
tcttgcccgc ctgatgaatg ctcatccgga attccgtatg gcaatgaaag acggtgagct 10200
ggtgatatgg gatagtgttc acccttgtta caccgttttc catgagcaaa ctgaaacgtt 10260
ttcatcgctc tggagtgaat accacgacga tttccggcag tttctacaca tatattcgca 10320
agatgtggcg tgttacggtg aaaacctggc ctatttccct aaagggttta ttgagaatat 10380
gttttttgtc tcagccaatc cctgggtgag tttcaccagt tttgatttaa acgtggccaa 10440
tatggacaac ttcttcgccc ccgttttcac catgggcaaa tattatacgc aaggcgacaa 10500
ggtgctgatg ccgctggcga ttcaggttca ttatgccgtc tgtgatggct tccatgtcgg 10560
cagaatgctt aatgaattac aacagtactg cgatgagtgg cagggcgggg cgtaattttt 10620
ttaaggcagt tattggtgcc cttaaacgcc tggtgctacg cctgaataag tgaagcatgc 10680
aaggagatgg cgcccaacag tcccccggcc acggggcctg ccaccatacc cacgccgaaa 10740
caagcgctca tgagcccgaa gtggcgagcc cgatcttccc catcggtgat gtcggcgata 10800
taggcgccag caaccgcacc tgtggcgccg gtgatgccgg ccacgatgcg tccggcgtag 10860
aggatcgaga tctcgatccc gcgaaattaa tacgactcac tataggggaa ttgtgagcgg 10920
ataacaattc ccctctagga tcc 10943
<210> 484
<211> 8520
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: Plasmid
<220>
<223> Description: pET21-sgRNA-TadA (ABE8.17m)-nMG34-1 (D10A)
<400> 484
gaaataattt tgtttaactt taagaaggag atataccatg ggcagcagtc atcatcatca 60
ccatcactcc gaggttgaat ttagtcatga atattggatg cgccacgcgc tgacgttagc 120
caaacgtgct cgtgatgagc gcgaagttcc agtcggggcc gtcttggtcc ttaacaatcg 180
tgtcattggc gaggggtgga accgcgctat tgggctgcac gatccaacag cgcatgctga 240
gattatggcc ttgcgtcaag gagggttagt aatgcaaaac taccgtctta ttgatgctac 300
gttatactct acattcgaac cctgtgtaat gtgtgcagga gcgatgatcc acagtcgtat 360
tggccgcgta gtatttggtg tacgcaatgc taaaactgga gccgccggat cgttgatgga 420
tgtcttgcat taccctggaa tgaaccatcg tgtagagatc actgaaggca tccttgccga 480
tgagtgtgcg gctttgcttt gctatttctt ccgtatgcca cgtcgtgttt ttaacgccca 540
aaaaaaggct caatccagta ccgattcagg cgggtcgtcg ggaggaagca gtggcagcga 600
gactcccgga acttcggaga gcgctacacc agaaagtagt ggaggcagct ctggtgggtc 660
catggagcgc gagctggtgc tggggatcgc gtatggtggt aagtacacgg gcttggcggt 720
ggtggatcgc cgccacaacc aagtgctgta cgcgaatcgt cttaaaatgc gtgatgacgt 780
ggcaggcatc ttgaaggacc gtcgcaaaca gcgcgggatt cgtcgcacgg cccagacgaa 840
gaagaaacgc cttcgcgagc tgaagaatta cctgaagagc atcgggtaca atgagtcgac 900
ggccaccttc gagaccgtgt attcactggc gcacaagcgt ggttacgact acgcagacat 960
gccagaggag aaaaccagtg aggagattga agcgatggac gttgaggaac gtaagcaatg 1020
ggagaaggaa aagcaagagt gggaagaaac taagcgcaac tctcgccatc gcaaagaggt 1080
agttaaggac gtacacaagg cgatgatcga gggccgtgcc acggaagaac aaattaagcg 1140
tgtggagcgc atcttcaaca agcaatatcg cccgaagcgt tttaacaacc gcatcttgac 1200
caagtgcaaa gtggaagact gtggtgtgaa cactcctttg cgtaagaacg tacgcgacct 1260
gctgattgag aacattgttc gtttctttcc gattgagcag agcgagaaag acaacctgaa 1320
ggacgccgta ttagacaaga atcgtcgcga agaggtgaag tccttctttc gcaagcacaa 1380
aaccgacgag cacatccgta aacaagtgta cgacattgcc gacaataaac tgagcgggcg 1440
tactgtattc tgcaaggagc acattctgga gcacacggaa cactccaagg aagagcgtaa 1500
agtctttcgc ctggcaccga gtctgaagac gaagattgaa aacgtgctgg cagtaatcaa 1560
ggatgaaatt ctccctaagt tcacggtgaa caaagtagtg atggaatcaa ataacttcga 1620
catcgccgcg aagacccaag gtaagaagcg tctcgccaag gaagagtacg gcaagggccc 1680
gcgtgagggt aaggaaacgc gcaaagaggc gctgctgcgc gagaccgacg ggcgctgcat 1740
ttattgcggc aagagcatcg atatttcgaa cgcacacgac gatcacatct tccctcgtaa 1800
agcgggcgga ttgaacattt tcgcgaacct cgtggcctgc tgtgcggtgt gcaacgaaaa 1860
caagaagggc cgcacgcctc tggagtcggg catttcacca aagccagaga ttattgcatt 1920
tatgaagaac gacctgaaga agaaaatctt ggaagatgct cgcaacatta acaccgtcga 1980
cttcaacaag tatatgagcc acgcttcgat tgggtggcgt tacatgcgcg atcgccttcg 2040
cgaatcggca ggtaacaaga aactgccgat cgaacgccaa agtggtattt atacggccta 2100
ctttcgtcgc tggtggggtt tcaagaaaga gcgcggtaat actttgcacc acgctctgga 2160
cgcggtgatt ttggcctcgc gtaagggcta ctcagacgac ggcttagtag acatgacttt 2220
aaaacccaag tacaataagg gcggcgaatt cgatccggag aagcacttac cggagcctat 2280
cgagttcaag atggacaagg ggtcacgcgg tagcgccctg cacgaccgta atccgttgag 2340
ttacaagaag ggtatcatca ctcgtcgctt catggtcact gaaatcgaat gtggcaagga 2400
agatgacgtg atctctgaaa cctaccgcga gaagttgaag gaagcgttca agcgcttcga 2460
caccaagaag ggcaagtgcc tgaccgataa agaagccaaa gaggcggggt tctgtatcaa 2520
gaagaacgag ctggtgatgt cgctgaagtg ttcaatcaag gggactggcc cgggccaaat 2580
gattcgcatt aacaacaacg tgttcaaaac caacgtacac aacgtaggag ttgacgtcta 2640
cctggacgag aagggcaaga agaaggcgta cgaacgcaag aacccacgct tatcgaagca 2700
ttttattgag ccgccgccac aaccgaacgg ccgcgtctct ttcacactga agcgtcgcga 2760
catggtgact gtagagggag aggatgccat ttaccgcatt aagaagttgg gtacttcccc 2820
gaccatcgag gcggtggtgg ggagcgacgg taagacgcgc acagtatcgg caacgaaatt 2880
gaccaaggcc aatagcgccg agctcgaggg ctctggcggg tctcccaaga agaagaggaa 2940
agtctaagat ccggctgcta acaaagcccg aaaggaagct gagttggctg ctgccaccgc 3000
tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg gttttttgct 3060
gaaaggagga actatatccg gattggcgaa tgggacgcgc cctgtagcgg cgcattaagc 3120
gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 3180
gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 3240
ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 3300
aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 3360
cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 3420
ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 3480
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 3540
cttacaattt aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 3600
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 3660
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 3720
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 3780
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 3840
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 3900
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 3960
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 4020
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 4080
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 4140
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 4200
acgagcgtga caccacgatg cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg 4260
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 4320
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 4380
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 4440
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 4500
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 4560
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 4620
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 4680
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 4740
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 4800
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 4860
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 4920
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 4980
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5040
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 5100
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 5160
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 5220
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 5280
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 5340
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 5400
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 5460
cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg 5520
gtatttcaca ccgcaatggt gcactctcag tacaatctgc tctgatgccg catagttaag 5580
ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 5640
acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 5700
gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 5760
aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat gtctgcctgt 5820
tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct tctgataaag 5880
cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt gtaaggggga 5940
tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac gatacgggtt 6000
actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact ggcggtatgg 6060
atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt taatacagat 6120
gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa cataatggtg 6180
cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa gaccattcat 6240
gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg ctcgcgtatc 6300
ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt cctcaacgac 6360
aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc ctgcttctcg 6420
ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg 6480
aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa 6540
atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata 6600
agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct 6660
ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg 6720
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6780
ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac 6840
cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa 6900
gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg 6960
gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac 7020
gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac 7080
cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga 7140
catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata 7200
tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag 7260
cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc 7320
atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg 7380
aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat 7440
gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac 7500
gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt 7560
aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat 7620
cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc 7680
cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac 7740
cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac 7800
tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg 7860
aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct 7920
gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg 7980
gtttaattaa ttacggccag tcatgcataa tccgcacgca tctggaataa ggaagtgcca 8040
ttccgcctga ccttaatacg actcactata gtctttatgg cagggtgaaa cgcgttacag 8100
ttaagaaatt aattgtaaaa cgcctataca gtgaagggat atacgcttgg gtttgtccag 8160
cctgagcctc tatgccagaa atggcgcctt catcgtgggt taggacattt aattttaaaa 8220
aaaaaccccg cttcggcggg gttttttttt agcatgcaag gagatggcgc ccaacagtcc 8280
cccggccacg gggcctgcca ccatacccac gccgaaacaa gcgctcatga gcccgaagtg 8340
gcgagcccga tcttccccat cggtgatgtc ggcgatatag gcgccagcaa ccgcacctgt 8400
ggcgccggtg atgccggcca cgatgcgtcc ggcgtagagg atcgagatct cgatcccgcg 8460
aaattaatac gactcactat aggggaattg tgagcggata acaattcccc tctaggatcc 8520
<210> 485
<211> 8925
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: Plasmid
<220>
<223> Description: pET21-sgRNA-rAPOBEC1-nMG34-1 (D10A)-UGI (PBS1)
<400> 485
atgggcagca gtcatcatca tcaccatcac atgtcgtctg agaccgggcc tgttgccgtg 60
gaccctaccc ttcgccgccg tatcgaacca cacgagtttg aagtgttttt tgacccacgc 120
gaactgcgca aagagacttg tttgctttac gagattaact ggggaggccg tcactccatc 180
tggcgtcaca cttcacaaaa tactaataag cacgttgagg ttaatttcat tgagaaattt 240
actacagagc gctacttctg tccgaataca cgttgcagca tcacctggtt tctttcctgg 300
tccccgtgcg gtgaatgttc acgtgccatc accgaattct tatcgcgcta ccctcacgta 360
actttgttta tctatattgc ccgtttatat caccatgcag accctcgcaa tcgtcagggc 420
ctgcgcgacc ttatctcgag tggagtcacc atccaaatta tgactgaaca ggaatcgggg 480
tattgttggc gcaactttgt caattattct ccgagcaacg aggcacattg gccgcgttac 540
ccacacttat gggtgcgcct ttacgtgctg gaattgtatt gcatcattct tggtcttccc 600
ccatgtttga atatccttcg ccgcaaacag cctcagttga cgttttttac gattgctctt 660
cagtcctgtc actaccaacg tcttcccccg cacatcctgt gggcgaccgg tttgaaatcg 720
gggagtgaaa cacccggcac atccgaaagt gcgacacctg aatctgccat ggagcgcgag 780
ctggtgctgg ggatcgcgta tggtggtaag tacacgggct tggcggtggt ggatcgccgc 840
cacaaccaag tgctgtacgc gaatcgtctt aaaatgcgtg atgacgtggc aggcatcttg 900
aaggaccgtc gcaaacagcg cgggattcgt cgcacggccc agacgaagaa gaaacgcctt 960
cgcgagctga agaattacct gaagagcatc gggtacaatg agtcgacggc caccttcgag 1020
accgtgtatt cactggcgca caagcgtggt tacgactacg cagacatgcc agaggagaaa 1080
accagtgagg agattgaagc gatggacgtt gaggaacgta agcaatggga gaaggaaaag 1140
caagagtggg aagaaactaa gcgcaactct cgccatcgca aagaggtagt taaggacgta 1200
cacaaggcga tgatcgaggg ccgtgccacg gaagaacaaa ttaagcgtgt ggagcgcatc 1260
ttcaacaagc aatatcgccc gaagcgtttt aacaaccgca tcttgaccaa gtgcaaagtg 1320
gaagactgtg gtgtgaacac tcctttgcgt aagaacgtac gcgacctgct gattgagaac 1380
attgttcgtt tctttccgat tgagcagagc gagaaagaca acctgaagga cgccgtatta 1440
gacaagaatc gtcgcgaaga ggtgaagtcc ttctttcgca agcacaaaac cgacgagcac 1500
atccgtaaac aagtgtacga cattgccgac aataaactga gcgggcgtac tgtattctgc 1560
aaggagcaca ttctggagca cacggaacac tccaaggaag agcgtaaagt ctttcgcctg 1620
gcaccgagtc tgaagacgaa gattgaaaac gtgctggcag taatcaagga tgaaattctc 1680
cctaagttca cggtgaacaa agtagtgatg gaatcaaata acttcgacat cgccgcgaag 1740
acccaaggta agaagcgtct cgccaaggaa gagtacggca agggcccgcg tgagggtaag 1800
gaaacgcgca aagaggcgct gctgcgcgag accgacgggc gctgcattta ttgcggcaag 1860
agcatcgata tttcgaacgc acacgacgat cacatcttcc ctcgtaaagc gggcggattg 1920
aacattttcg cgaacctcgt ggcctgctgt gcggtgtgca acgaaaacaa gaagggccgc 1980
acgcctctgg agtcgggcat ttcaccaaag ccagagatta ttgcatttat gaagaacgac 2040
ctgaagaaga aaatcttgga agatgctcgc aacattaaca ccgtcgactt caacaagtat 2100
atgagccacg cttcgattgg gtggcgttac atgcgcgatc gccttcgcga atcggcaggt 2160
aacaagaaac tgccgatcga acgccaaagt ggtatttata cggcctactt tcgtcgctgg 2220
tggggtttca agaaagagcg cggtaatact ttgcaccacg ctctggacgc ggtgattttg 2280
gcctcgcgta agggctactc agacgacggc ttagtagaca tgactttaaa acccaagtac 2340
aataagggcg gcgaattcga tccggagaag cacttaccgg agcctatcga gttcaagatg 2400
gacaaggggt cacgcggtag cgccctgcac gaccgtaatc cgttgagtta caagaagggt 2460
atcatcactc gtcgcttcat ggtcactgaa atcgaatgtg gcaaggaaga tgacgtgatc 2520
tctgaaacct accgcgagaa gttgaaggaa gcgttcaagc gcttcgacac caagaagggc 2580
aagtgcctga ccgataaaga agccaaagag gcggggttct gtatcaagaa gaacgagctg 2640
gtgatgtcgc tgaagtgttc aatcaagggg actggcccgg gccaaatgat tcgcattaac 2700
aacaacgtgt tcaaaaccaa cgtacacaac gtaggagttg acgtctacct ggacgagaag 2760
ggcaagaaga aggcgtacga acgcaagaac ccacgcttat cgaagcattt tattgagccg 2820
ccgccacaac cgaacggccg cgtctctttc acactgaagc gtcgcgacat ggtgactgta 2880
gagggagagg atgccattta ccgcattaag aagttgggta cttccccgac catcgaggcg 2940
gtggtgggga gcgacggtaa gacgcgcaca gtatcggcaa cgaaattgac caaggccaat 3000
agcgccgagc tcgaggggtc tggtggttct accaatcttt cagatattat tgaaaaagag 3060
acaggaaagc agttggtcat tcaagagagt atcctgatgt taccggagga agttgaggag 3120
gtaatcggaa ataaacccga gagcgacatt ttagtccaca ctgcttatga cgagagtacg 3180
gatgagaatg tgatgctgct tacgtcagat gcgcccgagt ataagccgtg ggccctggtc 3240
attcaggaca gtaacggcga aaacaagatc aaaatgcttt ctggtggttc tcccaagaag 3300
aagaggaaag tctaagatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 3360
gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt 3420
tttttgctga aaggaggaac tatatccgga ttggcgaatg ggacgcgccc tgtagcggcg 3480
cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc 3540
tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc 3600
gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg 3660
accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg 3720
tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg 3780
gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt 3840
cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa 3900
tattaacgct tacaatttag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 3960
tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 4020
gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 4080
tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 4140
aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 4200
cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 4260
agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 4320
ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 4380
tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 4440
tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 4500
caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 4560
accaaacgac gagcgtgaca ccacgatgcc tgcagcaatg gcaacaacgt tgcgcaaact 4620
attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 4680
ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 4740
taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 4800
taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 4860
aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 4920
agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 4980
ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 5040
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 5100
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 5160
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 5220
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 5280
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 5340
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 5400
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 5460
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 5520
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 5580
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 5640
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 5700
ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 5760
taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 5820
cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca 5880
tctgtgcggt atttcacacc gcaatggtgc actctcagta caatctgctc tgatgccgca 5940
tagttaagcc agtatacact ccgctatcgc tacgtgactg ggtcatggct gcgccccgac 6000
acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca 6060
gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga 6120
aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc gtgaagcgat tcacagatgt 6180
ctgcctgttc atccgcgtcc agctcgttga gtttctccag aagcgttaat gtctggcttc 6240
tgataaagcg ggccatgtta agggcggttt tttcctgttt ggtcactgat gcctccgtgt 6300
aagggggatt tctgttcatg ggggtaatga taccgatgaa acgagagagg atgctcacga 6360
tacgggttac tgatgatgaa catgcccggt tactggaacg ttgtgagggt aaacaactgg 6420
cggtatggat gcggcgggac cagagaaaaa tcactcaggg tcaatgccag cgcttcgtta 6480
atacagatgt aggtgttcca cagggtagcc agcagcatcc tgcgatgcag atccggaaca 6540
taatggtgca gggcgctgac ttccgcgttt ccagacttta cgaaacacgg aaaccgaaga 6600
ccattcatgt tgttgctcag gtcgcagacg ttttgcagca gcagtcgctt cacgttcgct 6660
cgcgtatcgg tgattcattc tgctaaccag taaggcaacc ccgccagcct agccgggtcc 6720
tcaacgacag gagcacgatc atgcgcaccc gtggggccgc catgccggcg ataatggcct 6780
gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa ggcttgagcg agggcgtgca 6840
agattccgaa taccgcaagc gacaggccga tcatcgtcgc gctccagcga aagcggtcct 6900
cgccgaaaat gacccagagc gctgccggca cctgtcctac gagttgcatg ataaagaaga 6960
cagtcataag tgcggcgacg atagtcatgc cccgcgccca ccggaaggag ctgactgggt 7020
tgaaggctct caagggcatc ggtcgagatc ccggtgccta atgagtgagc taacttacat 7080
taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt 7140
aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgccag ggtggttttt 7200
cttttcacca gtgagacggg caacagctga ttgcccttca ccgcctggcc ctgagagagt 7260
tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa aatcctgttt gatggtggtt 7320
aacggcggga tataacatga gctgtcttcg gtatcgtcgt atcccactac cgagatatcc 7380
gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg cgcccagcgc catctgatcg 7440
ttggcaacca gcatcgcagt gggaacgatg ccctcattca gcatttgcat ggtttgttga 7500
aaaccggaca tggcactcca gtcgccttcc cgttccgcta tcggctgaat ttgattgcga 7560
gtgagatatt tatgccagcc agccagacgc agacgcgccg agacagaact taatgggccc 7620
gctaacagcg cgatttgctg gtgacccaat gcgaccagat gctccacgcc cagtcgcgta 7680
ccgtcttcat gggagaaaat aatactgttg atgggtgtct ggtcagagac atcaagaaat 7740
aacgccggaa cattagtgca ggcagcttcc acagcaatgg catcctggtc atccagcgga 7800
tagttaatga tcagcccact gacgcgttgc gcgagaagat tgtgcaccgc cgctttacag 7860
gcttcgacgc cgcttcgttc taccatcgac accaccacgc tggcacccag ttgatcggcg 7920
cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca gggccagact ggaggtggca 7980
acgccaatca gcaacgactg tttgcccgcc agttgttgtg ccacgcggtt gggaatgtaa 8040
ttcagctccg ccatcgccgc ttccactttt tcccgcgttt tcgcagaaac gtggctggcc 8100
tggttcacca cgcgggaaac ggtctgataa gagacaccgg catactctgc gacatcgtat 8160
aacgttactg gtttcacatt caccaccctg aattgactct cttccgggcg ctatcatgcc 8220
ataccgcgaa aggttttgcg ccattcgatg gtgtccggga tctcgacgct ctcccttatg 8280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 8340
aaggaatggt ttaattaatt acggccagtc atgcataatc cgcacgcatc tggaataagg 8400
aagtgccatt ccgcctgacc ttaatacgac tcactatagc gcgccggaga aaaccgcctc 8460
ggttacagtt aagaaattaa ttgtaaaacg cctatacagt gaagggatat acgcttgggt 8520
ttgtccagcc tgagcctcta tgccagaaat ggcgccttca tcgtgggtta ggacatttaa 8580
ttttaaaaaa aaaccccgct tcggcggggt ttttttttag catgcaagga gatggcgccc 8640
aacagtcccc cggccacggg gcctgccacc atacccacgc cgaaacaagc gctcatgagc 8700
ccgaagtggc gagcccgatc ttccccatcg gtgatgtcgg cgatataggc gccagcaacc 8760
gcacctgtgg cgccggtgat gccggccacg atgcgtccgg cgtagaggat cgagatctcg 8820
atcccgcgaa attaatacga ctcactatag gggaattgtg agcggataac aattcccctc 8880
taggatccga aataattttg tttaacttta agaaggagat atacc 8925
<210> 486
<211> 9519
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: Plasmid
<220>
<223> Description: pET21-CAT (H193Y)-sgRNA-MG68-4 (D109N)-nMG34-1
(D10A)
<400> 486
ttaattaatt tgatcggcac gtaagaggtt ccaactttca ccataatgaa ataagatcac 60
taccgggcgt attttttgag ttatcgagat tttcaggagc taaggaagct aaaatggaga 120
aaaaaatcac tggatatacc accgttgata tatcccaatg gcatcgtaaa gaacattttg 180
aggcatttca gtcagttgct caatgtacct ataaccagac cgttcagctg gatattacgg 240
cctttttaaa gaccgtaaag aaaaataagc acaagtttta tccggccttt attcacattc 300
ttgcccgcct gatgaatgct catccggaat tccgtatggc aatgaaagac ggtgagctgg 360
tgatatggga tagtgttcac ccttgttaca ccgttttcca tgagcaaact gaaacgtttt 420
catcgctctg gagtgaatac cacgacgatt tccggcagtt tctacacata tattcgcaag 480
atgtggcgtg ttacggtgaa aacctggcct atttccctaa agggtttatt gagaatatgt 540
tttttgtctc agccaatccc tgggtgagtt tcaccagttt tgatttaaac gtggccaata 600
tggacaactt cttcgccccc gttttcacca tgggcaaata ttatacgcaa ggcgacaagg 660
tgctgatgcc gctggcgatt caggttcatt atgccgtctg tgatggcttc catgtcggca 720
gaatgcttaa tgaattacaa cagtactgcg atgagtggca gggcggggcg taattttttt 780
aaggcagtta ttggtgccct taaacgcctg gtgctacgcc tgaataagtg aagcatgcaa 840
ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 900
agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 960
ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 1020
gatcgactcg agtgcggccg caagcttgtc gacggagctc gaattcggat cctaatacga 1080
ctcactatag taatgaacct gaatcgccag gttacagtta agaaattaat tgtaaaacgc 1140
ctatacagtg aagggatata cgcttgggtt tgtccagcct gagcctctat gccagaaatg 1200
gcgccttcat cgtgggttag gacatttaat tttaaaaaaa aaccccgctt cggcggggtt 1260
tttttttagc atgcaaggag atggcgccca acagtccccc ggccacgggg cctgccacca 1320
tacccacgcc gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg 1380
tgatgtcggc gatataggcg ccagcaaccg cacctgtggc gccggtgatg ccggccacga 1440
tgcgtccggc gtagaggatc gagatctcga tcccgcgaaa ttaatacgac tcactatagg 1500
ggaattgtga gcggataaca attcccctct aggatccgaa ataattttgt ttaactttaa 1560
gaaggagata taccccgcgg atgactgatt ctcaaaatga tacagatgaa tactggatgg 1620
gagaggccct gaagttggca caaaaggcat gggacgaagg agaggtgccc gtaggagcca 1680
tcttggttcg taagggcgaa gttatcggtc atggctggaa ccgtagcatc gggtcccatg 1740
acccctcggc gcatgctgaa attatggcta ttcgtgaagc cggggtgcgt atcggtaatt 1800
atcgcatgtt ggataccgta ttatacgtta cgctggagcc gtgtgcaatg tgcgcagggg 1860
cacttgttca cgggcgtatt tcacgcttgg tctttggtgc cgaaaacccc aagacagggg 1920
cgtgcgggtc agtcatggac attgctcgcc accctgcttt gaaccaccaa ttacaagttg 1980
atggtggggt aatggcggct ccttgtgcgc gtcttttatc tgacttcttt cgctggcgtc 2040
gcgctcagaa aaaggcggcc cgtgataata gttcggggaa cggtacctca ggcgggtcgt 2100
cgggaggaag cagtggcagc gagactcccg gaacttcgga gagcgctaca ccagaaagta 2160
gtggaggcag ctctggtggg tccatggagc gcgagctggt gctggggatc gcgtatggtg 2220
gtaagtacac gggcttggcg gtggtggatc gccgccacaa ccaagtgctg tacgcgaatc 2280
gtcttaaaat gcgtgatgac gtggcaggca tcttgaagga ccgtcgcaaa cagcgcggga 2340
ttcgtcgcac ggcccagacg aagaagaaac gccttcgcga gctgaagaat tacctgaaga 2400
gcatcgggta caatgagtcg acggccacct tcgagaccgt gtattcactg gcgcacaagc 2460
gtggttacga ctacgcagac atgccagagg agaaaaccag tgaggagatt gaagcgatgg 2520
acgttgagga acgtaagcaa tgggagaagg aaaagcaaga gtgggaagaa actaagcgca 2580
actctcgcca tcgcaaagag gtagttaagg acgtacacaa ggcgatgatc gagggccgtg 2640
ccacggaaga acaaattaag cgtgtggagc gcatcttcaa caagcaatat cgcccgaagc 2700
gttttaacaa ccgcatcttg accaagtgca aagtggaaga ctgtggtgtg aacactcctt 2760
tgcgtaagaa cgtacgcgac ctgctgattg agaacattgt tcgtttcttt ccgattgagc 2820
agagcgagaa agacaacctg aaggacgccg tattagacaa gaatcgtcgc gaagaggtga 2880
agtccttctt tcgcaagcac aaaaccgacg agcacatccg taaacaagtg tacgacattg 2940
ccgacaataa actgagcggg cgtactgtat tctgcaagga gcacattctg gagcacacgg 3000
aacactccaa ggaagagcgt aaagtctttc gcctggcacc gagtctgaag acgaagattg 3060
aaaacgtgct ggcagtaatc aaggatgaaa ttctccctaa gttcacggtg aacaaagtag 3120
tgatggaatc aaataacttc gacatcgccg cgaagaccca aggtaagaag cgtctcgcca 3180
aggaagagta cggcaagggc ccgcgtgagg gtaaggaaac gcgcaaagag gcgctgctgc 3240
gcgagaccga cgggcgctgc atttattgcg gcaagagcat cgatatttcg aacgcacacg 3300
acgatcacat cttccctcgt aaagcgggcg gattgaacat tttcgcgaac ctcgtggcct 3360
gctgtgcggt gtgcaacgaa aacaagaagg gccgcacgcc tctggagtcg ggcatttcac 3420
caaagccaga gattattgca tttatgaaga acgacctgaa gaagaaaatc ttggaagatg 3480
ctcgcaacat taacaccgtc gacttcaaca agtatatgag ccacgcttcg attgggtggc 3540
gttacatgcg cgatcgcctt cgcgaatcgg caggtaacaa gaaactgccg atcgaacgcc 3600
aaagtggtat ttatacggcc tactttcgtc gctggtgggg tttcaagaaa gagcgcggta 3660
atactttgca ccacgctctg gacgcggtga ttttggcctc gcgtaagggc tactcagacg 3720
acggcttagt agacatgact ttaaaaccca agtacaataa gggcggcgaa ttcgatccgg 3780
agaagcactt accggagcct atcgagttca agatggacaa ggggtcacgc ggtagcgccc 3840
tgcacgaccg taatccgttg agttacaaga agggtatcat cactcgtcgc ttcatggtca 3900
ctgaaatcga atgtggcaag gaagatgacg tgatctctga aacctaccgc gagaagttga 3960
aggaagcgtt caagcgcttc gacaccaaga agggcaagtg cctgaccgat aaagaagcca 4020
aagaggcggg gttctgtatc aagaagaacg agctggtgat gtcgctgaag tgttcaatca 4080
aggggactgg cccgggccaa atgattcgca ttaacaacaa cgtgttcaaa accaacgtac 4140
acaacgtagg agttgacgtc tacctggacg agaagggcaa gaagaaggcg tacgaacgca 4200
agaacccacg cttatcgaag cattttattg agccgccgcc acaaccgaac ggccgcgtct 4260
ctttcacact gaagcgtcgc gacatggtga ctgtagaggg agaggatgcc atttaccgca 4320
ttaagaagtt gggtacttcc ccgaccatcg aggcggtggt ggggagcgac ggtaagacgc 4380
gcacagtatc ggcaacgaaa ttgaccaagg ccaatagcgc cgagctcgag ggctctggcg 4440
ggtctcccaa gaagaagagg aaagtctaag atccggctgc taacaaagcc cgaaaggaag 4500
ctgagttggc tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac 4560
gggtcttgag gggttttttg ctgaaaggag gaactatatc cggattggcg aatgggacgc 4620
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 4680
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 4740
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 4800
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 4860
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 4920
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 4980
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 5040
gaattttaac aaaatattaa cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc 5100
ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 5160
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 5220
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 5280
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 5340
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 5400
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 5460
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 5520
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 5580
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 5640
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 5700
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgcagc aatggcaaca 5760
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 5820
gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 5880
tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 5940
ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 6000
actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 6060
taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 6120
tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 6180
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 6240
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 6300
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 6360
gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 6420
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 6480
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 6540
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 6600
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 6660
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 6720
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 6780
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 6840
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 6900
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 6960
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat 7020
tttctcctta cgcatctgtg cggtatttca caccgcaatg gtgcactctc agtacaatct 7080
gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat 7140
ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 7200
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 7260
accgtcatca ccgaaacgcg cgaggcagct gcggtaaagc tcatcagcgt ggtcgtgaag 7320
cgattcacag atgtctgcct gttcatccgc gtccagctcg ttgagtttct ccagaagcgt 7380
taatgtctgg cttctgataa agcgggccat gttaagggcg gttttttcct gtttggtcac 7440
tgatgcctcc gtgtaagggg gatttctgtt catgggggta atgataccga tgaaacgaga 7500
gaggatgctc acgatacggg ttactgatga tgaacatgcc cggttactgg aacgttgtga 7560
gggtaaacaa ctggcggtat ggatgcggcg ggaccagaga aaaatcactc agggtcaatg 7620
ccagcgcttc gttaatacag atgtaggtgt tccacagggt agccagcagc atcctgcgat 7680
gcagatccgg aacataatgg tgcagggcgc tgacttccgc gtttccagac tttacgaaac 7740
acggaaaccg aagaccattc atgttgttgc tcaggtcgca gacgttttgc agcagcagtc 7800
gcttcacgtt cgctcgcgta tcggtgattc attctgctaa ccagtaaggc aaccccgcca 7860
gcctagccgg gtcctcaacg acaggagcac gatcatgcgc acccgtgggg ccgccatgcc 7920
ggcgataatg gcctgcttct cgccgaaacg tttggtggcg ggaccagtga cgaaggcttg 7980
agcgagggcg tgcaagattc cgaataccgc aagcgacagg ccgatcatcg tcgcgctcca 8040
gcgaaagcgg tcctcgccga aaatgaccca gagcgctgcc ggcacctgtc ctacgagttg 8100
catgataaag aagacagtca taagtgcggc gacgatagtc atgccccgcg cccaccggaa 8160
ggagctgact gggttgaagg ctctcaaggg catcggtcga gatcccggtg cctaatgagt 8220
gagctaactt acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 8280
gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 8340
ccagggtggt ttttcttttc accagtgaga cgggcaacag ctgattgccc ttcaccgcct 8400
ggccctgaga gagttgcagc aagcggtcca cgctggtttg ccccagcagg cgaaaatcct 8460
gtttgatggt ggttaacggc gggatataac atgagctgtc ttcggtatcg tcgtatccca 8520
ctaccgagat atccgcacca acgcgcagcc cggactcggt aatggcgcgc attgcgccca 8580
gcgccatctg atcgttggca accagcatcg cagtgggaac gatgccctca ttcagcattt 8640
gcatggtttg ttgaaaaccg gacatggcac tccagtcgcc ttcccgttcc gctatcggct 8700
gaatttgatt gcgagtgaga tatttatgcc agccagccag acgcagacgc gccgagacag 8760
aacttaatgg gcccgctaac agcgcgattt gctggtgacc caatgcgacc agatgctcca 8820
cgcccagtcg cgtaccgtct tcatgggaga aaataatact gttgatgggt gtctggtcag 8880
agacatcaag aaataacgcc ggaacattag tgcaggcagc ttccacagca atggcatcct 8940
ggtcatccag cggatagtta atgatcagcc cactgacgcg ttgcgcgaga agattgtgca 9000
ccgccgcttt acaggcttcg acgccgcttc gttctaccat cgacaccacc acgctggcac 9060
ccagttgatc ggcgcgagat ttaatcgccg cgacaatttg cgacggcgcg tgcagggcca 9120
gactggaggt ggcaacgcca atcagcaacg actgtttgcc cgccagttgt tgtgccacgc 9180
ggttgggaat gtaattcagc tccgccatcg ccgcttccac tttttcccgc gttttcgcag 9240
aaacgtggct ggcctggttc accacgcggg aaacggtctg ataagagaca ccggcatact 9300
ctgcgacatc gtataacgtt actggtttca cattcaccac cctgaattga ctctcttccg 9360
ggcgctatca tgccataccg cgaaaggttt tgcgccattc gatggtgtcc gggatctcga 9420
cgctctccct tatgcgactc ctgcattagg aagcagccca gtagtaggtt gaggccgttg 9480
agcaccgccg ccgcaaggaa tggtttaatt aattctaga 9519
<210> 487
<211> 11211
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: Plasmid
<220>
<223> Description: pET21-CAT (H193Y)-sgRNA-MG68-4 (D109N)-nSpCas9
(D10A)
<400> 487
gaaataattt tgtttaactt taagaaggag atataccatg ggcagcagtc atcatcatca 60
ccatcacatg actgattctc aaaatgatac agatgaatac tggatgggag aggccctgaa 120
gttggcacaa aaggcatggg acgaaggaga ggtgcccgta ggagccatct tggttcgtaa 180
gggcgaagtt atcggtcatg gctggaaccg tagcatcggg tcccatgacc cctcggcgca 240
tgctgaaatt atggctattc gtgaagccgg ggtgcgtatc ggtaattatc gcatgttgga 300
taccgtatta tacgttacgc tggagccgtg tgcaatgtgc gcaggggcac ttgttcacgg 360
gcgtatttca cgcttggtct ttggtgccga aaaccccaag acaggggcgt gcgggtcagt 420
catggacatt gctcgccacc ctgctttgaa ccaccaatta caagttgatg gtggggtaat 480
ggcggctcct tgtgcgcgtc ttttatctga cttctttcgc tggcgtcgcg ctcagaaaaa 540
ggcggcccgt gataatagtt cggggaactc aggcgggtcg tcgggaggaa gcagtggcag 600
cgagactccc ggaacttcgg agagcgctac accagaaagt agtggaggca gctctggtgg 660
gtccatggat aagaaatact caataggact ggcgattggc acaaatagcg tcggatgggc 720
tgtgatcact gatgaatata aggttccttc taaaaagttc aaggttctgg gaaatacaga 780
ccgccacagt atcaaaaaaa atcttatagg ggctcttctg tttgacagtg gagagacagc 840
cgaagctact agactcaaac ggacagctag gagaaggtat acaagacgga agaataggat 900
ttgttatctc caggagattt tttcaaatga gatggccaaa gtggatgata gtttctttca 960
tagacttgaa gagtcttttt tggtggaaga agacaagaag catgaaagac atcctatttt 1020
tggaaatata gtggatgaag ttgcttatca cgagaaatat ccaactatct atcatctgag 1080
aaaaaaattg gtggattcta ctgataaagc cgatttgcgc ctgatctatt tggccctggc 1140
ccacatgatt aagtttagag gtcatttttt gattgagggc gatctgaatc ctgataatag 1200
tgatgtggac aaactgttta tccagttggt gcaaacctac aatcaactgt ttgaagaaaa 1260
ccctattaac gcaagtggag tggatgctaa agccattctt tctgcaagat tgagtaaatc 1320
aagaagactg gaaaatctca ttgctcagct ccccggtgag aagaaaaatg gcctgtttgg 1380
gaatctcatt gctttgtcat tgggtttgac ccctaatttt aaatcaaatt ttgatttggc 1440
agaagatgct aaactccagc tttcaaaaga tacttacgat gatgatctgg ataatctgtt 1500
ggctcaaatt ggagatcaat atgctgattt gtttttggca gctaagaatc tgtcagatgc 1560
tattctgctt tcagacatcc tgagagtgaa tactgaaata actaaggctc ccctgtcagc 1620
ttcaatgatt aaacgctacg atgaacatca tcaagacttg actcttctga aagccctggt 1680
tagacaacaa cttccagaaa agtataaaga aatctttttt gatcaatcaa aaaacggata 1740
tgcaggttat attgatggcg gcgcaagcca agaagaattt tataaattta tcaaaccaat 1800
tctggaaaaa atggatggta ctgaggaact gttggtgaaa ctgaatagag aagatttgct 1860
gcgcaagcaa cggacctttg acaacggctc tattccccat caaattcact tgggtgagct 1920
gcatgctatt ttgagaagac aagaagactt ttatccattt ctgaaagaca atagagagaa 1980
gattgaaaaa atcttgactt ttaggattcc ttattatgtt ggtccattgg ccagaggcaa 2040
tagtaggttt gcatggatga ctcggaagtc tgaagaaaca attaccccat ggaattttga 2100
agaagttgtc gataaaggtg cttcagctca atcatttatt gaacgcatga caaactttga 2160
taaaaatctt ccaaatgaaa aagtgctgcc aaaacatagt ttgctttatg agtattttac 2220
cgtttataac gaattgacaa aggtcaaata tgttactgaa ggaatgagaa aaccagcatt 2280
tctttcaggt gaacagaaga aagccattgt tgatctgctc ttcaaaacaa ataggaaagt 2340
gaccgttaag caactgaaag aagattattt caaaaaaata gaatgttttg atagtgttga 2400
aatttcagga gttgaagata gatttaatgc ttcactgggt acataccatg atttgctgaa 2460
aattattaaa gataaagatt ttttggataa tgaagaaaat gaagacatcc tggaggatat 2520
tgttctgaca ttgaccctgt ttgaagatag ggagatgatt gaggaaagac ttaaaacata 2580
cgctcacctc tttgatgata aggtgatgaa acagcttaaa agacgcagat atactggttg 2640
gggaaggttg tccagaaaat tgattaatgg tattagggat aagcaatctg gcaaaacaat 2700
actggatttt ttgaaatcag atggttttgc caatcgcaat tttatgcagc tcatccatga 2760
tgatagtttg acatttaaag aagacatcca aaaagcacaa gtgtctggac aaggcgatag 2820
tctgcatgaa catattgcaa atctggctgg tagccctgct attaaaaaag gtattctcca 2880
gactgtgaaa gttgttgatg aattggtcaa agtgatgggg cggcataagc cagaaaatat 2940
cgttattgaa atggcaagag aaaatcagac aactcaaaag ggccagaaaa attccagaga 3000
gaggatgaaa agaatcgaag aaggtatcaa agaactggga agtcagattc ttaaagagca 3060
tcctgttgaa aatactcaat tgcaaaatga aaagctctat ctctattatc tccaaaatgg 3120
aagagatatg tatgtggacc aagaactgga tattaatagg ctgagtgatt atgatgtcga 3180
tcacattgtt ccacaaagtt tccttaaaga cgattcaata gacaataagg tcctgaccag 3240
gtctgataaa aatagaggta aatccgataa cgttccaagt gaagaagtgg tcaaaaagat 3300
gaaaaactat tggagacaac ttctgaacgc caagctgatc actcaaagga agtttgataa 3360
tctgaccaaa gctgaaagag gaggtttgag tgaacttgat aaagctggtt ttatcaaacg 3420
ccaattggtt gaaactcgcc aaatcactaa gcatgtggca caaattttgg atagtcgcat 3480
gaatactaaa tacgatgaaa atgataaact tattagagag gttaaagtga ttaccctgaa 3540
atctaaactg gtttctgact tcagaaaaga tttccaattc tataaagtga gagagattaa 3600
caattaccat catgcccatg atgcctatct gaatgccgtc gttggaactg ctttgattaa 3660
gaaatatcca aaacttgaaa gcgagtttgt ctatggtgat tataaagttt atgatgttag 3720
gaaaatgatt gctaagtctg agcaagaaat aggcaaagca accgcaaagt atttctttta 3780
ctctaatatc atgaacttct tcaaaacaga aattacactt gcaaatggag agattcgcaa 3840
acgccctctg atcgaaacta atggggaaac tggagaaatt gtctgggata aagggagaga 3900
ttttgccaca gtgcgcaaag tgttgtccat gccccaagtc aatatcgtca agaaaacaga 3960
agtgcagaca ggcggattct ctaaggagtc aattctgcca aaaagaaatt ccgacaagct 4020
gattgctagg aaaaaagact gggacccaaa aaaatatggt ggttttgata gtccaaccgt 4080
ggcttattca gtcctggtgg ttgctaaggt ggaaaaaggg aaatccaaga agctgaaatc 4140
cgttaaagag ctgctgggga tcacaattat ggaaagaagt tcctttgaaa aaaatcccat 4200
tgactttctg gaagctaaag gatataagga agttaaaaaa gacctgatca ttaaactgcc 4260
taaatatagt ctttttgagc tggaaaacgg taggaaacgg atgctggcta gtgccggaga 4320
actgcaaaaa ggaaatgagc tggctctgcc aagcaaatat gtgaattttc tgtatctggc 4380
tagtcattat gaaaagttga agggtagtcc agaagataac gaacaaaaac aattgtttgt 4440
ggagcagcat aagcattatc tggatgagat tattgagcaa atcagtgaat tttctaagag 4500
agttattctg gcagatgcca atctggataa agttcttagt gcatataaca aacatagaga 4560
caaaccaata agagaacaag cagaaaatat cattcatctg tttaccttga ccaatcttgg 4620
agcacccgct gcttttaaat actttgatac aacaattgat aggaaaagat atacctctac 4680
aaaagaagtt ctggatgcca ctcttatcca tcaatccatc actggtcttt atgaaacacg 4740
cattgatttg agtcagctgg gaggtgacgg ctctggcggg tctcccaaga agaagaggaa 4800
agtctaagat ccggctgcta acaaagcccg aaaggaagct gagttggctg ctgccaccgc 4860
tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg gttttttgct 4920
gaaaggagga actatatccg gattggcgaa tgggacgcgc cctgtagcgg cgcattaagc 4980
gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 5040
gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 5100
ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 5160
aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 5220
cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 5280
ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 5340
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 5400
cttacaattt aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 5460
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 5520
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 5580
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 5640
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 5700
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 5760
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 5820
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 5880
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 5940
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 6000
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 6060
acgagcgtga caccacgatg cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg 6120
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 6180
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 6240
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 6300
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 6360
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 6420
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 6480
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 6540
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 6600
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 6660
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 6720
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 6780
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 6840
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 6900
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6960
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 7020
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 7080
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 7140
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 7200
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 7260
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 7320
cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg 7380
gtatttcaca ccgcaatggt gcactctcag tacaatctgc tctgatgccg catagttaag 7440
ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 7500
acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 7560
gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 7620
aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat gtctgcctgt 7680
tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct tctgataaag 7740
cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt gtaaggggga 7800
tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac gatacgggtt 7860
actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact ggcggtatgg 7920
atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt taatacagat 7980
gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa cataatggtg 8040
cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa gaccattcat 8100
gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg ctcgcgtatc 8160
ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt cctcaacgac 8220
aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc ctgcttctcg 8280
ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg 8340
aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa 8400
atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata 8460
agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct 8520
ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg 8580
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 8640
ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac 8700
cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa 8760
gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg 8820
gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac 8880
gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac 8940
cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga 9000
catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata 9060
tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag 9120
cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc 9180
atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg 9240
aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat 9300
gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac 9360
gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt 9420
aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat 9480
cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc 9540
cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac 9600
cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac 9660
tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg 9720
aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct 9780
gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg 9840
gtttaattaa tttgatcggc acgtaagagg ttccaacttt caccataatg aaataagatc 9900
actaccgggc gtattttttg agttatcgag attttcagga gctaaggaag ctaaaatgga 9960
gaaaaaaatc actggatata ccaccgttga tatatcccaa tggcatcgta aagaacattt 10020
tgaggcattt cagtcagttg ctcaatgtac ctataaccag accgttcagc tggatattac 10080
ggccttttta aagaccgtaa agaaaaataa gcacaagttt tatccggcct ttattcacat 10140
tcttgcccgc ctgatgaatg ctcatccgga attccgtatg gcaatgaaag acggtgagct 10200
ggtgatatgg gatagtgttc acccttgtta caccgttttc catgagcaaa ctgaaacgtt 10260
ttcatcgctc tggagtgaat accacgacga tttccggcag tttctacaca tatattcgca 10320
agatgtggcg tgttacggtg aaaacctggc ctatttccct aaagggttta ttgagaatat 10380
gttttttgtc tcagccaatc cctgggtgag tttcaccagt tttgatttaa acgtggccaa 10440
tatggacaac ttcttcgccc ccgttttcac catgggcaaa tattatacgc aaggcgacaa 10500
ggtgctgatg ccgctggcga ttcaggttca ttatgccgtc tgtgatggct tccatgtcgg 10560
cagaatgctt aatgaattac aacagtactg cgatgagtgg cagggcgggg cgtaattttt 10620
ttaaggcagt tattggtgcc cttaaacgcc tggtgctacg cctgaataag tgaagcatgc 10680
aaggagatgg cgcccaacag tcccccggcc acggggcctg ccaccatacc cacgccgaaa 10740
caagcgctca tgagcccgaa gtggcgagcc cgatcttccc catcggtgat gtcggcgata 10800
taggcgccag caaccgcacc tgtggcgccg gtgatgccgg ccacgatgcg tccggcgtag 10860
aggatcgact cgagtgcggc cgcaagcttg tcgacggagc tcgaattcgg atcctaatac 10920
gactcactat agtaatgaac ctgaatcgcc aggttttaga gctagaaata gcaagttaaa 10980
ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt ttttgtgaac 11040
ctgcaggagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 11100
ctgttgtttg tcggtgaacg ctctcctgag taggacaaat tcgatcccgc gaaattaata 11160
cgactcacta taggggaatt gtgagcggat aacaattccc ctctaggatc c 11211
<210> 488
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: sgRNA scaffold sequence
<220>
<223> Description: MG15-1
<400> 488
gttgtaattc cctagaaata ggttattaca ataaggtcca acaggagtgt tggtaccgta 60
aagctctaac ggcacccacg ggtgccgtta tctttt 96
<210> 489
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Category: sgRNA scaffold sequence
<220>
<223> Description: MG34-1
<400> 489
gttacagtta agaaattaat tgtaaaacgc ctatacagtg aagggatata cgcttgggtt 60
tgtccagcct gagcctctat gccagaaatg gcgccttcat cgtgggttag gacatttaat 120
ttt 123
<210> 490
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A) in E. coli
<400> 490
gatccgcgct ggctaccggc ga 22
<210> 491
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)-UGI (PBS1) in E. coli
<400> 491
gatccgcgct ggctaccggc ga 22
<210> 492
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-1 in E. coli
<400> 492
gatccgcgct ggctaccggc ga 22
<210> 493
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-2 in E. coli
<400> 493
gatccgcgct ggctaccggc ga 22
<210> 494
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nMG15-1 (D8A)-MG69-3 in E. coli
<400> 494
gatccgcgct ggctaccggc ga 22
<210> 495
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nSpCas9 (D10A)-UGI (PBS1) in HEK293T
<400> 495
ggcccagact gagcacgtga 20
<210> 496
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nSpCas9 (D10A) in HEK293T
<400> 496
ggcccagact gagcacgtga 20
<210> 497
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nSpCas9 (D10A)-MG69-1 in HEK293T
<400> 497
ggcccagact gagcacgtga 20
<210> 498
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: rAPOBEC1-nSpCas9 (D10A)-MG69-2 in HEK293T
<400> 498
ggcccagact gagcacgtga 20
<210> 499
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 1 in HEK293T
<400> 499
gattcccacc tctcaatacg tt 22
<210> 500
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 2 in HEK293T
<400> 500
cccaggcagg caggctctcc ga 22
<210> 501
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 3 in HEK293T
<400> 501
caccccctct ccctccatca gt 22
<210> 502
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG1-4 (D9A)-MG69-1_site 4 in HEK293T
<400> 502
tgtacacagt ttcccaagct ac 22
<210> 503
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 1 in HEK293T
<400> 503
ctggactctg gccactccct gg 22
<210> 504
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 2 in HEK293T
<400> 504
catccagctc cagccccaga gc 22
<210> 505
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 3 in HEK293T
<400> 505
gattccggct ctgagggcca gt 22
<210> 506
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 4 in HEK293T
<400> 506
gcccttctgt ttgtcccact tg 22
<210> 507
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 5 in HEK293T
<400> 507
ttggccaagc caggcctaga at 22
<210> 508
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 6 in HEK293T
<400> 508
ctcagctggt acacggcagg gt 22
<210> 509
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG3-6 (D13A)-MG69-1_site 7 in HEK293T
<400> 509
tcgcctatgg gaactctgga gg 22
<210> 510
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 1 in HEK293T
<400> 510
cctaacatgg ataagtccag at 22
<210> 511
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 2 in HEK293T
<400> 511
ggccctcaga gccggaatct ac 22
<210> 512
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 3 in HEK293T
<400> 512
tgtcctccct caagatacag ga 22
<210> 513
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG4-2 (D28A)-MG69-1_site 4 in HEK293T
<400> 513
tgtgttcacc tgcccttctg tt 22
<210> 514
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 1 in HEK293T
<400> 514
cagtgtcccc cttccctatg gg 22
<210> 515
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 2 in HEK293T
<400> 515
cccccttccc tatgggaata at 22
<210> 516
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 3 in HEK293T
<400> 516
cagctccagc cccagagcct gg 22
<210> 517
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nMG18-1 (D12A)-MG69-1_site 4 in HEK293T
<400> 517
gtgcctctcc ctgcagacgg ta 22
<210> 518
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 1 in HEK293T
<400> 518
ttgccacgaa gcaggccaat 20
<210> 519
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 2 in HEK293T
<400> 519
cccggggccg ccattgacag 20
<210> 520
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 3 in HEK293T
<400> 520
tccggctctg agggccagtg 20
<210> 521
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 4 in HEK293T
<400> 521
caaccagtcc ccagtgactc 20
<210> 522
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Category: spacer
<220>
<223> Description: A0A2K5RDN7-nSpCas9 (D10A)-MG69-1_site 5 in HEK293T
<400> 522
gagtccgagc agaagaagaa 20
<210> 523
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify lacZ of E. coli
and Sanger sequencing
<400> 523
ccaggcttta cactttatgc t 21
<210> 524
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify lacZ of E. coli
and Sanger sequencing
<400> 524
cgaacatcca aaagtttgtg ttttt 25
<210> 525
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Sanger sequencing of base edit of lacZ of E. coli
<400> 525
ccgaaaggcg cggtgccg 18
<210> 526
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Sanger sequencing of base edit of lacZ of E. coli
<400> 526
gtatgtggtg gatgaagcc 19
<210> 527
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Sanger sequencing of base edit of lacZ of E. coli
<400> 527
ttgtggagcg acatccag 18
<210> 528
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Sanger sequencing of base edit of lacZ of E. coli
<400> 528
tgagcgcatt tttacgcgc 19
<210> 529
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Sanger sequencing of base edit of lacZ of E. coli
<400> 529
gaaaacggca acccgtgg 18
<210> 530
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Sanger sequencing of base edit of lacZ of E. coli
<400> 530
ggattgaaaa tggtctgctg 20
<210> 531
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Sanger sequencing of base edit of lacZ of E. coli
<400> 531
actgctgacg ccgctgcg 18
<210> 532
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify CAT (H193Y) of CAT
(H193Y)-sgRNA- MG68-4 variant-nSpCas9 (D10A)
<400> 532
ccgccgccgc aaggaatggt ttaattaatt tgatcggcac gtaagagg 48
<210> 533
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify CAT (H193Y) of CAT
(H193Y)-sgRNA-MG68-4 variant-nSpCas9
<400> 533
ggactgttgg gcgccatctc cttgcatgct tcacttattc aggcgtagca 50
<210> 534
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify CAT (H193Y) of CAT
(H193Y)-sgRNA-MG68-4 variant-nMG34-1 (D10A)
<400> 534
aaggaatggt ttaattaatt ctagattaat taatttgatc ggcacgtaag 50
<210> 535
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Sanger sequencing primer of CAT (H193Y)
<400> 535
ggactgttgg gcgccatctc cttgcatgct tcacttattc aggcgtagca 50
<210> 536
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify BE3 target site in
HEK293T cells and Sanger sequencing
<400> 536
gaggctggag aggcccgt 18
<210> 537
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify BE3 target site in
HEK293T cells for Sanger sequencing
<400> 537
gattttcatg caggtgctga aa 22
<210> 538
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 538
gctcttccga tctnnnnnag gaggaagggc ctgagt 36
<210> 539
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 539
gctcttccga tctnnnnntc tgccctcgtg ggtttg 36
<210> 540
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 540
gctcttccga tctnnnnnct ctggccactc cctggc 36
<210> 541
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 541
gctcttccga tctnnnnngg caggctctcc gaggag 36
<210> 542
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 542
gctcttccga tctnnnnngg gaataataaa agtctctctc ttaa 44
<210> 543
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 543
gctcttccga tctnnnnncc ccctccacca gtaccc 36
<210> 544
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 544
gctcttccga tctnnnnncc tgtccttgga gaaccg 36
<210> 545
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 545
gctcttccga tctnnnnngc aggtgaacac aagagct 37
<210> 546
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 5 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 546
gctcttccga tctnnnnnga aggtgtggtt ccagaac 37
<210> 547
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nSpCas9
(D10A)-MG69-1_site 5 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 547
gctcttccga tctnnnnntc gatgtcctcc ccattg 36
<210> 548
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG1-4
(D9A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 548
gctcttccga tctnnnnnaa acaggctaga cataggga 38
<210> 549
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG1-4
(D9A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 549
gctcttccga tctnnnnnga agccaccaga gtctcta 37
<210> 550
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG1-4
(D9A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 550
gctcttccga tctnnnnngc cgccattgac agaggg 36
<210> 551
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG1-4
(D9A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 551
gctcttccga tctnnnnngc atcaaaacaa aagggagatt g 41
<210> 552
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG1-4
(D9A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 552
gctcttccga tctnnnnncc tctgcccacc tcactt 36
<210> 553
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG1-4
(D9A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 553
gctcttccga tctnnnnngc catgtgggtt aatctgg 37
<210> 554
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG1-4
(D9A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 554
gctcttccga tctnnnnncc ggacgcacct acccat 36
<210> 555
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG1-4
(D9A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 555
gctcttccga tctnnnnnct agatgggaat ggatggg 37
<210> 556
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 556
gctcttccga tctnnnnnaa ccacaaaccc acgagg 36
<210> 557
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 557
gctcttccga tctnnnnntc aatggcggcc ccgggc 36
<210> 558
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 558
gctcttccga tctnnnnnag tgatccccag tgtccc 36
<210> 559
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 559
gctcttccga tctnnnnngc cctgaacgcg tttgct 36
<210> 560
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 560
gctcttccga tctnnnnntg ggaataataa aagtctctct ct 42
<210> 561
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 561
gctcttccga tctnnnnncc cctccaccag tacccc 36
<210> 562
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 562
gctcttccga tctnnnnnca gggcctcctc agccca 36
<210> 563
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 563
gctcttccga tctnnnnngt ctggatgtcg taagggaa 38
<210> 564
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 5 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 564
gctcttccga tctnnnnngg ggtgtaactc agaatgtttt 40
<210> 565
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 5 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 565
gctcttccga tctnnnnngg gagtgagact cagaga 36
<210> 566
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 6 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 566
gctcttccga tctnnnnngc aaagagggaa atgagatca 39
<210> 567
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 6 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 567
gctcttccga tctnnnnngt gacacatttg tttgagaatc a 41
<210> 568
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 7 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 568
gctcttccga tctnnnnnct ttatccccgc acagag 36
<210> 569
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG3-6
(D13A)-MG69-1_site 7 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 569
gctcttccga tctnnnnnct tggcccatgg gaaatc 36
<210> 570
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG4-2
(D28A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 570
gctcttccga tctnnnnngt cccatcccaa cacccc 36
<210> 571
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG4-2
(D28A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 571
gctcttccga tctnnnnntg ggcatgtgtg ctccca 36
<210> 572
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG4-2
(D28A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 572
gctcttccga tctnnnnnct atgggaataa taaaagtctc tc 42
<210> 573
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG4-2
(D28A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 573
gctcttccga tctnnnnnct ccaccagtac cccacc 36
<210> 574
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG4-2
(D28A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 574
gctcttccga tctnnnnngg accctggtct ctacct 36
<210> 575
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG4-2
(D28A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 575
gctcttccga tctnnnnncc tctcccattg aactacc 37
<210> 576
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG4-2
(D28A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 576
gctcttccga tctnnnnncc ccagtgactc agggcc 36
<210> 577
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG4-2
(D28A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 577
gctcttccga tctnnnnntc gtaagggaaa gacttaggaa 40
<210> 578
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG18-1
(D12A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 578
gctcttccga tctnnnnntc tcccttttgt tttgatgcat tt 42
<210> 579
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG18-1
(D12A)-MG69-1_site 1 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 579
gctcttccga tctnnnnncc accccaggct ctgggg 36
<210> 580
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG18-1
(D12A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 580
gctcttccga tctnnnnncc ttttgttttg atgcatttct gttt 44
<210> 581
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG18-1
(D12A)-MG69-1_site 2 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 581
gctcttccga tctnnnnnaa tctaccaccc caggct 36
<210> 582
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG18-1
(D12A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 582
gctcttccga tctnnnnnat ccccagtgtc cccctt 36
<210> 583
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG18-1
(D12A)-MG69-1_site 3 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 583
gctcttccga tctnnnnncc aggccctgaa cgcgtt 36
<210> 584
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Forward primer used to amplify A0A2K5RDN7-nMG18-1
(D12A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 584
gctcttccga tctnnnnnag gccaggcctg cggggg 36
<210> 585
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<223> Category: primer
<220>
<223> Description: Reverse primer used to amplify A0A2K5RDN7-nMG18-1
(D12A)-MG69-1_site 4 in HEK293T cells
<220>
<221> modified_base
<222> (14)..(18)
<223> a, c, t, g, unknown or other
<400> 585
gctcttccga tctnnnnncc aaaaactccc aaattagcaa a 41
<210> 586
<211> 969
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: adenine base editor
<220>
<223> Description: TadA (ABE8.17m)-nMG34-1 (D10A)
<400> 586
Met Gly Ser Ser His His His His His His Ser Glu Val Glu Phe Ser
1 5 10 15
His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg
20 25 30
Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg
35 40 45
Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr
50 55 60
Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln
65 70 75 80
Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Ser Thr Phe Glu Pro Cys
85 90 95
Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
100 105 110
Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
115 120 125
Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
130 135 140
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met
145 150 155 160
Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
165 170 175
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
180 185 190
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
195 200 205
Met Glu Arg Glu Leu Val Leu Gly Ile Ala Tyr Gly Gly Lys Tyr Thr
210 215 220
Gly Leu Ala Val Val Asp Arg Arg His Asn Gln Val Leu Tyr Ala Asn
225 230 235 240
Arg Leu Lys Met Arg Asp Asp Val Ala Gly Ile Leu Lys Asp Arg Arg
245 250 255
Lys Gln Arg Gly Ile Arg Arg Thr Ala Gln Thr Lys Lys Lys Arg Leu
260 265 270
Arg Glu Leu Lys Asn Tyr Leu Lys Ser Ile Gly Tyr Asn Glu Ser Thr
275 280 285
Ala Thr Phe Glu Thr Val Tyr Ser Leu Ala His Lys Arg Gly Tyr Asp
290 295 300
Tyr Ala Asp Met Pro Glu Glu Lys Thr Ser Glu Glu Ile Glu Ala Met
305 310 315 320
Asp Val Glu Glu Arg Lys Gln Trp Glu Lys Glu Lys Gln Glu Trp Glu
325 330 335
Glu Thr Lys Arg Asn Ser Arg His Arg Lys Glu Val Val Lys Asp Val
340 345 350
His Lys Ala Met Ile Glu Gly Arg Ala Thr Glu Glu Gln Ile Lys Arg
355 360 365
Val Glu Arg Ile Phe Asn Lys Gln Tyr Arg Pro Lys Arg Phe Asn Asn
370 375 380
Arg Ile Leu Thr Lys Cys Lys Val Glu Asp Cys Gly Val Asn Thr Pro
385 390 395 400
Leu Arg Lys Asn Val Arg Asp Leu Leu Ile Glu Asn Ile Val Arg Phe
405 410 415
Phe Pro Ile Glu Gln Ser Glu Lys Asp Asn Leu Lys Asp Ala Val Leu
420 425 430
Asp Lys Asn Arg Arg Glu Glu Val Lys Ser Phe Phe Arg Lys His Lys
435 440 445
Thr Asp Glu His Ile Arg Lys Gln Val Tyr Asp Ile Ala Asp Asn Lys
450 455 460
Leu Ser Gly Arg Thr Val Phe Cys Lys Glu His Ile Leu Glu His Thr
465 470 475 480
Glu His Ser Lys Glu Glu Arg Lys Val Phe Arg Leu Ala Pro Ser Leu
485 490 495
Lys Thr Lys Ile Glu Asn Val Leu Ala Val Ile Lys Asp Glu Ile Leu
500 505 510
Pro Lys Phe Thr Val Asn Lys Val Val Met Glu Ser Asn Asn Phe Asp
515 520 525
Ile Ala Ala Lys Thr Gln Gly Lys Lys Arg Leu Ala Lys Glu Glu Tyr
530 535 540
Gly Lys Gly Pro Arg Glu Gly Lys Glu Thr Arg Lys Glu Ala Leu Leu
545 550 555 560
Arg Glu Thr Asp Gly Arg Cys Ile Tyr Cys Gly Lys Ser Ile Asp Ile
565 570 575
Ser Asn Ala His Asp Asp His Ile Phe Pro Arg Lys Ala Gly Gly Leu
580 585 590
Asn Ile Phe Ala Asn Leu Val Ala Cys Cys Ala Val Cys Asn Glu Asn
595 600 605
Lys Lys Gly Arg Thr Pro Leu Glu Ser Gly Ile Ser Pro Lys Pro Glu
610 615 620
Ile Ile Ala Phe Met Lys Asn Asp Leu Lys Lys Lys Ile Leu Glu Asp
625 630 635 640
Ala Arg Asn Ile Asn Thr Val Asp Phe Asn Lys Tyr Met Ser His Ala
645 650 655
Ser Ile Gly Trp Arg Tyr Met Arg Asp Arg Leu Arg Glu Ser Ala Gly
660 665 670
Asn Lys Lys Leu Pro Ile Glu Arg Gln Ser Gly Ile Tyr Thr Ala Tyr
675 680 685
Phe Arg Arg Trp Trp Gly Phe Lys Lys Glu Arg Gly Asn Thr Leu His
690 695 700
His Ala Leu Asp Ala Val Ile Leu Ala Ser Arg Lys Gly Tyr Ser Asp
705 710 715 720
Asp Gly Leu Val Asp Met Thr Leu Lys Pro Lys Tyr Asn Lys Gly Gly
725 730 735
Glu Phe Asp Pro Glu Lys His Leu Pro Glu Pro Ile Glu Phe Lys Met
740 745 750
Asp Lys Gly Ser Arg Gly Ser Ala Leu His Asp Arg Asn Pro Leu Ser
755 760 765
Tyr Lys Lys Gly Ile Ile Thr Arg Arg Phe Met Val Thr Glu Ile Glu
770 775 780
Cys Gly Lys Glu Asp Asp Val Ile Ser Glu Thr Tyr Arg Glu Lys Leu
785 790 795 800
Lys Glu Ala Phe Lys Arg Phe Asp Thr Lys Lys Gly Lys Cys Leu Thr
805 810 815
Asp Lys Glu Ala Lys Glu Ala Gly Phe Cys Ile Lys Lys Asn Glu Leu
820 825 830
Val Met Ser Leu Lys Cys Ser Ile Lys Gly Thr Gly Pro Gly Gln Met
835 840 845
Ile Arg Ile Asn Asn Asn Val Phe Lys Thr Asn Val His Asn Val Gly
850 855 860
Val Asp Val Tyr Leu Asp Glu Lys Gly Lys Lys Lys Ala Tyr Glu Arg
865 870 875 880
Lys Asn Pro Arg Leu Ser Lys His Phe Ile Glu Pro Pro Pro Gln Pro
885 890 895
Asn Gly Arg Val Ser Phe Thr Leu Lys Arg Arg Asp Met Val Thr Val
900 905 910
Glu Gly Glu Asp Ala Ile Tyr Arg Ile Lys Lys Leu Gly Thr Ser Pro
915 920 925
Thr Ile Glu Ala Val Val Gly Ser Asp Gly Lys Thr Arg Thr Val Ser
930 935 940
Ala Thr Lys Leu Thr Lys Ala Asn Ser Ala Glu Leu Glu Gly Ser Gly
945 950 955 960
Gly Ser Pro Lys Lys Lys Arg Lys Val
965
<210> 587
<211> 1104
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: cytosine base editor
<220>
<223> Description: rAPOBEC1-nMG34-1 (D10A)-UGI (PBS1)
<400> 587
Met Gly Ser Ser His His His His His His Met Ser Ser Glu Thr Gly
1 5 10 15
Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu
20 25 30
Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu
35 40 45
Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr
50 55 60
Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe
65 70 75 80
Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp
85 90 95
Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu
100 105 110
Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg
115 120 125
Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu
130 135 140
Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly
145 150 155 160
Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His
165 170 175
Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu
180 185 190
Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg
195 200 205
Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His
210 215 220
Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser
225 230 235 240
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ala
245 250 255
Met Glu Arg Glu Leu Val Leu Gly Ile Ala Tyr Gly Gly Lys Tyr Thr
260 265 270
Gly Leu Ala Val Val Asp Arg Arg His Asn Gln Val Leu Tyr Ala Asn
275 280 285
Arg Leu Lys Met Arg Asp Asp Val Ala Gly Ile Leu Lys Asp Arg Arg
290 295 300
Lys Gln Arg Gly Ile Arg Arg Thr Ala Gln Thr Lys Lys Lys Arg Leu
305 310 315 320
Arg Glu Leu Lys Asn Tyr Leu Lys Ser Ile Gly Tyr Asn Glu Ser Thr
325 330 335
Ala Thr Phe Glu Thr Val Tyr Ser Leu Ala His Lys Arg Gly Tyr Asp
340 345 350
Tyr Ala Asp Met Pro Glu Glu Lys Thr Ser Glu Glu Ile Glu Ala Met
355 360 365
Asp Val Glu Glu Arg Lys Gln Trp Glu Lys Glu Lys Gln Glu Trp Glu
370 375 380
Glu Thr Lys Arg Asn Ser Arg His Arg Lys Glu Val Val Lys Asp Val
385 390 395 400
His Lys Ala Met Ile Glu Gly Arg Ala Thr Glu Glu Gln Ile Lys Arg
405 410 415
Val Glu Arg Ile Phe Asn Lys Gln Tyr Arg Pro Lys Arg Phe Asn Asn
420 425 430
Arg Ile Leu Thr Lys Cys Lys Val Glu Asp Cys Gly Val Asn Thr Pro
435 440 445
Leu Arg Lys Asn Val Arg Asp Leu Leu Ile Glu Asn Ile Val Arg Phe
450 455 460
Phe Pro Ile Glu Gln Ser Glu Lys Asp Asn Leu Lys Asp Ala Val Leu
465 470 475 480
Asp Lys Asn Arg Arg Glu Glu Val Lys Ser Phe Phe Arg Lys His Lys
485 490 495
Thr Asp Glu His Ile Arg Lys Gln Val Tyr Asp Ile Ala Asp Asn Lys
500 505 510
Leu Ser Gly Arg Thr Val Phe Cys Lys Glu His Ile Leu Glu His Thr
515 520 525
Glu His Ser Lys Glu Glu Arg Lys Val Phe Arg Leu Ala Pro Ser Leu
530 535 540
Lys Thr Lys Ile Glu Asn Val Leu Ala Val Ile Lys Asp Glu Ile Leu
545 550 555 560
Pro Lys Phe Thr Val Asn Lys Val Val Met Glu Ser Asn Asn Phe Asp
565 570 575
Ile Ala Ala Lys Thr Gln Gly Lys Lys Arg Leu Ala Lys Glu Glu Tyr
580 585 590
Gly Lys Gly Pro Arg Glu Gly Lys Glu Thr Arg Lys Glu Ala Leu Leu
595 600 605
Arg Glu Thr Asp Gly Arg Cys Ile Tyr Cys Gly Lys Ser Ile Asp Ile
610 615 620
Ser Asn Ala His Asp Asp His Ile Phe Pro Arg Lys Ala Gly Gly Leu
625 630 635 640
Asn Ile Phe Ala Asn Leu Val Ala Cys Cys Ala Val Cys Asn Glu Asn
645 650 655
Lys Lys Gly Arg Thr Pro Leu Glu Ser Gly Ile Ser Pro Lys Pro Glu
660 665 670
Ile Ile Ala Phe Met Lys Asn Asp Leu Lys Lys Lys Ile Leu Glu Asp
675 680 685
Ala Arg Asn Ile Asn Thr Val Asp Phe Asn Lys Tyr Met Ser His Ala
690 695 700
Ser Ile Gly Trp Arg Tyr Met Arg Asp Arg Leu Arg Glu Ser Ala Gly
705 710 715 720
Asn Lys Lys Leu Pro Ile Glu Arg Gln Ser Gly Ile Tyr Thr Ala Tyr
725 730 735
Phe Arg Arg Trp Trp Gly Phe Lys Lys Glu Arg Gly Asn Thr Leu His
740 745 750
His Ala Leu Asp Ala Val Ile Leu Ala Ser Arg Lys Gly Tyr Ser Asp
755 760 765
Asp Gly Leu Val Asp Met Thr Leu Lys Pro Lys Tyr Asn Lys Gly Gly
770 775 780
Glu Phe Asp Pro Glu Lys His Leu Pro Glu Pro Ile Glu Phe Lys Met
785 790 795 800
Asp Lys Gly Ser Arg Gly Ser Ala Leu His Asp Arg Asn Pro Leu Ser
805 810 815
Tyr Lys Lys Gly Ile Ile Thr Arg Arg Phe Met Val Thr Glu Ile Glu
820 825 830
Cys Gly Lys Glu Asp Asp Val Ile Ser Glu Thr Tyr Arg Glu Lys Leu
835 840 845
Lys Glu Ala Phe Lys Arg Phe Asp Thr Lys Lys Gly Lys Cys Leu Thr
850 855 860
Asp Lys Glu Ala Lys Glu Ala Gly Phe Cys Ile Lys Lys Asn Glu Leu
865 870 875 880
Val Met Ser Leu Lys Cys Ser Ile Lys Gly Thr Gly Pro Gly Gln Met
885 890 895
Ile Arg Ile Asn Asn Asn Val Phe Lys Thr Asn Val His Asn Val Gly
900 905 910
Val Asp Val Tyr Leu Asp Glu Lys Gly Lys Lys Lys Ala Tyr Glu Arg
915 920 925
Lys Asn Pro Arg Leu Ser Lys His Phe Ile Glu Pro Pro Pro Gln Pro
930 935 940
Asn Gly Arg Val Ser Phe Thr Leu Lys Arg Arg Asp Met Val Thr Val
945 950 955 960
Glu Gly Glu Asp Ala Ile Tyr Arg Ile Lys Lys Leu Gly Thr Ser Pro
965 970 975
Thr Ile Glu Ala Val Val Gly Ser Asp Gly Lys Thr Arg Thr Val Ser
980 985 990
Ala Thr Lys Leu Thr Lys Ala Asn Ser Ala Glu Leu Glu Gly Ser Gly
995 1000 1005
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
1010 1015 1020
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
1025 1030 1035
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His
1040 1045 1050
Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
1055 1060 1065
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
1070 1075 1080
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro
1085 1090 1095
Lys Lys Lys Arg Lys Val
1100
<210> 588
<211> 1592
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: adenine base editor
<220>
<223> Description: MG68-3-nSpCas9 (D10A)
<400> 588
Met Gly Ser Ser His His His His His His Met Asn Glu Gln Thr Ser
1 5 10 15
Thr Asp Glu Gln Phe Met Gln Gln Ala Leu Ala Leu Ala Asp Glu Ala
20 25 30
Glu Arg Gln Gly Glu Val Pro Val Gly Ala Leu Leu Val His Gln Gly
35 40 45
Thr Val Ile Gly Arg Gly Phe Asn Gln Val Ile Thr Gln Leu Asp Pro
50 55 60
Ser Ala His Ala Glu Met Leu Ala Ile Arg Asp Ala Ala Arg Tyr Leu
65 70 75 80
Gln Asn Tyr Arg Ile Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro
85 90 95
Cys Pro Met Cys Ala Gly Ala Leu Val His Ala Arg Val Lys Arg Leu
100 105 110
Val Tyr Gly Ala Ser Asp Pro Arg Thr Gly Ala Cys Gly Ser Val Phe
115 120 125
Asn Val Val Ala Asp Thr Arg Leu Asn His Gln Leu Glu Val Val Ala
130 135 140
Gly Val Leu Gly Ser Gln Cys Gly Glu Arg Leu Ser Ala Phe Phe Arg
145 150 155 160
Gln Arg Arg Ala Ala Gln Lys Ala Leu Lys Lys Ala Ala Gln Asn Phe
165 170 175
Gln Ser Pro Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu
180 185 190
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser
195 200 205
Ser Gly Gly Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
210 215 220
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
225 230 235 240
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
245 250 255
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
260 265 270
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
275 280 285
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
290 295 300
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
305 310 315 320
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
325 330 335
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
340 345 350
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
355 360 365
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
370 375 380
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
385 390 395 400
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
405 410 415
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
420 425 430
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
435 440 445
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
450 455 460
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
465 470 475 480
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
485 490 495
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
500 505 510
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
515 520 525
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
530 535 540
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
545 550 555 560
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
565 570 575
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
580 585 590
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
595 600 605
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
610 615 620
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
625 630 635 640
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
645 650 655
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
660 665 670
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
675 680 685
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
690 695 700
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
705 710 715 720
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
725 730 735
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
740 745 750
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
755 760 765
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
770 775 780
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
785 790 795 800
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
805 810 815
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
820 825 830
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
835 840 845
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
850 855 860
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
865 870 875 880
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
885 890 895
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
900 905 910
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
915 920 925
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
930 935 940
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
945 950 955 960
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
965 970 975
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
980 985 990
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
995 1000 1005
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu
1010 1015 1020
Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
1025 1030 1035
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
1040 1045 1050
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val
1055 1060 1065
Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro
1070 1075 1080
Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu
1085 1090 1095
Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr
1100 1105 1110
Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe
1115 1120 1125
Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val
1130 1135 1140
Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn
1145 1150 1155
Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
1160 1165 1170
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
1175 1180 1185
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala
1190 1195 1200
Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser
1205 1210 1215
Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met
1220 1225 1230
Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr
1235 1240 1245
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr
1250 1255 1260
Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
1265 1270 1275
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1280 1285 1290
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys
1295 1300 1305
Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu
1310 1315 1320
Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp
1325 1330 1335
Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr
1340 1345 1350
Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
1355 1360 1365
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg
1370 1375 1380
Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly
1385 1390 1395
Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1400 1405 1410
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1415 1420 1425
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys
1430 1435 1440
Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys
1445 1450 1455
Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln
1460 1465 1470
His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
1475 1480 1485
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu
1490 1495 1500
Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
1505 1510 1515
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1520 1525 1530
Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr
1535 1540 1545
Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser
1550 1555 1560
Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly
1565 1570 1575
Gly Asp Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1580 1585 1590
<210> 589
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<223> Category: adenine base editor
<220>
<223> Description: MG68-8-nSpCas9 (D10A)
<400> 589
Met Gly Ser Ser His His His His His His Met Pro Gln Ser Glu Gln
1 5 10 15
Asp Ile Tyr Trp Ile Arg Tyr Ala Met Gln Leu Ala Glu Arg Ala Glu
20 25 30
Gln Ala Gly Glu Val Pro Val Gly Ala Val Leu Val Leu Asp Asn Gln
35 40 45
Ala Leu Gly Glu Gly Trp Asn Leu Ser Ile Ser Arg His Asp Pro Cys
50 55 60
Ala His Ala Glu Ile Met Ala Ile Arg Gln Ala Gly Glu Arg Ile Gly
65 70 75 80
Asn Tyr Arg Leu Leu Gly Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys
85 90 95
Val Met Cys Ala Gly Ala Met Val His Ser Arg Ile Ala Arg Val Val
100 105 110
Tyr Gly Ala Ser Asp Leu Lys Thr Gly Ala Ala Gly Ser Val Phe Asp
115 120 125
Val Leu Ser Asp Pro Arg His Asn His Val Val Glu Ile Thr Gly Gly
130 135 140
Val Glu Ser Glu Ala Cys Ser Gln Gln Leu Ser Asp Phe Phe Arg Arg
145 150 155 160
Arg Arg Ala Glu Gln Lys Ala Glu Lys Gln Arg Leu Lys Asp Asn Gln
165 170 175
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
180 185 190
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
195 200 205
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
210 215 220
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
225 230 235 240
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
245 250 255
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
260 265 270
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
275 280 285
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
290 295 300
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
305 310 315 320
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
325 330 335
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
340 345 350
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
355 360 365
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
370 375 380
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
385 390 395 400
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
405 410 415
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
420 425 430
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
435 440 445
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
450 455 460
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
465 470 475 480
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
485 490 495
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
500 505 510
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
515 520 525
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
530 535 540
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
545 550 555 560
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
565 570 575
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
580 585 590
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
595 600 605
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
610 615 620
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
625 630 635 640
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
645 650 655
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
660 665 670
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
675 680 685
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
690 695 700
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
705 710 715 720
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
725 730 735
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
740 745 750
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
755 760 765
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
770 775 780
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
785 790 795 800
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
805 810 815
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
820 825 830
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
835 840 845
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
850 855 860
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
865 870 875 880
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
885 890 895
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
900 905 910
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
915 920 925
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
930 935 940
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
945 950 955 960
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
965 970 975
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
980 985 990
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
995 1000 1005
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
1010 1015 1020
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
1025 1030 1035
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser
1040 1045 1050
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1055 1060 1065
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1070 1075 1080
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1085 1090 1095
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1100 1105 1110
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1115 1120 1125
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
1130 1135 1140
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1145 1150 1155
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1160 1165 1170
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1175 1180 1185
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1190 1195 1200
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1205 1210 1215
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1220 1225 1230
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1235 1240 1245
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1250 1255 1260
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1265 1270 1275
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1280 1285 1290
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1295 1300 1305
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1310 1315 1320
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1325 1330 1335
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1340 1345 1350
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1355 1360 1365
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1370 1375 1380
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1385 1390 1395
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1400 1405 1410
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1415 1420 1425
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1430 1435 1440
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1445 1450 1455
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1460 1465 1470
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1475 1480 1485
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1490 1495 1500
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1505 1510 1515
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1520 1525 1530
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1535 1540 1545
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1550 1555 1560
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly Ser
1565 1570 1575
Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 590
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> Category: Linker
<400> 590
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 591
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> Category: Linker
<400> 591
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
Ala
<210> 592
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> Category: Linker
<400> 592
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
<210> 593
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> Category: Linker
<400> 593
Gly Thr Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
1 5 10 15
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly
20 25 30
Gly Ser
Claims (133)
- 조작된 핵산 편집 시스템으로서,
(a) RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제;
(b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및
(c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
i. 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
ii. 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
을 포함하는 조작된 가이드 리보핵산 구조체
를 포함하는 조작된 핵산 편집 시스템. - 제1항에 있어서, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 조작된 핵산 편집 시스템.
- 제1항에 있어서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성되는 것인 조작된 핵산 편집 시스템.
- 제1항 또는 제2항에 있어서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 닉카제(nickase) 돌연변이를 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 클래스 2, 타입 II cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 72에 비해 잔기 13에, 또는 서열번호 75에 비해 잔기 17에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 조작된 뉴클레아제 시스템.
- 조작된 핵산 편집 시스템으로서,
(a) 서열번호 70-78, 596, 또는 597-598 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제;
(b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및
(c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
i. 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
ii. 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
을 포함하는 조작된 가이드 리보핵산 구조체
를 포함하는 조작된 핵산 편집 시스템. - 조작된 핵산 편집 시스템으로서,
(a) 서열번호 360-368 또는 598 중 어느 하나 또는 이의 변이체를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서,
상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제;
(b) 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및
(c) 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
i. 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
ii. 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
을 포함하는 조작된 가이드 리보핵산 구조체
를 포함하는 조작된 핵산 편집 시스템. - 제9항에 있어서, 상기 엔도뉴클레아제는 닉카제 돌연변이를 포함하는 것인 조작된 핵산 편집 시스템.
- 제9항에 있어서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성되는 것인 조작된 핵산 편집 시스템.
- 제9항에 있어서, 상기 클래스 2, 타입 II cas 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 조작된 핵산 편집 시스템.
- 제9항에 있어서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제9항에 있어서, 상기 염기 편집기는 서열번호 50-51 또는 385-390 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제8항 내지 제14항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 조작된 핵산 편집 시스템.
- 제8항 내지 제15항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 조작된 핵산 편집 시스템.
- 제8항 내지 제16항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는 것인 조작된 핵산 편집 시스템.
- 제8항 내지 제17항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 조작된 가이드 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성(non-degenerate) 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 조작된 핵산 편집 시스템으로서,
(a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
(ii) 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
을 포함하는 조작된 가이드 리보핵산 구조체로서,
상기 조작된 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나 또는 이의 변이체의 비축퇴성 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 구조체;
(b) 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, 타입 II Cas 엔도뉴클레아제; 및
(c) 상기 엔도뉴클레아제에 커플링된 염기 편집기
를 포함하는 조작된 핵산 편집 시스템. - 제20항에 있어서, 상기 엔도뉴클레아제는 서열번호 360-368 또는 598로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성되는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 염기 편집기는 서열번호 50-51 또는 385-390 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 염기 편집기는 아데닌 데아미나제인 조작된 핵산 편집 시스템.
- 제23항에 있어서, 상기 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 염기 편집기는 시토신 데아미나제인 조작된 핵산 편집 시스템.
- 제26항에 있어서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제(UGI)를 포함하는 조작된 핵산 편집 시스템.
- 제28항에 있어서, 상기 우라실 DNA 글리코실라제 억제제(UGI)는 서열번호 52-56 또는 서열번호 67 중 어느 하나에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 조작된 가이드 리보핵산 구조체는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 조작된 가이드 리보핵산 구조체는 상기 가이드 리보핵산 서열 및 엔도뉴클레아제에 결합하도록 구성된 상기 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제31항 중 어느 한 항에 있어서, 상기 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물 또는 인간 게놈 서열에 상보적인 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 가이드 리보핵산 서열은 길이가 15 내지 24 개의 뉴클레오티드인 조작된 핵산 편집 시스템.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 추가로 포함하는 조작된 핵산 편집 시스템.
- 제34항에 있어서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합되는 것인 조작된 핵산 편집 시스템.
- 제36항에 있어서, 폴리펩티드는 상기 엔도뉴클레아제 및 상기 염기 편집기를 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성되는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 상기 시스템은 Mg2+ 공급원을 추가로 포함하는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제39항 중 어느 한 항에 있어서,
(a) 상기 엔도뉴클레아제는 서열번호 70, 71, 73, 74, 76, 78, 77 또는 78 중 어느 하나 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나;
(b) 상기 가이드 RNA 구조체는 서열번호 88, 89, 91, 92, 94, 96, 95 또는 488 중 어느 하나의 비축퇴성 뉴클레오티드와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나;
(c) 상기 엔도뉴클레아제는 서열번호 360, 361, 363, 365, 367, 또는 368 중 어느 하나를 포함하는 PAM에 결합하도록 구성되거나; 또는
(d) 상기 염기 편집기는 서열번호 58 또는 595 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하는 것인 조작된 핵산 편집 시스템. - 제1항 내지 제39항 중 어느 한 항에 있어서,
(a) 상기 엔도뉴클레아제는 서열번호 70, 71 또는 78 중 어느 하나 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나;
(b) 상기 가이드 RNA 구조체는 서열번호 88, 89, 또는 96 중 적어도 하나의 비축퇴성 뉴클레오티드와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하거나;
(c) 상기 엔도뉴클레아제는 서열번호 360, 362 또는 368 중 어느 하나를 포함하는 PAM에 결합하도록 구성되거나; 또는
(d) 상기 염기 편집기는 서열번호 594 또는 이의 변이체와 적어도 70%, 적어도 80% 또는 적어도 90% 동일한 서열을 포함하는 것인 조작된 핵산 편집 시스템. - 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT 또는 스미스-워터맨(Smith-Waterman) 상동성 검색 알고리즘에 의해 결정되는 것인 조작된 핵산 편집 시스템.
- 제42항에 있어서, 상기 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고, 조건부 조성 점수 매트릭스 조정을 사용하여, 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는 것인 조작된 핵산 편집 시스템.
- 제1항 내지 제43항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 촉매적으로 사멸되도록 구성되는 것인 조작된 핵산 편집 시스템.
- 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 핵산.
- 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 염기 편집기에 커플링된, 서열번호 70-78 중 어느 하나에 대해 적어도 70% 서열 동일성을 갖는 엔도뉴클레아제를 코딩하는 것인 핵산.
- 제44항 내지 제46항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함하는 것인 핵산.
- 제47항에 있어서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 핵산.
- 제44항 내지 제48항 중 어느 한 항에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간인 핵산.
- 염기 편집기에 커플링된 클래스 2, 타입 II Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 벡터로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 벡터.
- 제44항 내지 제49항 중 어느 한 항의 핵산을 포함하는 벡터.
- 제50항 또는 제51항에 있어서,
상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
(a) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
(b) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
을 포함하는 조작된 가이드 리보핵산 구조체를 코딩하는 핵산을 추가로 포함하는 벡터. - 제50항 내지 제52항 중 어느 한 항에 있어서, 상기 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래 비리온 또는 렌티바이러스인 벡터.
- 제50항 내지 제53항 중 어느 한 항의 벡터를 포함하는 세포.
- 제54항의 세포를 배양하는 단계를 포함하는, 엔도뉴클레아제의 제조 방법.
- 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를,
a. RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제;
b. 상기 엔도뉴클레아제에 커플링된 염기 편집기; 및
c. 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체
를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하는 것인, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법. - 제56항에 있어서, RuvC 도메인 및 HNH 도메인을 포함하는 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합되는 것인 방법.
- 제56항 또는 제57항에 있어서, RuvC 도메인 및 HNH 도메인을 포함하는 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 방법.
- 제56항 또는 제57항에 있어서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73 또는 78에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 서열번호 77에 비해 잔기 8에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 방법.
- 제56항 또는 제57항에 있어서, 상기 엔도뉴클레아제는 최적으로 정렬된 경우에 서열번호 70에 비해 잔기 9에, 서열번호 72에 비해 잔기 13에, 또는 서열번호 75에 비해 잔기 17에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 방법.
- 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 변형시키는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를,
클래스 2, 타입 II Cas 엔도뉴클레아제,
상기 엔도뉴클레아제에 커플링된 염기 편집기, 및
상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조체
를 포함하는 복합체와 접촉시키는 단계를 포함하고; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하며; 상기 PAM은 서열번호 70-78 또는 597로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법. - 제61항에 있어서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 상기 염기 편집기에 공유 결합되거나, 링커를 통해 상기 염기 편집기에 커플링되는 것인 방법.
- 제61항 또는 제62항에 있어서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 또는 이의 변이체로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함하는 것인 방법.
- 제61항 내지 제63항 중 어느 한 항에 있어서,
상기 염기 편집기는 아데닌 데아미나제를 포함하고;
상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 아데닌을 포함하며;
상기 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 상기 아데닌을 구아닌으로 전환시키는 것을 포함하는 것인 방법. - 제64항에 있어서, 상기 아데닌 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 방법.
- 제61항 내지 제63항 중 어느 한 항에 있어서,
상기 염기 편집기는 시토신 데아미나제를 포함하고;
상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 시토신을 포함하며;
상기 이중 가닥 데옥시리보핵산 폴리펩티드를 변형시키는 것은 상기 시토신을 우라실로 전환시키는 것을 포함하는 것인 방법. - 제66항에 있어서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 방법.
- 제61항 내지 제67항 중 어느 한 항에 있어서, 상기 복합체는 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제를 추가로 포함하는 것인 방법.
- 제68항에 있어서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 방법.
- 제61항 내지 제69항 중 어느 한 항에 있어서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는, 상기 조작된 가이드 리보핵산 구조체의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함하는 것인 방법.
- 제70항에 있어서, 상기 PAM은 상기 조작된 가이드 리보핵산 구조체의 상기 서열에 상보적인 상기 서열의 3' 말단에 바로 인접한 것인 방법.
- 제61항 내지 제71항 중 어느 한 항에 있어서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제 또는 Cas 13d 엔도뉴클레아제가 아닌 것인 방법.
- 제61항 내지 제72항 중 어느 한 항에 있어서, 상기 클래스 2, 타입 II Cas 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 방법.
- 제61항 내지 제73항 중 어느 한 항에 있어서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드인 방법.
- 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 제1항 내지 제44항 중 어느 한 항의 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것을 포함하고, 상기 엔도뉴클레아제는 상기 조작된 가이드 리보핵산 구조체와 복합체를 형성하도록 구성되며, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인 방법.
- 제75항에 있어서, 상기 조작된 핵산 편집 시스템은 아데닌 데아미나제를 포함하고, 상기 뉴클레오티드는 아데닌이며, 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 아데닌을 구아닌으로 전환시키는 것을 포함하는 것인 방법.
- 제75항에 있어서, 상기 조작된 핵산 편집 시스템은 시티딘 데아미나제 및 우라실 DNA 글리코실라제 억제제를 포함하고, 상기 뉴클레오티드는 시토신이며, 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 아데닌을 우라실로 전환시키는 것을 포함하는 것인 방법.
- 제75항 내지 제77항 중 어느 한 항에 있어서, 상기 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA 또는 박테리아 DNA를 포함하는 것인 방법.
- 제75항 내지 제78항 중 어느 한 항에 있어서, 상기 표적 핵산 유전자좌는 시험관 내에 있는 것인 방법.
- 제75항 내지 제78항 중 어느 한 항에 있어서, 상기 표적 핵산 유전자좌는 세포 내에 있는 것인 방법.
- 제80항에 있어서, 상기 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포 또는 인간 세포인 방법.
- 제80항 또는 제81항에 있어서, 상기 세포는 동물 내에 있는 것인 방법.
- 제82항에 있어서, 상기 세포는 달팽이관 내에 있는 것인 방법.
- 제80항 또는 제81항에 있어서, 상기 세포는 배아 내에 있는 것인 방법.
- 제84항에 있어서, 상기 배아는 2세포 배아인 방법.
- 제84항에 있어서, 상기 배아는 마우스 배아인 방법.
- 제75항 내지 제86항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은, 제46항 내지 제49항 중 어느 한 항의 핵산 또는 제50항 내지 제53항 중 어느 한 항의 벡터를 전달하는 것을 포함하는 것인 방법.
- 제75항 내지 제87항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은, 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함하는 것인 방법.
- 제88항에 있어서, 상기 핵산은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임이 작동 가능하게 연결된 프로모터를 포함하는 것인 방법.
- 제75항 내지 제89항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은, 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 포함하는 캡핑된 mRNA를 전달하는 것을 포함하는 것인 방법.
- 제75항 내지 제86항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 폴리펩티드를 전달하는 것을 포함하는 것인 방법.
- 제75항 내지 제86항 중 어느 한 항에 있어서, 상기 조작된 핵산 편집 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은, 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 상기 조작된 가이드 리보핵산 구조체를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함하는 것인 방법.
- 조작된 핵산 편집 폴리펩티로서,
RuvC 도메인 및 HNH 도메인를 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되고, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 RuvC 도메인은 뉴클레아제 활성이 결여되어 있는 것인 엔도뉴클레아제; 및
상기 엔도뉴클레아제에 커플링된 염기 편집기
를 포함하는 조작된 핵산 편집 폴리펩티드. - 제93항에 있어서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 조작된 핵산 편집 폴리펩티드로서,
서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 서열 동일성을 갖는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및
상기 엔도뉴클레아제에 커플링된 염기 편집기
를 포함하는 조작된 핵산 편집 폴리펩티드. - 조작된 핵산 편집 폴리펩티드로서,
서열번호 360-368 또는 598 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 II Cas 엔도뉴클레아제이며, 상기 엔도뉴클레아제는 뉴클레아제 활성이 결여된 RuvC 도메인을 포함하는 것인 엔도뉴클레아제; 및
상기 엔도뉴클레아제에 커플링된 염기 편집기
를 포함하는 조작된 핵산 편집 폴리펩티드. - 제95항 또는 제96항에 있어서, 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래되는 것인 조작된 핵산 편집 폴리펩티드.
- 제93항 내지 제97항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는 것인 조작된 핵산 편집 폴리펩티드.
- 제95항 내지 제98항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제95항 내지 제99항 중 어느 한 항에 있어서, 상기 tracr 리보핵산 서열은 서열번호 88-96, 488 및 489 중 어느 하나로부터 선택된 약 60 내지 90 개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제93항 내지 제100항 중 어느 한 항에 있어서, 상기 염기 편집기는 서열번호 1-51, 57-66, 385-443, 444-475 또는 594-595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제93항 내지 제101항 중 어느 한 항에 있어서, 상기 염기 편집기는 아데닌 데아미나제인 조작된 핵산 편집 폴리펩티드.
- 제102항에 있어서, 상기 아데노신 데아미나제는 서열번호 50-51, 57, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제93항 내지 제101항 중 어느 한 항에 있어서, 상기 염기 편집기는 시토신 데아미나제인 조작된 핵산 편집 폴리펩티드.
- 제104항에 있어서, 서열번호 1-49, 444-447, 594, 또는 58-66 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 조작된 핵산 편집 폴리펩티드로서,
엔도뉴클레아제로서, 상기 엔도뉴클레아제는 엔도뉴클레아제 활성이 결핍되도록 구성되는 것인 엔도뉴클레아제; 및
상기 엔도뉴클레아제에 커플링된 염기 편집기로서, 상기 염기 편집기는 서열번호 1-51, 385-386, 387-443, 444-447, 488-475 또는 595 중 어느 하나, 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 염기 편집기
를 포함하는 조작된 핵산 편집 폴리펩티드. - 제106항에 있어서, 상기 엔도뉴클레아제는 이중 가닥 표적 데옥시리보핵산의 한 가닥을 절단하도록 구성되는 것인 조작된 핵산 편집 폴리펩티드.
- 제106항에 있어서, 상기 엔도뉴클레아제는 촉매적으로 사멸되도록 구성되는 것인 조작된 핵산 편집 폴리펩티드.
- 제106항 내지 제108항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 Cas 엔도뉴클레아제인 조작된 핵산 편집 폴리펩티드.
- 제109항에 있어서, 상기 Cas 엔도뉴클레아제는 클래스 II, 타입 II Cas 엔도뉴클레아제 또는 클래스 II, 타입 V Cas 엔도뉴클레아제인 조작된 핵산 편집 폴리펩티드.
- 제106항에 있어서, 상기 엔도뉴클레아제는 서열번호 70-78 또는 597 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제109항 내지 제111항 중 어느 한 항에 있어서, 상기 Cas 엔도뉴클레아제는 닉카제 돌연변이를 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제112항에 있어서, 상기 Cas 엔도뉴클레아제는 서열번호 70에 비해 잔기 9에, 서열번호 71, 72 또는 74에 비해 잔기 13에, 서열번호 73에 비해 잔기 12에, 서열번호 75에 비해 잔기 17에, 서열번호 76에 비해 잔기 23에, 또는 서열번호 597에 비해 잔기 10에 아스파르테이트에서 알라닌으로의 돌연변이를 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제109항 내지 제113항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 서열번호 360-368 또는 598로 이루어진 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성되는 것인 조작된 핵산 편집 폴리펩티드.
- 제106항 내지 제114항 중 어느 한 항에 있어서, 상기 염기 편집기는 아데닌 데아미나제인 조작된 핵산 편집 폴리펩티드.
- 제115항에 있어서, 상기 아데노신 데아미나제는 서열번호 50-51, 385-443, 448-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제116항에 있어서, 상기 아데노신 데아미나제는 서열번호 50-51, 385-390, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제106항 내지 제114항 중 어느 한 항에 있어서, 상기 염기 편집기는 시토신 데아미나제인 조작된 핵산 편집 폴리펩티드.
- 제118항에 있어서, 상기 시토신 데아미나제는 서열번호 1-49, 444-447 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제106항 내지 제119항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제 또는 상기 염기 편집기에 커플링된 우라실 DNA 글리코실라제 억제제(UGI)를 추가로 포함하는 조작된 핵산 편집 폴리펩티드.
- 제120항에 있어서, 상기 우라실 DNA 글리코실라제 억제제는 서열번호 52-56 또는 서열번호 67 중 어느 하나 또는 이의 변이체에 대해 적어도 70%, 80%, 90% 또는 95% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제106항 내지 제121항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제를 포함하는 폴리펩티드는, 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제122항에 있어서, 상기 NLS는 서열번호 369-384로부터 선택된 것 또는 이의 변이체에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 조작된 핵산 편집 폴리펩티드.
- 제106항 내지 제123항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 염기 편집기에 직접 공유 결합되거나, 링커를 통해 상기 염기 편집기에 공유 결합되는 것인 조작된 핵산 편집 폴리펩티드.
- 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 서열번호 1-51, 385-386, 387-443, 444-447, 488-475, 또는 595 중 어느 하나 또는 이의 변이체에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 코딩하는 것인 핵산.
- 제125항에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류 또는 인간인 핵산.
- 제125항 또는 제126항의 핵산을 포함하는 벡터.
- 제127항에 있어서, 상기 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래의 비리온 또는 렌티바이러스인 벡터.
- 제127항 또는 제128항의 벡터를 포함하는 세포.
- 제129항의 상기 세포를 배양하는 단계를 포함하는, 염기 편집기의 제조 방법.
- 시스템으로서,
(a) 제106항 내지 제124항 중 어느 한 항의 핵산 편집 폴리펩티드; 및
(b) 상기 핵산 편집 폴리펩티드와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조체로서,
i. 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
ii. 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
을 포함하는 조작된 가이드 리보핵산 구조체
를 포함하는 시스템. - 제131항에 있어서, 상기 조작된 가이드 리보핵산 서열은 서열번호 88-96 또는 488-489 중 어느 하나의 비축퇴성 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 시스템.
- 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 제106항 내지 제124항 중 어느 한 항의 상기 조작된 핵산 편집 폴리펩티드 또는 제131항 또는 제132항의 상기 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합시, 상기 복합체가 상기 표적 핵산 유전자좌의 뉴클레오티드를 변형시키도록 구성되는 것인, 표적 핵산 유전자좌를 변형시키는 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063077057P | 2020-09-11 | 2020-09-11 | |
US63/077,057 | 2020-09-11 | ||
US202163222351P | 2021-07-15 | 2021-07-15 | |
US63/222,351 | 2021-07-15 | ||
PCT/US2021/049962 WO2022056324A1 (en) | 2020-09-11 | 2021-09-10 | Base editing enzymes |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230062873A true KR20230062873A (ko) | 2023-05-09 |
Family
ID=80629930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237012244A KR20230062873A (ko) | 2020-09-11 | 2021-09-10 | 염기 편집 효소 |
Country Status (9)
Country | Link |
---|---|
US (3) | US20220364067A1 (ko) |
EP (1) | EP4211234A1 (ko) |
JP (1) | JP2023540797A (ko) |
KR (1) | KR20230062873A (ko) |
AU (1) | AU2021339819A1 (ko) |
CA (1) | CA3192224A1 (ko) |
GB (1) | GB2605340A (ko) |
MX (1) | MX2023002913A (ko) |
WO (1) | WO2022056324A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4114932A4 (en) | 2020-03-06 | 2024-03-13 | Metagenomi, Inc. | CLASS II, TYPE V CRISPR SYSTEMS |
MX2022012110A (es) * | 2020-03-31 | 2022-10-18 | Metagenomi Inc | Sistemas crispr clase ii tipo ii. |
KR20230134543A (ko) * | 2021-01-22 | 2023-09-21 | 메타지노미, 인크. | 신규한 조작된 뉴클레아제 및 키메라 뉴클레아제 |
AU2022380842A1 (en) * | 2021-11-05 | 2024-05-23 | Metagenomi, Inc. | Base editing enzymes |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190134673A (ko) * | 2017-03-30 | 2019-12-04 | 고쿠리츠 다이가쿠 호진 교토 다이가쿠 | 게놈 편집에 의한 엑손 스키핑 유도 방법 |
US9982279B1 (en) * | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
-
2021
- 2021-09-10 KR KR1020237012244A patent/KR20230062873A/ko unknown
- 2021-09-10 JP JP2023516057A patent/JP2023540797A/ja active Pending
- 2021-09-10 CA CA3192224A patent/CA3192224A1/en active Pending
- 2021-09-10 GB GB2209534.3A patent/GB2605340A/en active Pending
- 2021-09-10 MX MX2023002913A patent/MX2023002913A/es unknown
- 2021-09-10 EP EP21867718.5A patent/EP4211234A1/en active Pending
- 2021-09-10 AU AU2021339819A patent/AU2021339819A1/en active Pending
- 2021-09-10 WO PCT/US2021/049962 patent/WO2022056324A1/en active Application Filing
-
2022
- 2022-06-15 US US17/841,082 patent/US20220364067A1/en active Pending
-
2023
- 2023-03-07 US US18/180,009 patent/US20230348876A1/en active Pending
- 2023-05-31 US US18/326,440 patent/US20230374482A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2023002913A (es) | 2023-06-01 |
GB2605340A8 (en) | 2024-02-21 |
CA3192224A1 (en) | 2022-03-17 |
US20230374482A1 (en) | 2023-11-23 |
GB202209534D0 (en) | 2022-08-10 |
US20220364067A1 (en) | 2022-11-17 |
EP4211234A1 (en) | 2023-07-19 |
WO2022056324A1 (en) | 2022-03-17 |
US20230348876A1 (en) | 2023-11-02 |
AU2021339819A1 (en) | 2023-05-25 |
GB2605340A (en) | 2022-09-28 |
JP2023540797A (ja) | 2023-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102654180B1 (ko) | 프롤린 및 알라닌 잔기가 풍부한 반복적인 아미노산 서열을 암호화하고 낮은 반복적인 뉴클레오티드 서열을 갖는 핵산 | |
KR20230062873A (ko) | 염기 편집 효소 | |
KR102622910B1 (ko) | Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법 | |
JP2023082141A (ja) | CasZ組成物及び使用方法 | |
CN108753824B (zh) | 用于治疗视网膜营养不良的病毒载体 | |
KR102604096B1 (ko) | 윌슨병을 치료하기 위한 유전자 치료 | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
CN107580503B (zh) | 用于治疗细菌感染的杀菌剂与亲溶酶体碱化剂的组合 | |
DK2768848T3 (en) | METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS | |
KR101449587B1 (ko) | 장기 지속형 약물 제형 | |
CN112218882A (zh) | Foxp3在经编辑的cd34+细胞中的表达 | |
KR20210005146A (ko) | 유전자 편집된 t 세포에서의 인간 foxp3의 발현 | |
CN108289933A (zh) | 作为认知和行为障碍药物的哺乳动物Klotho的分泌型剪接变体 | |
KR20210151916A (ko) | 뒤시엔느 근육 이영양증의 치료를 위한 aav 벡터-매개된 큰 돌연변이 핫스팟의 결실 | |
CN112912112A (zh) | 肝特异性核酸调节元件以及其方法及用途 | |
CN110785179A (zh) | Wiskott-Aldrich综合征和X连锁血小板减少症中的治疗性基因组编辑 | |
CN116083398B (zh) | 分离的Cas13蛋白及其应用 | |
KR101970428B1 (ko) | 재조합 볼거리 바이러스 제릴린2계 백신 | |
CN113164560A (zh) | 改善基因疗法的新工具及其用途 | |
KR20220142502A (ko) | 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도 | |
CN107988259B (zh) | SmartBac杆状病毒表达系统及其应用 | |
CN112342234B (zh) | 一种调控n-乙酰神经氨酸产量提高的重组枯草芽孢杆菌 | |
CN112312931A (zh) | X连锁高IgM综合征的治疗性基因组编辑 | |
CN112203697A (zh) | 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途 | |
CN114990157B (zh) | 用于构建lmna基因突变的扩张型心肌病模型猪核移植供体细胞的基因编辑系统及其应用 |